Continuamos con la serie de artículos en los que tratamos de explicar las nociones básicas del análisis de datos en el fútbol. Históricamente la mayoría de la investigación en este área ha sido en inglés, pero queremos contribuir a cambiar eso. Esto pretende ser un manual básico para entender las métricas que se están generalizando en el fútbol y previsiblemente serán parte del vocabulario estándar en pocos años.
Sabemos que hay partes del juego y posiciones que son más difíciles de analizar desde un enfoque cuantitativo que otras. Históricamente, los aspectos defensivos han sido uno de los más complicados.
Este no es un problema exclusivo del fútbol, sino que ha sido recurrente en deportes con mayor nivel de desarrollo analítico como el baseball o el baloncesto.
Incluso en la famosa gesta de los Oakland A’s contada en Moneyball, Billy Bean y Paul De Podesta se centraron específicamente en la parte ofensiva. El desarrollo y análisis de la parte defensiva es algo que no se ha ido corrigiendo en general hasta mucho más recientemente.
¿Por qué la defensa es difícil?
Hay varias razones que explican por qué es tan difícil entender la defensa en fútbol.
Conceptualmente, hay una diferencia fundamental entre el ataque y la defensa: Mientras que en ataque, de un modo u otro, el rendimiento exitoso acaba traduciéndose en realizar una acción (rematar, completar un regate, meter gol etc.) y hacerlo más veces suele ser mejor, en defensa no siempre sucede lo mismo. No en vano, el objetivo es evitar que el equipo rival haga algo, y por tanto muchas veces lo que no se hace es tan importante o más que lo que sí se hace. Paradójicamente, en defensa menos puede ser mejor.
Por ejemplo, un posicionamiento adecuado o un pressing coordinado de manera eficaz limitan las opciones del rival y por tanto es menos probable que los jugadores más retrasados tengan que defender de manera activa frecuentemente.
Como ejemplo opuesto, si un portero tiene que intervenir muchas veces durante un partido para evitar que su equipo reciba gol, parece evidente que hay algún problema en la manera de defender de ese equipo más allá de las estadísticas individuales del meta.
Un defensa que realice más entradas o interceptaciones no es necesariamente mejor que uno que realice menos, estos datos miden en mayor medida la oportunidad que la habilidad. En las acciones que se realizan en defensa hay mucho más ruido que señal. ¿Cómo podemos empezar a disipar ese ruido?
La segunda razón, relacionada con lo anterior, tiene que ver con los datos que había disponibles hasta hace poco. Durante mucho tiempo los proveedores se limitaron a contar eventos (por ejemplo, interceptaciones) sin tener en cuenta si estos eran representativos de las tareas fundamentales en defensa. Por el camino, se dejaron algunas acciones que ahora sabemos no sólo dan una imagen más realista del espectro de tareas en defensa sino que además permiten analizar en detalle algunas posiciones concretas. Explicaremos más sobre esto al hablar de los eventos de presión.
Razones adicionales que van más allá del propósito de esta introducción son, entre otras, las interacciones entre jugadores, el contexto de las acciones defensivas, el tipo de datos empleados, o efectos de equipo difíciles de controlar.
En definitiva, ni todo lo que es relevante se puede contar, ni (hasta recientemente) se ha contado todo lo que es relevante.
Métricas Defensivas: Revisión de diferentes enfoques
Para comenzar a arrojar un poco de luz, vamos a hacer una pequeña revisión de los enfoques que se han empleado en los últimos años y a mostrar algunas de las soluciones que hemos desarrollado en StatsBomb para analizar la defensa con mayor rigor. Algunas de las preguntas relevantes son las siguientes:
- ¿Cómo de efectivos son los equipos tratando de evitar recibir goles?
- ¿Qué rasgos estilísticos diferencian equipos que tratan de presionar alto respecto a los que defienden en bloques medios o bajos?
- ¿Cómo podemos tener una visión más representativa de la influencia de determinados jugadores en defensa más allá de recuperar la posesión directamente?
Una de las premisas de las que partimos es que en defensa hay dos objetivos: Evitar recibir goles y recuperar la posesión. Ambos están latentes en las decisiones estratégicas que toman los equipos haciendo que haya rasgos estilísticos reconocibles que permiten situar los diferentes enfoques tácticos en categorías específicas.
Métricas de equipo: Defender nuestra portería
La primera tarea colectiva es evitar conceder goles restringiendo para ello la cantidad y calidad de ocasiones de las que dispone el rival. Si los Goles Esperados (xG) son una métrica útil para medir el rendimiento ofensivo, parece lógico pensar los Goles Esperados Concedidos (xGA) es una métrica que nos muestra la eficacia del equipo evitando que les generen ocasiones de valor elevado.
Un equipo al que regularmente le generan un número elevado de Goles Esperados es probable que - pese a variabilidad transitoria - acabe concediendo goles y por tanto teniendo complicado sumar puntos.
Además, podemos tratar de discernir la capacidad que tenga el equipo para conceder menos goles de los que el modelo espera (y la habilidad de los porteros evitando goles, pero este es un tema para otra ocasión). Hay equipos como el Atlético de Madrid que lo han logrado regularmente.
Sin embargo, no tenemos por qué detenernos en los números agregados de xG. Podemos analizar detalles sobre el volumen y aspectos concretos de los remates tales como distancia, situaciones de juego o defensores cercanos al rematador.
En este sentido, los datos de StatsBomb y por consiguiente los modelos construidos a partir de ellos proporcionan una visión más precisa del valor de las ocasiones que el equipo recibe. Podéis leer más en este artículo.
En el gráfico superior podemos ver los tiros claros concedidos (por partido) por los equipos de La Liga esta temporada. Los tiros claros (Clear Shots) son aquellos en los que no hay ningún defensor interponiéndose entre el rematador y el portero.
En el Freeze Frame inferior se puede ver un ejemplo de un Clear Shot.
También podemos analizar aspectos como los tiros bloqueados, la distancia media desde la que se remata, o la altura del remate, así como tiros precedidos por una pérdida en campo propio o tiros en situaciones de contraataque.
Además, dado que tenemos la posición de los defensas en cada remate podemos analizar al detalle cómo influye la presión de un defensor en los distintos remates. Revisaremos este tema en profundidad más adelante, pero si tenéis interés podéis leer la investigación original al respecto de Derrick Yam aquí, aquí y aquí (en inglés).
Es indudable que analizar lo que sucede en las áreas y las ocasiones de cada equipo aporta información relevante. Sin embargo, la pregunta que sigue sin quedar resuelta es qué hacen los equipos para evitar eso en primer lugar y cómo influye en la cantidad y calidad de las ocasiones.
Por ejemplo, hay equipos que prefieren presionar con una línea defensiva alta para así mantener al rival lejos de su área y limitar el número de tiros de los que dispone, sin embargo, al mismo tiempo esto hace más probable que las ocasiones de las que dispone el rival tengan un xG medio más alto (porque habitualmente serán situaciones de juego al espacio y unos contra uno).
Otros equipos prefieren defender más cerca de su propio área acumulando más jugadores en las inmediaciones, lo que limitará la calidad de las ocasiones rivales, pero al mismo tiempo tenderá a cederle la iniciativa por lo que dispondrá de mayor número de remates.
Analizar sólo el tipo o cómo evitan las ocasiones es descuidar la interrelación entre los dos objetivos anteriormente mencionados. Puesto que la defensa trata tanto de evitar conceder goles como de recuperar la pelota (para posteriormente crear ocasiones) entender las diferentes opciones tácticas para asegurar un equilibrio entre ambos y los trade-offs de diferentes enfoques ha sido una preocupación para la comunidad de analistas.
Rasgos estilísticos, control del espacio e intensidad defensiva
Las cuestiones habituales al respecto han sido cómo, cuánto y dónde realizan las acciones defensivas los equipos.
Ha habido varios enfoques al respecto, pero podemos señalar como inicial el trabajo de Colin Trainor en 2014 que llevó al desarrollo de la métrica PPDA (pases por cada acción defensiva). Esta métrica responde a una pregunta sencilla: ¿cuántos pases realiza el rival por cada acción defensiva de mi equipo?
Pases del rival / Acciones defensivas (entradas, interceptaciones, faltas, duelos)
Por tanto, a menor PPDA, mayor intensidad defensiva ejercida.
Partiendo de que el número de acciones defensivas de un equipos (originalmente entradas e interceptaciones) tienen nula correlación con el rendimiento de los equipos Colin desarrolló gradualmente una medida que era más representativa de la intensidad defensiva.
Pese a que la idea inicial era discriminar los equipos que mostraban una presión más alta, la métrica se fue desarrollando y gradualmente adaptando a diferentes zonas hasta ser una de las métricas descriptivas más empleadas para mostrar los rasgos estilísticos que definen la defensa de los equipos. En StatsBomb la utilizamos regularmente en los análisis.
Hay equipos que presionan más alto y otros que prefieren defender en bloque bajo. Poder diferenciar estos rasgos estilísticos es un primer paso para saber qué estrategia defensiva es más interesante, la influencia en las posteriores transiciones ofensivas, contextualizar los datos de un jugador individual o saber si el rendimiento del equipo con determinada estrategia tiene puntos débiles.
Otras fórmulas para medir la intensidad defensiva incluyen la altura a la que los equipos realizan acciones defensivas, las recuperaciones post-presión, entre otras.
En el gráfico superior podemos ver la distancia defensiva media (respecto a su propia portería) a la que los equipos realizan las acciones defensivas en Liga. Como se puede comprobar a simple vista, y de manera poco sorprendente, el Getafe y el Eibar sobresalen en está métrica.
Sin embargo, todas estas fórmulas quedaban cojas por las razones expuestas anteriormente - principalmente porque sólo utilizan acciones defensivas realizadas sobre el balón. En StatsBomb creíamos que había mucho margen de mejora y una de las soluciones que creíamos más valiosas era recoger otros eventos relevantes.
Las presiones
Los eventos defensivos en los proveedores de datos tradiciones han sido las entradas o tackles, interceptaciones, duelos, despejes, etc. Mientras que estos datos son útiles hasta cierto punto, no llegan a dar una visión representativa del espectro completo de acciones que tienen impacto a nivel defensivo del equipo, limitando así la capacidad de extraer conclusiones relevantes.
Es aquí donde las cosas se ponen interesantes, y los datos de StatsBomb proporcionan un nuevo evento que cambia la manera de afrontar el análisis defensivo: las presiones.
¿Qué son las presiones?
Una presión es la acción de atacar al poseedor de balón o al receptor de un pase - en un radio de 5-8 metros en función de la zona del campo - sin llegar a realizar una entrada, falta o interceptar el pase (cualquiera de estas acciones puede ocurrir posteriormente, pero es un evento diferente).
Para cada evento de presión tenemos su localización, dirección, duración y resultado. En el vídeo de la presentación de los datos de StatsBomb se puede encontrar más detalle sobre la manera de recoger este evento.
La lógica subyacente es que muchas de las acciones defensivas que permiten que posteriormente un equipo recupere la posesión o lleve a cabo un pressing* eficaz no se limitan a las acciones que ocurren sobre balón, sino que hay toda una serie de acciones que llevan a ello tales como cerrar líneas de pase, acelerar la acción del jugador, dirigirle hacia determinadas zonas, forzar pases descontrolados, o hacer que el jugador en posesión se quite el balón de encima.
A nivel colectivo esto nos permite tener una visión más realista y completa de los mecanismos tácticos que los equipos usan en fase defensiva: En qué zonas comienzan a ejercer presión, hacia qué lado dirigen a los rivales, dónde son más fuertes, con qué frecuencia presionan en determinadas zonas del campo y qué jugadores son los más involucrados en ello.
En el mapa defensivo inferior podemos ver la actividad defensiva (acciones defensivas incluyendo presiones) del Getafe respecto a la media de la Liga en cada zona. Los colores más rojos indican mayor actividad defensiva que la media, y los colores más oscuros menor. El perfil defensivo del Getafe es claro a simple vista.
Además, nos permite analizar al detalle aspectos como la presión tras pérdida, o los contraataques que se inician a partir de presiones en diferentes zonas.
En los gráficos superiores podemos ver el mapa de presiones del Real Madrid en el último Clásico. Las zonas en las que el Real Madrid realizó más presiones y las zonas en las que realizó más frecuentemente presiones tras pérdida (definido como presiones realizadas en los 5 segundos posteriores a la pérdida de balón).
A nivel individual, los datos de presión nos proporcionan una dimensión adicional para analizar el rendimiento defensivo. Este evento es especialmente relevante para los atacantes y los centrocampistas, pero por su granularidad y por la cantidad de eventos de este tipo que se dan por partido podemos emplear para analizar de manera más exhaustiva incluso los defensas.
El problema evidente que supone tratar de evaluar el rendimiento de los jugadores atacantes con las acciones como entradas o interceptaciones es que estas son por definición acciones en las que se trata de recuperar directamente la posesión. Sin embargo, como cualquiera con experiencia en fútbol puede corroborar, desde un punto de vista táctico las funciones defensivas habituales de los atacantes no son recuperar el balón.
Es decir, normalmente el delantero no presiona para recuperar la pelota por sí mismo, sino para tapar líneas de pase concretas, orientar la salida de balón del rival hacia zonas concretas (normalmente exteriores), forzar a los rivales a realizar acciones descontroladas, cometer errores, o a quitarse el balón de encima.
En definitiva, ayudar a que los compañeros tengan mayor probabilidad de recuperar la pelota posteriormente. Con los eventos de presión podemos otorgar valor a estas acciones y comenzar a analizar de manera más detallada el rendimiento de los jugadores sin balón.
Una de las maneras es utilizando la métrica Pressure Regains o Recuperación post-presión. Si el equipo recupera la pelota en los cinco segundos posteriores a una acción de presión de un jugador, se le asignará una recuperación post-presión al jugador. Este es un proxy muy práctico de la influencia de los jugadores atacantes en las recuperaciones de su equipo.
Como todo, no está exento de limitaciones, y es que un delantero puede esforzarse muchísimo, ejercer presión con el timing apropiado pero si el resto del equipo no le acompaña o no lo hacen de manera coordinada, difícilmente será efectivo. Sin embargo, estas métricas dan una visión más representativa de la realidad que intentamos analizar.
En los gráficos inferiores podemos ver la comparativa del rendimiento defensivo de Roberto Firmino (2018-2019) excluyendo las acciones de presión (gráfico izquierdo) e incluyéndolas (gráfico derecho).
Ventajas y usos adicionales de los eventos de presión
No tenemos por qué deternos aquí, los eventos de presión abren un abánico nuevo de posibilidades y preguntas que podemos intentar responder (y que de hecho aún estamos haciendo). Entre otras cosas podemos evaluar las acciones de counterpressure (presiones en los cinco segundos posteriores a la pérdida), qué jugadores tienen mayor influencia en los momentos de transición defensiva o cómo la capacidad de presionar evoluciona a lo largo de los partidos, de las temporadas o cómo disminuye con la edad.
También podemos medir aspectos como la intensidad (o agresividad) defensiva, el número de recepciones en zonas de influencia presionadas, entre otras.
Además, los usos de estos datos no se circunscriben sólo al apartado defensivo, sino que gracias a tener los eventos de presión, al mismo tiempo, podemos saber si los jugadores en posesión del balón están siendo presionados mientras realizan una acción determinada (AUP o Actions Under Pressure). Es decir, podemos ver cómo cambian las decisiones y el grado de precisión en las acciónes de los jugadores en posesión cuando están presionados respecto a cuando no lo están. Esto no es sólo fascinante sino que tiene innumerables utilidades prácticas.
En la imagen superior podemos comparar visualmente los pases desde zonas centrales a zonas adyacentes de Casemiro y Busquets cuando están presionados. El jugador catalán tiene un volumen mayor como es esperado, así como un porcentaje de pases completados mayor (en rojo los completados) y su tendencia a distribuir en corto hacia las bandas incluso bajo presión es evidente. Por su parte el mediocentro brasileño prefiere los envíos largos y los cambios de orientación al lado opuesto.
Ajustar las métricas defensivas en función de la posesión
Para terminar, hay una pregunta recurrente que tenemos que abordar, ¿Cómo afecta el estilo de juego del equipo al output defensivo de los jugadores? ¿Qué podemos hacer para controlar esto?
Uno de los puntos más claros, es que los jugadores sólo pueden realizar acciones defensivas cuando su equipo no tiene la posesión, por tanto, en función del tiempo que el equipo esté en posesión tendrán más o menos oportunidades de sumar acciones defensivas. Esto hace que los equipos con volúmenes elevados de posesión tengan menor número de acciones defensivas y por tanto los números absolutos de tackles, interceptaciones (o presiones) tienen más ruido de lo deseable.
Por tanto, para una comparación más objetiva una de las soluciones prácticas y sencillas es ajustar en función de la posesión (esto es más difícil de lo que parece, si tenéis interés podéis leer el artículo de Ted Knutson con la metodología original aquí).
En el gráfico superior vemos los diez jugadores de La Liga esta temporada ordenados por la suma de interceptaciones y entradas (cada 90 minutos). Mientras que el gráfico izquierdo muestra los valores absolutos, el derecho muestra los valores una vez que aplicamos el ajuste en función de la posesión de sus equipos.
Pese a que algunos nombres se repiten, como es esperable, en el ranking ajustado vemos algunos sospechosos habituales que pese a ser defensores intensos y agresivos no aparecen en el izquierdo (o en menor medida) simplemente porque sus equipos dominan la posesión más tiempo.
Este ajuste es una solución práctica para estandarizar los valores de modo que se puedan comparar entre diferentes jugadores corrigiendo aspectos ajenos a su habilidad.
Sin embargo, es importante remarcar que una vez ajustada por posesión ya no existe una correspondencia verídica entre el valor de la métrica y las acciones reales que podamos ver en vídeo. Es por ello, que los números absolutos siguen teniendo utilidad a la hora de evaluar el rendimiento de los jugadores (por ejemplo, para definir los límites).
* Aclaración: Adaptando la terminología inglesa, al hablar de presión nos referimos a la acción individual. Por su parte, pressing se refiere a la tactica colectiva basada en acciones presión de manera coordinada por los miembros del equipo.