Estadisticas avanzadas

Nuevos modelos de Hudl Statsbomb: xPass y Pass Clustering

Por Hudl Statsbomb | octubre 5, 2023 | Tiempo de lectura: 8 minutos
Estadisticas avanzadas

Nuevos modelos de Hudl Statsbomb: xPass y Pass Clustering

En Hudl Statsbomb, siempre estamos desarrollando nuevos modelos y métricas que proporcionan información determinante a nuestros clientes y/o hacen más fácil su trabajo.

Hace meses lanzamos HOPS, un modelo que mide la habilidad de los jugadores en los duelos aéreos. Esta semana, presentamos dos nuevos modelos, xPass y Pass Clustering, ya disponibles en cada una de las más de 140 competiciones que cubrimos alrededor del mundo.

xPass

Nuestro modelo de xPass toma en cuenta varios factores para calcular la probabilidad de que un pase dado sea completado en base de datos históricos de pases con características similares.

Los factores principales son:

  • La localización del pase
  • El ángulo y la longitud
  • La parte del cuerpo utilizada (pie, cabeza, etc…)
  • El tipo de jugada (juego abierto, a balón parado)
  • Si el pase se realizó bajo presión rival

Por ejemplo, un pase de pie, horizontal y de tres metros de longitud desde el centro del campo y sin presión rival podría tener un xPass de un 96%, mientras que un pase de pie de 40 metros desde el tercio defensivo a la banda izquierda bajo presión rival podría tener un xPass de un 37%.

A nivel más básico, se pueden juntar todos los pases de un jugador para comparar su porcentaje de éxito en el pase con el xPass de sus pases y así analizar si completa una cantidad por encima o por debajo de lo esperado.

Para ilustrar, aquí están los cinco centrocampistas de la pasada temporada de La Liga que rindieron más por encima del xPass en los pases de pie en juego abierto:

  • Toni Kroos, Real Madrid: +5,21%
  • Moi Gómez, Osasuna: +3,94%
  • Manu Trigueros, Villarreal: +3,61%
  • Luka Modrić, Real Madrid: +3,38%
  • Federico Valverde, Real Madrid: +3,20%

…y aquí, los que rindieron más por debajo:

  • Fidel, Elche: -7,74%
  • Gabri Veiga, Celta de Vigo: -3,94%
  • Pablo Barrios, Atlético de Madrid: -3,46%
  • Oier Zarraga, Athletic Club: -2,82%
  • Kike Pérez, Real Valladolid: -2,56%

Sin embargo, podemos ir mucho más allá, por ejemplo para analizar la distribución de dificultad de pase (por cuartiles) entre los centrocampistas de un equipo concreto, en este caso el Atlético de Madrid.

Inmediatamente se pueden ver las diferencias entre los distintos jugadores. En el cuartil (0-25) que incluye los pases más difíciles, Rodrigo de Paul realizó más, proporcionalmente, que cualquier otro jugador y los completó a un ritmo por encima del xPass. Axel Witsel tiene un perfil muy diferente, intentando un porcentaje mucho menor de los pases más difíciles (y completándolos a un ritmo por debajo del xPass) y uno mucho mayor de los pases más simples (los del cuartil 75-100). Además, parece que Pablo Barrios intentó demasiados pases difíciles dados los problemas que tuvo en completarlos.

A nivel de equipos se pueden ilustrar los cambios en su perfil de pase de acuerdo con el estado del marcador…

…o ver el efecto que tiene un cambio de entrenador y estilo de juego en el xPass promedio de los jugadores.

Existen muchas posibilidades de análisis con utilidad tanto en el scouting de jugadores como en el análisis de rivales o del rendimiento del propio equipo.

Pass Clustering

La mayoría de los equipos realizan más de 450 pases por partido y aunque es posible analizar y visualizar esta cantidad de pases, cuando tienes los de dos, tres o más partidos ya es difícil presentarlos de una manera fácilmente interpretable.

Un modelo de Pass Clustering agrupa pases con características similares para simplificar la tarea de visualizarlos e identificar patrones en el juego de un equipo o en los pases de un jugador concreto.

El modelo de Pass Clustering de Hudl Statsbomb toma en cuenta cuatro factores principales para asignar cada pase a uno de 60 grupos o clusters:

  • Localización
  • Longitud
  • Dirección

Por ejemplo, un cluster podría estar compuesto por pases desde el centro del tercio defensivo, altos y de larga distancia hacía la banda derecha, mientras que otro podría agrupar pases cortos y rasos desde la misma zona hacía atrás.

Los clusters se pueden utilizar como son o se pueden agrupar para identificar, por ejemplo, los jugadores que hacen una gran cantidad de pases rasos desde el centro del campo a la banda, sin discriminar por la banda a la que los pases están dirigidos.

Como ejemplo de la utilidad del modelo, aquí están los pases completados desde el centro del campo de Toni Kroos del Real Madrid la temporada pasada. Es muy difícil sacar algún tipo de información relevante de este bosque de líneas superpuestas.

El modelo de Pass Clustering da acceso fácil a la información más importante. En vez de visualizar todos los pases, se pueden visualizar los seis clusters de pase que Kroos realizó con más frecuencia o los seis que fueron los más característicos de él con respecto al resto de los jugadores de su posición.

Inmediatamente, tenemos una idea mucho más clara de los tipos de pase que realizó.

A nivel de equipos, se puede hacer un análisis de una liga completa, concretamente para ver los cinco clusters de pase más característicos de cada equipo…

…y de ahí, enfocar en un equipo concreto. Por ejemplo, si un analista está elaborando un informe del próximo rival, podría visualizar los clusters de pase que más utiliza el equipo en la construcción del juego desde atrás.

Se puede extender este tipo de análisis a otras fases del juego, como, por ejemplo, los primeros pases tras una recuperación de balón en el centro del campo o para ver los pases que utiliza un equipo para hacer llegar el balón al área o al último tercio.

El modelo también tiene utilidad en tareas no involucradas con la visualización, por ejemplo para encontrar a futbolistas que tienen perfiles de pase similares, algo muy útil en el scouting o incluso en la identificación de jugadores dentro de un club, sean del segundo equipo o de la cantera/los inferiores, que tienen perfiles similares a los titulares del primer equipo.

Conclusión

Como hemos demostrado, estos dos modelos proporcionan información relevante y de calidad sobre los pases tanto de jugadores como de equipos, ayudando a acelerar y mejorar los procesos de scouting y análisis de los clubes.

Cabe mencionar de nuevo que a diferencia de otros proveedores, nuestros modelos de xPass y Pass Clustering están disponibles en cada una de las más de 120 competiciones que cubrimos.

Se puede hacer el mismo análisis para la Primera División de Chile...

…o la Primera Federación de España...

...o la Liga F.

Si trabajas en un club o una federación, un medio de comunicación o una casa de apuestas deportivas y quieres saber más sobre lo que Hudl Statsbomb puede hacer por ti y tu organización, ponte en contacto con nosotros.

Por Hudl Statsbomb | octubre 5, 2023