StatsBomb lanza un modelo de Goles Esperados con Shot Impact Height

El modelo de Goles Esperados (xG) de StatsBomb siempre ha sido un poco diferente. Cuando StatsBomb Data se lanzó en 2018, el objetivo era acercar más los datos de fútbol a lo realmente pasa en el campo de juego.

Desde el principio, añadimos la posición del portero y de los defensores en cada tiro de cada liga que recogemos. Esta aparente pequeña mejora ha resultado en mejoras sustanciales en los valores de xG cuando hay mucha gente en el área de penalti y especialmente cuando el portero está fuera de posición.

Con los mejores valores de xG, acciones de presión, información sobre el pie con el que se realizan todos los pases y muchos otros factores diferenciales, no es de extrañar que StatsBomb Data se ha convertido en la opción preferida para equipos inteligentes, federaciones y jugadores de todo el mundo.

Nuestros datos son más precisos no sólo en cuanto a dónde ocurren los eventos en el campo, y en qué orden, sino que también en cuanto a cuándo ocurren. Esto significa que los datos de StatsBomb son más fáciles de integrar con los datos de tracking que los de cualquier otro proveedor de datos de evento en el mercado.

Sin embargo, el mundo de los datos deportivos es un ámbito competitivo y cada año nos esforzamos por mejorar nuestro producto. La temporada pasada, hicimos dos grandes mejoras en la información que recogemos en relación con los tiros:

  • Nuestro Freeze Frame (un imagen del momento en que se realiza el tiro, que muestra la posición del portero y tanto de los atacantes como de los defensores) se recoge mediante visión por ordenador. Esto nos da mejor información sobre la posición tanto del balón como de los jugadores que nunca antes.
  • Añadimos algo que llamamos Shot Impact Height (SIH) a los datos de los tiros. En breve, el Shot Impact Height es la altura (o la coordenada z) del balón en el momento en que se realiza el tiro.

¿Por qué recoger el Shot Impact Height? Porque mirando el juego desde una perspectiva futbolística, parecía que podía haber una diferencia entre un tiro de cabeza realizado con el balón a la altura de la cabeza frente a uno realizado con el balón 40 cm más alto que solamente roza la parte superior de la cabeza. O una volea realizada cerca del suelo frente a una realizada a la altura del pecho.

Lo interesante es que no sabíamos nada de esto cuando empezamos a recoger los datos. Simplemente añadimos las características al proceso de recogida y este verano las revisamos para investigar más.

¿Qué hemos aprendido?

Esta nueva información apenas cambia los valores de xG en la mayoría de los tiros ya que el modelo ya incluía la altura del pase previo el tiro. Siempre hemos recogido la altura de los pases y esa información formaba parte de nuestro modelo de xG. Esto significaba que ya había alguna información sobre la potencial altura de impacto de los tiros incorporada en el modelo, por lo que la mayoría de los valores de xG no han cambiado.

Sin embargo... en algunos tiros, la adición del Shot Impact Height ha hecho una diferencia significativa. Estos tiros son en gran parte ellos en los que el modelo no conoce la altura del balón porque los tiros se realizan después de un evento que no es un pase, como un rebote, el control del jugador, la segunda jugada de una acción a balón parado... lo que sea. En esos tiros, la adición de la altura de impacto del tiro hace una diferencia significativa.

Aquí están los pensamientos de nuestro CTO, Thom Lawrence:

Nuestra esperanza era que la inclusión de la altura de impacto mejoraría el modelo en algunos casos de borde, especialmente en aquellos que requieren saltos particularmente majestuosos o posiciones corporales difíciles. Aunque esta adición no proporciona un gran salto en la precisión general del modelo, existen muchos tiros cuyos nuevos valores parecen más precisos cuando consultamos el vídeo.

Por ejemplo, este tiro del Ajaccio contra el Caen previamente tenía un valor de ~0.6 xG. Hay dos defensores presionando el tiro, pero es un remate de pie dentro del área pequeña con el portero completamente fuera de posición.

Sin embargo, viendo el vídeo podemos ver que el punto de impacto es a la altura de la cintura.

Eso significa que el tiro es mucho más difícil de ejecutar. El jugador realizó el tiro pero no de manera limpia. El modelo identifica la altura de impacto como un factor significativo en su predicción aquí, y el nuevo valor es de ~0.3 xG.

Como curiosidad, señalar que la altura de impacto no sólo tiene un efecto negativo en el xG de los tiros difíciles. Asimismo, tiene un efecto positivo en algunos tiros. Por ejemplo, una altura de impacto de cero, es decir, con el balón en el suelo, puede ser a veces muy útil para detectar grandes ocasiones. Vemos mejoras en esas ocasiones a través del conjunto de datos.

Más ejemplos

xG anterior: 0.65
xG con SIH: 0.35

xG anterior: 0.40
xG con SIH: 0.20

xG anterior: 0.54
xG con SIH: 0.29

xG anterior: 0.67
xG con SIH: 0.47

Esto es similar al efecto de tener la posición del portero en cada tiro. En la gran mayoría de los tiros en los que el portero está en una posición normal, tener su posición tiene un valor nominal. Sin embargo, en los tiros en los que el portero está fuera de posición, la diferencia entre tener o no tener su posición es enorme.

Ejemplos del efecto de la posición del portero

xG sin la posición del portero: 0.48
StatsBomb xG: 0.82

xG sin la posición del portero: 0.27
StatsBomb xG: 0.74

Al igual que tener la posición del portero, tener el SIH en el modelo refleja con más precisión el valor de xG para cada tiro. Cada mejora en la recogida de datos nos acerca a reflejar de manera más completa lo que está sucediendo en el campo de juego.

Conclusiones

  • Tiros desde el suelo son más valiosos de lo que pensábamos antes.
  • Shot Impact Height tiene un impacto considerable en un subconjunto de tiros que no se realizan inmediatamente después de un pase.
  • La posición del portero, la altura del pase y el Shot Impact Height combinan para mejorar de manera significante los modelos de goles esperados y reducir los errores en los casos atípicos.
  • Realmente importa tener datos más detallados y de mejor calidad.
  • Deberías comprar los datos de StatsBomb porque son los mejores.

Si quieres saber más sobre lo que StatsBomb puede hacer por ti, envía un email a Sales@StatsBomb.com

-- Ted Knutson
CEO, StatsBomb

StatsBomb presenta sus nuevas visualizaciones

En StatsBomb los radares son nuestra icono, una manera original y útil de visualizar datos tanto de jugadores como equipos. Desde la primera versión en 2014 han tenido múltiples mejoras y han ido sufriendo un progresivo desarrollo a media que StatsBomb crecía.

En inglés hemos escrito sobre las diversas actualizaciones aquí y aquí.

Hoy en día, los radares están omnipresentes en los círculos de análisis de datos en el fútbol. Sin embargo, somos conscientes de que los radares no son la única forma de visualizar los datos. Los radares son bastante prácticos, pero nuestra plataforma StatsBomb IQ es lo suficientemente madura como para ofrecer otras opciones.

Por ello, las nuevas actualizaciones en StatsBomb IQ incluyen las siguientes mejoras:

1. En los radares, se actualizan los límites de las métricas en las plantillas para cada posición con los datos del último año.

2. En los radares se añade la opción de visualizar los percentiles en lugar de los valores de cada métrica.

3. Un nuevo panel para visualizar la información incluida en el radar.

4. Nueva opción de visualización de distribuciones con múltiples opciones de personalización.

5. Las comparaciones entre jugadores se pueden realizar directamente desde el perfil de cada jugador. Creemos que esto ofrece una UI más limpia y mayor facilidad en su uso.

6. Usando las distribuciones, ahora se pueden ver los datos de equipos y jugadores como percentiles en las tablas de cada liga.

Hemos lanzado estas actualizaciones para que nuestros clientes se sientan cómodos con los cambios y las nuevas características antes de pasar al siguiente paso del proyecto de customización en que los clientes tendrán la opción de construir sus propias plantillas para los radares y distribuciones.

Esto es, probablemente, la funcionalidad más solicitada por los clientes. Pero lo primero es lo primero...

Los límites para cada plantilla han sido actualizados

Actualizamos los límites de nuestros radares aproximadamente una vez al año, a medida que tenemos más datos en el sistema. Se basan en la distribución posicional para cada métrica en las cinco grandes ligas de Europa durante varias temporadas. Sin embargo, esta vez hemos añadido nuevas distribuciones.

Nuevas distribuciones posicionales de la población

Un elemento en el que hemos trabajado es la creación de nuevas distribuciones poblacionales para poder realizar diferentes comparaciones entre jugadores. En el correo electrónico a los clientes, explicamos que deben leer la detallada advertencia incluida en StatsBomb IQ antes de hacer cambios en la configuración de la distribución.

Como ironía del destino, nosotros mismos demostramos exactamente por qué hay que tener cuidado con los ajustes al incluir accidentalmente los datos históricos de La Liga que recogimos para la Biografía de Datos de Messi en los cálculos de las distribuciones poblacionales.

¿Cuál es el problema?

Esas temporadas de La Liga sólo incluyen partidos del Barcelona en los cuales lo habitual era dominar a los rivales, y nada más. Con estos datos incluidos, era normal que los equipos recibieran tres Goles Esperados (xG) por partido. Así que hemos tenido que arreglar rápidamente este error.

¡Gracias Messi!

Radares de percentiles

Además de los radares tradicionales, ahora es posible mostrar las métricas como percentiles para esa posición. Esto elimina los límites del 5%/95% de los radares clásicos y reemplaza las estadísticas normales con los percentiles para toda la población en esa posición. Dependiendo de los casos de uso esta función aporta flexibilidad y una nueva alternativa de visualización y comparación de los perfiles de los jugadores.

Actualizaciones en la visualización de información Hemos cambiado bastante la forma de mostrar la información esta vez. La nueva tabla contiene la producción estadística por 90 minutos y como novedad, el percentil para esa misma métrica.

Nueva opción de visualización: Distribuciones

Hace tiempo que queríamos añadir diferentes formas de mostrar los datos. Investigamos (en realidad Nat James ha realizado la mayoría del trabajo) y probamos un abanico de posibilidades. Las que mostramos a continuación han sido las que mejor se ajustaron a lo que queríamos lograr en términos de visualización de información y precisión estadística.

Todas las visualizaciones tienen varias opciones adicionales de personalización seleccionables debajo de Distribution. A continuación, un repaso a cada opción. Tipo de gráfica: Área/Violín Área viene seleccionada por defecto. Violín refleja la forma del Área. Distribución mostrada: Positionally Filtered/Any Position/Both En los gráficos de distribución, permitimos elegir entre algunas opciones. Positionally Filtered limita la muestra a los jugadores que han jugado una cantidad de minutos significativa en esa posición.

Any Position muestra la distribución para todos los jugadores: la población. Both... aquí es donde las cosas se complican un poco más. Si hemos elegido Área como tipo de trama, eligiendo Both obtenemos la distribución de la población completa como una línea de puntos.

Sin embargo, si tenemos Violín como el tipo de trama, la distribución superior mostrará la distribución filtrada por posición mientras la distribución inferior mostrará la población completa.

Color de la distribución: Radar Colours / Percentile Gradient / Metric Distinction Estas son sólo preferencias sobre el color de las distribuciones. Percentile Gradient ofrece a través de la paleta de colores una idea del percentil en el que se encuentra el jugador. Además, esos valores también están mostrados al final de la visualización.

Límites de la plantilla: Not Displayed / Dotted / Notches En caso de que queramos mantener una conexión con el clásico estilo del radar, se pueden elegir mostrar líneas de puntos en el límite del 5%/95% de la población o marcas para cada parte de esa distribución.

Interfaz de usuario para comparaciones

Ahora las comparaciones ocurren en la propia página de radar. Existe un menú desplegable que muestra los jugadores favoritos guardados para hacer las comparaciones además de dar la opción de buscar uno nuevo.

En cualquier radar, al hacer clic en la estrella de la parte superior izquierda de la pantalla se añadirá un nuevo favorito. Estos se pueden gestionar en el menú de favoritos en la parte superior derecha de la pantalla de IQ. Tanto los radares como las distribuciones permiten superponer diferentes jugadores y equipos para comparar de manera rápida.

Esta es una gran actualización de nuestra plataforma y esta pequeña explicación de las opciones de diseño y nuevas visualizaciones no abarca totalmente la cantidad de cosas nuevas que los clientes pueden explorar. Como hemos señalado anteriormente, esta es la primera fase de una serie de actualizaciones en diferentes fases que permitirán a los clientes opciones de personalización adicionales en la forma en que pueden visualizar y analizar la información en StatsBomb IQ.

¡Gracias por la atención!

- Ted Knutson CEO de StatsBomb