2020

StatsBomb lanza un modelo de Goles Esperados con Shot Impact Height

By Ted Knutson | agosto 3, 2020
2020

StatsBomb lanza un modelo de Goles Esperados con Shot Impact Height

El modelo de Goles Esperados (xG) de StatsBomb siempre ha sido un poco diferente. Cuando StatsBomb Data se lanzó en 2018, el objetivo era acercar más los datos de fútbol a lo realmente pasa en el campo de juego.

Desde el principio, añadimos la posición del portero y de los defensores en cada tiro de cada liga que recogemos. Esta aparente pequeña mejora ha resultado en mejoras sustanciales en los valores de xG cuando hay mucha gente en el área de penalti y especialmente cuando el portero está fuera de posición.

Con los mejores valores de xG, acciones de presión, información sobre el pie con el que se realizan todos los pases y muchos otros factores diferenciales, no es de extrañar que StatsBomb Data se ha convertido en la opción preferida para equipos inteligentes, federaciones y jugadores de todo el mundo.

Nuestros datos son más precisos no sólo en cuanto a dónde ocurren los eventos en el campo, y en qué orden, sino que también en cuanto a cuándo ocurren. Esto significa que los datos de StatsBomb son más fáciles de integrar con los datos de tracking que los de cualquier otro proveedor de datos de evento en el mercado.

Sin embargo, el mundo de los datos deportivos es un ámbito competitivo y cada año nos esforzamos por mejorar nuestro producto. La temporada pasada, hicimos dos grandes mejoras en la información que recogemos en relación con los tiros:

  • Nuestro Freeze Frame (un imagen del momento en que se realiza el tiro, que muestra la posición del portero y tanto de los atacantes como de los defensores) se recoge mediante visión por ordenador. Esto nos da mejor información sobre la posición tanto del balón como de los jugadores que nunca antes.
  • Añadimos algo que llamamos Shot Impact Height (SIH) a los datos de los tiros. En breve, el Shot Impact Height es la altura (o la coordenada z) del balón en el momento en que se realiza el tiro.

¿Por qué recoger el Shot Impact Height? Porque mirando el juego desde una perspectiva futbolística, parecía que podía haber una diferencia entre un tiro de cabeza realizado con el balón a la altura de la cabeza frente a uno realizado con el balón 40 cm más alto que solamente roza la parte superior de la cabeza. O una volea realizada cerca del suelo frente a una realizada a la altura del pecho.

Lo interesante es que no sabíamos nada de esto cuando empezamos a recoger los datos. Simplemente añadimos las características al proceso de recogida y este verano las revisamos para investigar más.

¿Qué hemos aprendido?

Esta nueva información apenas cambia los valores de xG en la mayoría de los tiros ya que el modelo ya incluía la altura del pase previo el tiro. Siempre hemos recogido la altura de los pases y esa información formaba parte de nuestro modelo de xG. Esto significaba que ya había alguna información sobre la potencial altura de impacto de los tiros incorporada en el modelo, por lo que la mayoría de los valores de xG no han cambiado.

Sin embargo... en algunos tiros, la adición del Shot Impact Height ha hecho una diferencia significativa. Estos tiros son en gran parte ellos en los que el modelo no conoce la altura del balón porque los tiros se realizan después de un evento que no es un pase, como un rebote, el control del jugador, la segunda jugada de una acción a balón parado... lo que sea. En esos tiros, la adición de la altura de impacto del tiro hace una diferencia significativa.

Aquí están los pensamientos de nuestro CTO, Thom Lawrence:

Nuestra esperanza era que la inclusión de la altura de impacto mejoraría el modelo en algunos casos de borde, especialmente en aquellos que requieren saltos particularmente majestuosos o posiciones corporales difíciles. Aunque esta adición no proporciona un gran salto en la precisión general del modelo, existen muchos tiros cuyos nuevos valores parecen más precisos cuando consultamos el vídeo.

Por ejemplo, este tiro del Ajaccio contra el Caen previamente tenía un valor de ~0.6 xG. Hay dos defensores presionando el tiro, pero es un remate de pie dentro del área pequeña con el portero completamente fuera de posición.

Sin embargo, viendo el vídeo podemos ver que el punto de impacto es a la altura de la cintura.

Eso significa que el tiro es mucho más difícil de ejecutar. El jugador realizó el tiro pero no de manera limpia. El modelo identifica la altura de impacto como un factor significativo en su predicción aquí, y el nuevo valor es de ~0.3 xG.

Como curiosidad, señalar que la altura de impacto no sólo tiene un efecto negativo en el xG de los tiros difíciles. Asimismo, tiene un efecto positivo en algunos tiros. Por ejemplo, una altura de impacto de cero, es decir, con el balón en el suelo, puede ser a veces muy útil para detectar grandes ocasiones. Vemos mejoras en esas ocasiones a través del conjunto de datos.

Más ejemplos

xG anterior: 0.65
xG con SIH: 0.35

xG anterior: 0.40
xG con SIH: 0.20

xG anterior: 0.54
xG con SIH: 0.29

xG anterior: 0.67
xG con SIH: 0.47

Esto es similar al efecto de tener la posición del portero en cada tiro. En la gran mayoría de los tiros en los que el portero está en una posición normal, tener su posición tiene un valor nominal. Sin embargo, en los tiros en los que el portero está fuera de posición, la diferencia entre tener o no tener su posición es enorme.

Ejemplos del efecto de la posición del portero

xG sin la posición del portero: 0.48
StatsBomb xG: 0.82

xG sin la posición del portero: 0.27
StatsBomb xG: 0.74

Al igual que tener la posición del portero, tener el SIH en el modelo refleja con más precisión el valor de xG para cada tiro. Cada mejora en la recogida de datos nos acerca a reflejar de manera más completa lo que está sucediendo en el campo de juego.

Conclusiones

  • Tiros desde el suelo son más valiosos de lo que pensábamos antes.
  • Shot Impact Height tiene un impacto considerable en un subconjunto de tiros que no se realizan inmediatamente después de un pase.
  • La posición del portero, la altura del pase y el Shot Impact Height combinan para mejorar de manera significante los modelos de goles esperados y reducir los errores en los casos atípicos.
  • Realmente importa tener datos más detallados y de mejor calidad.
  • Deberías comprar los datos de StatsBomb porque son los mejores.

Si quieres saber más sobre lo que StatsBomb puede hacer por ti, envía un email a Sales@StatsBomb.com

-- Ted Knutson
CEO, StatsBomb