El modelo de Goles Esperados (xG) de StatsBomb siempre ha sido un poco diferente. Cuando StatsBomb Data se lanzó en 2018, el objetivo era acercar más los datos de fútbol a lo realmente pasa en el campo de juego. Desde el principio, añadimos la posición del portero y de los defensores en cada tiro de cada liga que recogemos. Esta aparente pequeña mejora ha resultado en mejoras sustanciales en los valores de xG cuando hay mucha gente en el área de penalti y especialmente cuando el portero está fuera de posición.
Con los mejores valores de xG, acciones de presión, información sobre el pie con el que se realizan todos los pases y muchos otros factores diferenciales, no es de extrañar que StatsBomb Data se ha convertido en la opción preferida para equipos inteligentes, federaciones y jugadores de todo el mundo.
Nuestros datos son más precisos no sólo en cuanto a dónde ocurren los eventos en el campo, y en qué orden, sino que también en cuanto a cuándo ocurren. Esto significa que los datos de StatsBomb son más fáciles de integrar con los datos de tracking que los de cualquier otro proveedor de datos de evento en el mercado.
Sin embargo, el mundo de los datos deportivos es un ámbito competitivo y cada año nos esforzamos por mejorar nuestro producto. La temporada pasada, hicimos dos grandes mejoras en la información que recogemos en relación con los tiros:
¿Por qué recoger el Shot Impact Height? Porque mirando el juego desde una perspectiva futbolística, parecía que podía haber una diferencia entre un tiro de cabeza realizado con el balón a la altura de la cabeza frente a uno realizado con el balón 40 cm más alto que solamente roza la parte superior de la cabeza. O una volea realizada cerca del suelo frente a una realizada a la altura del pecho.
Lo interesante es que no sabíamos nada de esto cuando empezamos a recoger los datos. Simplemente añadimos las características al proceso de recogida y este verano las revisamos para investigar más.
¿Qué hemos aprendido?
Esta nueva información apenas cambia los valores de xG en la mayoría de los tiros ya que el modelo ya incluía la altura del pase previo el tiro. Siempre hemos recogido la altura de los pases y esa información formaba parte de nuestro modelo de xG. Esto significaba que ya había alguna información sobre la potencial altura de impacto de los tiros incorporada en el modelo, por lo que la mayoría de los valores de xG no han cambiado.
Sin embargo... en algunos tiros, la adición del Shot Impact Height ha hecho una diferencia significativa. Estos tiros son en gran parte ellos en los que el modelo no conoce la altura del balón porque los tiros se realizan después de un evento que no es un pase, como un rebote, el control del jugador, la segunda jugada de una acción a balón parado... lo que sea. En esos tiros, la adición de la altura de impacto del tiro hace una diferencia significativa.
Aquí están los pensamientos de nuestro CTO, Thom Lawrence:
Nuestra esperanza era que la inclusión de la altura de impacto mejoraría el modelo en algunos casos de borde, especialmente en aquellos que requieren saltos particularmente majestuosos o posiciones corporales difíciles. Aunque esta adición no proporciona un gran salto en la precisión general del modelo, existen muchos tiros cuyos nuevos valores parecen más precisos cuando consultamos el vídeo.
Por ejemplo, este tiro del Ajaccio contra el Caen previamente tenía un valor de ~0.6 xG. Hay dos defensores presionando el tiro, pero es un remate de pie dentro del área pequeña con el portero completamente fuera de posición.
Sin embargo, viendo el vídeo podemos ver que el punto de impacto es a la altura de la cintura.
Eso significa que el tiro es mucho más difícil de ejecutar. El jugador realizó el tiro pero no de manera limpia. El modelo identifica la altura de impacto como un factor significativo en su predicción aquí, y el nuevo valor es de ~0.3 xG.
Como curiosidad, señalar que la altura de impacto no sólo tiene un efecto negativo en el xG de los tiros difíciles. Asimismo, tiene un efecto positivo en algunos tiros. Por ejemplo, una altura de impacto de cero, es decir, con el balón en el suelo, puede ser a veces muy útil para detectar grandes ocasiones. Vemos mejoras en esas ocasiones a través del conjunto de datos.
Más ejemplos
xG anterior: 0.65
xG con SIH: 0.35
xG anterior: 0.40
xG con SIH: 0.20
xG anterior: 0.54
xG con SIH: 0.29
xG anterior: 0.67
xG con SIH: 0.47
Esto es similar al efecto de tener la posición del portero en cada tiro. En la gran mayoría de los tiros en los que el portero está en una posición normal, tener su posición tiene un valor nominal. Sin embargo, en los tiros en los que el portero está fuera de posición, la diferencia entre tener o no tener su posición es enorme.
Ejemplos del efecto de la posición del portero
xG sin la posición del portero: 0.48
StatsBomb xG: 0.82
xG sin la posición del portero: 0.27
StatsBomb xG: 0.74
Al igual que tener la posición del portero, tener el SIH en el modelo refleja con más precisión el valor de xG para cada tiro. Cada mejora en la recogida de datos nos acerca a reflejar de manera más completa lo que está sucediendo en el campo de juego.
Conclusiones
Oh... y vamos a ofrecer datos en vivo esta temporada. Estén atentos.
Si quieres saber más sobre lo que StatsBomb puede hacer por ti, envía un email a Sales@StatsBomb.com
-- Ted Knutson
CEO, StatsBomb