2021

¿Qué ocurrió en StatsBomb Evolve? Y cómo verlo en diferido

By StatsBomb | marzo 23, 2021
2021

¿Qué ocurrió en StatsBomb Evolve? Y cómo verlo en diferido

Cuando creas algo nuevo y revolucionario, quieres contárselo a todo el mundo. Eso es lo que hicimos en StatsBomb Evolve el 17 de marzo. Queríamos poner al día a todos nuestros amigos y a la comunidad de la mayor parte de las cosas que han estado cocinándose a puerta cerrada en StatsBomb.

Ted Knutson, CEO y fundador, abrió el evento con una reflexión sobre las razones que llevaron a StatsBomb a existir.

Frustrados por la falta de innovación y progreso en el campo, StatsBomb fue fundada en 2018 como proveedor de datos. Ted explicó varias anécdotas sobre datos de baja calidad y proveedores con una atención al cliente cuestionable. Así, en StatsBomb decidimos hacerlo nosotros mismos. Con ello trajimos todas las innovaciones que hoy son puntos clave de nuestro feed de datos - presiones, nuestros Freeze Frames, altura y pie de los pases, altura de remate, etc.

Todas estas cosas importaban entonces y lo siguen haciendo hoy, creando una ventaja competitiva para nuestros clientes en análisis de juego, evaluación de jugadores y a encontrar mejores respuestas para tomar decisiones. ¿Y qué es lo nuevo entonces? El nuevo producto de StatsBomb es obra de mucha gente inteligente que ha trabajado conjuntamente durante meses y ahora está disponible para todo el mundo.

Presentamos StatsBomb 360

StatsBomb 360 son datos de evento contextuales.

¿Qué significa esto?

Ahora tenemos la posición de todos los jugadores en el campo en más de 3,300 eventos por partido Con 360 vamos a poder responder a preguntas que los analistas siempre han querido saber pero era imposible de responder con los datos existentes.

¿Quieres saber qué jugadores rompen líneas de manera más habitual?

Ahora puedes ¿Quieres encontrar jugadores que sean capaces de recibir entre líneas y girarse?

Ahora puedes. ¿Evaluar la toma de decisiones de los jugadores en función de las opciones de pase disponibles?

Sí, eso también.

Y esto es sólo a nivel individual.

A nivel colectivo, podemos analizar la estructura defensiva en miles de eventos, identificar qué patrones de juego desestabilizan la organización defensiva, y obtener una imagen clara de qué espacios existen entre líneas o en diferentes momentos de juego. Estos son solo varios ejemplos, la realidad es que aún no somos conscientes de la infinidad de posibilidades que se abren ahora.

Nosotros mismos estamos generando nuevas ideas día a día. Lo que es evidente es que esto crea de manera inmediata una nueva ventaja competitiva en scouting y análisis de equipos para aquellos que usan estos datos.

A continuación una selección de diapositivas de la charla de Ted:

Pero esto no es todo en lo que hemos estado trabajando. Nuestro Responsable de Datos Ali Elfakharany hizo un recorrido a través de algunas de las cosas que estamos cocinando y estarán en producción pronto. Además, detalló los retos que hemos tenido que ir superando estos años.

En primer lugar, Ali confirmó que habrá StatsBomb Live - datos en tiempo real en un futuro no lejano. Los datos en tiempo real ha sido uno de los productos más demandados desde el día 1 de StatsBomb.

Con utilidad obvia para diferentes agentes en la industria, desde clubes a medios de comunicación nuestro énfasis en ofrecer la mayor calidad de datos en tiempo real sigue siendo una de las prioridades. Os mantendremos informados.

Uno de los retos principales para nuestro equipo de recolección ha sido cómo llevar a cabo el proceso de recogida de datos que lleva varias horas en los datos post-partido debido al nivel de precisión y detalle que exigimos en tiempo real en los datos en directo. Ali, explicó cómo StatsBomb incorpora un proceso de recolección híbrido combinando Computer Vision con recolección manual para tener el mejor equilibrio entre calidad y velocidad.

Humanos y ordenadores conjuntamente siempre producen mejores resultados que cada uno de ellos independientemente.

A continuación una selección de diapositivas de la charla de Ali:

Nuestro responsable de Operaciones Hesham Abozekry fue el siguiente en tomar la palabra y extendió el tema anterior, proporcionando más contexto e información sobre cómo StatsBomb consigue mantener la mayor calidad y precisión en los datos de la industria.

La recolección de datos no es blanco o negro, en muchos casos, los eventos pueden ser interpretados de dos o tres maneras diferentes. El mayor reto por tanto no es conseguir una definición universal, sino asegurar consistencia entre todos los eventos, partidos y competiciones. Hesham describió los dos procesos de revisión principales que se llevan a cabo en StatsBomb para asegurar que la calidad sea la más alta.

Por un lado, un proceso automático basado en reglas específicas que alerta de cualquier inconsistencia en la sintaxis lógica, ya sea muy improbable o directamente imposible, para una revisión inmediata.

Por otro lado, el Active Review, una selección de partidos son recolectados dos veces por recolectores diferentes y posteriormente ambos feeds son comparados por un miembro del equipo de resolución que evalúa los posibles conflictos y toma una decisión sobre cuál es correcto y el grado de error.

Estos procesos no son sólo valiosos para mantener la precisión pero también para identificar las áreas de mayor subjetividad en la recolección y buscar reducir lo mayor posible ese factor.

A continuación una selección de diapositivas de la charla de Hesham:

Finalmente, Dinesh Vatvani, responsable de Data Science en StatsBomb, dio la última presentación del día, donde detalló los modelos e investigaciones en los que ha estado trabajando el equipo de Data Science de StatsBomb. La novedad principal fue el modelo de possession value de StatsBomb, llamado On-Ball Value (OBV), que otorga un valor a cada evento durante un partido en función del cambio en la probabilidad de que el equipo marque o conceda.

OBV representa una mejora significativa respecto a los modelos de possession value anteriores y estará disponible a los clientes de StatsBomb mediante nuestra plataforma de análisis StatsBomb IQ en las próximas semanas.

Dinesh detalló las diferentes iteraciones del modelo, el uso de estados de posesión en lugar de acciones, argumentó por la exclusión de factores relativos a la posesión como proxy del posicionamiento defensivo para eliminar sesgos relativos al nivel de los equipos, etc... Además, nuevamente en este sentido los datos más detallados de StatsBomb proporcionan ventajas evidentes en el entrenamiento de modelos de possession value.

A continuación una selección de diapositivas de la charla de Dinesh:

Finalmente, Ted respondió a preguntas de los asistentes sobre 360, competiciones a cubrir, y sobre la posibilidad de aportar datos gratuitos en el futuro.


 

StatsBomb Evolve está disponible para ver en diferido aquí. Y StatsBomb 360 no es algo del futuro, está disponible ya mismo. Si eres un club de fútbol, organización deportiva o medio de comunicación y quieres ponerte en contacto con nosotros puedes hacerlo ya mismo aquí.