El fútbol americano es un deporte donde la potencia, la estrategia y la precisión juegan un papel fundamental. Tras la espectacularidad de los touchdowns y los placajes se esconden una serie de métricas físicas fundamentales para entender el éxito sobre el terreno de juego.
En este artículo explicaremos cómo StatsBomb calcula dichas métricas a partir de los datos de tracking, estimados mediante Inteligencia Artificial y refinados mediante un proceso de supervisión manual. Gracias a la alta calidad de las métricas resultantes, nuestros clientes pueden tomar decisiones sobre jugadores y estrategias de una forma más efectiva.
Este artículo ha sido escrito en colaboración entre Yohahn Ribeiro y Alex Palmer-Walsh, ingenieros de machine learning en StatsBomb. Traducido por Iñaki Rabanillo.
Métricas físicas a partir de video
El campo de la analítica deportiva está en continua evolución. Los entrenadores y analistas recurren cada vez con más frecuencia a métricas avanzadas que permitan un estudio más profundo de las dinámicas de juego.
La distinción de dichas métricas se ubica en su origen: se extraen a partir de las acciones de juego sobre imágenes de video. Este enfoque ofrece ciertas ventajas frente a las métricas de eventos tales como las de NFL Combine.
Las métricas de NFL Combine proporcionan datos valiosos, pero con frecuencia son obtenidas en entornos controlados que pueden no ser representativos del comportamiento de los jugadores en partidos reales. A diferencia de éstas, las métricas derivadas de video son capaces de capturar matices más sutiles en situaciones de juego real, tales como la aceleración de un jugador en una jugada específica, o su habilidad para realizar cambios de dirección a alta velocidad. De esta forma se facilita una toma de decisiones más precisa gracias a la disponibilidad de un contexto más informativo.
El video superior se corresponde con un partido entre los Kansas City Chiefs y los Buffalo Bills, el cual nos muestra cómo Tyreek Hill, gracias su ágil y veloz cambio de dirección, recibe la pelota para dejar atrás a sus oponentes.
Generar métricas para jugadores y jugadas de este tipo directamente a partir del video puede ser de gran utilidad para establecer referencias y llevar a cabo comparaciones, permitiendo así complementar los datos provenientes de NFL Combine.
¿Qué métricas físicas generamos?
En StatsBomb, investigamos y desarrollamos varias métricas avanzadas que integramos en nuestras plataformas.
Se tratan de métricas intuitivas, orientadas a proporcionar una base sólida sobre la que ir creciendo:
- Distancia total recorrida: los jugadores, gracias a su resistencia, son capaces de recorrer grandes distancias a lo largo de un partido. Esta métrica puede ser utilizada para monitorizar el estado de forma de los jugadores y determinar su capacidad para mantener su rendimiento al máximo a lo largo del encuentro.
- Distancia acumulada: esta métrica permite ir un paso más allá y medir la distancia recorrida a lo largo de distintas instancias: una jugada, una serie de jugadas, o un conjunto de partidos. De esta forma, permite medir la carga de trabajo de un jugador a lo largo de distintos periodos y establecer la capacidad para sumar al equipo a lo largo de la temporada.
- Velocidad: se trata de una métrica fundamental, no solo para medir quién es más rápido en una carrera, sino también para determinar la capacidad para alcanzar y mantener dicha velocidad sostenida. Es imprescindible para evaluar a los receptores abiertos y los backs defensivos.
- Velocidad punta: permite identificar la máxima velocidad alcanzada por un jugador a lo largo de una carrera. Resulta de particular utilidad al evaluar la explosividad que marca la diferencia en touchdowns y placajes.
- Aceleración: en un deporte que requiere de rápida reacción y toma de decisiones, la aceleración es clave. Esta métrica mide cómo de rápido un jugador en parado alcanza su velocidad punta. Permite por tanto monitorizar la agilidad y capacidad para cambiar de dirección en carrera, cualidades imprescindibles para running-backs y line-backers.
- Aceleración punta: marca la máxima aceleración alcanzada por un jugador. Puede suponer la diferencia entre los grandes jugadores y las estrellas de la liga, pues es clave a la hora de esquivar placajes o realizar carreras explosivas.
De datos espaciales de alta frecuencia a métricas de alto orden
En StatsBomb utilizamos algoritmos de Inteligencia Artificial (IA, o AI por sus siglas en inglés) y Visión por Ordenador para generar datos de seguimiento (tracking) de alta frecuencia. Estos datos son posteriormente revisados por nuestro equipo especializado de anotadores, utilizando nuestra propia plataforma de recolección.
Flujo de alto nivel en StatsBomb.
A modo de resumen, el sistema de Tracking por IA extrae cada frame del video para una determinada jugada. A continuación, procesa individualmente dichos frames, estimando la homografía de cámara y localizando los jugadores sobre el terreno de juego.
Esta información es procesada por un algoritmo de tracking que asocia los jugadores detectados para asignarles una identidad consistente a lo largo de la jugada.
Predicciones generadas via IA en nuestra app de recolección especializada en tracking.
Los tracks (trayectoria de un jugador a lo largo de la jugada) sobre el video y la homografía son combinados para estimar la posición de los jugadores a lo largo del tiempo. Más adelante publicaremos un nuevo artículo detallando el sistema de tracking.
Predicciones generadas via IA en nuestra app de recolección especializada en tracking.
El sistema de tracking genera así datos para cada frame del video. Esto nos permite calcular las métricas anteriormente descritas con alta granularidad, facilitando así el análisis a los especialistas.
Suavizando las predicciones de Tracking
Cualquier medida proporcionada por un sensor estará inevitablemente contaminada por un cierto nivel de ruido. Entendemos como ruido cualquier señal espúrea e indeseada que introduce desviaciones en la medida respecto a su valor real.
En el caso de tracking de jugadores, nuestros modelos de IA actúan como sensores, y por tanto pueden incluir un cierto grado de ruido en sus predicciones.
Dado un frame del video, el modelo IA de detección proporciona un rectángulo conteniendo al jugador. Cuando ejecutamos el modelo sobre el frame inmediatamente posterior, dicho rectángulo podría estar ligeramente desplazado con respecto al frame anterior, incluso si el jugador no se movió.
Este ligero desplazamiento de un frame a otro es lo que definimos como el ruido en la detección. Se manifiesta como una pequeña fluctuación en el rectángulo a lo largo del tiempo.
Ejemplo de ruido en la detección (rectángulo).
Para corregir el efecto del ruido, aplicamos un filtro que suaviza la trayectoria de las coordenadas x-y del jugador en el campo a lo largo del tiempo. Existen múltiple métodos de suavizado, tales como la media móvil, el filtro paso bajo o el filtro de Kalman.
Como se aprecia en la imagen inferior, la trayectoria obtenida tras el filtro de suavizado consigue eliminar la fluctuación introducida por la presencia de ruido.
Filtro de suavizado aplicado a la coordenada y de la trayectoria del jugador a lo largo del tiempo.
Es importante remarcar que en función de la configuración del filtro de suavizado se obtendrá una trayectoria u otra, que podrá desviarse en mayor o menor medida de la real. En pos de minimizar dicha desviación, estamos actualmente investigando la estrategia óptima de suavizado para obtener las medidas más fiables.
Seguimiento de jugadores
Los operadores de cámara normalmente siguen la jugada centrándose en la posición del balón, lo que implica que en ocasiones algunos jugadores desaparecen del tiro de cámara, para posteriormente reaparecer. Esto provoca discontinuidades temporales en el seguimiento de los jugadores, por lo que nuestras métricas se calculan basándose únicamente en los tramos de video donde el jugador es visible.
Ejemplos generados por StatsBomb
A continuación, se proporcionan algunos ejemplos para jugadas de larga duración utilizando los datos de tracking y las técnicas de suavizado descritas anteriormente.
Estos videos muestran las métricas calculadas a lo largo del tiempo (actualizadas frame a frame). Así mismo, las velocidades y aceleraciones para los jugadores pueden visualizarse a continuación.
Este tipo de métricas de alta frecuencia combinadas con el contexto de partido, extraídas a partir de videos y eventos, proporcionan una perspectiva más detallada del rendimiento de los jugadores. Además, estas métricas pueden monitorizarse a lo largo de una jugada, ofreciendo mayor granularidad que las métricas agregadas. Estas últimas pueden ocultar detalles relevantes al eliminar la variable temporal.
Por ejemplo, Brenton Strange tiene una gráfica de velocidad bastante peculiar al recibir un pase próximo a la línea lateral y evitar varios intentos de placaje. Esta habilidad puede resultar más útil que alcanzar la velocidad punta en una jugada.
El futuro
Como hemos visto, las métricas físicas a partir de video pueden ser de gran utilidad al proporcionar un mayor contexto en situaciónes de partido reales. En este artículo hemos explicado algunas de las métricas básicas que proporcionamos en StastBomb, así como ciertos desafíos encontrados en su estimación.
Estamos trabajando en múltiples métricas que esperamos sean de gran ayuda para nuestros clientes en sus tareas de análisis y monitorización. No obstante, nuestro siguiente paso será validar nuestro proceso de generación de métricas frente a los datos de NGS. Gracias a la colaboración de múltiples equipos, esperamos así poder garantizar y mantener un alto nivel de confianza y calidad en nuestros datos.