Previa de la final de la Copa Libertadores 2021: Flamengo vs. Palmeiras

El Flamengo y el Palmeiras son los dos últimos ganadores de la Copa Libertadores y uno de ellos volverá a levantar el trofeo cuando se enfrenten en la final de la edición de 2021 en Montevideo el sábado. Es la segunda final consecutiva entre dos equipos brasileños, en este caso entre dos que provienen de los dos principales ciudades del país: Rio de Janeiro y São Paulo.

Es probable que ambos equipos terminen la temporada de la Serie A entre los tres primeros de la clasificación, aunque sólo el Flamengo aún tiene la oportunidad de luchar con el Atlético Mineiro por el título, y aunque el Flamengo ha sido el mejor equipo según tanto los resultados como los números subyacentes, la diferencia no es tan grande como para pensar que el resultado de la final ya está cantado.

El Flamengo es un equipo que apuesta por el balón, construyendo juego desde atrás con pases cortos y dominando la posesión en sus partidos. En promedio, tiene un 60% del balón, cuatro puntos porcentuales más que cualquier otro equipo. La cifra del Palmeiras es mucho más cerca de un 50% y es un equipo más directo, con una longitud media de pase que figura entre las más largas de la liga.

Esta diferencia queda evidente cuando echamos un ojo a las zonas del campo desde las que los dos equipos generan más peligro. Con la ayuda de nuestro nuevo modelo On-Ball Value (en adelante, OBV), un modelo que mide el cambio en la probabilidad de un equipo de marcar/conceder como resultado de una acción dada, podemos visualizar los sectores del campo desde las que los dos equipos generan más valor respecto a la media de la liga.

El Flamengo es mucho más activo en las zonas centrales, sobre todo en los pasillos interiores del último tercio donde crea la mayoría de sus ocasiones. Desde la izquierda, los pases incisivos de Giorgian de Arrascaeta y las conducciones directas de Michael son las acciones que agregan más valor; desde la derecha, los pases del delantero centro Gabriel Barbosa.

Barbosa, que marcó el doblete en los dramáticos momentos finales de la final de 2019 contra el River Plate que le dio la Libertadores al Flamengo, juega como el único delantero centro en el esquema de Renato Gaucho y es el máximo goleador del equipo en la Libertadores con 10 tantos. Sin embargo, no es su única amenaza goleadora. El Flamengo tiene los mejores números atacantes de la Serie A tanto reales como subyacentes, además de haber marcado una media de 2.75 goles por partido en la Libertadores, y Bruno Henrique y Michael también han marcado más de 10 goles de liga.

En cuanto a la tarea de hacer llegar el balón al ataque, es Filipe Luís que sobresale. El ex-lateral del Atlético Madrid es mucho más activo en zonas interiores que la gran mayoría de los laterales de la Serie A y lidera tanto su equipo como la liga en incursiones en el último tercio (mediante pases o conducciones), distancia avanzada en campo contrario y con las acciones directamente relacionadas a los tiros eliminadas del cálculo, OBV. Aún a sus 36 años, tiene un papel muy importante en el equipo.

En lo que se refiere al avance del balón, hay una balanza más igualada entre los dos lados del campo en el Palmeiras, con los pases y las conducciones de Dudu desde la banda izquierda acoplados con las subidas del lateral Marcos Rocha, o su suplente Gabriel Menino, por la derecha. Más atrás, Luan figura entre los centrales de la Serie A que más valor agregan con sus pases según OBV.

Sin embargo, es desde la derecha que el equipo de Abel Ferreira crea la mayoría de sus ocasiones. El cuadro de rojo oscuro dentro del área en el gráfico de arriba de OBV representa las aportaciones de Rocha, el delantero Rony y el mediapunta o extremo Gustavo Scarpa.

Scarpa es el jugador del Palmeiras que más tiros ha realizado y más ocasiones ha creado (ambos por cada 90 minutos en el campo) en la liga brasileña esta temporada y ha sumado tres goles (sin contar penaltis) y 11 asistencias. Asimismo, ha acumulado la cifra más alta de OBV por 90 entre todos los jugadores de la Serie A que han disputado al menos 900 minutos. Sin embargo, no ha jugado tanto en la Libertadores y es probable que empiece la final desde el banquillo.

Con la baja probable de Luiz Adriano, lesionado, es probable que Rony sea el elegido para ocupar el puesto de delantero centro en una formación que podría variar entre un 4-2-3-1 y un 3-4-2-1 en línea con el posicionamiento de Felipe Melo, aún jugando a sus 38 años. En liga, Rony ha jugado más en banda que la temporada pasada, lo que ha supuesto una bajada consecuente en su producción de tiros y goles, pero es el máximo goleador del equipo en la Libertadores con seis goles, 0.78 por cada 90 minutos en el campo.

En defensa, siguen las diferencias entre los equipos. El Flamengo no sólo defiende más lejos de su portería que cualquier otro equipo de la Serie A sino también figura entre los equipos más agresivos a la hora de intentar recuperar el balón, sobre todo tras pérdida.

En cambio, el Palmeiras defiende más cerca de su portería que la media de la liga y es claramente menos activo en campo contrario.

Dicho esto, ambos equipos parecen igualmente eficientes cuando se trata de convertir las recuperaciones de balón en ocasiones de gol. Ambos figuran entre los equipos que más tiros realizan y más goles marcan en los 20 segundos posteriores a una recuperación.

El Flamengo y el Palmeiras ya se han enfrentado dos veces en la liga brasileña este año, y el ganador en ambas ocasiones ha sido el Flamengo. Dominó en una victoria por 1-0 en casa en el primer partido de la temporada y otra vez, por 3-1, en el estadio del Palmeiras hace dos meses en un encuentro que fue más igualado en cuanto a la cantidad y calidad de ocasiones.

El Flamengo es el ganador más probable de la final, pero el Palmeiras, el campeón vigente, ya ha eliminado dos equipos brasileños para llegar a este punto y hará que sea un partido competitivo.

Datos gratuitos: La Euro 2020 con StatsBomb 360

La semana pasada, agregamos los datos de la última temporada de Lionel Messi en el Barcelona a nuestra base de datos gratuitos. Esta semana, tenemos algo muy especial para la comunidad de analistas e investigadores: datos gratuitos de la Euro 2020, y no solo los datos de evento normales sino también toda la información adicional que proporciona nuestro nuevo producto StatsBomb 360.

¿Qué es StatsBomb 360?

StatsBomb 360 es la próxima revolución en los datos de evento de fútbol. Ya revolucionamos la industria en 2018 con el lanzamiento de StatsBomb Data y la inclusión de una imagen de cada tiro, un freeze frame, que nos proporciona la posición tanto del portero como de los atacantes y defensores en el momento del tiro. Con StatsBomb 360, recogemos un freeze frame para todos los eventos en un partido, mostrando la posición de todos los jugadores en la pantalla. Esta información adicional abre muchas posibilidades de análisis, cosas como:

  • Pases que rompen líneas
  • Recepciones entre líneas, al pie, o al espacio
  • Distancia respecto a los defensores
  • Líneas de pase abiertas… ¡y cerradas!
  • Defensive Island Events (DIEs) - cuando equipos crean situaciones de 1v1 donde los defensores están sin coberturas/ayudas cercanas
  • Formación defensiva en cada evento

Esto solo es la punta del iceberg. Nuestros clientes ya han empezado a analizar y sacar provecho de la esta nueva información y nosotros mismos estamos generando nuevas ideas día a día.

Ahora, vosotros tenéis la oportunidad de investigar los datos y hacer su propio análisis.

Cabe mencionar que si solo queréis aprovechar de los datos de evento normales de la Euro 2020 podéis hacerlo sin problema alguno. Podéis usar nuestra guía vigente sobre el uso de StatsBomb Data en R, utilizar nuestra herramienta de Python, statsbombpy, para acceder a los datos o buscar en la web una de las varias guías escritas por gente de la comunidad.

Pero aquí, os daremos el código del software de programación R para empezar a trabajar con los datos de StatsBomb 360. Os mostraremos como encontrar los Freeze Frame de StatsBomb 360, combinarlos con los datos de evento normales, utilizarlos para calcular la cantidad de atacantes y defensores en el área en todos los centros de la Euro 2020 y finalmente, hacer un plot de un centro dado con las localizaciones de todos los jugadores en la pantalla.

Antes de nada, hay que actualizar el paquete StatsBombR para tener acceso a las nuevas funciones relacionadas a StatsBomb 360: get.360matchFree y free_allevents_360.

Ya con esto hecho podemos empezar el proceso de importación. Primero, importamos los datos de evento normal de la Euro 2020.

library(tidyverse)
library(StatsBombR)

Comp <- FreeCompetitions() %>%
filter(competition_id==55 & season_id==43)

Matches <- FreeMatches(Comp)

events <- free_allevents(MatchesDF = Matches, Parallel = T)

events = allclean(events)

events = get.opposingteam(events)

Luego, importamos los datos de StatsBomb 360, los combinamos con los datos normales y guardamos este conjunto de datos para uso futuro.

datos360 <- free_allevents_360(MatchesDF = Matches, Parallel = T)

datos360 = datos360 %>% rename(id = event_uuid)

events = events %>% left_join(datos360, by = c("id" = "id"))

events = events %>% rename(match_id = match_id.x) %>% select(-match_id.y)

save(events, file = "Euro_2020_con_360.RData")

Con el conjunto de datos guardado, ahora lo utilizaremos para encontrar los 10 centros de la Euro 2020 en los que habían más atacantes en el área.

Primero, reducimos la cantidad de eventos con los que estamos trabajando para allanar un poco el próximo proceso, filtrando los eventos para incluir solo a los pases.

ffs = events %>%
group_by(team.name) %>%
filter(type.name=="Pass") %>%
select(id, match_id, team.name, OpposingTeam, player.name, type.name, minute, second, location.x, location.y, pass.end_location.x, pass.end_location.y, pass.type.name, pass.cross, freeze_frame)

Luego, desplegamos los freeze frame para tener las localizaciones de los jugadores en cada uno de ellos en el mismo dataframe que los eventos a las que se relacionan.

ffs = ffs %>% unnest(freeze_frame) %>%
mutate(ff_location.x = (map(location, 1)), ff_location.y = (map(location, 2))) %>%
select(-location) %>%
mutate(ff_location.x = as.numeric(ifelse(ff_location.x == "NULL", NA, ff_location.x)), ff_location.y = as.numeric(ifelse(ff_location.y == "NULL", NA, ff_location.y)))

Finalmente, filtramos otra vez para incluir solo a los centros en juego dinámico que acabaron en el área de penalti y calculamos la cantidad de atacantes y defensores en el área en cada uno de ellos. Luego, ordenamos los centros por la cantidad de atacantes en el área y hacemos una lista de los 10 centros en los que habían más atacantes en el área.

centros = ffs %>%
filter(pass.end_location.x>102 & pass.end_location.y>18 & pass.end_location.y<62) %>%
filter(is.na(pass.type.name) | pass.type.name=="Recovery" | pass.type.name=="Interception")%>%
filter(pass.cross==TRUE) %>%
filter(keeper==FALSE) %>%
group_by(team.name, OpposingTeam, id) %>%
summarise(atacantes = sum(teammate==TRUE & actor==FALSE & ff_location.x>102 & ff_location.y>18 & ff_location.y<62, na.rm = TRUE), defensores = sum(teammate==FALSE & ff_location.x>102 & ff_location.y>18 & ff_location.y<62, na.rm = TRUE), ata_v_def = atacantes-defensores) %>%
ungroup() %>%
arrange(desc(atacantes)) %>%
slice(1:10)

El resultado:

Ahora, haremos un plot de las localizaciones de los jugadores tanto del equipo atacante como del equipo defensivo en uno de estos centros.

Primero, filtramos para incluir solo al centro con más atacantes en el área (Polonia vs. Suecia), cogiendo el id de este centro del dataframe previo, y creamos una nueva columna para nombrar los cuatro tipos de jugador: el que realiza el centro, un compañero de este jugador, un jugador rival o el portero rival.

chart = ffs %>%
filter(id=="57074cd6-5525-49d5-8528-be4bfb329e9b") %>%
mutate(tipo_de_jugador = case_when(actor==TRUE & teammate==TRUE ~ "Activo", teammate==TRUE ~ "Compañero", teammate==FALSE & keeper==FALSE ~ "Rival", keeper==TRUE & teammate==FALSE ~ "Portero"))

De ahí, podemos hacer el plot.

ggplot() +
annotate("rect",xmin = 0, xmax = 120, ymin = 0, ymax = 80, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 0, xmax = 60, ymin = 0, ymax = 80, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 18, xmax = 0, ymin = 18, ymax = 62, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 102, xmax = 120, ymin = 18, ymax = 62, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 0, xmax = 6, ymin = 30, ymax = 50, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 120, xmax = 114, ymin = 30, ymax = 50, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 120, xmax = 120.5, ymin =36, ymax = 44, fill = NA, colour = "black", size = 0.6) +
annotate("rect",xmin = 0, xmax = -0.5, ymin =36, ymax = 44, fill = NA, colour = "black", size = 0.6) +
annotate("segment", x = 60, xend = 60, y = -0.5, yend = 80.5, colour = "black", size = 0.6)+
annotate("segment", x = 0, xend = 0, y = 0, yend = 80, colour = "black", size = 0.6)+
annotate("segment", x = 120, xend = 120, y = 0, yend = 80, colour = "black", size = 0.6)+
theme(rect = element_blank(),
line = element_blank()) +
# add penalty spot right
annotate("point", x = 108 , y = 40, colour = "black", size = 1.05) +
annotate("path", colour = "black", size = 0.6, x=60+10*cos(seq(0,2*pi,length.out=2000)), y=40+10*sin(seq(0,2*pi,length.out=2000)))+
# add centre spot
annotate("point", x = 60 , y = 40, colour = "black", size = 1.05) + annotate("path", x=12+10*cos(seq(-0.3*pi,0.3*pi,length.out=30)), size = 0.6, y=40+10*sin(seq(-0.3*pi,0.3*pi,length.out=30)), col="black") +
annotate("path", x=107.84-10*cos(seq(-0.3*pi,0.3*pi,length.out=30)), size = 0.6, y=40-10*sin(seq(-0.3*pi,0.3*pi,length.out=30)), col="black") +
geom_point(data = chart, aes(x = ff_location.x, y = ff_location.y, fill=tipo_de_jugador), size = 6, alpha = 0.8, shape=21) + #3
theme(axis.text.x=element_blank(),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
plot.caption=element_text(size=13,family="Source Sans Pro", hjust=0.5, vjust=0.5),
plot.subtitle = element_text(size = 18, family="Source Sans Pro", hjust = 0.5),
axis.text.y=element_blank(), legend.position = "top",
legend.title=element_text(size=18,family="Source Sans Pro"),
legend.text=element_text(size=16,family="Source Sans Pro"),
legend.margin = margin(c(20, 10, -65, 50)),
legend.key.size = unit(1.5, "cm"),
plot.title = element_text(margin = margin(r = 10, b = 10), face="bold",size = 24, family="Source Sans Pro", colour = "black", hjust = 0.5),
legend.direction = "horizontal",
axis.ticks=element_blank(),
aspect.ratio = c(65/100),
plot.background = element_rect(fill = "white"),
strip.text.x = element_text(size=13,family="Source Sans Pro")) +
labs(title = "El centro de la Euro 2020 con más atacantes en el área", subtitle = "Przemysław Frankowski, Polonia vs. Suecia, 23/06/2021",
caption = "Creado con los datos gratuitos de StatsBomb\n https://github.com/statsbomb/open-data") +
coord_flip(xlim = c(85, 125))

Con este resultado:

Este código solo representa un punto de partida para investigaciones más profundas. Incluso con un cambio sencillo de los filtros para incluir a diferentes variables, podéis crear algo distinto. Tenemos muchas ganas de ver lo que vosotros haréis con estos datos.

Si necesitáis un poco de inspiración, varios académicos y analistas presentaron sus investigaciones con StatsBomb 360 en la StatsBomb Conference 2021. Podéis ver los videos (en inglés) en nuestro canal de Youtube o leer los artículos de investigación (también en inglés) aquí.

StatsBomb anuncia acuerdo con el Borussia Dortmund

StatsBomb, el proveedor de datos avanzados de fútbol líder en la industria, ha llegado a un acuerdo con el Borussia Dortmund, uno de los clubes más innovadores en Europa.

El Borussia Dortmund se beneficiará de los datos y modelos más precisos disponibles, así como la plataforma de análisis StatsBomb IQ, incrementando así su capacidad de identificar jugadores, analizar a los rivales y evaluar su propio rendimiento.

Ismail Tari, Responsable de Negocio en Alemania de StatsBomb, dijo:

"Estamos encantados de firmar este acuerdo con uno de los clubes más reconocidos por su gran gestión. El Borussia Dortmund tiene un sólido historial en hacer cosas de manera inteligente y nuestra intención es ayudarles a seguir por ese camino con el acceso a los mejores datos y herramientas de análisis disponibles."

Kai-Norman Schulz, Responsable de Tecnología Deportiva en el Borussia Dortmund, dijo:

"Siempre intentamos ser innovadores y aplicar las mejores soluciones disponibles en nuestro día a día. Por ello, estamos encantados de trabajar con StatsBomb, una empresa que está desarrollando un enfoque muy interesante en relación a las estadísticas avanzadas y el eventing. Esperamos que nuestra colaboración sea un éxito."

Sobre StatsBomb

StatsBomb es el proveedor de datos avanzados y herramientas de análisis con mayor crecimiento en el mundo del deporte. Fundado por Ted Knutson, StatsBomb nace  con el propósito de potenciar a los analistas con el acceso a la mejor base de datos de fútbol en el mundo.

StatsBomb comenzó  como un blog de análisis de datos, posteriormente se transformó en una consultoría para clubes profesionales. En 2018, frustrados con las limitaciones de los datos disponibles en ese momento, StatsBomb adquirió ArqamFC, una empresa de recolección de datos con sede en El Cairo, Egipto, y comenzó a recoger y producir sus propios datos.

El lanzamiento de los datos de StatsBomb representó un antes y un después en el campo del análisis en fútbol incorporando información y métricas totalmente novedosas como acciones de presión, freeze frames con la posición del portero, los defensores y los atacantes en cada tiro, altura de remate, y aspectos relativos al tipo de pase.

En 2021, se ha dado un paso más con el lanzamiento de StatsBomb 360 que proporciona la posición de todos los jugadores en el frame en cada uno de los más de 3.400 eventos que se recogen en cada partido.

StatsBomb ha ganado rápidamente terreno en la industria y hoy en día trabaja con clubes profesionales y otras entidades de fútbol de más de 25 países.

Datos gratuitos: La última temporada de Lionel Messi en el Barcelona

En StatsBomb estamos comprometidos a apoyar la comunidad de analistas e investigadores de datos de fútbol y fomentar nuevas investigaciones y análisis. Es por eso que ofrecemos de manera gratuita acceso a los datos de una selección de competiciones al público.

La selección incluye los últimos mundiales tanto masculino como femenino, la FA Women’s Super League y todos los partidos de liga de Lionel Messi. En este último, acabamos de actualizar los datos disponibles para incluir la 2020-21, la última temporada de Messi en el Barcelona. Así que ahora es posible analizar la carrera completa de Messi en el club en el que creció y en el que disfrutó de muchísimos triunfos.

Se puede encontrar aquí los detalles de cómo acceder a los datos y trabajar con ellos en el software de programación R, y aquí más ejemplos de uso, incluyendo mapas de tiros y xG asistido.

¿Sois más de Python? Se puede encontrar aquí los detalles en nuestra herramienta de Python, statsbombpy. En ambos casos, la especificación de datos es un documento imprescindible para entender la estructura de los datos y ver los nombres de las varias variables. Esta nueva temporada de datos de Messi tiene las siguientes ids:

  • competition_id: 11
  • season_id: 90

Si necesitáis un poco de inspiración, hemos escrito varios artículos en el hemos utilizado estos datos para analizar la evolución de Messi como futbolista:

Asimismo, existen muchos ejemplos de gente que han creado cosas muy interesantes con nuestros datos gratuitos:

StatsBomb firma un acuerdo con el Club América, uno de los clubes más grandes de Latinoamérica

StatsBomb, el proveedor de datos avanzados de fútbol líder en la industria, ha llegado a un acuerdo con el Club América, uno de los clubes más prestigiosos de Latinoamérica.

Club América podrá tomar decisiones con mayor información al convertirse en uno de los más de 100 clubes profesionales y federaciones alrededor del mundo que se benefician del acceso a los datos y modelos de vanguardia de StatsBomb con +3.400 eventos por partido en más de 80 competiciones.

El club mexicano se dispondrá de acceso a los datos y modelos más detallados y fiables disponibles así como la personalizable plataforma de análisis StatsBomb IQ, incrementando así su capacidad de identificar jugadores, analizar a los rivales y evaluar su propio rendimiento.

Pablo Peña Rodríguez, Responsable de Innovación en StatsBomb, dijo:

"Estamos encantados de trabajar de la mano de un club tan prestigioso como el Club América, una referencia en el fútbol mexicano y latinoamericano. La incorporación de datos avanzados para la toma de decisiones nunca ha sido tan importante como hoy en día para conseguir una ventaja competitiva en el fútbol de élite y esperamos acompañar al club en muchos éxitos."

Enrique Cházaro, Coordinador Inteligencia Deportiva en Club América, dijo:

"En el fútbol, como en todos los deportes, la tecnología y recolección de datos ha avanzado mucho en los últimos años y unos de los principales objetivos dentro del Club es siempre estar a la vanguardia tecnológica, pues pensamos que son estos detalles los que nos permitirán ganar una ventaja competitiva frente al resto de los clubes y también poder ser referentes en el continente en ésta área.

"Es por eso que poder contar ahora con StatsBomb nos va a permitir seguir con esta idea de trabajo, no tenemos duda que la información y reportes que podemos generar en esta aplicación son de la más alta calidad y van a aportar mucho en los análisis finales que hacemos al scoutear jugadores y analizar los jugadores rivales jornada a jornada."

Sobre StatsBomb

StatsBomb es el proveedor de datos avanzados y herramientas de análisis con mayor crecimiento en el mundo del deporte. Fundado por Ted Knutson, StatsBomb nace con el propósito de potenciar a los analistas con el acceso a la mejor base de datos de fútbol en el mundo.

StatsBomb comenzó  como un blog de análisis de datos, posteriormente se transformó en una consultoría para clubes profesionales. En 2018, frustrados con las limitaciones de los datos disponibles en ese momento, StatsBomb adquirió ArqamFC, una empresa de recolección de datos con sede en El Cairo, Egipto, y comenzó a recoger y producir sus propios datos.

El lanzamiento de los datos de StatsBomb representó un antes y un después en el campo del análisis en fútbol incorporando información y métricas totalmente novedosas como acciones de presión, freeze frames con la posición del portero, los defensores y los atacantes en cada tiro, altura de remate, y aspectos relativos al tipo de pase.

En 2021, se ha dado un paso más con el lanzamiento de StatsBomb 360 que proporciona la posición de todos los jugadores en el frame en cada uno de los más de 3.400 eventos que se recogen en cada partido.

StatsBomb ha ganado rápidamente terreno en la industria y hoy en día trabaja con clubes profesionales y otras entidades de fútbol de más de 25 países.