Bei StatsBomb haben wir uns verpflichtet, die Entwicklung der nächsten Generation von Analysten und Forschern zu fördern.
Wir wissen, dass es schwierig sein kann, Zugang zu qualitativ hochwertigen Ereignisdaten zu erhalten, und deshalb veröffentlichen wir regelmäßig kostenlose Datensätze für die Öffentlichkeit: ganze Saisons von Ligadaten, Turniere wie die Weltmeisterschaft und die Euro und sogar die Karriere von Lionel Messi.
Heute freuen wir uns, die Veröffentlichung von Ereignisdaten für die historische Saison 2023-24 von Bayer Leverkusen bekannt zu geben, die endlich den „Vizekusen“-Schriftzug losgeworden sind und unter der Leitung von Xabi Alonso den ersten Bundesliga-Titel ihrer Geschichte gewonnen haben.
Die neue Version enthält dieselben branchenführenden Ereignisdaten, die auch von unseren Kunden verwendet werden, mit rund 3.400 Ereignissen pro Spiel, einschließlich unserer exklusiven Druckdaten und Schussstandbilder sowie einzigartiger Qualifizierungsmerkmale wie Passgenauigkeit und Passhöhe.
Darüber hinaus enthält sie auch StatsBomb 360-Daten, die den Standort aller sichtbaren Spieler zum Zeitpunkt jedes Ereignisses angeben und so eine gründlichere Analyse der räumlichen Beziehungen eines der interessantesten Teams der letzten Jahre ermöglichen.
Wie man auf die Daten zugreift
Für den Zugriff auf die Daten empfehlen wir die Verwendung eines unserer speziell entwickelten Pakete für die beiden gängigsten Programmiersprachen: Python und R
Für diejenigen, die bereits mit StatsBomb-Daten gearbeitet haben, lauten die wichtigsten Informationen, die Sie für den Zugriff auf diese Version von Bayer Leverkusen benötigen, wie folgt
- competition_id: 9
- season_id: 281
Für diejenigen, die gerade erst mit der Datenanalyse beginnen, stellen wir im Folgenden eine Reihe von Downloads in den Formaten Python und R zur Verfügung, um Ihnen den Einstieg zu erleichtern, auf die Daten zuzugreifen und sie zu organisieren sowie eine einfache Visualisierung zu erstellen.
Erste Schritte
Im Internet gibt es zahlreiche Anleitungen, die Ihnen den Einstieg in Python oder R erleichtern. Wenn Sie jedoch direkt loslegen möchten, helfen Ihnen die Downloads am Ende dieses Abschnitts bei der Installation der grundlegenden Pakete, die für die Arbeit mit unseren Daten erforderlich sind.
Als Erstes benötigen Sie jedoch eine Programmierumgebung.
Für R empfehlen wir im Allgemeinen R Studio, da es die stabilste und benutzerfreundlichste Umgebung ist, aber es gibt auch andere Alternativen.
Für Python ist Google Colab die einfachste Lösung, da es eine vollständige, webbasierte Programmierumgebung für jeden mit einem Google-Konto bietet. Jupyter Notebook und Spyder sind weitere beliebte Optionen.
Sobald Sie eine Programmierumgebung eingerichtet haben, laden Sie die entsprechende Datei unten herunter, laden Sie sie in Ihre Umgebung und führen Sie den Code aus. Nun sind Sie bereit, auf die Daten zuzugreifen.
Code-Dateien:
Zugriff und Organisation der Daten
Die folgenden Dateien laden die installierten Pakete, rufen unsere kostenlose Daten-API auf, um die relevanten Daten herunterzuladen, und erstellen eine Liste der Pässe, die von jedem Spieler von Bayer Leverkusen im Laufe der Saison versucht und abgeschlossen wurden.
Die endgültige Ausgabe sollte wie folgt aussehen:
Dies ist ein grundlegender Ausgangspunkt, den Sie jedoch leicht erweitern können, indem Sie den Ereignistyp ändern, zusätzliche Filter wie z. B. die Art des Passes einbeziehen oder sogar die Ausgaben nach dem Passempfänger statt nach dem Spieler, der den Pass gespielt hat, gruppieren.
Unsere Datenspezifikation enthält detaillierte Informationen über die Struktur unserer Daten, einschließlich aller Ereignistypen und Qualifikatoren.
Code-Dateien:
Visualisierung der Daten
Die folgenden Dateien erweitern die einfache Tabelle mit den Pässen, um die Pässe herauszufiltern, die den Ball in das letzte Drittel befördern, und diese dann auf einem Fußballfeld darzustellen.
Die endgültige Ausgabe sollte wie folgt aussehen:
Wie zuvor gibt es verschiedene Möglichkeiten, diesen einfachen Code zu modifizieren, um die Pässe eines anderen Spielers anzuzeigen oder um eine andere Art von Aktion zu visualisieren, wie z. B. Pässe oder Schüsse.
Code-Dateien:
Der vollständige Code
Hier sind die Codedateien aus den drei vorangegangenen Abschnitten in einem zusammengefasst, damit Sie den gesamten Prozess von Anfang bis Ende durchlaufen können.
Code-Dateien:
Hinzufügen von StatsBomb 360-Daten
In Wirklichkeit ist die Manipulation von StatsBomb 360-Daten für einen Anfänger in der Datenanalyse wahrscheinlich nicht zu bewältigen, aber wenn Sie einmal die Gelegenheit hatten, mit den Standard-Ereignisdaten zu spielen, möchten Sie vielleicht die zusätzlichen kontextbezogenen Informationen erkunden, die sie bieten.
In diesem Fall finden Sie in den folgenden Dateien den Code, mit dem Sie die StatsBomb 360-Daten von der API abrufen und mit den Standard-Ereignisdaten kombinieren können.
Code-Dateien:
Leitlinien zur Veröffentlichung
Die hier bereitgestellten Dateien sollen Ihnen einen Ausgangspunkt für die Arbeit mit unseren Daten und die Analyse der historischen Saison von Bayer Leverkusen bieten.
Wenn Sie beabsichtigen, Ihre Arbeit in den sozialen Medien zu veröffentlichen - wozu wir Sie sehr ermutigen, wenn Sie möchten, dass Ihre Fähigkeiten von Fachleuten wahrgenommen werden -, dann denken Sie bitte daran, unsere Nutzungsvereinbarung einzuhalten und StatsBomb als Ihre Datenquelle anzugeben, wenn Sie dies tun.
Unser Nutzungsleitfaden und unsere Logos finden Sie in unserem Medienpaket.
Viel Spaß mit den Daten.
Das StatsBomb-Team