Tipp für Statistik-Fans: Bundesliga.de
Im Zuge der Diskussion um die Datenerhebung von Impire habe ich mich gefragt, wo denn eben jene Daten zur Laufleistung jedes einzelnen Spielers abrufbar sind – und wurde auf Bundesliga.de fündig. In diesem Beitrag möchte ich euch Teile des Bereichs Statistik von Bundesliga.de kurz vorstellen.
Aber zunächst ein paar Worte zur aktuellen Debatte: Vom “gläsernen Fußballprofi” ist seit der Veröffentlichung der Laufleistung jedes Spielers die Rede. So wurde Lukas Podolski nach dem ersten Spieltag als “lauffaul” tituliert, also so gesehen an den Pranger gestellt. Schlagzeilen dieser Art gefallen den sportlichen Verantwortlichen – hier vom 1. FC Köln – natürlich weniger. Auf einer Managertagung wurde das Thema daher debattiert und man einigte sich darauf, dass alles so bleibt, wie es ist. Klingt komisch, ist aber so. Herausgekommen ist ein gut gemeinter Appell an die Medien, verantwortungsvoll mit den bereitgestellten Daten umzugehen – na dann schau’mer mal, wie sich das entwickelt.
Schließlich liegt es ja im Interesse eines jeden Redakteurs, seine Aussage mit Fakten zu untermauern. Und so werden Statistiken eben genau so betrachtet, wie es reinpasst. Zur Laufleistung von Podolski könnte man beispielsweise sagen, Lukas ist in 90 Minuten lediglich 2,88 km mehr gelaufen als Diego Benaglio – der Torwart vom VfL Wolfsburg. Man könnte aber auch sagen, Lukas ist mit 8,94 km nur 1,8 km weniger gelaufen als der Kölner Teamdurchschnitt, was zwar immer noch wenig ist, sich aber besser anhört.
Verantwortungsvoller Umgang bezieht sich natürlich auch auf Fakten wie Position des Spielers, taktische Ausrichtung oder auch Verletzungspausen während des Spiels. Der Spielraum für Interpretationen ist also weiterhin groß, aber vielleicht hat die öffentliche Debatte um die Datenerhebung auch dafür gesorgt, dass der Leser die aufbereiteten Statistiken nicht nur konsumiert, sondern kritisch liest und auch zuweilen infrage stellt.
So könnte sich der Leser beispielsweise selbst von der Richtigkeit bzw. der korrekten Einordnung der interpretierten Daten auf Bundesliga.de überzeugen, womit wir also nun auch beim eigentlichen Thema dieses Beitrages angelangt wären :-)
Statistikübersicht auf Bundesliga.de
Auf der offiziellen Webpräsenz Bundesliga.de kann der Statistikfreund unter den Fußball-Fans schon die ein oder andere Stunde verbringen. Im folgenden möchte ich euch u.a. das zu Beginn des Beitrages thematisierte Feature Laufdistanz in der Rubrik Statistik kurz vorstellen (zur Vergrößerung jeweils auf die Grafiken klicken):
Um zu den gewünschten Daten zu gelangen, wählt ihr auf der Startseite in der oberen Navigation den Punkt Statistik und wählt dann im zweiten Schritt die Begegnung aus, die euch interessiert.
In meinem Beispiel ist es Bayer Leverkusen gegen den VfL Wolfsburg. Nach Auswahl der Begegnung, landet ihr auf der Übersichtsseite:
Neben Angaben zu Toren, Spielerwechsel und Karten ist auch die taktische Aufstellung in Form einer Grafik dargestellt. Nach Klick auf Teamstatistik und danach auf Tracking, erhalte ich eine Teamübersicht über die Laufleistung:
Anhand dieser Daten wird deutlich, dass in dieser Begegnung die Mannschaft gewonnen hat, die läuferisch mehr investiert hat. Ich habe das mal stichprobenartig bei den anderen Begegnungen des achten Spieltages untersucht und festgestellt, dass die jeweils erzielten Siege – zumindest was die Laufleistung angeht – verdient waren.
Lediglich eine Punkteteilung erscheint mit Blick auf diese Zahlen nicht ganz gerechtfertigt:
Hier kann man sagen, dass die Werte zum läuferischen Aufwand meinen subjektiven Eindruck, Hoffenheim hätte das Spiel nicht nur aufgrund der Chancen gewinnen sollen, durchaus bestätigen.
Aber zurück zu unserer beispielhaften Begegnung Leverkusen gegen Wolfsburg. Neben der Teamstatistik gibt es auch noch den Punkt Spielerstatistik, der uns zu den gewünschten und viel diskutierten Werten der Laufleistung einzelner Spieler bringt:
Die Grafik zeigt mir in absteigender Reihenfolge die zurückgelegten Kilometer jedes einzelnen Spielers, auch der Torhüter. Besonders wichtig, um die Werte korrekt einzuordnen, sind hier die grünen und roten Pfeile, die Ein- und Auswechselspieler anzeigen. Bei der Bewertung der Laufleistung sollten diese weitestgehend ausgeklammert werden. Weitestgehend, weil die Laufleistung von beispielsweise Michael Ballack trotz seiner Auswechslung (In der 88. Minute) positiv hervorzuheben ist.
Unter Beachtung dieser Besonderheiten führen mich die aufgeführten Werte zu interessanten Schlussfolgerungen. Ich kann beispielsweise feststellen, dass Leverkusens rechte Seite mit Castro und Balitsch besonders fleißig war. Torschütze Castro ist mit 12,46 km in diesem Spiel mit Abstand am meisten gelaufen. Mit einem detaillierten Blick auf die Laufwege der betrachteten Spieler Castro und Balitsch ist diese besondere Laufintensität der rechten Seite auch durchaus zu erklären.
Zurück zur Aufstellung kann nicht innerhalb der grafischen Darstellung per Klick auf den gewünschten Spieler – hier Castro – entsprechende Details seiner Leistung einblenden, dazu gehört unter anderem auch eine Heatmap:

Hier kann ich gut erkennen, in welchem Bereich des Spielfeldes der betrachtete Spieler die meisten Aktionen hatte. Im Falle von Castro fällt hier auf, dass er als Rechtsaußen verhältnismäßig viel im zentralen Mittelfeld agierte.
Schauen wir zum Vergleich auf die Heatmap von Castros Pendant Sidney Sam,:

Im Vergleich der beiden Heatmaps lässt sich ablesen, dass Castro seine Rolle als Rechtsaußen zentraler interpretierte, als Leverkusens Linksaußen Sam.
Wahrscheinlich begünstigte dieser Umstand auch die engagierte Laufleistung von Hanno Balitsch, der mit Castros Zug in die Zentrale über mehr Raum auf der rechten Seite verfügte, das bestätigt auch seine Heatmap:

Neben dem erkennbaren Offensivdrang auf der rechten Seite, zeigt die Heatmap auch, dass neben Castro auch Balitsch häufiger die Zentrale aufsuchte. Zur besseren Einordnung wieder der Blick auf die andere Seite, Linksverteidiger Kadlec:
Hier zeigt sich die bereits angesprochene defensivere Grundausrichtung und und die etwas stärker ausgeprägte Positionstreue als linker Verteidiger.
Wie ihr seht, bietet Bundesliga.de eine Menge Möglichkeiten, sich weit über Tore und Karten hinaus zu informieren, Und das zudem grafisch anspruchsvoll gestaltet. Bei all dem Lob gibt es aber auch immer noch das eine oder andere zu verbessern, so fehlen mir beispielsweise Prozentwerte bei Zweikämpfen, Quoten bei Fehlpässen oder die durchschnittliche Laufleistung des gesamten Teams unter Berücksichtigung einer vergleichbaren Datenbasis. Ich möchte nicht ausschließen, dass ich diese vermeintlich fehlenden Zahlen bei diesem umfangreichen Angebot schlichtweg übersehen habe. Falls nicht, wären das meine konkreten Verbesserungsvorschläge.
Schaut es euch einfach mal an: Bundesliga.de Statistik
—————————–
Dieser Beitrag wurde mithilfe der Spracherkennungssoftware Dragon 11 verfasst.
Schreibst Du noch oder diktierst Du schon? Link zu Amazon: Nuance Dragon NaturallySpeaking 11 BASICS
---
Okt 5th, 2011
Diesen Beitrag: Tweet






