Den ersten Teil dieses Gastartikels findest Du hier (hier klicken).
Für die Kalkulation von Siegwahrscheinlichkeiten ist die zugrundeliegend Datenbasis und/oder das theoretische Modell essenziell. Oftmals werden hierfür relative Häufigkeiten für bestimmte Ereignisse als Basis genommen. Ein Beispiel hierfür ist die Wahrscheinlichkeit des Aufschlägers im Tennis den Punkt mit einer Chance von 2:1 (66,7 %) zu gewinnen. Sollte diese relative Häufigkeit jedoch ein Extremum, d.h. 0% oder 100% annehmen, handelt es sich hierbei nicht mehr um valide Schätzer der Eintrittswahrscheinlichkeit. Ausgehend vom Leitsatz „Geht nicht-gibt’s nicht“ lassen sich für solche Ereignisse minimale und maximale Eintrittswahrscheinlichkeiten berechnen. Henry Maske hatte vor seinem designierten letzten Kampf gegen Virgil Hill im Jahr 1996 einen Rekord von 30:0 an Siegen zu Niederlagen. Unschlagbar war er auch statistisch dennoch nicht. Die Wahrscheinlichkeit für eine Niederlage im 31. Profikampf lässt sich anhand seiner Kampfstatistik auf ein Maximum von 9,5 % (sog. Probability-at-risk auf einem Signifikanzniveau von 5 %). Doch warum beträgt die Wahrscheinlichkeit für eine Niederlage 9,5 %? Angenommen die Wahrscheinlichkeit einer Niederlage Henry Maskes läge immer bei 20 %. Bei solch einer hohen Chance für eine Niederlage wäre ein Kampfrekord von 30:0 sehr unwahrscheinlich (0,1 %). Somit ist es wenig glaubhaft, dass die Niederlagenwahrscheinlichkeit tatsächlich 20 % oder mehr beträgt. Man reduziert die hypothetisch angenommene Niederlagenwahrscheinlichkeit nun so weit, dass die Wahrscheinlichkeit für eine Kampfbilanz von 30:0 mindestens 5 % beträgt. Bei einer Niederlagenwahrscheinlichkeit von 15 % (10 %), beläuft sich die Wahrscheinlichkeit für eine 30:0-Bilanz auf lediglich 0,7 % (4,2 %). Wenn die Niederlagenwahrscheinlichkeit nun einmal per Annahme mit 9,5 % determiniert wird, so erreicht man hiermit den in der Statistik als Annahmebereich bezeichneten Wertebereich. Das bedeutet, dass eine Niederlagenwahrscheinlichkeit von 9,5 % oder weniger statistisch gesehen mit einer 30:0-Bilanz in Einklang zu bringen ist, eben weil die Wahrscheinlichkeit hierfür mind. 5 % beträgt. Je kleiner die Niederlagenwahrscheinlichkeit, desto plausibler ist die 30:0-Bilanz. Geht man beispielsweise von einer 2,3%-igen Chance auf eine Niederlage aus, so ist es schon wahrscheinlicher als 50 % nach 30 Profikämpfen ungeschlagen zu sein.
Der ungeschlagene, aber nicht unbesiegbare Henry Maske verlor den Kampf gegen Virgil Hill nach Punkten. Retrospektiv gesehen waren Virgil Hill nach den vorgängigen Analysen, trotz bzw. aufgrund von Maskes 30:0-Bilanz eine Siegchance von bis zu 9,5 % zuzuweisen. Auf jeden Fall war es Überraschungssieg, eine Sensation war dies jedoch nicht.
Spielt man im Badminton einen Satz, so gewinnt derjenige Spieler, welcher zuerst 21 Punkte mit mind. 2 Punkten Vorsprung auf dem Punktekonto vorzuweisen hat. Zieht man die Parallele zum erläuterten Beispiel aus dem Boxsport, entspricht ein Satzrückstand von 7:13-Punkten bei einem Spiel gegen einen gleichstarken Kontrahenten genau denjenigen 9,5 % für Virgil Hill für dem Kampf gegen Henry Maske. Den 6-Punkte-Rückstand noch wettzumachen ist schwierig, kommt aber eben immer einmal wieder vor.
Der Badmintonsport als Rückschlagsportart, bei der jeder Punkt gezählt wird, ermöglicht es aus der Punkteverteilung der Kontrahenten interessante Rückschlüsse zu ziehen. Gewinnt Spieler A gegen Spieler B den Satz mit 21:10 oder besser, so lässt sich zeigen, dass unter gleichstarken Gegner ein solches oder noch besseres Ergebnis (21:9,21:8,21:7, etc.) für einen Spieler nur zu 3,5 % vorkommt. Legt man das gängige Signifikanzniveau von 5% zugrunde, wäre mit diesem Satzresultat die Hypothese, dass Spieler A höchstens gleichstark, wie Spieler B zu verwerfen und die Alternativhypothese, dass Spieler A besser ist als Spieler B wäre anzunehmen.
Trotz gleicher Spielstärke kommt es schon rein statistisch häufig vor, dass einzelne Sätze relativ stark in eine Richtung tendieren. Während im Badminton rein theoretisch nur 12,5 % aller Sätze in die Verlängerung gehen (ab 20:20 spricht man von der Satzverlängerung), sind es im Tischtennissport bei den Sätzen bis 11 Gewinnpunkten noch 17,6 %. Die Aufrechterhaltung der Spannung innerhalb eines Satz war mit ein Grund für die Verantwortlichen des Tischtennissport die Sätze von 21 Gewinnpunkten auf 11 bei nunmehr 3 statt 2 Gewinnsätzen zu reduzieren.
Gewinnt Kontrahent A gegen Kontrahent B alle ersten 5 Punkte beträgt seine Satzgewinnwahrscheinlichkeit im Tischtennis (Badminton) 89,5 % (79,7 %). Insgesamt allerdings ist die Siegwahrscheinlichkeit in beiden Sportarten nach 5 in Folge gewonnenen Punkte zu Anfang jedoch nahezu identisch. Während sie für Spieler A im Tischtennis 64,8 %, beträgt diese im Badminton 64,9 %. Dies rührt daher, dass der erste bzw. ein Satz im Tischtennis durch den einen Gewinnsatz mehr nicht ganz die Bedeutung hat im Vergleich zum Badminton. Im Tischtennis erhöht der Gewinn des ersten Satzes die Siegwahrscheinlichkeit auf 68,75 %, im Badminton hingegen auf 75 %. Gewinnt Spieler A 11 Punkte hintereinander, so hat dieser im Tischtennis zwar definitiv bereits den ersten Satz gewonnen, jedoch ist dessen geringer als im Badminton. Im Tischtennis beträgt die Siegwahrscheinlichkeit daher genau 68,75 %. Bei einer 11:0-Führung im ersten Satz eines Badmintonmatches hat der führende Spieler ein 97,9%-ige Wahrscheinlichkeit den ersten Satz zu gewinnen. Da der Gewinn des ersten Satz mit 75 % an Siegwahrscheinlichkeit einhergehen würden, beträgt die Siegwahrscheinlichkeit 97,9 % x 75 % + 2,1 % x 25 % = 74,0 %. Unter gleichstarken Konkurrenten ist die Auswirkung von bspw. 11 in Folge gewonnenen Punkte daher stark von Regelwerk abhängig.
Fernsehformate mit Sportwettkämpfen sind oftmals so konstruiert, dass die Spannung möglichst lange aufrechterhalten wird. Beim Fernsehformat „Schlag den Star“ bei dem zwei Prominente bei diversen Spielen gegeneinander um Punkte antreten, wird dies besonders deutlich. In diesem Fernsehformat sind die zu erzielenden Punkte pro Spiel linear aufsteigend. Während es für Spiel 1 einen Punkt gibt, gibt es bei Spiel 2 schon deren zwei, etc. zu verteilen. Dies führt dazu, dass die ersten Spiele deutlich unbedeutender sind als die letzten Spiele. Während für die ersten 5 Spiele nur 15 Punkte (12,5 % aller Punkte), vergeben werden, sind es für die letzten 5 Spielen deren 65 (54,2 % aller Punkte). Ein Sieg im allerersten Spiel mag psychologisch wertvoll sein, rein stochastisch ist er nahezu bedeutungslos. Dieser Sieg erhöht die Siegchance nämlich gerade einmal auf 51,1 %. Als Joey Kelly am 11.März 2017 gegen Alexander Klaws die ersten vier Spiele („Über die Bank“, “Bei Aufschlag Ass“, “Wer kennt wen“ und „Fang den Ball“) verlor sah er sich mit einem Spielstand von 0:10 konfrontiert. Aufgrund der erst 10 von 120 verteilten Punkt betrug Joey Kellys Siegchance nach Spiel 4 noch 39,01 %. Wäre jedes Spiel gleichbedeutend eingestuft, läge seine Chance zu diesem Zeitpunkt nur bei 11,3 %. Joey Kelly machte sich das aufsteigende Punktesystem zunutze und gewann das Duell mit 73:47 Punkten. Von den 15 Spielen gewann der Sieger 7 Spiele und damit eines weniger als der Verlierer.
Das TV-Format stellt einen Mehrkampf von verschiedenen und zuvor unbekannten und unabhängigen Disziplinen dar. Der Zehnkampf gilt als die Königsdisziplin der Leichtathletik. Im Gegensatz zu „Schlag den Star“ sind alle zehn durchzuführenden Disziplinen auch in der Reihenfolge zuvor bekannt. Zudem sind die Disziplinen nachweislich nicht unabhängig voneinander. Zwischen mehreren Disziplinen gibt es einen positiven Zusammenhang. Im olympischen Zehnkampf von 2016 beispielsweise betrug die Rangkorrelation zwischen den 400m-Laufergebnissen und denjenigen der 110m Hürden (=67,8%). Athleten mit einer überdurchschnittlich guten Platzierung im 400m-Lauf, sind tendenziell auch im 110m-Hürdenlauf erfolgreich. Pro 10 Platzverbesserungen (z.B. Platz 4 gegenüber 14) in 400m-Lauf, ist zu erwarten, dass die Platzierung im 110m-Lauf um 8,2 Plätze besser ist.
Ähnlich wie bei „Schlag den Star“ stellt sich auch hier die Frage nach einer Wertung, welche die verschiedenen Disziplinen fair gewichtet. Während bei „Schlag den Star“ immer nur zwei Kontrahenten gegeneinander antreten, sind es bei einem Zehnkampf meist rund zwei bis drei Dutzend Teilnehmer. Zum einen kann man die Leistungen des 1500m-Lauf durch keine Formel adäquat mit dem Speerwurf vergleichen. Beim 1500m-Lauf geht es um die kürzeste Zeit in Sekunden, beim Speerwurf um die Weite in Zentimetern. Zum anderen ist auch die Normierung mittels des aktuellen Weltrekords in der jeweiligen Disziplin eine unzureichende Approximation. Besser wäre es hier auf die Rangwertung zurückzugreifen. Die Rangwertung verteilt die Punkte objektiv nach dem erzielten Rang eines Athleten. Der beste Athlet einer Disziplin erhält einen Rangpunkt, der zweitbeste zwei, etc. Der Athlet mit den wenigsten Rangpunkten gewinnt den Zehnkampf. Die Rangwertung hätte im olympischen Zehnkampf von Rio de Janeiro 2016 statt dem tatsächlichen Olympiasieger Ashton Eaton den Franzosen Kevin Mayer als Sieger hervorgebracht.
Die angefügte Literatur verweist auf die detaillierten Grundlagen für die Berechnung der statistischen Analysen und Modelle der einzelnen Sportarten. Zudem ist hierbei Zusatzliteratur aufgeführt, welche Erkenntnisse aus diesen Modellen anhand von Beispielen aus der Theorie und Praxis enthält.
Literatur
Tischtennis
08/2022
Saisonprognose der TTBL
08/2021
Hinrundenprognose der Tischtennisbundesliga (TTBL)
URL: http://ttbl.de/prognose-hinrunde-tabelle-statistik-tim-scheffczyk
08/2021
Spielprognose des olympischen Teamfinals im Tischtennis
https://www.instagram.com/p/CSMqv_9t8eY/?utm_medium=share_sheet
01/2021
Faire Saisonhochrechnung für Tischtennis-Sport am Beispiel der TTBL
Zitation
URL: https://ttbl.de/saisonprognose-so-konnte-die-tabelle-nach-der-hauptrunde-aussehen
https://www.wz.de/nrw/borussia-ohne-probleme-im-hochtaunus_aid-55479683
https://rp-online.de/nrw/staedte/duesseldorf/sport/borussia-ohne-probleme-im-hochtaunus_aid-55480505
08/2018
Offizielle Spielprognosen der Tischtennisbundesliga (TTBL)
Zahlen, bitte !
URL: http://ttbl.de/zahlen-bitte
https://ttbl.de/ttbl-spielprognosen
http://ttbl.de/von-favoriten-und-underdogs
http://ttbl.de/das-liebherr-pokal-finale-vier-teams-drei-spiele-ein-ziel
https://www.bttv.de/news/data/2019/02/15/bad-koenigshofen-erwartet-schwalben-im-hoehenflug/
https://www.wz.de/nrw/borussia-wird-der-favoritenrolle-in-neu-ulm-gerecht_aid-66048167
01/2017
Stochastische Analyse des TTBL- Pokalfinals 2016/17
12/2016
Wissen, wer gewinnt- Interview zum TTR-Modell
Zeitschrift, tischtennis 2016/12, S. 32
URL: https://www.tischtennis-pur.de/interviews-detail/wissen-wer-gewinnt.html
12/2014
TTR – Die „Elo- Zahl“ des Tischtennis
URL: http://statistik-dresden.de/archives/11964
05/2014
Gewinnchancen im Tischtennis
Tennis
11/2020
Der GOAT-Score. Eine statistische Analyse der Grand Slams
URL: https://statistik-dresden.de/archives/16321
Badminton
01/2018
Der statistische Bilanzvergleich für Rückschlagsportarten
Zeitschrift, BETRIFFT SPORT, 1/2018, S. 17
Zeitschrift, Badminton Sport Nr. 3, März 2018, S. 28
URL: https://www.bisp-surf.de/Record/PU201804002576
06/2017
Das olympische Finale im Herreneinzel von 2012 unter der statistischen Lupe
Zeitschrift, Badminton Sport Nr. 6, Juni 2017, S. 23
URL: https://www.bisp-surf.de/Record/PU201707005209
Darts
01/2017
Das Random-Darter-Modell
URL: https://www.darts1.de/kolumnen/random-darter-modell.php
Fußball
06/2016
Das Elfmeterschießen-Tool (EM 2016)
URL: http://statistik-dresden.de/archives/13304
05/2020
Die faire Bundesligatabelle
URL: https://statistik-dresden.de/archives/16219
08/2022
Die Achterbahnfahrt des SC Freiburg im DFB-Pokal 2021/22
URL: https://statistik-dresden.de/archives/17770?amp
Zehnkampf
07/2021
URL: https://statistik-dresden.de/archives/17289
Regressionsanalyse
06/2017
Einflussfaktoren auf die Zuschauernachfrage im professionellen Tischtennissport
Konfidenzintervalle
09/2022
Geht nicht, gibt’s nicht – Probability at Risk
URL: https://statistik-dresden.de/archives/17789
TV–Format – Stochastik des Punktesystems
03/2017
Siegchancen bei „Schlag den Star“
URL: http://statistik-dresden.de/archives/14296
Bildquelle: pixabay.com
Seit vielen Jahren betrachtet Tim den Sport aus der statistischen Perspektive.
In seiner Masterarbeit in Volkswirtschaftslehre forschte er zum Thema „Einflussfaktoren auf die Zuschauernachfrag im professionellen Tischtennissport“. Vor allem für den Tischtennissport, aber auch in vielen verschiedenen Sportarten hat er bereits Prognosen und/oder Analysen angefertigt, die einen etwas anderen Blickwinkel auf den Sport ermöglichen. Seit der Saison 2018/19 erstellt er für die Vorschau die offiziellen Spielprognosen für die Tischtennisbundesliga. Beruflich ist er als Data Analyst tätig.