Προβλέψεις για το EURO 2020 βασισμένες σε Στατιστικά Μοντέλα Αναλυτικής Ποδοσφαίρου – O Τελικός

Η ερευνητική ομάδα sports analytics του ΟΠΑ παρουσίασε τις προβλέψεις της για τις φάσεις του Euro 2020, μέσω του Οικονομικού Ταχυδρόμου, και σήμερα ολοκληρώνονται με την πρόβλεψη για τον τελικό

Μετά από δύο συναρπαστικούς ημιτελικούς, έστω και δύσκολα επικράτησαν οι δύο ομάδες που είχαν τις περισσότερες πιθανότητες να φτάσουν στον τελικό.

Η πρόβλεψη για τους ημιτελικούς εδώ.

Οι προβλέψεις του μοντέλου για τον τελικό δίνονται στον πίνακα και το διάγραμμα που ακολουθούν. Μαζί με τις πιθανότητες κάθε αποτελέσματος δίνεται και το σκορ με την μεγαλύτερη πιθανότητα εμφάνισης (η αντίστοιχη πιθανότητα δίνεται σε παρένθεση) και ο αναμενόμενος αριθμός γκολ της κάθε ομάδας (με δύο δεκαδικά).

Ο αναμενόμενος αριθμός των γκολ για την Αγγλία είναι περίπου 1 (0.91 για την ακρίβεια) και 0.62 για την Ιταλία. Η διαφορά των αναμενόμενων αριθμών των γκολ είναι ίση με 0.29 (μικρότερος της μονάδας και από τους μικρότερους που έχουμε δει στο EURO 2020) και υποδεικνύει τις μικρές διάφορες μεταξύ των αντίπαλων ομάδων και την αβεβαιότητα για το τελικό αποτέλεσμα.

Με βάση, λοιπόν, τα παραπάνω αποτελέσματα βλέπουμε ότι ο τελικός αγώνας είναι σχετικά αμφίρροπος (όπως και αναμενόταν) με ελαφρύ προβάδισμα της Αγγλίας επί της Ιταλίας. Πιο συγκεκριμένα η Αγγλία έχει ελαφρύ προβάδισμα νίκης με πιθανότητα νίκης 41.5% κατά της Ιταλίας ενώ η πιθανότητα να πάει ο αγώνας στην παράταση ή να νικήσει η Ιταλία είναι ίση με 58.5%.

Να σημειώσουμε ότι σε αυτό το EURO έχουμε παρατηρήσει αυξημένο αριθμό αγώνων που οδηγήθηκαν σε παράταση. Αυτό θα μπορούσαμε να το λάβουμε υπόψη μας με βάση το διορθωμένο μοντέλο που η ερευνητική μας ομάδα έχει εισάγει στην βιβλιογραφία το 2003 και προσθέτει ένα πληθωριστικό όρο για τις ισοπαλίες με σκοπό να τις εκτιμήσει σωστά. Αυτό το διορθωμένο μοντέλο εδώ θα υποδείκνυε, και με βάση τα αποτελέσματα που έχουμε δει, την παράταση ως πιο πιθανό αποτέλεσμα (αλλά και πάλι η Αγγλία θα έχει ελαφρύ προβάδισμα).

Στο ακόλουθο διάγραμμα απεικονίζονται οι πιθανότητες κάθε σκορ για τον τελικό. Τα πιο σκούρα κουτάκια απεικονίζουν τα πιο πιθανά αποτελέσματα ενώ τα πιο ανοικτόχρωμα υποδεικνύουν αποτελέσματα με χαμηλή πιθανότητα εμφάνισης. Επικρατέστερο σκορ το 0-0 (21%) και ακολουθούν αποτελέσματα όπως το 1-0 υπέρ της Αγγλίας (20%) και 0-1 υπέρ της Ιταλίας (13%) και η ισοπαλία με 1-1 (12%). Να σημειώσουμε ότι οι πιθανότητες να προβλέψουμε το τελικό σκορ είναι αρκετά μειωμένες.

Τέλος, το διάγραμμα των αμυντικών (με μπλε) και επιθετικών (με κόκκινο) δυναμικοτήτων των δύο αντιπάλων απεικονίζει την ισορροπία μεταξύ των δύο ομάδων. Αν εξετάσουμε προσεκτικά τα διαγράμματα, θα δούμε ότι Αγγλία έχει και τις δύο παραμέτρους ελαφρώς καλύτερες από την Ιταλία που τελικά της δίνει το μικρό προβάδισμα στις τελικές πιθανότητες. (Σημείωση: όσο μικρότερες είναι οι αμυντικές δυναμικότητες τόσο καλύτερη είναι η αμυντική της λειτουργία ενώ μεγαλύτερες επιθετικές δυναμικότητες απεικονίζουν ομάδες με καλύτερη επιθετική λειτουργία).

Λίγα λόγια για το μοντέλο

Η τεχνική αλλά και τέχνη στατιστικής μοντελοποίησης έχει άμεση εφαρμογή στον τομέα του αθλητισμού και πιο συγκεκριμένα του ποδοσφαίρου με άμεση εφαρμογή στην λήψη αξιόπιστων προβλέψεων σε μελλοντικούς αγώνες ποδοσφαίρου όπου το ενδιαφέρον των φιλάθλων αυξάνει κατακόρυφα.

Η χρήση στατιστικών τεχνικών για την πρόβλεψη αγώνων ποδοσφαίρου πρώτο-εμφανίστηκε στην επιστημονική βιβλιογραφία το 1968 με την πρωτοπόρα επιστημονική δημοσίευση των Reep & Benjamin.

Οι επόμενες πραγματικές καινοτομίες εμφανίζονται στη δεκαετία του 80 με την εργασία του Michael Maher και την εργασία του Lee το 1997 όπου έθετε το ερώτημα αν πράγματι η Μάντσεστερ Γιουνάιτεντ τότε ήταν πράγματι η καλύτερη ομάδα. Το ερώτημα επιβεβαιώνονταν με την χρήση ενός απλοϊκού στατιστικού μοντέλου και προσομοίωσης. Η ανάλυση αυτή έθετε τα θεμέλια της σύγχρονης μοντελοποίησης στο Ποδόσφαιρο και στον αθλητισμό.

Επόμενες σημαντικές δημοσιεύσεις ήταν οι εργασίες των Dixon & Coles το 1997 και το διμεταβλητό μοντέλο Poisson των Καρλή και Ντζούφρα το 2003 (δύο από τους συγγραφείς της συγκεκριμένης ανάλυσης). Τα δύο αυτά μοντέλα έθεσαν τη βάση των συγχρόνων μοντέλων πρόβλεψης των αποτελεσμάτων αγώνων ποδοσφαίρου.

Η βασική ιδέα του στατιστικού μοντέλου των καθηγητών του ΟΠΑ Καρλή και Ντζούφρα βασίζεται σε μια επέκταση μια γνωστής κατανομής που ονομάζεται Poisson για την πρόβλεψη του αριθμού των γκολ που θα σκοράρει κάθε ομάδα. Ο προβλεπόμενος αριθμός γκολ γράφεται ως συνάρτηση της επίδρασης της έδρας (home effect) που πλέον μπορεί να ποσοτικοποιηθεί και της επιθετικής και αμυντικής δυναμικότητας των ομάδων.

Εδώ γίνεται χρήση μιας παραλλαγής αυτού του μοντέλου για να γίνει πρόβλεψη των αγώνων του EURO 2020. Επιπλέον χρησιμοποιούνται χρονό-δυναμικές παράμετροι που αντικατοπτρίζουν τις δυναμικότητες ομάδων και η διαφορά στο ranking μεταξύ των δύο αντίπαλων ομάδων με βάση τον δείκτη Coca-Cola FIFA ranking την 27η Μαΐου 2021. Το μοντέλο εκτιμήθηκε με χρήση της Μπευζιανής προσέγγισης (Bayesian approach) με του στατιστικών πακέτων R και STAN. Οι προβλέψεις αυτές είναι παρόμοιας ακρίβειας με αυτές που χρησιμοποιούν οι εταιρείες στοιχηματισμού.

· i είναι ο δείκτης του αγώνα

· 𝑋𝑖 και 𝛶𝑖 είναι ο αριθμός των γκολ μεταξύ της 1ης και της 2ης ομάδας στον αγώνα i

· h𝑜𝑚𝑒 είναι η επίδραση της έδρας (μόνο για τους αγώνες που ισχύει αυτό). Συνήθως στο EURO οι περισσότεροι αγώνες είναι σε ουδέτερη έδρα οπότε αυτό το bonus δεν προστίθεται σε καμία από τις δύο αντίπαλες ομάδες

· ℎ𝑖 και 𝑎𝑖 είναι η 1η και 2η ομάδα αντίστοιχα (ή η εντός και εκτός έδρα ομάδα – όπου ισχύει) για τον i αγώνα.

· 𝑎𝑡𝑡𝑘,𝑡 και 𝑑𝑒𝑓𝑘,𝑡 οι παράμετροι που εκτιμούν της επιθετική και αμυντική δυναμικότητα/ ικανότητα της ομάδας k την χρονική στιγμή t (δυναμικές παράμετροι που αλλάζουν στο χρόνο)

· 𝑟𝑎𝑛𝑘𝑖𝑛𝑔𝑘 δείκτης Coca-Cola FIFA ranking την 27η Μαΐου 2021 για την ομάδα k.

· 𝛾 είναι η επίδραση του Coca-Cola FIFA ranking στο λογάριθμο των αναμενόμενων γκολ

Οι προβλέψεις γίνονται για επιστημονικούς λόγους και δεν συνιστούν προτροπή ή συμβουλή για στοιχηματισμό.

Βιβλιογραφία για διαβαστερούς φιλάθλους

· Dixon, M.J. and Coles, S.G. (1997), Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society: Series C (Applied Statistics), 46, 265-280.

· Karlis, D. and Ntzoufras, I. (2003), Analysis of sports data by using bivariate Poisson models. Journal of the Royal Statistical Society: Series D (The Statistician), 52, 381-393.

· Lee A.J. (1997). Modeling Scores in the Premier League: Is Manchester United Really the Best? Chance, 10, 15-19.

· Maher, M.J. (1982), Modelling association football scores. Statistica Neerlandica, 36, 109-118.

· Reep, C., & Benjamin, B. (1968). Skill and Chance in Association Football. Journal of the Royal Statistical Society. Series A (General), 131, 581-585.

Λίγα λόγια για τους Συγγραφείς

*O Leonardo Egidi είναι επίκουρος καθηγητής Στατιστικής στο Πανεπιστήμιο της Τεργέστης στην Ιταλία και μέλος της ερευνητικής ομάδας του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group. Έχει διδακτορικό στην μοντελοποιηση και αναλυτική ποδοσφαίρου και έντονη ερευνητική δραστηριότητα στη Μπευζιανή Στατιστική μεθοδολογία.

*O Ιωάννης Ντζούφρας είναι καθηγητής Στατιστικής και πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Δημήτρη Καρλή. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η Μπευζιανή στατιστική μεθοδολογία, υπολογιστικ

υπολογιστική στατιστική, Βιοστατιστική, ψυχομετρία και αναλυτική των σπορ.

*O Δημήτρης Καρλής είναι καθηγητής Στατιστικής και αναπληρωτής πρόεδρος στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών. Είναι ιδρυτικό μέλος της ερευνητικής ομάδας AUEB Sports Analytics Group μαζί με τον Ιωάννη Ντζούφρα. Έχει αναγνωρισμένη επιστημονική δραστηριότητα σε τομείς όπως η στατιστική μεθοδολογία, υπολογιστική στατιστική, Βιοστατιστική, και αναλυτική των σπορ.

Οι τρεις συγγραφείς του άρθρου αυτή τη στιγμή συνεργάζονται για τη συγγραφή ενός βιβλίου σε Football Analytics σε διεθνή επιστημονικό οίκο ενώ στο τελευταίο workshop της ομάδας έδωσαν ένα σεμιναριακό μάθημα σε Football analytics.

Η ερευνητική ομάδα του Οικονομικού Πανεπιστημίου Αθηνών AUEB Sports Analytics Group ιδρύθηκε το 2015 από τους καθηγητές Ιωάννη Ντζούφρα και Δημήτρη Καρλή. Μέλη του είναι σημαντικά μέλη της κοινότητα της αναλυτικής των σπορ όπως οι Stefan Kesenne (Πανεπιστήμιο Antwerp & Leuven), Leonardo Egidi (Πανεπιστήμιο Trieste), Ιωάννης Κοσμίδης (Warwick), Κωνσταντίνος Πελεχρίνης (Pittsburg), Nial Friel (UCD) και Gianluca Baio (UCL) καθώς επίσης και ο πρώην προπονητής της εθνικής Ελλάδας Βόλεϊ, Σωτήρης Δρίκος. Η ερευνητική ομάδα είναι υπεύθυνη για της σειρά ετήσιων συνεδρίων με το όνομα AUEB Sports Analytics Workshop (5 συνολικά) ενώ το 2019 διοργάνωσε το διεθνές συνέδριο MathSport 2019 με 200 συμμετέχοντες επιστήμονες από όλο τον κόσμο. Τέλος η ομάδα έχει μια σειρά από σημαντικές επιστημονικές δημοσιεύσεις στο χώρο της αναλυτικής των σπορ.

Ακολουθήστε στο Google News και μάθετε πρώτοι όλες τις αθλητικές ειδήσεις
Δείτε όλες τις τελευταίες Αθλητικές Ειδήσεις από την Ελλάδα και τον Κόσμο, από