Περί στατιστικής ανάλυσης στο Ευρωπαικό μπάσκετ (Part 1)

Περί στατιστικής ανάλυσης στο Ευρωπαικό μπάσκετ (Part 1)

Μια κριτική στο PIR, που αντιπροσωπεύει την προσπάθεια περιγραφής της απόδοσης ενός μπασκετμπολίστα, καθώς και την ταυτόχρονη αποτύπωση της με την βοήθεια μιας αριθμητικής τιμής.

Πριν από λίγες μέρες η Ευρωλίγκα δημοσίευσε την κορυφαία δεκάδα παικτών με βάση το στατιστικό του Performance Index Rating. Το PIR – όπως και κάθε στατιστικός δείκτης – αντιπροσωπεύει την προσπάθεια περιγραφής της απόδοσης ενός μπασκετμπολίστα, καθώς και την ταυτόχρονη αποτύπωση της με την βοήθεια μιας αριθμητικής τιμής. Ο στόχος είναι να διευκολυνθούν η αξιολόγηση και οι συγκρίσεις μεταξύ των επιδόσεων διαφορετικών αθλητών. Η εν λόγω ανάγκη προέκυψε αρκετά νωρίς στην «ζωή» του επαγγελματικού μπάσκετ. Για παράδειγμα έστω ότι επιθυμούμε να ανακαλύψουμε ποιος οργανισμός διαθέτει την καλύτερη επίθεση. Εάν απλώς αθροίσουμε τους πόντους που παρήγαγε στα παιχνίδια της και τους διαιρέσουμε με το πλήθος των αγώνων, τότε το νούμερο στο οποίο θα καταλήξουμε θα είναι εντελώς λάθος. Γιατί; Διότι παραλείψαμε την έννοια του ρυθμού.

Μια ομάδα που παίζει σε υψηλότερο ρυθμό ( παραπάνω κατοχές), θα σουτάρει νομοτελειακά περισσότερες φορές την μπάλα – άρα θα συσσωρεύσει μεγαλύτερο αριθμό πόντων. Αυτό όμως δεν σημαίνει πως είναι απαραίτητα πιο εύστοχη και κατά συνέπεια ότι διαθέτει την αποτελεσματικότερη επίθεση. Ο ρυθμός αλλοιώνει τους υπολογισμούς μας. Η απάντηση στο πρόβλημα εδράζεται στα μαθηματικά και περιλαμβάνει την αναγωγή στις 100 κατοχές. Μέσω αυτής της διαδικασίας τα μεγέθη γίνονται όμοια μεταξύ τους και μπορούν να συγκριθούν πιο εύκολα. Κάπως έτσι γεννήθηκε το προηγμένο στατιστικό που ονομάζεται Offensive Rating (πόντοι ανά 100 κατοχές), το οποίο εισήχθηκε στο δημόσιο διάλογο από τον σπουδαίο Dean Oliver (2004) μέσα από το περίφημο βιβλίο: Basketball on Paper.

Είναι σημαντικό να κατανοήσουμε ότι όλα τα στατιστικά έχουν τα δικά τους πλεονεκτήματα και μειονεκτήματα. Το καθένα προσπαθεί να απαντήσει στις ανεπάρκειες κάποιου άλλου. Το ατομικό OffRtg ενός μπασκετμπολίστα, πρέπει πάντοτε να εξετάζετε σε συνδυασμό με το Usage Rate – δηλαδή το ποσοστό των συνολικών κατοχών της ομάδας του, που ο ίδιος καταναλώνει. Είναι λογικό πως όσο μεγαλύτερος είναι ο επιθετικός του ρόλος, τόσο δυσκολότερο είναι να διατηρήσει υψηλό OffRtg – αντίθετα εάν φέρ’ ειπείν σουτάρει μια στο τόσο, η αποτελεσματικότητα του ενδέχεται να εκτοξευθεί. Δεν υπάρχει «τέλειο» στατιστικό, απαλλαγμένο από αδυναμίες. Υπάρχουν όμως ορισμένα που προσεγγίζουν την πραγματικότητα με περισσότερη ακρίβεια από κάποια άλλα.

Ρίξτε μια ματιά στον μαθηματικό τύπο του PIR.

PIR = (πόντοι + rebound + assists + κλεψίματα + κοψίματα + κερδισμένα φάουλ) – (άστοχα σουτ + άστοχες ελεύθερες βολές + λάθη + εναντίων κοψίματα (shots rejected) + φάουλ (fouls committed).

Ο υπολογισμός του είναι τόσο απλοϊκός, που καταντά κομματάκι επικίνδυνος για ασφαλή συμπεράσματα. Καταρχάς δεν λαμβάνονται υπόψη τα λεπτά που αγωνίστηκε ο παίκτης. Είναι το ίδιο να πετύχεις 10 πόντους σε 8 ή σε 30 λεπτά; Προφανώς όχι. Δεύτερον δεν συμπεριλαμβάνονται συντελεστές βαρύτητας – με άλλα λόγια τα τεκταινόμενα στο παρκέ εξισώνονται σε απόλυτο και αντιεπιστημονικό βαθμό. Τα λάθη ή τα rebounds δεν επιδρούν με ανάλογο τρόπο στην εξέλιξη ενός παιχνιδιού. Πιο συγκεκριμένα οι 4 παράγοντες του Dean Oliver ορίζουν ότι π.χ. τα λάθη επηρεάζουν μόνο κατά 25% τις πιθανότητες νίκης. Επιπλέον είναι πιο σωστό να καταγράφουμε τα μεγέθη αυτά με την μορφή ποσοστών – τα οποία επίσης απουσιάζουν καθολικά από τον τύπο. Τα λάθη ή τα rebound πρέπει να μετασχηματίζονται σε TOV% ή Reb%, δηλαδή ως ποσοστό των συνολικών κατοχών ή των συνολικών διαθέσιμων rebound. Είναι τελείως διαφορετικό ένα club να υποπέσει σε 7 λάθη στις 20 ή στις 40 κατοχές.

Μπορώ να συνεχίσω για πολύ ώρα ακόμα. Δεν υπάρχει διαχωρισμός ανάμεσα σε τρίποντα και δίποντα. Το τρίποντο παράγει έναν περισσότερο πόντο, άρα πρέπει να σταθμιστεί ανάλογα. Το ίδιο ισχύει και για τις ελεύθερες βολές. Παραλείπεται ο καθοριστικός ρόλος των επιθετικών rebound. Οι 4 παράγοντες ορίζουν πως το OR% (πάλι ως ποσοστό) επιδρούν κατά 20% στις πιθανότητες νίκης.

Για να μην σας κουράσω παραπάνω, το συμπέρασμα που προκύπτει από όλα αυτά είναι ότι το PIR μοιάζει πλέον με ένα κειμήλιο του παρελθόντος. Η παραδοσιακή στατιστική κρίνεται πια ξεπερασμένη – αδυνατεί να καλύψει τις σύγχρονες ανάγκες του αθλήματος. Προσωπικά εξακολουθώ να μην καταλαβαίνω γιατί η επίσημη διοργάνωση της Ευρωλίγκας, εξακολουθεί να χρησιμοποιεί το εν λόγω ανεπαρκές στατιστικό. Ίσως η απορία μου να μην λυθεί ποτέ. Στο δεύτερο μέρος του κειμένου, θα μελετήσουμε μαζί τους τρόπους με τους οποίος μπορούμε να παρακάμψουμε τις αδυναμίες που συζητήσαμε σήμερα.

Ακολουθήστε στο Google News και μάθετε πρώτοι όλες τις αθλητικές ειδήσεις
Δείτε όλες τις τελευταίες Αθλητικές Ειδήσεις από την Ελλάδα και τον Κόσμο, από

ΤΕΛΕΥΤΑΙΕΣ ΕΙΔΗΣΕΙΣ