היום, כשאתם מהמרים באתרי הימורים, אתם לא משחקים נגד בני אדם אלא נגד מפלצת דאטה בלתי נתפסת שמופעלת על ידי אלגוריתמים לניתוח ביצועי שחקנים. מי הם ה-"שחקנים" במקרה הזה? אנחנו מדברים על אלה שעל הדשא, על הפרקט, על המסלול. לברון, אמבפה, ג'וקוביץ' וכל סוס מרוצים אקראי. במאמר הזה אנחנו כן ננסה להבין איך המפלצת הזאת חושבת ולמה היא כמעט תמיד צעד אחד לפנינו. אמנם, זה לא יגרום לכם לנצח בכל הימור, אבל זה בטוח ישנה את הדרך שבה אתם קוראים את הליין בפעם הבאה.
מעבר לסטטיסטיקה הפשוטה
כשאני התחלתי להתעסק בהימורים, "ניתוח" היה להסתכל בטבלה. מי מקום ראשון, מי מקום אחרון. כמה גולים הבקיע החלוץ. אולי, אם הייתי ממש משקיע, הייתי בודק פצועים ונעדרים. זה היה עולם פשוט.
היום? הסטטיסטיקות הפשוטות האלה הן בקושי המתאבן של הארוחה. המודלים המודרניים לא מסתפקים ב-"מה קרה". הם רוצים לדעת "איך", "למה", ו-"מה הסיכוי שזה יקרה שוב". הם מפרקים כל ספורטאי וכל קבוצה לגורמים ברמה שאנחנו לא יכולים לתפוס.
מדדים מתקדמים לאלגוריתמים לניתוח ביצועי שחקנים
כאן נכנסות לתמונה הסטטיסטיקות המתקדמות. רובנו שמענו את המונחים האלה, אבל אנחנו לא תמיד מבינים מה הם אומרים.
בכדורגל, המלך הבלתי מעורער הוא xG (Expected Goals), או "מדד שערים צפויים". המודל כבר לא סופר רק "בעיטות לשער". זה פאסה. הוא בודק את האיכות של כל בעיטה. הוא שואל: "מאיזה מרחק הבעיטה? באיזו זווית? האם זה היה ברגל החזקה של הכדורגלן? כמה מגנים היו בינו לבין השער? האם זה היה אחרי כדור קרן או במהלך משחק שוטף?".
האלגוריתם משווה את הבעיטה הזאת למאגר נתונים של מאות אלפי בעיטות דומות מהעבר, ונותן לה ציון הסתברותי. נניח, 0.3xG. זה אומר שבעיטה כזאת נכנסת ב-30% מהמקרים. למה זה קריטי? כי זה מזהה "מזל". אם קבוצה ניצחה 1-0, אבל ה-xG שלה היה 0.4 וה-xG של היריבה היה 2.5, המודל מבין שהתוצאה "שקרית". הקבוצה שניצחה הייתה ברת מזל, והקבוצה שהפסידה הייתה חסרת מזל. בפעם הבאה שהם ייפגשו, או במשחק הבא שלהן, היחסים ישקפו את ה-xG, לא את התוצאה בטבלה.
בכדורסל, יש לנו מדדים כמו PER (Player Efficiency Rating). זה מדד שמנסה לזקק את כל התרומה של שחקן (נקודות, ריבאונדים, אסיסטים, חסימות, חטיפות) ולהפחית ממנה את הפעולות השליליות (איבודים, החטאות, עבירות), ואז לתקנן את הכל לדקה. מי שקולע 20 נקודות ב-20 זריקות פחות יעיל מזה שקולע 18 נקודות ב-10 זריקות. המודל יודע את זה. אנחנו, בעיניים, רואים רק "20 נקודות".
דאטה פיזיולוגי: החיישנים על הגופייה
היום, לרוב הספורטאים בליגות הבכירות יש שבב GPS זעיר בגופיית האימון או המשחק שלהם (כן, כמו באפליקציות ריצה, רק הרבה יותר משוכלל).
השבבים האלה מספקים למנגנון של המערכת מידע פיזיולוגי בזמן אמת:
- כמה קילומטרים הספורטאי רץ במשחק?
- מה הייתה מהירות הספרינט המקסימלית שלו?
- כמה "פעולות אינטנסיביות" (ספרינטים, קפיצות, שינויי כיוון) הוא ביצע?
- כמה מהר הדופק שלו ירד בחזרה אחרי ספרינט (מדד להתאוששות)?
- האם יש ירידה במדדים האלה בין המחצית הראשונה לשנייה (סימן לעייפות מצטברת)?
כשהאלגוריתם רואה שקבוצה שלמה מציגה מדדי עייפות גבוהים בשני המשחקים האחרונים, ועכשיו היא יוצאת למשחק חוץ שלישי בשבוע הוא יתמחר את הסיכוי שלה להפסיד הרבה יותר גבוה, גם אם היא פוגשת קבוצה "נחותה" על הנייר.
הקונטקסט הוא המלך באלגוריתמים לניתוח ביצועי שחקנים
אבל לאגור נתונים זה קל. כל אחד יכול. החוכמה של אלגוריתמים לניתוח ביצועי שחקנים היא לא הנתונים עצמם אלא בהקשרים שהם יוצרים. כאן למידת המכונה (Machine Learning) נכנסת לפעולה.
ניתוח Matchups
אנחנו מסתכלים על משחק ואומרים "לחלוץ הזה יש 10 גולים העונה". המודל אומר: "נכון, אבל איך הוא מתפקד ספציפית מול בלם שמשחק אגרסיבי? ומה קורה כשהוא משחק מול המגן הספציפי של הקבוצה היריבה, אותו הוא פגש 4 פעמים ב-3 השנים האחרונות ובאף אחת מהן לא הצליח לעבור אותו בכדרור?".
האלגוריתם מנתח "שחקן-מול-שחקן" ו-"סגנון-מול-סגנון". ב-NBA, הוא יבדוק איך הרכז של הקבוצה מתפקד מול "בליץ" על הפיק-אנד-רול. בפוטבול, איך הקוורטרבק מתפקד מול הגנת "קאבר 2". אלה ניואנסים שאנחנו, כבני אדם, לא מסוגלים לעבד עבור כל משחק. המודל עושה את זה בשבריר שנייה.
מזג אוויר, שופטים, וטיסות לילה
כאן זה נהיה ממש כיף. המודל לוקח את מה שאנחנו מחשיבים "רעש רקע" והופך אותו לנתון קשיח.
- מזג אוויר: לא סתם "גשם". הוא יבדוק: מה כמות המשקעים הצפויה? מה מהירות הרוח ולאיזה כיוון? איך הקבוצה הביתית מתפקדת היסטורית בתנאים האלה? ומה עם קבוצת החוץ, שמגיעה ממדינה חמה? המודל יוריד אוטומטית את הציפייה לשערים (xG) במשחק כזה, וישנה את הליין של ה"אנדר/אובר".
- שופטים: זה אחד המשתנים האהובים עליי. המערכת יודעת בדיוק מה הממוצע של כל שופט: כמה עבירות הוא שורק למשחק? כמה כרטיסים צהובים? אדומים? האם הוא נוטה לשרוק יותר לטובת קבוצת הבית? אם שופט "קמצן" בכרטיסים מנהל משחק דרבי חם, המודל ידע שיש סיכוי טוב שהמשחק יתפוצץ ויכלול יותר עבירות מהרגיל, אבל אולי פחות כרטיסים ממה שהציבור חושב.
- לוגיסטיקה: הקבוצה נאלצה לטוס 6 שעות? הטיסה התעכבה? הם נוחתים רק ב-3 לפנות בוקר שעון מקומי? המודל יודע. הוא יודע שלעייפות מטיסות (Jet Lag) יש השפעה סטטיסטית מובהקת על ביצועים ב-48 השעות הראשונות.
סריקת רשתות חברתיות ואתרי חדשות
אם כל מה שתיארתי עד עכשיו לא הספיק, חכו לזה. האלגוריתמים המתקדמים ביותר היום משתמשים ב-NLP (Natural Language Processing – עיבוד שפה טבעית) כדי לקרוא.
הם סורקים את טוויטר (X), אינסטגרם, פורומים של אוהדים, ואתרי חדשות מקומיים 24/7. הם לא מחפשים רק חדשות רשמיות על פציעות. הם מחפשים "סנטימנט".
- האם הציוצים האחרונים של כוכב הקבוצה נשמעים ממורמרים?
- האם צץ דיווח באתר מקומי קטן על "תקרית באימון" בין שני שחקנים?
- האם אשתו של השוער ילדה אתמול בלילה? (סיכוי סטטיסטי לעייפות או חוסר ריכוז).
- האם האוהדים "איבדו את זה" ודורשים לפטר את המאמן? (יכול להלחיץ שחקנים, או להפך, לתת להם מוטיבציה).
מה שהיה פעם "מידע פנימי" או "רכילות" הפך היום לנקודת דאטה. כשאנחנו עוד קוראים את הכותרת הראשית, המודל כבר עיבד את הכתבה, הצליב אותה עם 50 מקורות אחרים, והזיז את היחס ב-0.05 נקודות.
אז איך כל הבלאגן הזה הופך ליחס (Odds)?
אוקיי, אז לאלגוריתם יש הר של נתונים. מה עכשיו? כאן נכנסת לתמונה סימולציה. הדרך הכי טובה להסביר את זה היא מה שנקרא "סימולציית מונטה קרלו" (נשמע מסובך, אבל הרעיון פשוט).
המודל "מריץ את המשחק" במחשב עשרות אלפי פעמים, ואפילו מאות אלפי פעמים. בכל "משחק" כזה, הוא מכניס שינויים קטנים שמבוססים על כל הנתונים שאסף.
- בסימולציה אחת, החלוץ העייף מחמיץ מצב קל.
- בסימולציה אחרת, השופט שורק לפנדל גבולי.
- בסימולציה שלישית, הגשם מתחזק והכדור נעצר בשלולית.
אחרי שהוא מריץ את המשחק, נניח, 100,000 פעם, הוא מקבל תוצאות:
- ב-45,000 משחקים, קבוצה א' ניצחה.
- ב-25,000 משחקים, היה תיקו.
- ב-30,000 משחקים, קבוצה ב' ניצחה.
הנה, קיבלנו את ה"סיכוי האמיתי" לפי המודל: 45% לקבוצה א', 25% לתיקו, 30% לקבוצה ב'. החישוב מתרגם את האחוזים האלה ל"יחס אמיתי": 2.22 לא', 4.00 לתיקו, 3.33 לב'.
אבל (וזה אבל גדול) זה לא היחס שאתם תקבלו. עכשיו נכנס ה-"ויג" (Vig) – העמלה של הבית. הבוקמייקר ייקח את היחסים ה"אמיתיים" האלה וינמיך אותם קצת. במקום 2.22, תקבלו 2.15. במקום 4.00, תקבלו 3.80. הפער הזה? זה הרווח המובטח של הבית. הגאונות של אלגוריתמים לניתוח ביצועי שחקנים היא לא רק בחישוב היחס, אלא בחישובו בצורה כל כך מדויקת, שה-"ויג" תמיד ישאיר את הבית ברווח לאורך זמן.
אז מה, אי אפשר לנצח את המכונה?
זאת שאלת מיליון הדולר. אם המערכת כל כך משוכללת, כל כך חכמה, ויש לה יתרון מובנה (הויג), אז למה בכלל לטרוח?
והתשובה היא שזה מסובך. קודם כל, המודל הוא לא נביא. הוא לא חוזה עתידות. הוא מנוע הסתברויות. הוא מעריך מה סביר שיקרה, לא מה בטוח יקרה. ותמיד, אבל תמיד, יש מקום למשהו בלתי צפוי. זה כל הכיף בספורט.
איפה האלגוריתם עדיין מפספס?
- "הגורם האנושי" הבלתי מדיד: החישוב מנסה לכמת מוטיבציה, אבל זה קשה. מה קורה כששחקן משחק בשביל החוזה הבא שלו? או כשקבוצה עוברת טראומה (כמו המוות של מאמן) ופתאום משחקת "בשבילו"? או סתם כימיה קבוצתית שמתחברת? אלה דברים שהמנגנון מתקשה מאוד למדוד.
- "ברבורים שחורים" (Black Swans): אירועים קיצוניים ונדירים שאין להם תקדים בנתונים. פציעה של כוכב הקבוצה בדקה הראשונה, החלטת VAR הזויה שמשנה מומנטום, או סתם יום שבו הכדור פשוט לא רוצה להיכנס. האלגוריתם מבוסס על היסטוריה, והיסטוריה לא תמיד חוזרת על עצמה.
- מידע פנימי אמיתי (לא מהטוויטר): המודל קורא כל מה שפומבי. הוא לא יודע מה המאמן באמת אמר לשחקנים בחדר ההלבשה. הוא לא יודע על הריב הסודי שלא דלף. כאן, לפעמים, לכתב ספורט מקומי קטן יש יתרון על המכונה.
- התמחור של "הייפ": לפעמים, קבוצה או ספורטאי נהיים כל כך פופולריים (כמו מסי באינטר מיאמי), שכל הציבור מהמר עליהם. המודל מזהה את זה, והבוקמייקרים מזיזים את הליין בכוונה עוד יותר, כדי לנצל את ההייפ. לפעמים זה יוצר "ערך" (Value) דווקא בהימור נגד הקבוצה הפופולרית, כי היחס עליה נמוך מדי באופן לא פרופורציונלי.
בסופו של יום, כשאני מסתכל על ליין ההימורים של ה-NBA או ליגת העל, אני כבר לא רואה שתי קבוצות. אני רואה שתי משוואות מורכבות. ההבנה הזאת קצת מורידה מהרומנטיקה, אני מודה. אבל זה גם הופך את זה למאתגר יותר. זה הופך כל ניצחון למתוק יותר. כי לנצח את המכונה, למצוא את הסדק הקטן הזה במטריקס שהאלגוריתם פספס? זה כבר לא סתם מזל. זה להרגיש, ולו לרגע אחד, שאתה היית חכם יותר מהדבר הכי חכם בחדר.
דרגו אותנו
0 / 5. 0





