Legyőzheti-e egy kis csapat a Liverpoolt az adatok segítségével?

Olvasási idő: 9 perc

Intro

Egyre többet olvashatunk mostanság az adatalapú döntéshozatal előnyeiről a sport világában. A tavalyi Bajnokok Ligája győztes Liverpool rendelkezik az egyik legkomolyabb adatelemzői stábbal, ahogy a horvát csapat 2018-as VB döntőjében is jelentős szerepe volt egy adatelemzői csapatnak. A Kelet-európai régió még fejlődő pályán van, ugyanakkor az elmúlt időszakban több kezdeményezés is indult. A Hiflylabs az egyik ilyen sportanalitikai projekten vett részt, ezt mutatjuk be a következőekben egy kis iparági kitekintéssel egybekötve.

A sportanalitika ismertté válik

A sportanalitika témája széleskörű ismertséget először egy filmmel, a 2011-ben Brad Pitt-tel a főszerepben bemutatott Pénzcsinálóval (Moneyball) ért el. A történet szerint Billy Bean, az Oakland A’s baseball csapat General Managere (csapatfőnöke) klubja kedvezőtlen pénzügyi helyzete miatt új megoldások irányába kutatott. Szerződteti segédjének a fiatal sportanalitikai elemzőt, Paul DePodesta-t, akivel karöltve, statisztikai mutatók alapján olyan könnyen elérhető és alulértékelt játékosokat szerződtet, akik keveset játszanak, vagy leszálló ágban vannak jelenlegi csapatuknál. 2000-től 4 egymást követő évben jutnak be a rájátszásba, továbbá 2002-ben, az MLB liga 100+ éves történelmében először történik meg, hogy egy csapat 20 egymást követő mérkőzést nyerjen.

Jó példa arra, hogy az életben gyakran külső kényszerek hatására születnek meg új ötletek, melyek forradalmasítanak végül egy iparágat. A baseball azonban talán az egyik legjobban „adatosítható” sport, könnyen szétválaszthatóak a dobási, ütési és védekezési mozzanatok és ezek eredménye. Alkalmazható-e ez a többi sportra is?

Amikor az adatokat elkezdték az NFL-ben, a profi amerikai foci ligában alkalmazni, a többség szkeptikusan vélekedett. „Ez nem baseball, itt sokkal kiszámíthatatlanabb és kreatívabb a játék” – ez egy sokak által emlegetett vélemény volt. Azóta megváltozott a helyzet, olyannyira, hogy 2014-óta, minden játékos vállvédőjében egy RFID csip található, így minden játékos és a labda pontos mozgása követhető az edzők, de még a nézők számára is, ezekből készülnek a szinte „Real time” elemzések is a mérkőzések közvetítése alatt.

Lehetséges, hogy ilyen szintű adatelemzést végezzünk a labdarúgásban is? Bizonyára nem, hisz a foci egy sokkal, kiszámíthatatlanabb, kreatív… oh várjunk csak, ezt mintha már mondták volna valahol…

Sportanalitika a labdarúgásban

Lássunk egy egyszerű példát a „gurulós fociban” (ahogy a Sport1 amerikai foci közvetítői hívják a labdarúgást): a „passing victim” egy labdaszerzési taktika, célja, hogy az a játékos passzoljon sokat az ellenféltől, aki a legügyetlenebb. A módszer lényege, hogy a tipikusan 4 játékosból álló védelem 3 kijelölt játékosát támadják csak le a támadók és középpályások, így a labda a 4.-hez kerül, aki előre tud csak passzolni. Ő a „passing victim”.

A módszer alkalmazásához a múltban sok órányi videózásra volt szükség, amit a gondos csapatok videóelemzői meg is tettek minden meccs előtt. Minden héten több napot kellett tölteniük a következő ellenfél legutóbbi 4-5 meccsének videóelemzésével, hogy meghatározzák a legjobb és legrosszabb játékosokat.

Azonban adatalapon ez lényegesen egyszerűbb. Hiszen, ha létrehozunk egy adattárházat a csapat számára legfontosabb adatforrásokból és teljesítménymutatókkal, akkor ez az információ néhány perc alatt elérhető. Az elemzői felületről 1-2 kattintással lehívható akár az Arsenal elmúlt 3 évében legrosszabbul passzoló, legalább 300 percet a pályán töltő védője is. Sőt, a dashboardunk megmutathatja, hogy ki jöhet szóba, ha egy 180 cm-nél magasabb, 21 év alatti, jól fejelő, jó célzóképességű, legalább 100.000 Instagram lájkkal rendelkező latin nyelvet beszélő támadót keresünk.

adat, adatADAT

Az adatok nagy részét emberi erőforrás igénybevételével (Messi bal lábbal passzolt, 1 strigula, Messi jobb lábbal még egyszer bal lábbal passzolt, még egy strigula) állítják elő. Bár léteznek már automatizált, AI támogatást alkalmazó videó elemző rendszerek, ezek validálásához még jelentős emberigényre van szükség (pl. védőről lepattanó labdáról eldönteni, hogy rossz kapura lövés, vagy rossz passz volt).

Az elemzések elvégzéséhez jellemzően 3 nagy csoportba sorolhatjuk az adatokat:

  • Match statistics (játékoskeretek, eredmények, kapura lövések, passzok (2-300 adat / meccs).
  • Event data (játékesemények terület alapon, játékosonként (2-3000 adatpont / meccs).
  • Tracking data (helyhez kapcsolt másodperc alapú események, másodperc alapú adatok 22+6 játékosról és a labdáról (2-3 millió adatpont / meccs).

Míg a „match statistics”-re egyszerűbb rendszereket érdemes fejleszteni, az „event data”-val már komolyabb scouting, illetve játékos profilozás lehetséges, addig a „tracking data” használatával már mély taktikai elemzések is lehetségesség válnak. A nagyobb adatmennyiséggel ugyanakkor jelentősen nő a hozzáértés igénye is, és a projekt költsége is, így tisztában kell lennünk, hogy csapatunk (edzőink és játékosaink) egyáltalán milyen információ befogadására képes.

Mennyit is ér ez a rengeteg adat?

A Sportanalitika óriási piaccá nőtte ki magát a világon. A Grand View Research kutatása alapján a globális sportanalitikai piac értéke 2020-ban 1 milliárd $ körül mozog, az előrejelzések szerint 2025-re akár a 4,5 milliárd $-t is elérheti, ebből az európai labdarúgó elemzési piac értéke 100-200 millió € is lehet. Ebből látható, hogy a verseny egyre intenzívebb, és azon csapatok, melyek időben lépnek, komoly versenyelőnyre tehetnek szert, alulértékelt játékosokat vásárolnak, előre jelezhetik az ellenfél gyenge pontjait, követhetik a játékosok napi fizikai állapotát, megelőzhetik a sérüléseket, ezáltal felzárkózhatnak a nagyobb költségvetésű klubok mellé.

Egy sportanalitikai projekt története

A közelmúltban egy ismert kelet-európai klub kezdeményezésére egy pilot projekt megvalósításában vettünk részt. A projekt célja a klub döntéshozóinak (menedzser + sportigazgató) adat alapú támogatása volt, a következő 3 területen:

  • Játékosok teljesítményének értékelése (felnőtt + ifi csapat)
  • Ellenfél elemzés
  • Játékosmegfigyelés (scouting)

A megvalósítás során létrehoztunk egy adattárházat, fejlesztettünk egy Live Dashboard-ot, mindezt kiegészítve egy középtávú adat stratégiával.

Kell egy csapat

Régi álmom volt, hogy egy foci témájú adatprojektben részt vehessek, de azt nem tudtam, hogy ezzel a fél cég is így van, így mikor híre ment a projektnek majdnem tartanunk kellett egy előválogatót a jelentkezők kiszűrésére. Végül egy közel 10 fős kezdő csapattal álltunk ki, a következő pozíciókkal:

  • Data scientist
  • Data engineer
  • Dashboard szakértő
  • UI/UX designer
  • Stratégiai tanácsadó
  • Projekt menedzser
  • Foci analitikai szakértők – különösen nagy segítség volt, hogy bevontuk őket a csapatban konzulensként,  az adatok elemzéséhez

A projekt lebonyolítására a hagyományos top-down, vagy bottom up projekt módszertanok helyett az ún. outside-in módszertant követtük (bővebben a témában), melyben a csapatot 2 részre osztottuk:

  • Az adatelemző csapat elkezdte feltérképezni az elérhető adatokat (WyScout, Instat, Polar, Transfermarkt).
  • Közben a csapat másik fele, külső fociszakértők bevonásával a bemutatandó végeredményre koncentrált, olyan insightokat gyűjtve, melyek valóban hasznosak lehetnek a klub számára.
  • A két csapat folyamatosan iterált egymással, irányt adva az elemzőknek, hogy milyen adatokat keressenek, illetve tiszta képet adva a szakértőknek, hogy mi az, ami valóban megvalósítható lesz.

A mindent eldöntő Játékos-index (legalábbis a FIFA-ban)

A adatokat összesítve, a klub játékos-stratégiája mentén létrehoztuk a Játékos-indexet. Minden pozícióra 10 különböző paraméter alapján (pl. csatároknál a sikeres cselek, kapura tartó lövések, stb. védőknél: szerelések, nyert párharcok, stb.) alakítottuk ki az indexet, ugyanakkor a mutató egy általános képet is képes adni a játékosokról, poszttól függetlenül.

A liga és az utánpótlás liga összes játékosát indexáltuk, minden egyes mérkőzésre, így lehetőség nyílt fejlődésük követésére mérkőzésenként, negyedévenként, vagy akár szezonok között is.

Ezek alapján olyan valós javaslatokat szimuláltunk, melyek a mindennapi életben is keletkezhetnek:

A bemutatásra egy online elérhető Power BI felületet hoztunk létre (online, de nem real-time, a témáról itt bővebben), mely a klub számára már a projekt közepén „kattintható volt”, így lehetőségük volt még a végső változat kialakítása előtt kipróbálni a rendszert, saját javaslataikat beépíteni.

Ne építs atomrakétát, kezdd kicsiben

A 10 millió fociedző országaként ötletekben megközelítettük az 1 milliót, azonban lábbal a zöld gyepen kellett maradnunk, priorizálni kellett a fejlesztési javaslatokat erőforrás szükséglet és hasznosság alapján.  Egyik részről, hiába találunk összefüggéseket az adatok közt, ha azokat sport-szakmailag nem tudjuk hasznosítani (pl.: korrelációt találnánk a kapott sárga lapok és a bedobások száma közt), továbbá, ha túl fejlett módszertant próbálunk bevezetni egy olyan környezetben, ahol eddig semmilyet nem használtak, az a nagy ellenállás miatt valószínűleg nem fog sikerülni.

Első körben mindig érdemes felmérni a klub adatérettségét, a szervezeti felépítés, informatikai felkészültség, egyéni kompetenciák alapján, és ennek megfelelő javaslatot tenni.

Ezután érdemes lépcsőzetesen haladni, ún. proof of concept-tekkel, azaz teszt-projektekkel kezdeni. Ezek az ügyfelek számára kis kockázatot jelentenek, ugyanakkor gyors, 1-2 hónapos lefutásúak, és adnak egy ízelítőt, hogy milyen döntéseket lehet hozni az adatok segítségével, fejlesztik a kollégák adatérettségét és irányt adnak a jövő fejlesztéseinek. A proof of conceptek kialakítását és menedzselését egy hamarosan érkező blogposztban fejtjük ki.

Zárásként válaszoljuk is meg a címben feltett kérdést: összességében nem valószínű, hogy egy kis csapat magasabb adatérettségi szintre lépve rögtön megveri a Liverpoolt, de egy döntetlent jobb eséllyel kiharcolhat.

Források:

https://en.wikipedia.org/wiki/Billy_Beane
https://www.nytimes.com/2019/05/22/magazine/soccer-data-liverpool.html
https://www.grandviewresearch.com/industry-analysis/sports-analytics-market
https://kinexon.com/blog/sports-analytics-change-the-game

https://www.si.com/nfl/2017/11/29/nfl-football-location-tracking-chips-zebra-sports-rfid
https://www.zebra.com/us/en/blog/posts/2019/five-years-ago-nickel-sized-RFID-sensor-changed-NFL-forever.html
https://www.theringer.com/nfl/2018/12/19/18148153/nfl-analytics-revolution

 

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöljük.