How this is going to work.

Hur bygger man ett system som förutser ett resultat? Vi kan tala om smarta saker, smarta system, AI och machine learning. Teorierna som gömmer sej bakom dessa namn är inget nytt, vi kan ta “Bayesiansk statistik” som exempel. Thomas Bayes, en engelsk statistiker/matematiker på 1700-talet arbetade fram en sannolikhetslära som än idag används flitigt. Teorin bygger på hur framtida händelser påverkar det vi redan vet.

Bayes sats
Bayes sats. Sannolikeheten för B givet att A inträffar

En parantes är att mannen Thomas Bayes själv var känd som en riktig tjurgubbe vilket gjorde att ingen ville erkänna hans teorier förarens han var död. Målningarna som finns av han ska även de vara återskapade efter hans bortgång vilket gör gör han till en mytomspunnen herre.

Thomas Bayes.
Thomas Bayes.

Hur Bayes Sats fungerar och hur man kan leva ett Bayesiskt liv kommer vi gå igenom vid senare tillfälle. Det innebär inte att man ska vara sur.

Det som har förändrats är alltså inte teorierna, utan teknikerna att använda dem. Men det kräver en input, ett inflöde av data som är så bra som möjligt. Först då kommer algoritmen som används(skulle kunna vara Bayes Sats) göra ett bra jobb för oss och ge oss en pålitlig output. En output som i fallet med Better Than a Monkey är ett hockeyresultat.

Inputen är historisk data i form av tidigare hockeyresultat. Givetvis är det inte bara att sätta på en algoritm på tidigare spelade matcher. Då hade detta varit skapat för länge sedan. Här gäller det att skapa en struktur på datat som algoritmen gillar att arbeta med. Algoritmen är så pass smart som vi hjälper den att vara.

Så hur ska Better Than a Monkey fungera?

Det är egentligen inte svårare än hur man funderar själv på hur en match ska sluta. Den stora skillnaden och fördelen med att skapa detta genom en “maskin” är just att det är en maskin. Den kommer inte ha någon bias på det sättet en människa har. Den saknar alltså personliga värderingar, så som fördomar, favoritlag och “egna sanningar”. Den kommer även kunna bearbeta såna mängder data som tar en människa veckor på sekunder.

Men vi måste skapa förutsättningarna till maskinen.

1. Vi måste berätta för maskinen hur bra ett lag är. Hur vet man det? En tabell är ju en bra början, “den ljuger ju aldrig”. Vi kommer inte använda den traditionella tabellen utan istället använda ett “Power Rank-system” som bygger på matcher över lång tid. (Som exempel, om Karlskrona vinner premiären mot Malmö och svenska mästarna Frölunda förlorar sin premiär mot Malmö (ja båda premiärspelar mot Malmö), så skulle en traditionell tabell säga att Karlskrona är ett bättre lag än Frölunda och därmed gjort dem till storfavorit om dessa lag hade mötts i nästa omgång(vilket vi alla kan vara överens om inte kanske traditionellt sätt är hur vi skulle sätt på det)).

Power Ranken läser in matcher över längre tid för att inte vara speciellt formstyrt utan mer kvalitetsstyrt. Detta gör att varje lag får en unik Power Rank för varje omgång vilket även gör att vi kan jämföra hur bra två olika uppplagor av ett lag varit. Vi kommer även få siffror på hur starkt offensiv respektive defensiv varje lag har.

Som exempel säger vi att Frölunda efter omgång 1 har en Power Rank på 75 (100 är max) och Karlskrona 35. I vår hypotestiska värld så möts dessa lag i nästa omgång i Frölundas hemmaarena, Scandinavium.

fhc
vs.
khk
75
Power Rank
35

2. Vi måste sedan väga in form. Form från föregående säsong är på det stora hela inte jätteintressant utan vi har ju bara en match att gå på.

fhc
vs.
khk
75
Power Rank
35
-1
Form
+1
74
Total
36

3. Hur bra hemma/borta lag är lagen? Detta tar vi fram genom att skapa upp en powerrank för hemma/borta spel per lag och kolla differensen mot den vanliga powerranken. Differnsen vi får fram ger oss då exakt hur mycket starkare de olika lagen är hemma gentemot på bortaplan. Här är det lätt att luras av en vanlig hemma/borta tabell. Säsongen 2015/2016 tog Frölunda flest poäng av samtliga lag på hemmaplan (60 stycken) medans Karlskrona tog minst på bortaplan av samtliga lag (15). Det som dock inte ska glömmas är att Karlskrona tog endast totalt 31 poäng vilket visar att hemma/borta-fördelen är minimal i deras fall. Frölunda däremot tog totalt 16 poäng fler hemma än borta.

fhc
vs.
khk
75
Power Rank
35
-1
Form
+1
+2
Hemma/Bortafördel
+-0
76
Total
36

4. En annan aspekt, där maskinen gör ett stort jobb för oss är genom att söka igenom datat, är att se hur ett lag som Karlskrona, med den Power Ranken med justeringar samt skicklighet(offensivt/defensivt) har presterat historiskt mot lag i Frölundas sits. Ett bra lag, med god offensiv kraft men som kommer med en förlust in i matchen.

fhc
vs.
khk
75
Power Rank
35
-1
Form
+1
+2
Hemma/Bortafördel
+-0
-1
Situationsjsutering
+1
75
Total
37

5. Andra saker som kommer påverka är saker som var under säsongen vi befinner oss, bra lag med högre Power Rank har en tendens att prestera bättre ju längre in på säsongen vi befinner oss, och därmed som bäst i slutspelet. Antalet vilodagar påverkar även det resultatet, för korta vila ger tröga ben, för lång vila matchovana. Detta påverkar givetvis olika lag på olika sätt.

fhc
vs.
khk
75
Power Rank
35
-1
Form
+1
+2
Hemma/Bortafördel
+-0
-1
Situationsjsutering
+1
+1
Övriga aspekter
+-0
76
Total
37

På detta sätt har vi givit maskinen förutsättningar att ge oss sannolikheten för olika utfall i slutändan.

fhc

67%
vs.
khk

33%
75
Power Rank
35
-1
Form
+1
+2
Hemma/Bortafördel
+-0
-1
Situationsjsutering
+1
+1
Övriga aspekter
+-0
76
Total
37

Dessa siffror berättar då för oss att Frölunda vinner denna typen av match i 67 av 100 fall.

—————————–

På det stora hela är det så här vara grunden för programmet kommer vara. Ganska coolt va? Lägg där till att en algoritm kommer köras mot datan som modellerats fram förfina slutresultatet.

Nu kör vi!