Getting closer.

Tanken med Better Than a Monkey är att algoritmen ska bli bättre över tid. En stor del i dataprojekt av det här slaget är att arbeta hypotesbaserat. “Ett lag tar mer poäng borta än hemma” t.ex. Efter att hypotesen presenterats så försöker jag helt enkelt slå hål på den med fakta, lyckas jag inte så hamnar det som ett attribut i algoritmen -> Hemmafördel.

På detta sätt har till exempel antalet spelarövergångar undantagits modellen. Hypotesen “ju fler övergångar, ju sämre resultat” var på arbetsbordet under en tid. Det var en hypotes som inte bara stacks hål på, utan Skellefteås facit med ständiga topplaceringar trots nästan fullständiga truppbyten de senaste säsongerna krossade hypotesen totalt. Antalet förändringar i en trupp är alltså inte direkt kopplat till ett resultat.

Det växte däremot fram en annan hypotes igår kväll som bekräftades genom att köra igenom en simulering på all data som bygger upp Better Than a Monkey. Att ingående form har stor påverkan på en matchs utgång har tidigare bevisats i hypotesarbetet av modellen. Men en utveckling av det skedde i och med mötet mellan Växjö och Karlskrona.

Nämnde det som snabbast i ett inlägg igår (går att läsa här), att Karlskrona kom in med en makalös fin form mötte ett formsvagt Växjö. Men stämde det egentligen? Hur mäter man form.

Tidigare (t.o.m idag) har form helt enkelt räknats på sista matchernas resultat och poäng. Det ger något liknande som följande:

Växjös MatcherPoängKarlskronas MatcherPoäng
4-3 (ÖT) vs HV23-1 vs LIF3
4-1 vs LIF34-0 vs DIF3
2-3 (ÖT) vs SAIK15-2 vs FBK3
1-3 vs Luleå04-1 vs RBK3
1-3 vs FHC04-2 vs RBK3
Total Poäng:615

Men att Växjö förlorat mot tre “Power Horses” som FHC, SAIK och LHF, ska det verkligen värderas på samma sätt som att förlora mot t.ex. LIF?

Här skapades då hypotesen “form baseras på motståndarens kvalité och resultat”. Därmed ger inte en seger mot LIF alls samma status som en seger mot exempelvis SAIK. Detta test genomfördes med stor framgång och testerna visar på en modell som är mer tillförlitlig.

Exempel nedan (inga exakta siffror)

Växjös MatcherPoängKarlskronas MatcherPoäng
4-3 (ÖT) vs HV+4903-1 vs LIF+345
4-1 vs LIF+3454-0 vs DIF+490
2-3 (ÖT) vs SAIK-3505-2 vs FBK+527
1-3 vs Luleå-4004-1 vs RBK+410
1-3 vs FHC-3804-2 vs RBK+400
Total Poäng:-2952'172

(Skillnad i VHL-KHK ovan, där KHK’s formövertag snarare ökade än minskade)

Den nya modellen kommer först att användas i helgen men är provkörd på kvällens matcher. Enda justeringen i favoritskap var i matchen DIF – LHF där DIF tog över fanan med 55% – 45%. Om två timmar får vi facit.