Kan decemberbarn bli hockeyproffs?

Att lyckas inom idrott, så som i livet, har många parametrar som ska vara bra. Just för hockey ska du ha fysisk talang, bra psyke och kanske den viktigaste ingrediensen, viljan att träna. 10’000 timmar ska du lägga ner för att bli elit. Samtidigt som du ska kunna hålla dig skadefri, ta rätt beslut om olika vägar att gå osv.

Vissa saker är medfödda, andra uppfostras du till och vissa är det till och med slumpen som hjälper dig med. Detta pratas det mycket om. Men sannolikheten att du ska lyckas sätts redan vid födseln. Eller födelsedatumet rättare sagt.

Det har skrivits ett antal artiklar om detta och så här i sommarvärmen rekommenderar jag starkt boken Outliers av Malcolm Gladwell. Det är även samma bok som lyfter 10’000 regeln för att bli elit. Boken är fantastisk. Läs.

Genom samhällets struktur menar Gladwell på att de som är födda tidigt på året får ett stort försprång genom uppväxten som gör att de bara utökar “ledningen” mot de som är födda senare på året. Till exempel, de som är födda i januari är 6,5 år gamla när de börjar årskurs 1. De som är födda i december är 5,5 år gamla. Decemberbarnet är alltså 84% av januaribarnets ålder. Den procentuella diffen på en 50-åring är en 42-åring. Vi ser alltså en 50-åring som jämngammal med en 42-åring. Detta får förstås konsekvenser.

”If you make a decision about who is good and who is not good at an early age; if you separate the ‘talented’ from the ‘untalented’; and if you provide the ‘talented’ with a superior experience, then you’re going to end up giving a huge advantage to that small group of people born closest to the cutoff date.”

Malcolm Gladwell

Klart januaribarnet har utvecklat saker som decemberbarnet inte har. Och just detta övertag verkar vara svårt att slå genom livet. Men nog om det, läs boken.

Om vi tar och gräver oss ner i årets draft till NHL, kan vi då se denna “åldersdiskriminering”? Till årets draft var 26’637 spelare “draftbara”. Datat är hämtat från EliteProspects.com där födelsedatum saknas på 7’781 av dessa spelare. Vi gör ett antagande, av bekvämliga skäl, att dessa spelare inte är bra nog för att bli draftade. Om det är beroende på födelsemånad eller något annat bryr vi oss inte om. Så vi har 18’856 spelare kvar att titta på.

Till draften 2019 är det spelare som är födda från 16 September 2000 till och med 15 September 2001 som deltar. Så här ser fördelningen av dessa spelare ut över vilken månad de är födda på.

Redan här ser vi vad som hänt genom åren upp till draften. Spelare som är födda i januari 2001 är nästan dubbelt representerade jämfört med de spelare som är födda månaden före, december 2000.

Hur ser det då ut i Sverige? Jag väljer här att plocka ut de spelare som spelar i de tre av våra ligor som spelare blir draftade ifrån (SHL, Hockeyallsvenskan och SuperElit).

Vi verkar till och med vara ännu värre. Från november och december finns det totalt 14 spelare tillgängliga, medan januari och februari har 70 spelare. Kom ihåg i bakhuvudet att spelare födda i november och december är äldre än vad spelare i januari och februari är och därmed enligt vår tidigare logik torde vara mer utvecklade. Detta är inte heller vilka spelare som blir draftade utan de som är draftbara.

Så vi har nu fastslagit att spelare som är födda senare på året har det svårare att ens lyckats ta plats i lag som gör att de är draftbara vid 18 års ålder. En tidigare myt har varit att NHL-klubbarna har diskriminerat vid draften och endast tagit de spelare som varit födda tidigt på året. Är det så eller har helt enkelt utbudet av spelare varit som sådant? Att det funnits klart fler spelare som varit födda tidigt på året?

Av dessa 18’856 spelare som vi tittar på draftades i slutändan 174 stycken (0,9%). Vi bryter ner det per kvartal för att få en enkel överblick. Av våra draftbara spelare (18’856) är 30% födda under kvartal 1.

Filtrerar vi sedan på draftade spelare så ser vi att hela 40% av alla spelare som draftades 2019 var födda mellan januari och mars. 66% av alla spelare är födda under årets första halva.

Anledningarna till detta kan förstås vara flera, att man ser mer uppsida på en yngre spelare.

En snabbtitt på föregående (2018) och nästa års draft (2020) visar ungefär samma siffror. Det är helt enkelt en större chans att bli draftad av ett NHL-lag om du är född i början på året jämfört med slutet. Ibland så stor som fem gånger större. Så den största tillgång du kan få av dina föräldrar är kanske inte bra längd eller bra psyke. Det är helt enkelt att bli född i rätt månad på året.

Nästa års draftbara spelare

Kul fotnot. Våra två draft-ettor från Sverige, Mats Sundin (februari) och Rasmus Dahlin (april), faller under “tidigt födda” medan samtliga spelare från Sverige som draftats på plats 2-4 (6 st) går som “sent födda” (september och senare).

Så bara för att du är född sent betyder det inte att du inte blir NHL-spelare. Du har bara mindre chans.

Founder. Writer. Data Scientist. The Monkey beater.

I alla tider har det spelats. 3000 år före Kristus skapades de första tärningarna, sedan dess har alla möjliga typer av spel vuxit fram och egentligen allt som ska ske i framtiden kan vi spela på idag; politik, sport, tuppfäktning, modelltävlingar, väder osv.

Det uppskattas att det finns omkring 500 olika spelbolag i Sverige idag. 500 spelbolag! Det är ganska tydligt att “huset vinner” allt som oftast. Spelen är utformade på ett sådant vis. Huset vinner. För att citera mig själv från en artikel i Jönköpingsposten 2017

– Det är inte säkert att ett lag vinner även om sannolikheten är 80 procent för att de ska göra det. Två gånger av tio vinner de inte, så det slår tillbaka. Spelbranschen är en miljardindustri… –  Erik Wilderoth

a

Men hur slår vi huset då? Ja, du är på Better than a Monkey så jag tror du förstår vart jag är på väg. WAAPS. Vi vet att WAAPS levererar någonstans kring 68% rätt i sina förutsägelser. Är det bra nog för att slå huset?

Mig veterligen finns det inga historiska odds att hämta ut från SHL, men däremot har jag kommit över två års historiska odds från NHL. Inspirerad av den fina sidan Corsica, som även där förutser hockeyresultat med hjälp av ML, så genomfördes back testing av algoritmen/modellen. Jag körde helt enkelt igenom de två senaste säsongerna av NHL för att jämföra resultatet.

Två hypoteser som jag därmed testade, 

  1. Genom att använda WAAPS, slår vi huset?
  2. Är modellen “bättre” än Corsicas?

För det första, att förutspå NHL är svårare än SHL. Ta en titt på tabellen nedan där vi jämför NHL och SHL med olika metodet. Procenten står för antalet vinster i procent. Så första raden – HomeTeam – innebär att i SHL så vann hemmalaget 56,6% av matcherna. I NHL vann hemmalaget 54,6%.

Vi ser även tyngden i PowerRanken och i så många fall som 67,2% vann laget som var bäst placerat i SHL. I NHL endast 63,8%. 

Men slår vi huset? Det korta svaret är Ja. Vi slår huset. Med rätt strategi gör vi det även rejält. Grafen baseras på att vi back testat säsongen 2016/2017 med de olika metoderna i tabellen ovan.

Olika utfall med olika spelmetoder.

Ett par saker att anmärka från grafen:

  1. Slutspelet som börjar i April kan vi skippa rent spelmässigt då i stort sett alla spelmodeller ger ett negativt utfall
  2. Odds-favoriten var ett sämre val än odds-underdogen. (Genom att generera fram en säsong till så justeras det till tvärtom)
  3. Att spela på laget som har högst poäng är en helt OK strategi

Men viktigaste skillnaden att kolla på är skillnaden mellan “WAAPS Favorite” och “WAAPS + Math“. Skillnaden mellan att använda sannolikheterna eller inte.

WAAPS Favorite är som det låter, du spelar blint på favoriten som WAAPS producerar. WAAPS + Math innebär att du spelar på det utfallet som ger bäst utfall i längden. Exempel: Washington möter Ottawa. WSH är favoriter med 65%-35%. Oddset ger WSH 1,3 vid seger. Ottawa får 3,0. Vem spelar du på? Med enkel matte kan vi se vilket vi vinner på i längden:
WSH   65% * 1,3 = 0,845
OTT     35% * 3  = 1,05

Svaret är det laget som får över 1,0. Över 1,0 och det är spelvärde i det.

Rent psykologiskt är det tungt att spela på den som troligen förlorar, men är du ihärdig med denna metod, vilket innebär att du spelar på alla matcher(!) och att sannolikheterna stämmer, då har du ett vinnande koncept.

I exemplet ovan har du en pott på $1000 när säsongen börjar. När den är slut har du $3235. Det är en ROI på ~225%. Vart kan du få det?

Så med den logiken har jag tagit fram spelbarheten för första gången:

MatchOdds 1:aOdds 2:aSannolikhet HemmasegerSannolikhet BortasegerSpelbar 1:a?Spelbar 2:a?
FHC-DIF1,552,4841,3%58,7%0,641,46
LHC-TIK1,343,362,2%37,8%0,831,25
MIK-ÖHK1,732,1440,4%59,6%0,701,27
FBK-HV711,622,3361,6%38,4%1,000,89
LHF-BIF1,732,1461,3%37,8%1,060,81
SAIK-RBK1,33,658,0%42,0%0,751,51

Men är Better Than a Monkey bättre än Corsica då?
Enligt back testingen, Ja. Men den tror jag vi ska avvakta kommande säsong med. Vi spelar om det helt enkelt.

Founder. Writer. Data Scientist. The Monkey beater.

Hockeyn är på ingång vilket innebär att även BetterThanAMonkey varvas igång igen. Denna gång på en högre växel. Fokuset kommer som vanligt att ligga på vinstsannolikhetern och i mån av tid artiklar. Tyvärr är det där med tid en ond faktor. 

Till det positiva, 2018-2019 kommer Better Than A Monkey även leverera sannolikheter för världens bästa ishockeyliga, NHL. Jag har under ett år jobbat med algoritmen/modellen för just NHL till och från. Problemet har varit att få det automatiserat till en sådan nivå att jag helt enkelt ska hinna med. 

Så vad är skillnaden på NHL och SHL? NHL är svårare att predicera. Inget snack om det. Finns flertalet andra sajter som levererar vinstsannolikheter till NHL. Flertalet med fler parametrar än WAAPS (eller BET-M som den heter i min vetenskapliga artikel*) men med vad jag kan se lägre accuracy. 

Så vad är målet? Better Than a Monkey? Nej. Better Than the rest. WAAPS ska vara världens bästa modell för att förutse ishockey. 

Historiskt sett ser det rimlig ut. Det bästa med data är att vi faktiskt kommer veta det om 10 månader. 

Så. BetterThanaMonkey fokuserar främst på att leverera sannolikheter för kommande säsong. NHL. SHL. Ett bettingprojekt kommer även att publiceras för att visa på WAAPS förträfflighet.

*Mer om artikeln och bettingprojektet kommande vecka.

Founder. Writer. Data Scientist. The Monkey beater.