
Nimi johtuu siitä, että Excel hakee toteutuneiden lopputulosten todennäköisyyksien logaritmisummaa optimoimalla joukkueiden voimaluvut ja kotiedut. Tällä hetkellä puuhastelen ainoastaan Englannin liigan kanssa, mutta eiköhän tässä muitakin liigoja mukaan saada. Englannin liigasta on mukana kaikki 4 sarjatasoa, joista analyysissä on mukana tämän ja kahden edellisen kauden tulokset, yhteensä lähes 5000 peliä ja 95 joukkuetta (mukana pyörii kolme liigan ulkopuolella tällä hetkellä pelailevaa joukkuetta).
Näiden joukkueiden voimalukujen optimointi vaatii koneelta raakaa voimaa. Käytössäni oleva Pentium4 2.0 GHz tuskaili ongelman kanssa useamman tunnin ajan tänä iltana, joten enpä tiedä, onko tämä kovin käytännöllinen tapa selvittää voimalukuja. Tosin jatkossa optimointi on varmaan hieman helpompaa, kun joukkueiden voimaluvut ovat jo melko tarkkaan tiedossa, eikä tarvitse lähteä tyhjästä liikkeelle.
Optimaattorin perusajatus on se, että kotivoiton ja vierasvoiton suhde on suoraan sama kuin joukkueiden voimalukujen suhde. Tämä on siis oletus, jota ei ole mitenkään tilastollisesti testattu. Optimaattori luonnollisesti määrittää voimaluvut tämän oletuksen mukaan, mutta tasoerojen kertautumista on vaikeampi todistaa oikeaksi tai vääräksi (tästä oli puhetta toisessa topicissa).
Tasapelin todennäköisyys määräytyy funktiosta p=d*x^a, missä x on heikomman joukkueen voimaluvun suhde vahvemman joukkueen voimalukuun (tasavahvoilla joukkueilla x=1). Vakiot d ja a on haettu optimoimalla (yllätys, yllätys). Tässä siis d on tasapelin maksimitodennäköisyys, jolle on saatu arvo 30,9%. Vakio a kuvaa joukkueiden tasoerojen vaikutusta tähän muuttujaan (optimoimalla saatu a=0,156). Tämä eksponentiaalinen käyttäytyminen on täysin hihasta vedetty, mutta olen löytänyt sille hieman tilastollista pohjaa.
Hihasta vedetty on myös aikaisempien pelien vaikutus joukkueen nykytasoon. Tällä hetkellä olen käyttänyt voimalukujen määrittämiseen arviota, jolla pelin merkitys joukkueen suoritustasoon putoaa 70% vuodessa (jäljelle jää 30%). Kahden vuoden takaisen pelin merkitys on siis enää 9% suhteessa juuri pelatun pelin tulokseen. Kotiedun määrityksessä pudotusta tapahtuu vain 20% (oletan kotiedun olevan stabiilimpi kuin joukkueen suoritustason). (Nämä arvot olisi periaatteessa mahdollista hakea optimoimalla, mutta Excelin rahkeet eivät oikein riitä sellaiseen, ja lisäksi kyseinen optimointiprosessi veisi todennäköisesti viikkoja, ellei kuukausia.)
Optimaattorin heikkouksiin edellä mainittujen oletusten lisäksi kuuluu melko hidas reagointi joukkueissa tapahtuneisiin suuriin muutoksiin (esim. Chelsea). Myös sarjatasojen välisten erojen selvittäminen ja sitä kautta sarjanousijoiden ja -putoajien suoritustason selvittämiseen liittyy vielä jonkin verran epätarkkuutta. Myöskään kokoonpano- ja motivaatiotekijät eivät vaikuta mitenkään arvioihin.
Miksikö kerron näin tarkkaan Optimaattorin toiminnasta? Ajattelin, että jos (ja kun) alan esitellä Optimaattorin %-arvioita tällä foorumilla, olisi asiallista, että kerron, miltä pohjalta arviot tehdään. Voin luvata, että tulossa on myös melkoisen raflaavia arvioita...
Optimaattorin toiminnasta ei ole tietenkään vielä minkäänlaista seurantaa olemassa, ja jännityksellä odotan, millaista tulosta ohjelma alkaa tehdä. Varmaankin pistän pystyn virtuaalikassan, jolla hommaa aletaan seurailla.
Tässä kuitenkin vielä kiinnostuneille Valioliigan ja ykkösdivarin rankinglistat Optimaattorin mukaan...
Valioliiga:
1. Arsenal
2. Manchester_U
3. Chelsea
4. Newcastle
5. Liverpool
6. Fulham
7. Charlton
8. Middlesbrough
9. Birmingham
10. Southampton
11. Bolton
12. Blackburn
13. Manchester_C
14. Everton
15. Tottenham
16. Aston_Villa
17. Leicester
18. Leeds
19. Portsmouth
20. Wolverhampton
Ykkösdivari:
1. West_Ham
2. West_Bromwich
3. Sheffield_U
4. Norwich
5. Ipswich
6. Reading
7. Wigan
8. Cardiff
9. Millwall
10. Sunderland
11. Nottingham
12. Preston
13. Crewe
14. Gillingham
15. Burnley
16. Coventry
17. Crystal_P
18. Watford
19. Rotherham
20. Walsall
21. Derby
22. Wimbledon
23. Stoke
24. Bradford
Eriäviä mielipiteitä rankingistä saa (ja pitää) esittää, yritän parhaani mukaan perustella Optimaattorin mielipiteen...
Minikommentit