Sivu 1/1

Maaliodotusarvoista ja prosenttiarvioista

Lähetetty:
Kirjoittaja Spurs77
Olen tässä kesän ajan luonut uutta, maaliodotusarvoihin perustuvaa, laskentasysteemiäni. Tällainen asia on mietityttänyt jo pidemmän aikaa:

Periaatteessa metodi jakautuu kolmeen päävaiheeseen.

1. Kausikohtaisten maaliodotusarvojen määritys (esikausianalyysi)

2. Ottelukohtaisten maaliodotusarvojen määritys
(olen tässä käyttänyt Oliverin aikanaan esittämää kaavaa A*B/X, missä
A = kotijoukkueen kotiotteluiden MOA
B = vierasjoukkueen vierasotteluissa päästettyjen MOA
X = sarjan kotijoukkueiden keskimääräinen MOA
viewtopic.php?f=10&t=19133)

3. Korjattu poisson

Tässä on ongelmana se, että näissä jokaisessa kohdassa joutuu tekemään lukuihin tai kaavoihin korjauksia. Ensimmäistä kohtaa joudun ehkä hieman avaamaan. Jos tilastot tehdään jälkikäteen siitä, miten joukkueet lopulta pelasivat ottelunsa, saa hyvin erilaisia lukemia, kuin jos tilastot tehdään etukäteisrankingien (nämä toki muuttuvat kauden edetessä) pohjalta (Mika Ässälle kiitos tästä). Itse olen tutkinut tähän mennessä lähinnä Valioliigaa, jossa esim. C-luokan joukkueet ovat etukäteisrankingien pohjalta tehdyssä tilastoinnissa olleet huomattavasti heikompia kuin jälkikäteen tehdyn tilastoinnin mukaan. D-luokan joukkueilla tilanne on päinvastainen. Tässä kausikohtaisten maaliodotusarvojen määritysvaiheessa joukkueen maaliodotusarvojen tulisi vastata tätä jälkimmäistä tilastointia. Tässä kyse ei ole siis varsinaisesta korjauksesta, mutta määrittämisessä on silti selkeät ongelmansa.

Toisessa vaiheessa näistä kausikohtaisista odotusarvoista tulisi johtaa ottelukohtaiset MOA:t. Yllä esitetyn kaavan mukaan johdetut odotusarvot eivät täysin vastaa todellisia maalilukuja, vaan tässä joudutaan käyttämään jonkinlaista korjauskerrointa tms. Esim. huippujoukkueen kohdatessa kotonaan heittopussin em. kaava antaa selkeästi ylisuuria maaliodotusarvoja kotijoukkueelle. Muitakin korjauksia tämän lisäksi tarvitaan.

Kolmas kohta ja korjattu poisson onkin varmasti kaikille tuttu.

Onko tämä liian mutkikas tapa tehdä prosenttiarvioita, sillä virhe yhdessä vaiheessa saattaa romuttaa koko arvion?

Lisäksi vielä kysymys korjauskertoimien määrittämisestä. Olen (Excel on...) piirrellyt erinäköisiä ja kokoisia käppyröitä siitä, miten hyvin Oliverin kaava ja Poisson vastaavat todellisuutta. Nämä kuvaajat osoittavatkin, mihin suuntaan korjauksia tulisi tehdä, mutta käyrät eivät ole kuitenkaan niin selkeitä, että niiden osoittamia korjauskertoimia voisi käyttää sellaisenaan. Osaako joku tilastotieteilijä neuvoa tähän jotain menetelmää vai tulisiko korjauskertoimet määrittää kuvioiden pohjalta pelkällä mutulla (itsellä tilastotieteiden opintoja takana vain pari peruskurssia).

Tulipas pitkä postaus. Toivottavasti edes joku saa selvää...
Kaikki neuvot ja kommentit ovat tervetulleita :)

-Spurs77

Re: Maaliodotusarvoista ja prosenttiarvioista

Lähetetty:
Kirjoittaja credit
Spurs77 kirjoitti: Onko tämä liian mutkikas tapa tehdä prosenttiarvioita, sillä virhe yhdessä vaiheessa saattaa romuttaa koko arvion?
Tapa ei mielestäni ole ainakaan liian "mutkikas". Sen tarkemmin en osaa kommentoida, kun tämä nimenomainen tapa on minulle hieman vieras.
Spurs77 kirjoitti: Lisäksi vielä kysymys korjauskertoimien määrittämisestä. Olen (Excel on...) piirrellyt erinäköisiä ja kokoisia käppyröitä siitä, miten hyvin Oliverin kaava ja Poisson vastaavat todellisuutta. Nämä kuvaajat osoittavatkin, mihin suuntaan korjauksia tulisi tehdä, mutta käyrät eivät ole kuitenkaan niin selkeitä, että niiden osoittamia korjauskertoimia voisi käyttää sellaisenaan. Osaako joku tilastotieteilijä neuvoa tähän jotain menetelmää vai tulisiko korjauskertoimet määrittää kuvioiden pohjalta pelkällä mutulla (itsellä tilastotieteiden opintoja takana vain pari peruskurssia).
Itse suosittelisin määrittämään korjauskertoimet aluksi mutulla (niitä kuvaajia tietenkin apuna käyttäen). Vedonlyönti ei ole tarkkaa tiedettä, ja jos odotat, että sinulla on tarpeeksi dataa, jotta voit määrittää oikeat korjauskertoimet hyvin pienellä virhemarginaalilla, voitkin jo alkaa ihmetellä, onko vuosikymmenen vanha data enää relevanttia. Lisäksi sama data on käytössä kaikilla. Se, joka osaa tehdä pienimmästä mahdollisesta määrästä informaatiota, parhaat ja tarkimmat johtopäätökset, menestyy vedonlyönnissä, kun taas se, joka tavoittelee tieteellistä varmuutta, pääsee hädin tuskin voitolle - jos pääsee. Tärkeää on kokeilla ja yrittää, miten homma käytännössä toimii. Usein oikeansuuntaiset ratkaisut suorastaan hyppäävät silmille, kun puuhailee käppyröiden kanssa tarpeeksi pitkään.