Maaliodotusarvoista ja prosenttiarvioista
Lähetetty:
Olen tässä kesän ajan luonut uutta, maaliodotusarvoihin perustuvaa, laskentasysteemiäni. Tällainen asia on mietityttänyt jo pidemmän aikaa:
Periaatteessa metodi jakautuu kolmeen päävaiheeseen.
1. Kausikohtaisten maaliodotusarvojen määritys (esikausianalyysi)
2. Ottelukohtaisten maaliodotusarvojen määritys
(olen tässä käyttänyt Oliverin aikanaan esittämää kaavaa A*B/X, missä
A = kotijoukkueen kotiotteluiden MOA
B = vierasjoukkueen vierasotteluissa päästettyjen MOA
X = sarjan kotijoukkueiden keskimääräinen MOA
viewtopic.php?f=10&t=19133)
3. Korjattu poisson
Tässä on ongelmana se, että näissä jokaisessa kohdassa joutuu tekemään lukuihin tai kaavoihin korjauksia. Ensimmäistä kohtaa joudun ehkä hieman avaamaan. Jos tilastot tehdään jälkikäteen siitä, miten joukkueet lopulta pelasivat ottelunsa, saa hyvin erilaisia lukemia, kuin jos tilastot tehdään etukäteisrankingien (nämä toki muuttuvat kauden edetessä) pohjalta (Mika Ässälle kiitos tästä). Itse olen tutkinut tähän mennessä lähinnä Valioliigaa, jossa esim. C-luokan joukkueet ovat etukäteisrankingien pohjalta tehdyssä tilastoinnissa olleet huomattavasti heikompia kuin jälkikäteen tehdyn tilastoinnin mukaan. D-luokan joukkueilla tilanne on päinvastainen. Tässä kausikohtaisten maaliodotusarvojen määritysvaiheessa joukkueen maaliodotusarvojen tulisi vastata tätä jälkimmäistä tilastointia. Tässä kyse ei ole siis varsinaisesta korjauksesta, mutta määrittämisessä on silti selkeät ongelmansa.
Toisessa vaiheessa näistä kausikohtaisista odotusarvoista tulisi johtaa ottelukohtaiset MOA:t. Yllä esitetyn kaavan mukaan johdetut odotusarvot eivät täysin vastaa todellisia maalilukuja, vaan tässä joudutaan käyttämään jonkinlaista korjauskerrointa tms. Esim. huippujoukkueen kohdatessa kotonaan heittopussin em. kaava antaa selkeästi ylisuuria maaliodotusarvoja kotijoukkueelle. Muitakin korjauksia tämän lisäksi tarvitaan.
Kolmas kohta ja korjattu poisson onkin varmasti kaikille tuttu.
Onko tämä liian mutkikas tapa tehdä prosenttiarvioita, sillä virhe yhdessä vaiheessa saattaa romuttaa koko arvion?
Lisäksi vielä kysymys korjauskertoimien määrittämisestä. Olen (Excel on...) piirrellyt erinäköisiä ja kokoisia käppyröitä siitä, miten hyvin Oliverin kaava ja Poisson vastaavat todellisuutta. Nämä kuvaajat osoittavatkin, mihin suuntaan korjauksia tulisi tehdä, mutta käyrät eivät ole kuitenkaan niin selkeitä, että niiden osoittamia korjauskertoimia voisi käyttää sellaisenaan. Osaako joku tilastotieteilijä neuvoa tähän jotain menetelmää vai tulisiko korjauskertoimet määrittää kuvioiden pohjalta pelkällä mutulla (itsellä tilastotieteiden opintoja takana vain pari peruskurssia).
Tulipas pitkä postaus. Toivottavasti edes joku saa selvää...
Kaikki neuvot ja kommentit ovat tervetulleita
-Spurs77
Periaatteessa metodi jakautuu kolmeen päävaiheeseen.
1. Kausikohtaisten maaliodotusarvojen määritys (esikausianalyysi)
2. Ottelukohtaisten maaliodotusarvojen määritys
(olen tässä käyttänyt Oliverin aikanaan esittämää kaavaa A*B/X, missä
A = kotijoukkueen kotiotteluiden MOA
B = vierasjoukkueen vierasotteluissa päästettyjen MOA
X = sarjan kotijoukkueiden keskimääräinen MOA
viewtopic.php?f=10&t=19133)
3. Korjattu poisson
Tässä on ongelmana se, että näissä jokaisessa kohdassa joutuu tekemään lukuihin tai kaavoihin korjauksia. Ensimmäistä kohtaa joudun ehkä hieman avaamaan. Jos tilastot tehdään jälkikäteen siitä, miten joukkueet lopulta pelasivat ottelunsa, saa hyvin erilaisia lukemia, kuin jos tilastot tehdään etukäteisrankingien (nämä toki muuttuvat kauden edetessä) pohjalta (Mika Ässälle kiitos tästä). Itse olen tutkinut tähän mennessä lähinnä Valioliigaa, jossa esim. C-luokan joukkueet ovat etukäteisrankingien pohjalta tehdyssä tilastoinnissa olleet huomattavasti heikompia kuin jälkikäteen tehdyn tilastoinnin mukaan. D-luokan joukkueilla tilanne on päinvastainen. Tässä kausikohtaisten maaliodotusarvojen määritysvaiheessa joukkueen maaliodotusarvojen tulisi vastata tätä jälkimmäistä tilastointia. Tässä kyse ei ole siis varsinaisesta korjauksesta, mutta määrittämisessä on silti selkeät ongelmansa.
Toisessa vaiheessa näistä kausikohtaisista odotusarvoista tulisi johtaa ottelukohtaiset MOA:t. Yllä esitetyn kaavan mukaan johdetut odotusarvot eivät täysin vastaa todellisia maalilukuja, vaan tässä joudutaan käyttämään jonkinlaista korjauskerrointa tms. Esim. huippujoukkueen kohdatessa kotonaan heittopussin em. kaava antaa selkeästi ylisuuria maaliodotusarvoja kotijoukkueelle. Muitakin korjauksia tämän lisäksi tarvitaan.
Kolmas kohta ja korjattu poisson onkin varmasti kaikille tuttu.
Onko tämä liian mutkikas tapa tehdä prosenttiarvioita, sillä virhe yhdessä vaiheessa saattaa romuttaa koko arvion?
Lisäksi vielä kysymys korjauskertoimien määrittämisestä. Olen (Excel on...) piirrellyt erinäköisiä ja kokoisia käppyröitä siitä, miten hyvin Oliverin kaava ja Poisson vastaavat todellisuutta. Nämä kuvaajat osoittavatkin, mihin suuntaan korjauksia tulisi tehdä, mutta käyrät eivät ole kuitenkaan niin selkeitä, että niiden osoittamia korjauskertoimia voisi käyttää sellaisenaan. Osaako joku tilastotieteilijä neuvoa tähän jotain menetelmää vai tulisiko korjauskertoimet määrittää kuvioiden pohjalta pelkällä mutulla (itsellä tilastotieteiden opintoja takana vain pari peruskurssia).
Tulipas pitkä postaus. Toivottavasti edes joku saa selvää...
Kaikki neuvot ja kommentit ovat tervetulleita
-Spurs77