jormarules kirjoitti:Tuon kaavan modifikaatiolla ja pienellä viilauksella on kuitenkin voitettu ainakin 2000-alun totals-markkinat mennen tullen eli yksinkertainen voi joskus olla kaunista. Sitä paitsi en tiedä onko se enää monelle yksinkertaista tommonen melko matemaattinen malli missä pitää kertoa ristiin ja jakaa sekä tasapainottaa kaikkien joukkueiden keskiarvolla.
Omissa testauksissa en ole parempaakaan vielä löytänyt...
Itse en ole ollut mukana (läheskään) 2000-luvun alun markkinoita biittaamassa, mutta jos se tuolla Sinun kaavallasi onnistui, se markkina on valovuoden päässä nykyisestä.
Olennainen kysymys tuossa on, mistä tai miltä ajalta nuo maalimäärät poimitaan. Esim. kotoisissa sarjoissa joukkueiden kokoonpanoissa tapahtuu eri kausien välillä niin suuria muutoksia että aiempien kausien maalilukujen luotettavuus on hyvin heikko. Jos maaliarviot otetaan kuluvan kauden sarjasta, menee ainakin puoli sesonkia ennenkuin saaduilla luvuilla on merkittävää luotettavuutta, ja silloinkin päätelmät joudutaan tekemään liian suppeasta datasta.
Tein foorumille joskus vuosi sitten suurehkon selvityksen Englannin valioliigasta tarkoituksena löytää korvaavia menetelmiä todennäköisyysjakauman ja maalilukujen arviointiin. Jotta en puhuisi ihan höpöjä, tutkin tuossa yhteydessä myös maalilukujen ja liigarankingin välistä korrelaatiota. Sain silloin seuranvanlaiset tulokset:
<TABLE BORDER="1" cellspacing="0" align="right"><TR><TH>rank</TH><TH>g.scored</TH><TH>g.allow.</TH><TH>g.differ.
</TH></TR><TR><TD>1</TD><TD>1.73</TD><TD>1.73</TD><TD>1.36
</TD></TR><TR><TD>2</TD><TD>2.45</TD><TD>2.36</TD><TD>2.00
</TD></TR><TR><TD>3</TD><TD>3.18</TD><TD>3.36</TD><TD>3.00
</TD></TR><TR><TD>4</TD><TD>4.55</TD><TD>4.91</TD><TD>4.36
</TD></TR><TR><TD>5</TD><TD>6.00</TD><TD>6.00</TD><TD>5.00
</TD></TR><TR><TD>6</TD><TD>8.91</TD><TD>7.27</TD><TD>6.55
</TD></TR><TR><TD>7</TD><TD>8.64</TD><TD>9.00</TD><TD>7.64
</TD></TR><TR><TD>8</TD><TD>7.91</TD><TD>8.36</TD><TD>9.00
</TD></TR><TR><TD>9</TD><TD>10.27</TD><TD>10.45</TD><TD>9.91
</TD></TR><TR><TD>10</TD><TD>9.73</TD><TD>10.91</TD><TD>10.73
</TD></TR><TR><TD>11</TD><TD>13.73</TD><TD>9.73</TD><TD>11.18
</TD></TR><TR><TD>12</TD><TD>10.45</TD><TD>10.91</TD><TD>11.18
</TD></TR><TR><TD>13</TD><TD>14.18</TD><TD>12.64</TD><TD>13.27
</TD></TR><TR><TD>14</TD><TD>12.91</TD><TD>12.36</TD><TD>12.82
</TD></TR><TR><TD>15</TD><TD>14.82</TD><TD>15.18</TD><TD>13.64
</TD></TR><TR><TD>16</TD><TD>15.55</TD><TD>15.55</TD><TD>15.91
</TD></TR><TR><TD>17</TD><TD>15.00</TD><TD>15.55</TD><TD>17.45
</TD></TR><TR><TD>18</TD><TD>15.18</TD><TD>17.27</TD><TD>16.55
</TD></TR><TR><TD>19</TD><TD>16.09</TD><TD>17.64</TD><TD>19.36
</TD></TR><TR><TD>20</TD><TD>18.73</TD><TD>18.82</TD><TD>19.09</TD></TR></TABLE>
Kaaviota luetaan seuraavasti:
esim. vihreä käyrä kertoo mikä oli
maalieron suhteen parhaan joukkueen keskimääräinen liigasijoitus (1.36), mikä oli toiseksi parhaan joukkueen km. liigasijoitus (2.00) ja niin edelleen.
Korrelaatio on erittäin vahvaa kaikilla kolmella tekijällä mitattuna. Parhaiten liigasijoitusta ennusti maaliero (goal differential).
Tulos voidaan yhtä vahvana tulkita myös toisinpäin:
sarjasijoitus ennustaa maaliluvut erittäin hyvin.
Vaikka maalilukuja ei yksistään määritettäisikään sarjasijoituksen perusteella, noiden tekijöiden keskinäinen riippuvuus on niin vahvaa että tätä ennustetta epäilemättä kannattaa käyttää apuna lisäämässä muilla tavoin muodostettujen maaliarvioiden luotettavuutta.