Blog : Řeč čísel – Jak by mohl Arsenal dopadnout

 

Jsem denně pod palbou čísel a výpočtů a jeden den cestou z práce mě napadlo, jak by mohla vypadat spojnice trendu našich výsledků nebo průběžných umístění.

Přítelkyně tvrdí, že vysvětluji příliš složitě a technicky, tudíž zkusím být pokud možno nejstručnější. Věřím, že se možná najde v diskuzi i takový odborník, který to vysvětlí lépe.

Takže, máte-li grafický průběh funkce (například body získané v utkání za sezónu), lze v tabulkovém editoru (rozuměj Excel) vložit spojnici trendu, tedy úsečku (lineární) nebo křivku (exponenciální), která určuje trend směřování funkce a dokáže, jak bych tak řekl, „předpovědět“ nebo spíše dopočítat průběh do budoucna.

Počet bodů

První tabulka, kterou jsem sestavil, byla tabulka počtu bodů v jednotlivých kolech. Spojnice trendu by tak měla dopočítat, kolik by měl kdo mít bodů na konci 38. kola. A protože jsem chtěl, aby byl graf alespoň trochu přehledný, nechal jsem tam pouze sedm (momentálně) prvních týmů (shodou okolností ty, které se poperou o „evropské“ příčky). A zde malý obrázek:

Takhle by grafické průběhy a spojnice trendů vypadaly, kdyby byly brány od počátku ročníku.

Souhrnně tedy (konečné umístění po 38. kole):

  1. Chelsea
  2. City
  3. Účka
  4. Saints
  5. Arsenal
  6. Spurs
  7. Pool

Protože bude určitě někdo namítat, že forma na začátku je jiná než na konci a podobně, pro srovnání jsem udělal grafy a spojnice trendu i pro posledních deset kol (17.-26.) a posledních pět kol (22.-26.):

Last 10 rounds (konečné umístění po 38. kole):

  1. Chelsea
  2. Pool
  3. Arsenal (tady to bylo těsně s Poolem)
  4. Saints
  5. City
  6. Spurs
  7. Účka

Last 5 rounds (konečné umístění po 38. kole):

  1. Chelsea
  2. City
  3. Pool
  4. Arsenal (tady to bylo těsně s Poolem)
  5. Účka
  6. Spurs
  7. Saints

 

Pozice v tabulce

Druhou tabulku jsem sestavil, protože získané body nemusí vždy znamenat žádané umístění. Každý rok získá titul PL tým s určitým bodovým ziskem a – logicky – týmy umístěné na místě druhém a níž potřebují pro danou příčku bodů míň/víc. I sám AW několikrát vedl debatu o tom, kolik bodů stačí na postup do LM. Pokaždé je to jinak. Samotná pozice v tabulce má tedy jinou vypovídající hodnotu.

Graf, který vyhodnocuje pozice od začátku sezóny je docela nepřehledný. Proto si dovolím jen stručný výčet výsledků:

Souhrnně tedy (konečné umístění po 38. kole):

  1. Účka
  2. Saints
  3. City
  4. Chelsea
  5. Arsenal
  6. Spurs
  7. Pool

Tady si dovolím dodat jeden postřeh. Lineární spojnice trendu v tomto vyhodnocení není nejvhodnější. V konečném výčtu totiž 1. místo tedy hodnostu „1“ v 38. kole měla Chelsea. Oba Manchestery a Saints křivku končili nad 1. místem, což nelze. Spojnice se dostala do těchto pozic, protože byla ovlivněna strmostí postupů těchto týmů během sezóny. Takže tohle vyhodnocení lze brát spíše jako skokan sezóny. 

Vyhodnocení posledních deseti a pěti kol lineární spojnicí doprovází stejné zkreslení, ale výsledky už jsou zajímavější:

Last 10 rounds (konečné umístění po 38. kole):

  1. Chelsea
  2. City – Arsenal – Pool (dělené umístění)
  3. Saints
  4. City
  5. Spurs – Účka

Last 5 rounds (konečné umístění po 38. kole):

  1. Arsenal (hezké, viďte!)
  2. Chelsea
  3. Pool
  4. City
  5. Účka
  6. Spurs
  7. Saints

Důkaz grafického vyhodnocení umístění (Last 10 rounds)

Exponenciální spojnice

Když jsme si řekli, proč je lineární vyhodnocení nevhodné, dodám řešení: spojnice trendu exponenciální. Ta je nevhodná pro nárůst bodů (protože narůstání bodů je součtem), kdežto pro vyhodnocení pořadí by mohla být užitečnější a abych nezdržoval, připojím už jen vliv deseti a pěti posledních kol:

Last 10 rounds (konečné umístění po 38. kole):

  1. Chelsea
  2. City
  3. Arsenal
  4. Saints
  5. Pool
  6. Spurs
  7. Účka

Last 5 rounds (konečné umístění po 38. kole):

  1. Chelsea
  2. Arsenal (taky hezké, že!)
  3. City
  4. Pool
  5. Účka
  6. Spurs
  7. Saints

Tady jsou přiložené grafy s exponenciální spojnicí trendu:

Co vy na to? Budu rád, když se jakkoliv vyjádříte v diskuzi. Třeba i poradíte, která funkce je vhodnější a kolik kol sezóny je objektivnější….

 

by Mandinho44

Komentáře

  1. Pulec (karma: 0) #1

    Nechci se do toho moc vkladat, ale prijde mi to cele dosti nevhodne, nasilne napasovane na nejakou „statistiku.“ Zajimavy napad, ale bez jakehokoli prinosu. Kdyz nefunguje linearni trend, tak bude jiste fungovat exponencialni pro mensi pocet kol, jen aby byl vysledek co nejlepsi pro Arsenal. Takovy z toho mam pocit.
    Vyvoj formy bych mozna sledoval v probehu nekolika poslednich sezon. I tak by to bylo opatreno obrovskou chybou. Proste bych rekl, ze predpovidat vysledek u tak nepravdepodobneho, jako je vysledek dalsich 14 kol v anglicke lize na zaklade jakehosi vyvoje trendu vykonnosti jednotlivych tymu v dane sezone, je sebevrazda.

  2. Gundinho (karma: 0) #1

    Pulec: Souhlasím. Dle mého by bylo rozumnější srovnat třeba 10 kol před koncem losy týmů na 3. a 7. místě, protože řešit Chelsea a ManCity je zbytečnost. No a postupně vyhodnocovat podle aktuální formy, předchozích střetnutí možné výsledky.

    Loni jsme touto dobou byly pořád v boji o titul jen pár bodů za Chelsea a měli jsme slušnou formu až na výprask s Poolem. Poté přišla ostuda na Stamford Bridge a k tomu 3 zápasy bez výhry a titul byl v háji. Tohle by spojnice trendu nemohla nikdy předpovědět.

  3. Pulec (karma: 0) #1

    Mandinho44: ja ti to neberu, jen to proste neobstoji. Vstupuje do toho az moc promennych a vsechny maji velky dopad na pravdepodobnost spravnosti vysledku. Do podobnych predpovedi bych se nepoustel, navic jsem nikdy nic podobneho nevidel, ale rad se poucim.
    Navic, kdyz zmensis svuj statisticky soubor z 28 na 5, tak tim udelas obrovskou chybu, coz je videt napr u exponencialniho trendu, kde 5ti kolova statistika prisoudi Sotonu pad do hlubin zapomneni. Coz neznamena, ze nemohous skoncit v top4.

  4. Smurf (karma: 0) #1

    [quote name=“Pulec“]
    Vyvoj formy bych mozna sledoval v probehu nekolika poslednich sezon. [/quote]

    Ako píšeš, nemá to nejakú výpovednú hodnotu – ale pre zaujímavosť som teda spravil takú tabuľku. Rok 2015 je (okrem súčasného počtu bodov) priemerom tých zvyšných sezón.

    [img]http://s9.postimg.org/sde9bnnv3/AFC_Tab_26_38.jpg[/img]

  5. Pulec (karma: 0) #1

    Smurf: ano, mozna to neco rekne, ale chtelo by to pro vsechny tymy o kterych mluvil Mandinho44. To by zaslouzilo srovnani a dala by se na tom mozna stavet predikce umisteni na konci sezony. Je to muj nazor, stejne jako Mandinho44 prednesl svuj. Tim me podnitil po delsi dobe k diskuzi na gunners.cz a za to mu dekuji. 🙂

  6. Mandinho44 (karma: 0) #1

    To Pulec:

    Neobstojí v čem?

    O objemu proměných a dopadu na pravděpodobnost jsem věděl a v článku to nezapírám. Nikde netvrdím, že je můj propočet 100% správný a že Saints se určitě propadnou.

    Stejně tak ale ty si nemůžeš být 100% jistý, že žádná z variant nevyjde a Saints opravdu nepropadnou 😆

    Edit: zrovna sem si říkal, kdes tak dlouho byl? Není zač 😉

  7. Smurf (karma: 0) #1

    [quote name=“Pulec“]Smurf: …ale chtelo by to pro vsechny tymy o kterych mluvil Mandinho44. To by zaslouzilo srovnani a dala by se na tom mozna stavet predikce umisteni na konci sezony. [/quote]
    Here you go 🙂 (edit: mal som tam chybku)
    [img]http://s11.postimg.org/3m1h2oggj/AFC_Tab_26_38xy.jpg[/img]

    Po zaokrúhlení by teda tabuľka sezóny 2014/2015 vyzerala takto (na základe priemerov ostatných sezón):

    3. ManUtd 72
    4. Arsenal 71
    5. Liverpool 67
    6. Spurs 64
    7. Southampton 62

    Ale aby sme pochopili presnosť takéhoto „odhadu“. Tu je tabuľka rozdielu v bodoch pri skutočnom tohtoročnom zisku a zisku podľa priemeru ostatných sezón:

    (Tím/PTS 26 podľa priemeru/ PTS 26 skutočnosť / rozdiel)
    Arsenal / 50.2 / 48 / 2,2
    ManUtd / 56.4 / 47 / 9,4
    Liverpool / 42 / 45 / -3
    Southampton / 33 / 46 / -13
    Spurs / 48.2 / 44 / 4,2

  8. olidata (karma: 0) #1

    Na týchto prognózach mi vadilo, že ani v jednom prípade sme sa neumiestnili na prvom mieste. Rozmýšľal som prečo, a prišiel som na to, že tu nie je zahrnutá mentálna sila nášho kolektívu a charakter, ktorý preukazuje mužstvo (podľa tlačoviek). Zahrnutie týchto faktorov do grafov nás okamžite katapultuje na majstrovské miesto v každom z uvedených prípadov. 🙂 🙂

  9. Gunner_Pav (karma: 0) #1

    [quote name=“oggy.svab“]Pro zpestření dobrý. Ale statistika nikdy nevystihne dostatečně dvě věci. „Los“ a „random faktor“.[/quote]
    Ona je statistika a statistika. Samozrejme tyto trendy na zaklade dosu ziskanych bodu, jsou spis pro pobaveni (nic proti autorovi, kazdy prispevek, ktery probudi diskusi se pocita).
    Na druhou stranu statisticka analyza tzv. velkych dat ma ve sportu hodne prostoru. Staci vzpomenout na pribeh Oakland Athletics, nebo treba na soucasne uspechy FC Midtjylland. Jsem zvedavy, jak se tahle metoda podari Benhamovi implementovat v Brentfordu

  10. Ixtrinium (karma: 0) #1

    Analyzovat předpovědi umístění z počtu doposud získaných bodů nebo z posledních pár kol je asi stejné, jako kdybys to luštil z křišťálové koule. 🙂
    Z podobných statistických výpočtů by se dala získat „věrohodná“ předpověď, jak ty týmy dopadnou, ale to bys do těch výpočtů musel zahrnout kvanta a kvanta dat, třeba i ta, co jsi teď spočítal, ale jejich dopad na výpočet by byl minimální. Pokud chceš udělat „objektivnější“ výpočty, tak doporučuji zanalyzovat u všech týmů jejich zbylé zápasy a každý zápas poměřit oba týmy nějakými daty a dát těm týmům % šance na výsledek… podklady pro porovnání týmů najdeš třeba na http://www.squawka.com … Excel by na tohle poměřování měl stačit. Výsledkem by mělo být pravděpodobné umístění v tabulce s nějakou pravděpodobností, např. budeme mít 50% pravděpodobnost na 4. místo, 20% na 3., 2% na 1., 1% na 10., atd. V excelu by měly na tohle být funkce, které ti to dokáží vypočítat, jen musíš opatrně pracovat s těmi daty.

  11. mc1897 (karma: 0) #1

    [quote name=“Ixtrinium“]Pokud chceš udělat „objektivnější“ výpočty, tak doporučuji zanalyzovat u všech týmů jejich zbylé zápasy a každý zápas poměřit oba týmy nějakými daty a dát těm týmům % šance na výsledek……. Výsledkem by mělo být pravděpodobné umístění v tabulce s nějakou pravděpodobností, např. budeme mít 50% pravděpodobnost na 4. místo, 20% na 3., 2% na 1., 1% na 10., atd.[/quote]
    Ix thnx, plus-minus som chcel nieco podobne navrhnut, som rad ze to nemusim formulovat, lebo mam podobny problem ako Mandinho – malokto mi rozumie, ak sa vyjadrujem bez rozmyslania, ako hlava narastla 😆

Napište komentář

Musíte být pro přidání komentáře.