STRATEGIE
HUD potřebný vzorek hand pro pokerové statistiky
Foto: Poker-Arena
HUD a vzorek hand potřebný pro pokerové statistiky
Jak velký vzorek potřebujeme, abychom mohli věřit HUDu a statistikám? V tomto článku se vám pokusím ukázat, jak k problematice přistupovat. Článek je přepracovaná verze věcí, které jsem již dříve dával na fórum. Budu samozřejmě potřebovat trochu matematiky, ale nebudu se pouštět do příliš složitých výpočtů a pokusím se vše vysvětlit i nějak lidsky.
Co budeme potřebovat z matematiky?
1) Binomické rozdělení pravděpodobnosti
Většina statů je ve formě buď/nebo (soupeř nás buď 3betne a hodnota statu se zvýší, nebo ne-3betne a hodnota statu se sníží). Binomické rozdělení pravděpodobnosti je vlastně vzoreček, který počítá pravděpodobnost různých jevů v situacích, kdy se buď něco stane, nebo nestane – jsou tedy jen dva možné výsledky pokusu. Představte si, že řešíte otázky typu: “když hodím 5 krát mincí, jaká je šance, že přesně třikrát padne panna?”
Binomické rozdělení řeší podobné úlohy, ale i pro „nesymetrické mince“ - jakékoliv náhodné jevy, které mohou skončit jen jedním ze dvou možných výsledků. Na obrázku je červeně znázorněn pokus sestávající ze 40 hodů férovou mincí. Počítáme, kolikrát padla panna. Vidíme, že nejpravděpodobnější je možnost „panna padla dvacetkrát“. Šance že se to stane je pouze 12,5% (na vodorovné ose se podívejte na číslo 20, pravděpodobnost je na svislé ose).
Zdroj: http://cs.wikipedia.org/wiki/Binomické_rozdělení
2) Vlastnosti normálního rozdělení
O normálním rozdělení jsem stručně mluvil už v některých videích o varianci. Důležité je vědět, jak často se náhodný jev „vzdálí“ od své střední hodnoty o jednu, dvě nebo tři směrodatné odchylky.
Zdroj: http://cs.wikipedia.org/wiki/Normální_rozdělení
3) Centrální limitní věta
Ta nám říká, že když budeme dostatečně dlouho opakovat pokus s binomickým rozdělením z bodu 1, můžeme pravděpodobnosti určovat pomocí normálního rozdělení z bodu 2. To je pro nás výhodné, protože s normálním rozdělením se mnohem lépe pracuje. Když se podíváte na oba grafy nahoře, uvidíte, že červené tečky se formují do tvaru křivky z druhého obrázku. To je Centrální limitní věta.
Efektivní počet hand
Nejdůležitější je uvědomit si, že ne každá handa, kterou na soupeře máme, ovlivní každý stat. Proto budu používat efektivní počet hand jako termín pro počet hand, které na soupeře máme a které mají vliv na daný stat. Když budu sledovat VPIP na UTG a budu mít na hráče 900 hand, tak jen cca 100 z nich bude z UTG, takže jen těchto 100 hand ovlivní hodnotu statu. Asi nejednoduchá rada, kterou vám můžu dát, je tato: zamyslete se, jak se hodnota statu změní, když by soupeř několik málo situací, kterých se stat týká, zahrál jiným způsobem. Podívejme se opět na VPIP z UTG.
Řekněme, že na hráče máte 10 hand z této pozice (což odpovídá cca 90-100 handám celkově). Potom každá z těchto hand reprezentuje 10% vzorku. Pokud soupeř navýšil 5 hand, bude stat ukazovat 50%. Stačilo by ale, aby měl trochu více štestí nebo smůly a hodnota statu se výrazně změní. Pokud by místo jedné nebo dvou špatných kombinací dostal kombinace hratelné, bude navyšovat 6 z 10 nebo 7 z 10 a stat bude ukazovat 60% nebo 70%. Obecně můžete uvažovat tak, že statu se dá věřit, pokud by se při několika málo změnách v předchozí hře jeho hodnota příliš nezměnila.
To je samozřejmě poměrně triviální pozorování, ale ne každý dokáže uvažovat v efektivním počtu hand a hráči často přeceňují velikost vzorků, které na soupeře mají. Pojďme se nyní na celou věc podívat trochu detailněji, za pomoci výše uvedené matematiky. Následující příklad by měl ilustrovat, jak celá věc funguje.
Příklad: jsem na BB a raisuje mě hráč z BTN. Mám na něj 1 800 hand. Předpokládejme, že z BTN krade s 50% hand – ale tváříme se, že tuto informaci nemáme a zajímá nás, co uvidíme v HUDu. Dále předpokládám, že hráči na předchozích pozicích openraisují po řadě 15%, 15%, 20%, 20%, 25%, 25%. Nejprve potřebuji vědět, jaký mám efektivní počet hand. Z 1800 hand jich soupeř bude asi 200 mít na BTN. Dále si spočítám, jak často soupeři foldnou až k BTN.
Alternativně bych mohl použít nějaké informace z Holdem Manageru nebo Poker Trackeru, nebo si toto číslo prostě jen odhadnout. Musím alespoň přibližně vědět, kolik z těch 200 hand můžu reálně použít. Jak často soupeři foldnou až k BTN při openraisech které jsem si zadal? Stačí spočítat, jak často foldne každý z nich a čísla vynásobit:
Pr (BTN má šanci stealovat) = 0,85*0,85*0,8*0,8*0,75*0,75 = cca 25
To pro mě znamená, že jen asi čtvrtina hand je efektivních pro tento stat. Tady samozřejmě trochu podvádím, protože ignoruji varianci v rozdáních pro soupeře sedící před námi, ale jde mi jen o přibližnou hodnotu pro náš hypotetický příklad – počet efektivních hand pro daný stat se v konkrétní situaci dá najít v trackovacím softwaru. Z našich 200 hand na soupeře jich tedy asi 50 bude efektivních pro jeho steal z BTN. Přitom soupeř raisuje 50% range a folduje 50% range.
Teď budu využívat některé vlastnosti výše popsaných pravděpodobnostních rozdělení – pokud nevíte, co přesně dělám, netrapte se tím. Pro binomické rozdělení máme parametry n=50, p=0,5. Variance je n*p*(1-p) = 50*0,5*0,5 = 12,5. Střední hodnota počtu stealů z 50 hand je 25 (raisuje 50%). Takže použijeme normální rozdělení s parametry 25 a 12,5. Z toho nám vyjde, že mezi 3 směrodatné odchylky (jedna SD = 3,5: dělám stejné věci jako ve videu o varianci) se vejde téměř 100% všech situací, takže soupeř v tomto vzorku z BTN raisne něco mezi 14 a 36 handami. Zapsáno v procentech to bude 28% - 72%. Náš HUD bude tedy náhodně ukazovat něco mezi těmito hodnotami. Pokud si to zapíšeme jako 50%+-22%, tak platí následující rada: „čtyřnásobek počtu efektivních hand smrskne tento interval o polovinu“.
Pokud bychom měli 200 efektivních hand, tak bude HUD ukazovat 50%+-11%, což už vypadá použitelněji. Pro 800 efektivních hand to bude 50%+-5,5%. To je už celkem dobré. Přitom na získání jedné efektivní handy potřebujeme asi 4 handy, kdy hráč sedí na BTN a tedy 36 hand (4 orbity) celkově, takže na rozmezí 50%+-11% se s jistotou dostaneme někde u 36*200 =7 200 hand a na 50%+-5% u 28 800 hand.
Takové vzorky se samozřejmě těžko získávají, proto je lepší sledovat obecnější staty (ne VPIP z UTG, ale VPIP z early pozice, ne steal z BTN, ale steal z late pozice….). Ty nám sice řeknou o něco méně užitečnou informaci, ale staty stejně musíme chápat v kontextu toho, co se děje u stolu a na to nám budou stačit. Pokud sedím na BB a SB, BTN a CO jsou totální fishe a dobrý reg raisne z MP, tak se na jeho PFR stat ani nemusím dívat, protože v tomto prostředí bude stejně hrát úplně jinak, než je pro něj obvyklé.
Menší vzorky nám také budou stačit, pokud jsme ochotni přijmout větší „chybovost“ informace, kterou dostaneme. Tři směrodatné odchylky, které jsem použil, nám zaručují, že je daný stat téměř stoprocentně ve vypočítaném rozmezí. Pokud bych byl ochotný tolerovat cca 5% chybu (volně řečeno: v 95% leží stat ve vypočítaném rozmezí a v 5% je někde mimo a já se nechám splést), tak můžu použít jen dvě směrodatné odchylky. Pro náš vzorek 1 800 hand, tedy 200 hand z BTN a z toho 50 efektivních, bude HUD ukazovat 50%+-14% a při vzorku 7 200 hand bude v HUDu 50% + -7%.
Samozřejmě tímto příkladem nechci říct, že na každý stat potřebujete tisíce hand – stat na který jsem se díval je specifický v tom, že:
- Požadujeme ho z konkrétní pozice.
- Je to pozice, ve které se často stane, že se stat „nedostane ke slovu“, protože někdo raisne před BTN.
- 50% je v jistém smyslu extrémní hodnota, při které je největší variance v binomickém rozdělení.
Pro zjištění VPIP z early pozice budou nároky na počet hand menší, protože:
- Každá handa z těchto pozic se počítá do VPIP statu (stat se ptá jen hrál/nehrál a neřeší jestli je to proti raisu, v multiway potu, jako openraisor, jestli hráč limpnul...) – efektivní počet hand pro tento stat tedy bude celá třetina hand (v příkladu to byla 1/36 – hráč sedí na BTN jednou z devíti her a z těchto devíti her je k němu foldnuto jen jednou ze čtyř).
- Stat má typicky nízkou hodnotu, což u binomického rozdělení znamená menší varianci. Obecně platí, že čím blíže je hodnota k 50 procentům, tím větší variance a obráceně – jak hodně nízké, tak hodně vysoké hodnoty způsobují menší varianci (když někdo hraje jen 5% hand, tak se to rychle pozná podle velkého počtu foldů, když hraje 95% hand, tak se to rychle pozná podle velkého počtu raisů. Pokud ale hraje kolem 50% hand, nebude žádná akce výrazně vyčnívat a potřebujeme větší vzorek).
Chcete se zlepšit v pokeru a získat coaching zdarma? Přihlaste se do Studijní skupiny na Poker-Arena.cz pro hráče SNG, MTT, CG, HU SNG a DoN: Poker-Arena studijní skupiny CG, SNG, MTT a DoN Napište nám: studijniskupina@pokerarena.cz |
Nakonec bych chtěl upozornit na to, jak výhodné může být sledovat soupeře a dělat si poznámky, případně používat automatické poznámky v NoteCaddy nebo PT4. Pokud bych v oněch 1 800 handách jednou, dvakrát, třikrát viděl soupeře raisnout z BTN a pak v showdownu ukázat něco jako 95s nebo T6s a přitom mi na HUDu svítilo 30%, tak hned pochopím, že realita asi bude někde jinde… problém je v tom, že když bude takovou handu hrát proti někomu jinému, než jsem já, tak si dost možná nevšimnu, co za trash z BTN raisuje, protože zrovna sleduji jiný stůl. Automatická poznámka to ale může sledovat za mě.
Hrajte zodpovědně a pro zábavu! Zákaz účasti osob mladších 18 let na hazardní hře. Ministerstvo financí varuje: Účastí na hazardní hře může vzniknout závislost! Využití bonusů je podmíněno registrací u provozovatele - více zde.