úterý 10. února 2009

Jak zkreslit statistiky - a to hned dvakrát


Když potřebujete vytvořit hrůzně vypadající graf a obáváte se, že by vám někdo mohl přijít na to, že jste si k výsledném efektu dopomohli nepěknou manipulací s daty, není zřejmě nad to, 'vhodně zvolit' data hned dvakrát.

Podobné 'dvojnásobně vhodné' volby dat se dopustil Barry Ritholtz při porovnávání současného růstu nezaměstnanosti s předchozími recesemi. Nezaměstnanost v USA v lednu 2009 vystoupala na 7,6%, čímž překonala maxima předchozích dvou recesí (i když je třeba říci, že předchozí dvě recese byly z hlediska nezaměstnanosti mimořádně mírné). Navíc nezaměstnanosti téměř určitě ještě dále poroste.

Job losses in recessions - absolute level

Ztráty pracovních míst v průběhu poválečných recesí v USA (v tisících). Data relativně vůči předchozímu vrcholu zaměstnanosti

Na grafu vypadá současná recese opravdu hrozivě. Kde je háček? Počet práceschopného obyvatelstva v USA v poválečných letech výrazně rostl, takže jsou jednotlivé časové řady neporovnatelné (milion ztracených pracovních míst v USA taky vypadá jinak než milion ztracených pracovních míst třeba v Česku). Calculated Risk proto přináší ztráty pracovních míst v procentech.

Job losses in recessions - relative

Ztráty pracovních míst v průběhu poválečných recesí v USA (v procentech). Data relativně vůči předchozímu vrcholu zaměstnanosti

Tady už situace vypadá rozumněji - současná recese je zatím zhruba na úrovni té z roku 1981. Přesto je v grafu ještě jeden zádrhel. Časové řady jsou totiž vynesené relativně vůči předchozímu vrcholu v zaměstnanosti. Pokud tedy byla zaměstnanost před začátkem recese mimořádně vysoká a část korekce je daná pouze úpravou této kladné výchylky, pak budou recese, které začaly v bodě relativně vysoké zaměstnanosti vypadat relativně hůře.

Když se tedy podíváme na údaje o nezaměstnanosti, vidíme, že současná recese začínala s mírou nezaměstnanosti 4,6%, zatímco ta v roce 1981 s mírou nezaměstnanosti 5,8%. Pokud tedy přirozená míra nezaměstnanosti zůstala stejná, pak vhodnější obrázek o současné recesi v porovnání s tou v roce 1981 získáme posunutím dnešní křivky o zhruba 1% nahoru. To by nás samozřejmě nemělo uklidňovat, protože propad ještě není u konce, ale alespoň si můžeme udělat lepší obrázek o tom, jak na tom nyní jsme.

1 komentář: