1 00:00:14,260 --> 00:00:31,900 Existuje poměrně jednoduchý způsob, jakým si můžete ověřit, jestli data ve statistice jsou pravdivá, nebo jsou vymyšlená. Ne vždy a ne stoprocentně, ale většinou to platí. Čísla z reálného světa mají takovou zvláštní vlastnost. 2 00:00:32,800 --> 00:01:02,960 Dodržujou pravidlo, kterému se říká Benfordův zákon nebo Benfordovo pravidlo. Matematika pro ně ještě nemá zcela úplně jasné vysvětlení, ale empiricky platí. Zjednodušeně řečeno Benfordův zákon říká, že když vezmete nějaký data z přírody, z reálného světa, která se dají vyjádřit číslem, tak největší počet těchto čísel bude začínat jedničkou. Samozřejmě je v tom háček, neplatí to úplně obecně 3 00:01:03,040 --> 00:01:04,190 Pro jakákoliv čísla. 4 00:01:04,810 --> 00:01:18,330 Je potřeba, aby ta čísla spolu nějak souvisela a aby mezi nejmenším a největším číslem byly aspoň 3 řády rozdílu. To znamená, aby nejmenší číslo byly třeba desítky a největší tisíce. 5 00:01:19,110 --> 00:01:48,930 Nebo tisíce a statisíce, ale minimálně přes tři řády. A v takovémhle souboru dat, říká Benfordův zákon, bude 30% čísel začínat jedničkou, dvojkou jich bude začínat 17%, trojkou 12, čtyřkou 10 a tak dále. Až devítkou necelých 5%. Na tuhletu zvláštnost přišel americký matematik a astronom Simon Newcombe. 6 00:01:49,250 --> 00:02:18,940 A už v roce 1881 o tom napsal. Newcombe si totiž všiml, že logaritmické tabulky v knihovnách mají mnohem víc ošahané stránky, kde jsou čísla od jedničky a od dvojky než ty, kde je devítka třeba. A z toho usoudil, že lidé, kteří je používají, tak se ve svojí praxi mnohem častěji setkávají s číslicemi, který začínají jedničkou a dvojkou. A toto pravidlo znovuobjevil 7 00:02:19,040 --> 00:02:33,010 Fyzik Frank Benford v roce 1938. Samozřejmě to odporuje na první pohled zdravému rozumu. Člověk očekává, že když uvidí sadu čísel, která jsou někdy naměřená nebo zjištěná nebo spočítaná, 8 00:02:33,750 --> 00:03:05,060 tak že první číslice budou tak nějak rozmístěny stejně. Ale není to tak. Já jsem to zkoušel na sadě informací z Wikipedie, například na počtu obyvatel českých měst a na jejich rozloze. To jsou docela vhodná čísla, protože počet obyvatel je od 73 až do 1.300.000. Rozloha je mezi 5 a 500km čtverečních, takže i to splňuje tu podmínku tří řádů. A když si ty čísla dáte do tabulky a spočítáte, 9 00:03:05,740 --> 00:03:35,450 kolikrát je tam jednička na začátku, dvojka, trojka, ... tak zjistíte, že Benfordovo pravidlo opravdu funguje. A na základě tohoto pravidla, které sice ještě není matematicky dokázáno a vysvětleno, ale empiricky je zjištěno, že funguje, tak fungují i jednoduché testy, které ověří, jestli čísla, která někdo předkládá v nějakých studiích nebo v nějakých výsledcích, jsou opravdu správná, nebo jestli si je poopravil, popřípadě rovnou vymyslel. Pokud jsou čísla opravdu 10 00:03:35,550 --> 00:03:46,570 správná a reálná, naměřená, a pohybují se minimálně v rozmezí tří řádů, tak na prvním místě bude jednička sedmkrát častějc než devítka. 11 00:03:47,620 --> 00:04:06,410 Zkuste si to sami. A když si čísla vymýšlíte, tak se snažíte je vymýšlet tak, aby vypadaly na první pohled opravdu náhodně - a právě ta náhodnost a to, že první číslice budou se stejnou pravděpodobností, naznačuje, že to není úplně věrohodná sada čísel.