Jak číst vědecké studie
Uveďme si příklad. Pokud bychom čistě hypoteticky věděli, že „90% zločinců jí před činem chleba“, mohlo by to evokovat, že chléb nějakým způsobem zvyšuje tendenci k trestné činnosti a že bychom ho měli z jídelníčku našich dětí preventivně vyřadit.
Pokud ale nevíme nic dalšího, můžeme se ptát: No jo, ale co ostatní lidé, nejedí chleba úplně stejně, souvisí to spolu vůbec?
Kvalitní studie by měla mít kontrolní skupinu. Pokud by se ukázalo, že kolem 90% respondentů (účastníků výzkumu) v kontrolní skupině jí chleba stejně často a ve stejném množství jako v exprimentální skupině respondentů s kriminální minulostí, znamenalo by to, že chléb s trestnou činností pravděpodobně vůbec nesouvisí. Kdyby studie kontrolní skupinu měla a přeci jen by se prokázalo, že zločinci jedí chléb častěji, ještě je třeba podívat se na to, zda studie zohlednila např. socio-ekonomický status respondentů. To už je obtížně kontrolovatelné. Pokud bychom ale měli důvod předpokládat, že respondenti v kontrolní skupině mají (či mohou mít) významně vyšší příjmy než ti ve „zločinecké,“ měli bychom se ptát, co je příčina a co následek. Zločinci možná nekradou přímo proto, že jedí chleba. Možná kradou proto, že mají nižší příjmy a chléb předtím jedí, protože je levnější. Mezi trestnou činností a pojídáním chleba by tak sice vznikla korelace (souvislost), ale korelace není vždy kauzalita. Ideální by tak bylo sestavit experimentální a kontrolní skupinu tak, aby se podobaly co nejvíce z hlediska věku, pohlaví, příjmů, prostředí, kde žijí (protože v některých oblastech může být více zvykem jíst chléb než v jiných) apod., byť může být obtížné takové podoby docílit.
Jednou možností, jak zjistit, zda pojídání chleba samo o sobě zvyšuje pravděpodobnost páchání trestné činnosti, by bylo sledovat respondenty dlouhodobě, nejlépe již od dětství. Náhodně (např. losem) by byli rozděleni do experimentální a kontrolní skupiny. Dobré by bylo ověřit, zda jsou skupiny srovnatelné věkově, z hlediska schopností, socio-ekonomického statusu apod. Rodiče dětí z jedné skupiny by byli vyzváni, aby své děti pokud možno nenechali jíst chléb, nebo jen v nějaké omezené míře. Rodiče dětí z té druhé by naopak byli požádání, aby chléb dětem dávali častěji. Aby to neovlivnilo výsledky výzkumu, bylo by lepší rodičům dopředu neříkat, co přesně studie sleduje, výzkumníci by jim ale mohli nabídnout, že jim po jejím skončení poskytnou výsledky. Pak by se za nějakou dobu porovnalo, zda ve skupině dětí, které měly častěji pojídat chléb, dochází významně častěji k trestné činnosti. Takto dlouhodobý výzkum by bylo samozřejmě opět náročné zorganizovat a někdo by možná namítl, že je to z etického hlediska na hraně (přeci jen by to ovlivnilo způsob stravování dětí a mohlo to mít dopady na jejich vývoj. Minimálně by vylo vhodné tyto kroky konzultovat s odborníky na výživu).
Dalšími kritérii, jak hodnotit věrohodnost výzkumu, je počet účastníků. Je rozdíl, pokud experimentální a kontrolní skupina každá čítá 20 respondentů, nebo pokud je to více než 1000.
Zajímavé je také sledovat, zda se výsledky výzkumu na dané téma podařilo zreplikovat, tedy zda výzkumy na podobné téma přinesly podobné výsledky. Kdyby nám pouze jedna studie ukázala, že pojídání chleba může způsobovat trestnou činnost, zatímco jiné by to neprokázaly, nejeví se ta první příliš důvěryhodnou, případně je dobré zamyslet se nad tím, proč se výsledky daných studií tak liší (ve prospěch té jediné studie by mohlo mluvit snad jen to, kdyby ty ostatní měly nějaké zjevné nedostatky). To mi připomíná i vtip, který jsem jednou zaslechla: Paní přijde za lékařem a ptá se ho, zda očkování způsobuje autismus. Lékař odpoví: „Tahle studie říká že ano, tyto ostatní“ (ukáže na hromadu papírů) „říkají že ne“. Paní popadne tu jedinou studii a říká mu „děkuji, tohle jsem potřebovala.“
Důležité je podívat se i na to, zda jsou rozdíly mezi skupinami statisticky významné, případně velké. Pokud by třeba jak v experimentální, tak i kontrolní skupině, bylo 1000 účastníků, z experimentální skupiny by se trestných činů dopustilo 51 osob a z kontrolní 50, nejspíše by se nejednalo o žádné významné rozdíly a vliv chleba by šlo považovat o nulový či naprosto zanedbatelný. Někdy se i ukáže, že výsledky sice dosáhly statistické významnosti, ale i tak se od sebe skupiny liší velmi málo. To by mohlo napovídat, že chléb mohl mít určitý vliv na výkon trestné činnosti, ale zřejmě jen velmi malý.
U rodičovských témat se dá studie posuzovat z následujících kritérií:
-
existence kontrolní skupiny,
-
velikost souboru,
-
zda se výsledky výzkumu podařilo zreplikovat jinou studií,
-
zda lze výsledky vůbec vnímat jako významné či velké.
Samozřejmě může být těžké se ve studiích zorientovat, zejména pro lidi z jiných oborů. Sama jako rodič malých dětí vím, jak je těžké třeba během šestinedělí najít kapacitu na to číst vědecké studie, a to jsem je dříve pročítala dost často. Z těchto důvodů jsem v případě prvního dítěte učinila nějaké rozhodnutí, které jsem později přehodnotila. Naštěstí naše rozhodnutí, která bychom později radši vrátili zpět, obvykle nemívají žádné fatální následky. Pokud ale trochu máme kapacitu, je fajn informace ověřovat a rozhodovat se informovaně. V opačném případě můžeme poprosit někoho, komu důvěřujeme, aby zapátral on. Není ostuda nechat si pomoci, zvláště, když jde o naše děti. Dobré je se pokud možno rozhodovat informovaně.