Skaičiai meluoja rečiau nei žmonės, kurie juos interpretuoja
Kiekvieną savaitę žiniasklaidoje pasirodo dešimtys pranešimų su statistika. Išaugo nusikalstamumas. Sumažėjo nedarbo lygis. Nauja studija įrodo, kad kava gydo vėžį. Dauguma žmonių šiuos teiginius priima arba atmeta pagal tai, ar jie atitinka tai, kuo jau tiki. Tai nėra skaitymas – tai patvirtinimo ieškojimas.
Statistiniai pranešimai reikalauja šiek tiek daugiau kantrybės. Ne daug – bet pakankamai, kad sustotum ir užduotum kelis paprastus klausimus.
Absoliutūs ir santykiniai skaičiai – klasikinė painiava
Vienas dažniausių triukų – ir ne visada sąmoningas – yra absoliučių bei santykinių dydžių maišymas. Jei vaistas sumažina širdies priepuolio riziką 50 procentų, tai skamba įspūdingai. Bet jei pradinė rizika buvo 2 iš 1000, o dabar tapo 1 iš 1000 – kalbame apie labai mažą absoliutų pokytį.
Kai matai procentus, klausk: procentai nuo ko? Bazinė reikšmė keičia viską.
Imtis ir reprezentatyvumas
Tyrimas, atliktas su 80 studentų viename universitete, negali pasakyti daug apie visą visuomenę. Tai nereiškia, kad toks tyrimas beverčiamas – jis gali būti naudingas kaip žvalgomasis. Bet išvados neturėtų būti apibendrinamos taip, lyg būtų apklausti tūkstančiai skirtingų žmonių.
Žurnalistai dažnai šį niuansą praleidžia, nes jis netelpa į antraštę. Todėl verta pačiam pažiūrėti į originalų šaltinį – bent į santrauką – ir pamatyti, kiek žmonių dalyvavo ir kaip jie buvo atrinkti.
Koreliacija ir priežastingumas
Šis skirtumas yra žinomas, bet vis tiek nuolat painiojamas. Jei du dalykai kinta kartu, tai dar nereiškia, kad vienas sukelia kitą. Ledų pardavimas ir skendimų skaičius vasarą koreliuoja – bet ledai neskandina žmonių. Abu veikia ta pati priežastis: karštas oras.
Kai pranešime rašoma „siejama su” arba „susijęs su” – tai koreliacija. Kai rašoma „sukelia” arba „lemia” – turėtų būti pateiktas kur kas stipresnis įrodymas.
P reikšmė nėra magija
Mokslinėje literatūroje dažnai minimas statistinis reikšmingumas – paprastai p < 0,05. Tai reiškia, kad tokio ar stipresnio rezultato tikimybė atsitiktinai yra mažesnė nei 5 procentai. Tai nėra tas pats, kas „įrodyta tiesa".
Be to, jei atliekami šimtai tyrimų, statistiškai reikšmingi rezultatai atsiras ir atsitiktinai. Publikuojami dažniau teigiami rezultatai – tai vadinama publikavimo šališkumu. Vienas tyrimas retai ką nors galutinai įrodo.
Apie tai, ką skaičiai iš tikrųjų gali pasakyti
Statistika nėra priešas. Ji yra vienas iš nedaugelio būdų kalbėti apie sudėtingą tikrovę kiek sistemingiau nei vien asmeniniais įspūdžiais. Problema ne skaičiuose, o tame, kaip jie pateikiami ir kaip skaitomi.
Pakanka kelių įpročių: ieškoti bazinių reikšmių, tikrinti imties dydį, skirti koreliaciją nuo priežastingumo ir nepasitenkinti vienu tyrimu svarbiais klausimais. Tai nereikalauja statistikos išsilavinimo – tik noro sustoti sekundei ilgiau, nei to norisi.



