Skaičiai meluoja. Arba meluojame mes?
Kiekvieną savaitę naujienų portalai prikimša antraštes tipo „Tyrimas įrodo, kad kavos gėrėjai gyvena ilgiau” arba „80% lietuvių nesutinka su vyriausybės politika”. Ir kiekvieną kartą mes arba tuo tikime akimirksniu, arba visiškai atmetame. Abu atvejai – klaidinga strategija.
Statistiniai pranešimai nėra nei tiesa, nei melas savaime. Jie yra įrankis, kurį galima naudoti gerai arba blogai. Ir jei nori suprasti, kas iš tikrųjų vyksta – reikia išmokti kelis paprastus klausimus, kuriuos užduoti kiekvieną kartą.
Pirmas dalykas: kas klausė ir ko klausė?
Imtis – tai ne tik skaičius. Tai kontekstas. Jei tyrimas atliktas su 200 žmonių, kurie patys užsiregistravo dalyvauti internete, tai jau sako labai daug apie tai, kieno nuomonė čia atsispindi. Savanoriška imtis beveik visada yra šališka – atsiliepti linkę tie, kuriems tema aktuali arba kurie turi stiprią nuomonę.
Taip pat svarbu, kaip buvo suformuluotas klausimas. „Ar pritariate, kad valdžia turėtų geriau rūpintis piliečiais?” – beveik visi atsakys „taip”. Bet tai nieko nereiškia. Klausimo formuluotė gali lengvai nukreipti respondentą į norimą atsakymą, ir tai vadinama leading question efektu.
Procentai be konteksto – bevertė informacija
„Rizika išaugo 50%!” – skamba baisiai. Bet jei pradinė rizika buvo 2 iš milijono, dabar ji yra 3 iš milijono. Absoliutus skirtumas – vienas žmogus iš milijono. Ar tai vis dar taip baisu?
Čia slypi vienas iš labiausiai paplitusių manipuliavimo būdų – santykinė rizika prieš absoliučią riziką. Santykiniai skaičiai atrodo dramatiškiau, todėl juos mėgsta tiek žurnalistai, tiek farmacijos kompanijos, tiek politikai. Kai matai procentą – visada klausk: procentas nuo ko?
Koreliacija nėra priežastingumas – ir tai ne tik frazė
Šalys, kuriose vartojama daugiau šokolado, turi daugiau Nobelio premijos laureatų. Tai tikri duomenys. Ar tai reiškia, kad šokoladas daro žmones protingesnius? Žinoma, ne – turtingesnės šalys tiesiog gali sau leisti ir daugiau šokolado, ir geresnį mokslą.
Kai pranešime rašoma „tyrimas parodė ryšį tarp X ir Y” – tai dar nereiškia, kad X sukelia Y. Gali būti trečias veiksnys Z, kuris lemia abu. Gali būti atsitiktinumas. Gali būti, kad Y iš tikrųjų sukelia X. Priežastingumą įrodyti yra nepalyginamai sunkiau nei koreliaciją, ir dažnai žiniasklaida šį skirtumą tiesiog ignoruoja.
Ką daryti su „statistiškai reikšminga” fraze?
Ši frazė mokslinėje kalboje turi labai specifinę reikšmę – ji sako, kad rezultatas greičiausiai nėra atsitiktinis. Bet ji nesako, kad rezultatas yra praktiškai svarbus ar didelis. Galima turėti statistiškai reikšmingą, bet visiškai nereikšmingą praktikoje skirtumą.
Pavyzdžiui, nauja dieta statistiškai reikšmingai sumažino svorį – vidutiniškai 300 gramų per tris mėnesius. Techniškai tiesa. Praktiškai – niekas.
Skaičiai – ne priešai, bet reikia mokėti su jais kalbėtis
Statistika yra vienas galingiausių įrankių suprasti pasaulį. Problema ne skaičiuose – problema tame, kaip jie pateikiami ir kaip mes juos skaitome. Keli paprasti įpročiai – klausti apie imtį, ieškoti absoliučių skaičių, nepainioti koreliacijos su priežastingumu – gali radikaliai pakeisti tai, kaip suvoki informaciją kasdien. Nereikia būti statistiku. Reikia tiesiog sustoti sekundei prieš darant išvadą. Nes tas, kas parašė antraštę, dažnai tikisi, kad to nepadarysi.



