Skaičiai meluoja. Arba mes leidžiame jiems meluoti
Statistika turi keistą galią – kai tik kas nors ištaria „tyrimai rodo” arba „duomenys patvirtina”, žmonės linktelėja galvomis ir nustoja klausti. Lyg skaičiai būtų kažkokia aukštesnė tiesa, nepasiekiama paprastam mirtingajam. Bet čia ir slypi problema: statistiniai duomenys nėra tiesa savaime – jie yra įrankis, kurį galima naudoti ir sąžiningai, ir visiškai nesąžiningai.
Ir dažniausiai būna kažkas tarp šių dviejų kraštutinumų – ne tyčinis melas, o patogus neatsargumas.
Absoliutūs ir santykiniai skaičiai – klasikinis triukas
Vienas seniausių statistinio manipuliavimo būdų yra žongliravimas absoliučiais ir santykiniais dydžiais. Vaistas sumažina širdies smūgio riziką 50 procentų – skamba įspūdingai, tiesa? Bet jei ta rizika buvo 2 iš 1000, o tapo 1 iš 1000, absoliutus skirtumas yra vienas žmogus iš tūkstančio. Tai vis tiek svarbu, bet jau ne taip dramatiškai.
Farmacijos kompanijos, politikai, žiniasklaida – visi renkasi tą skaičių, kuris geriau parduoda jų žinutę. Santykinis dydis atrodo didesnis? Puiku, naudosim santykinį. Absoliutus skaičius labiau šokiruoja? Imkim absoliutų. Skaitytojo užduotis – visada klausti: o koks čia bazinis lygis?
Imtis ir kas į ją pateko
Kitas dalykas, į kurį beveik niekas nežiūri – kas iš tikrųjų buvo tiriama. „Tyrimas su 10 000 dalyvių” skamba solidžiai. Bet jei visi tie dalyviai buvo savanoriai iš vieno universiteto miestelio, kurių vidutinis amžius 22 metai, rezultatai apie „žmonių elgesį” yra gana abejotini.
Reprezentatyvumas – tai žodis, kurio daugelis statistinių antraščių vengia kaip ugnies. Nes jei pradėtum aiškinti, kad tyrimas buvo atliktas su labai specifine grupe, visa sensacinga žinutė subyrėtų. Todėl tiesiog rašoma „tyrimas parodė” ir taškas.
Koreliacija, kurią visi nori vadinti priežastimi
Šis klausimas jau tapo beveik medu – visi žino, kad koreliacija nėra priežastingumas, bet praktiškai visi tai ignoruoja, kai skaičiai patvirtina tai, kuo jau tikima. Šalys, kuriose valgoma daugiau šokolado, turi daugiau Nobelio premijos laureatų. Valstybėse su daugiau piratų – žemesnė visuotinio atšilimo temperatūra. Juokinga? Taip. Bet mechanizmas tas pats, kuriuo remiasi rimtai atrodantys tyrimai apie tai, kad kavos gėrimas „sukelia” ar „apsaugo” nuo vėžio.
Kai matai koreliaciją, reikia klausti: ar yra loginis mechanizmas? Ar buvo kontroliuoti kiti kintamieji? Ar tyrimas buvo kartojamas? Dažniausiai atsakymas į bent vieną iš šių klausimų bus nepatogus.
Grafikai, kurie vizualiai apgaudinėja
Vizualizacija yra atskira manipuliavimo meno šaka. Y ašis, prasidedanti ne nuo nulio, gali iš mažyčio pokyčio padaryti dramatišką šuolį. Sutrumpinta laiko skalė gali paslėpti, kad „rekordinis augimas” yra tiesiog sezoninis svyravimas. Spalvų pasirinkimas, proporcijos, pjūvio kampas pyrago diagramoje – visa tai formuoja įspūdį dar prieš skaitytojui perskaičius nors vieną skaičių.
Žiniasklaida šitai daro nuolat – ne visada piktybiškai, kartais tiesiog todėl, kad gražus grafikas pritraukia daugiau dėmesio nei tikslus. Bet rezultatas tas pats.
Tai ne paranoja – tai elementari higiena
Kritiškas požiūris į statistiką nereiškia, kad reikia viskuo abejoti ir nieko nepriimti. Tai reiškia, kad reikia užduoti kelis paprastus klausimus: kas atliko tyrimą ir ar jie turėjo interesą gauti konkretų rezultatą? Kokia buvo imtis ir ar ji reprezentatyvi? Ar kalbama apie absoliučius ar santykinius dydžius? Ar koreliacija painiojama su priežastingumu? Ar grafikas vizualiai neiškraipo duomenų?
Šie klausimai nereikalauja statistiko išsilavinimo. Jie reikalauja tik nenoro būti apgautam – o tai, deja, retesnė savybė nei turėtų būti. Statistika yra galinga, kai naudojama sąžiningai. Bet ji yra lygiai taip pat galinga kaip dezinformacijos įrankis. Skirtumas tarp šių dviejų dažnai priklauso ne nuo duomenų, o nuo to, ar kas nors ėmėsi vargo paklausti nepatogių klausimų.



