Skaičiai meluoja rečiau nei žmonės, kurie juos interpretuoja
Statistika yra vienas iš tų dalykų, kuriais visi remiasi, bet nedaugelis iš tikrųjų supranta. Politikai cituoja procentus, žurnalistai skelbia tyrimus, o socialiniai tinklai plinta diagramomis, kurios atrodo įtikinamai vien dėl to, kad jose yra skaičiai. Problema ta, kad skaičiai patys savaime nieko nereiškia – viskas priklauso nuo to, kaip jie surinkti, pateikti ir interpretuoti.
Absoliutūs ir santykiniai dydžiai – klasikinė manipuliavimo vieta
Vienas dažniausių būdų, kaip statistika tampa klaidinanti, yra absoliučių ir santykinių dydžių painiojimas. Tarkime, naujienų antraštė skelbia: „Naujas vaistas sumažina vėžio riziką 50 procentų.” Skamba įspūdingai. Tačiau jei pradinė rizika susirgti buvo 2 procentai, tai po gydymo ji tampa 1 procentu. Santykinis sumažėjimas – 50 procentų, absoliutus – vos 1 procentinis punktas. Abu teiginiai yra teisingi, bet sukuria visiškai skirtingą įspūdį.
Todėl skaitant bet kokį statistinį teiginį verta paklausti: nuo ko skaičiuojamas šis procentas ir koks yra bazinis dydis? Tai nėra sudėtingas klausimas, tačiau jį užduoda nedaugelis.
Imties dydis ir reprezentatyvumas
Kitas svarbus aspektas – kas buvo tiriama ir kiek žmonių dalyvavo tyrime. Tyrimas, atliktas su 50 studentų viename universitete, negali pretenduoti į universalias išvadas apie visą visuomenę. Vis dėlto tokie tyrimai reguliariai pasirodo žiniasklaidoje kaip „moksliškai įrodyti faktai”.
Imties reprezentatyvumas reiškia, kad tiriamoji grupė turi atspindėti platesnę populiaciją. Jei apklausiami tik tam tikro amžiaus, išsilavinimo ar geografinės vietovės žmonės, rezultatai gali būti šališki net tada, kai metodologija atrodo tvarkinga. Tai nereiškia, kad tokie tyrimai beverčiai – jie tiesiog turi ribotą taikymo sritį, kurią dažnai pamiršta paminėti tie, kas juos cituoja.
Koreliacija ir priežastingumas – amžinas nesusipratimas
Bene labiausiai paplitusi statistinė klaida – koreliaciją painioti su priežastingumu. Jei du reiškiniai kinta kartu, dar nereiškia, kad vienas sukelia kitą. Šaltuose kraštuose žmonės valgo daugiau riebalų ir gyvena ilgiau – bet tai nereiškia, kad riebalai ilgina gyvenimą. Čia veikia daugybė kitų veiksnių.
Priežastingumo nustatymas reikalauja kruopščiai suplanuotų eksperimentų arba bent jau statistinių metodų, leidžiančių kontroliuoti kintamuosius. Stebėjimo tyrimai gali rodyti sąsajas, tačiau retai gali tvirtai pasakyti, kas ką sukelia.
Diagramos, kurios rodo tai, ko nėra
Vizualizacija yra galinga priemonė, bet ja lengva piktnaudžiauti. Sutrumpinta Y ašis gali padaryti nedidelį skirtumą dramatišku. Stulpelinė diagrama, prasidedanti ne nuo nulio, vizualiai išpučia skirtumus tarp reikšmių. Pyragų diagramos su daugybe mažų skiltelių dažnai tiesiog apsunkina suvokimą, o ne palengvina.
Prieš darydami išvadas iš grafiko, verta kelias sekundes pažiūrėti į ašių skalę, patikrinti, ar pavaizduoti visi duomenys, ir paklausti, kodėl pasirinktas būtent toks vizualizacijos būdas.
Kai skaičiai tampa įrankiu, o ne tiesa
Statistinis raštingumas nėra matematikos žinios – tai gebėjimas sustoti ir paklausti paprastų klausimų. Kas atliko tyrimą ir kodėl? Kiek žmonių dalyvavo? Ką iš tikrųjų reiškia šis procentas? Ar diagrama pateikta sąžiningai? Šie klausimai nereikalauja jokių specialių žinių, tik įpročio nepriimti skaičių kaip savaime suprantamos tiesos.
Gyvename laikais, kai duomenų yra daugiau nei bet kada, tačiau tai nereiškia, kad esame geriau informuoti. Kartais kaip tik atvirkščiai – gausybė skaičių sukuria iliuziją, kad kažkas yra įrodyta, nors iš tikrųjų tik pateikta. Skirtumas tarp šių dviejų dalykų yra esminis, ir jį suprasti – kiekvieno skaitytojo atsakomybė.



