Skaičiai meluoja. Arba mes juos skaitome neteisingai
Kiekvieną dieną esame bombarduojami statistika. Vakaro žinios praneša, kad kažkoks produktas „padidina riziką 200 procentų”, socialiniuose tinkluose plinta infografikos apie tai, kad „80 procentų žmonių” kažko nedaro arba, priešingai, daro per daug. Politikai operuoja skaičiais kaip ginklais. Ir mes, dažniausiai, tiesiog tikime. Nes skaičiai atrodo objektyvūs. Atrodo, kad jie negali meluoti.
Bet gali. Tiksliau – ne patys skaičiai, o tai, kaip jie pateikiami, kokiame kontekste ir ko tyčia nepaminima.
Absoliutūs ir santykiniai dydžiai – klasikinis triukas
Grįžkime prie to „200 procentų padidėjimo”. Skamba baisiai, tiesa? Bet paklauskite savęs: nuo ko iki ko? Jei kažkokia liga pasitaiko pas 1 iš 10 000 žmonių, o nauja studija teigia, kad tam tikras veiksnys riziką padidina 200 procentų – tai reiškia, kad dabar ji pasitaikys pas 3 iš 10 000. Vis dar labai maža tikimybė, tačiau antraštė skamba apokaliptiškai.
Tai skirtumas tarp santykinės rizikos ir absoliučios rizikos. Žurnalistai ir rinkodarininkai myli santykines reikšmes, nes jos atrodo dramatiškiau. Jūsų užduotis – visada klausti: „O koks pradinis skaičius?”
Imtis – ne tik skaičius, bet ir klausimas „kas tie žmonės”
Studija atlikta su 50 žmonių. Arba su 50 000. Ar tai automatiškai reiškia, kad rezultatai patikimi? Ne visai. Svarbu ne tik kiek, bet ir kas buvo tiriama. Jei tyrimas apie miego įpročius atliktas tik su universitetų studentais – jo rezultatų nereikėtų taikyti pensininkams ar fizinį darbą dirbantiems žmonėms. Tai vadinama imties reprezentatyvumu, ir apie tai retai rašoma antraštėse.
Be to, verta žinoti apie išgyvenusiųjų paklaidą – mes dažnai analizuojame tik tuos, kurie „išgyveno” tam tikrą procesą, ir pamirštame tuos, kurie iškrito. Verslo sėkmės istorijos – klasikinis pavyzdys. Girdime apie tuos, kuriems pavyko. Negirdime apie šimtus, kurie bandė tą patį ir žlugo.
Koreliacija – dar ne priežastis
Vienas mėgstamiausių statistikos nesusipratimų. Du reiškiniai vyksta vienu metu – vadinasi, vienas sukelia kitą? Ne. Ledų pardavimai vasarą auga kartu su skendimų skaičiumi. Ar ledai žudo? Žinoma, ne – abu reiškiniai susiję su trečiuoju veiksniu, karštu oru.
Tai skamba juokingai, bet tokia logika naudojama rimtuose debatuose. „Šalyse, kuriose daugiau šokolado suvartojama, daugiau Nobelio premijų laureatų” – reali studija, kuri buvo publikuota kaip pokštas, bet kurią kai kurie žmonės priėmė rimtai. Visada klauskite: ar yra loginis mechanizmas, paaiškinantis ryšį? Ar gali būti trečias veiksnys?
Grafikai, kurie apgaudinėja akis
Pažiūrėkite į Y ašį. Ar ji prasideda nuo nulio? Jei ne – labai tikėtina, kad grafikas sukurtas tam, kad pokytis atrodytų didesnis, nei yra iš tikrųjų. Nedidelis augimas, kai ašis prasideda nuo 97, atrodo kaip milžiniškas šuolis. Tai ne klaida – tai dažnai sąmoningas pasirinkimas.
Taip pat atkreipkite dėmesį į tai, ar palyginami panašūs dalykai. Stulpelinė diagrama, kurioje vienas stulpelis rodo vienerių metų duomenis, o kitas – penkerių, yra beprasmė, bet vizualiai gali atrodyti įtikinamai.
Kai statistika tampa ginklu, o ne įrankiu
Visa tai nereiškia, kad reikia nepasitikėti jokiais duomenimis. Statistika – nepakeičiamas įrankis suprasti pasaulį. Vakcinų veiksmingumas, klimato kaita, ekonominės tendencijos – visa tai grindžiama duomenimis, ir gerai, kad taip yra. Problema ne statistikoje, o tame, kaip ji naudojama.
Paprasčiausias apsaugos mechanizmas – įprotis sustoti ir užduoti kelis klausimus: Kas atliko tyrimą ir ar jie suinteresuoti konkrečiu rezultatu? Kokia imtis ir ar ji reprezentatyvi? Ar kalbama apie absoliučius ar santykinius dydžius? Ar yra galimas trečias veiksnys? Šie klausimai nepavers jūsų statistiku, bet tikrai padarys kritiškesnį skaitytoją.
Skaičiai nemeluoja. Bet tie, kurie juos pasirenka, interpretuoja ir pateikia – kartais labai nori, kad jūs tikėtumėte kažkuo konkrečiu. Ir dažniausiai jiems tai pavyksta, nes mes skubame, tingime gilintis ir pasitikime autoritetais. Šiek tiek sveiko skepticizmo – ne cinizmo, o būtent skepticizmo – gali pakeisti tai, kaip matote ne tik statistiką, bet ir visą informacinę aplinką aplink save.





