Skaičiai meluoja. Arba mes juos skaitome neteisingai
Kiekvieną dieną mus užplūsta statistika. Vakcinos sumažino mirtingumą 70%. Kava padidina širdies smūgio riziką dvigubai. Šalyje nusikalstamumas išaugo 40%. Skaitome, galvos linksniojame ir einame toliau – įsitikinę, kad supratome. Bet ar tikrai?
Problema ne ta, kad statistika meluoja. Ji tiesiog labai lengvai leidžia meluoti kitiems – ir sau pačiam.
Pirmiausia klausk: lyginant su kuo?
Vienas iš labiausiai paplitusių triukų – absoliutūs skaičiai be konteksto. Jei žurnalistas rašo, kad tam tikras vaistas padvigubina vėžio riziką, tai skamba baisiai. Bet jei ta rizika buvo 0,1%, o dabar tapo 0,2% – kalbame apie vieną papildomą atvejį iš tūkstančio. Tai visiškai kita istorija.
Statistikai tai vadina absoliučiu ir santykiniu rizikos padidėjimu. Žiniasklaida beveik visada renkasi santykinį – jis skamba dramatiškiau. Todėl kiekvieną kartą, kai matai procentus, klausk savęs: nuo ko iki ko? Koks buvo pradinis skaičius?
Koreliacija – dar ne priežastis, bet visi elgiasi tarsi būtų
Šalys, kuriose vartojama daugiau šokolado, turi daugiau Nobelio premijos laureatų. Tai faktas. Ar turėtume valgyti daugiau šokolado, kad taptume protingesni? Akivaizdžiai ne – abu reiškiniai tiesiog koreliuoja su bendru gyvenimo lygiu ir išsivystymu.
Tačiau tas pats logikos klaidos mechanizmas veikia ir rimtesnėse diskusijose. Regionuose, kur daugiau policininkų, dažnai daugiau nusikaltimų – ar policija sukelia nusikaltimus? Ne, ji tiesiog siunčiama ten, kur jų jau yra. Kai matai ryšį tarp dviejų dalykų, visada verta paklausti: ar čia nėra trečio veiksnio, kuris lemia abu?
Imtis – tas nuobodus žodis, kuris viską keičia
Apklausa parodė, kad 8 iš 10 lietuvių palaiko X. Įspūdinga. Bet kiek tų lietuvių buvo apklausta? Kokie jie buvo? Jei tyrimą atliko pati suinteresuota organizacija, jei apklausti tik miesto gyventojai, jei klausimas buvo suformuluotas taip, kad sunkiai galėjai atsakyti kitaip – skaičius nieko nereiškia.
Reprezentatyvi imtis – tai ne tik kiekybė, bet ir kokybė. Tūkstančio atsitiktinai parinktų žmonių apklausa gali būti patikimesnė nei dešimties tūkstančių savanorių, kurie patys nusprendė dalyvauti.
Grafikai – kur slypi daugiausia velnių
Vizualizacija gali iškraipyti duomenis net jų nekeičiant. Klasikinis pavyzdys – Y ašis, prasidedanti ne nuo nulio. Jei rodi, kaip kompanijos pelnas augo nuo 980 iki 1000 milijonų, bet grafiką pradedi nuo 970, atrodo, kad augimas buvo milžiniškas. Realybėje – mažiau nei 2%.
Kitas mėgstamiausias triukas – spalvų skalės žemėlapiuose. Priklausomai nuo to, kaip paskirstai intervalus, tas pats reiškinys gali atrodyti kaip katastrofa arba kaip visiškai normali situacija. Prieš darydamas išvadas iš grafiko, visada pažiūrėk į ašis ir legendą. Nuobodu, bet būtina.
Vidurkis – tas apgaulingas draugas
Vidutinis atlyginimas Lietuvoje auga. Puiku. Bet jei dešimt žmonių uždirba po 1000 eurų, o vienas – 100 000, vidutinis atlyginimas toje grupėje bus apie 10 000. Niekas iš jų tiek negauna. Todėl ekonomistai dažnai kalba apie medianą – vidurinę reikšmę, kuri geriau atspindi tipinę situaciją.
Kai matai žodį „vidutiniškai”, klausk: ar čia aritmetinis vidurkis, ar mediana? Atsakymas gali pakeisti visą paveikslą.
Kai skaičiai tampa ginklu – ir kaip nuo to apsisaugoti
Statistikos raštingumas nėra matematikų privilegija. Tai elementari savigyna šiuolaikiniame informacijos pasaulyje, kur duomenys naudojami įtikinti, parduoti ir manipuliuoti. Politikai, reklamos kūrėjai, net geranoriški žurnalistai – visi kartais, sąmoningai ar ne, pasirenka tuos skaičius, kurie patvirtina jų istoriją.
Receptas paprastas, nors ir reikalauja šiek tiek pastangų: klausk, kas atliko tyrimą ir kodėl. Ieškok originalaus šaltinio, ne jo interpretacijos. Tikrink, ar imtis buvo pakankamai didelė ir reprezentatyvi. Skirtink koreliaciją nuo priežastingumo. Žiūrėk į grafiko ašis. Klausk, koks buvo pradinis skaičius.
Statistika nemeluoja. Bet ji labai kantriai laukia, kol mes patys sau meluosime jos pagalba.



