Skaičiai meluoja. Arba meluojame mes?
Kiekvieną dieną naujienų portalai bombarduoja mus statistika. „Nusikalstamumas išaugo 40%.” „Nauja dieta sumažina širdies ligų riziką perpus.” „Lietuviai – vieni laimingiausių Europoje.” Skamba įtikinamai, tiesa? Problema ta, kad dauguma žmonių perskaito antraštę, patiki ja ir eina toliau. O būtent toje antraštėje dažniausiai ir slypi manipuliacija.
Statistika nėra objektyvi tiesa. Ji yra įrankis, o įrankius galima naudoti tiek gerai, tiek blogai. Žurnalistai, politikai ir rinkodaros specialistai tai žino puikiai.
Absoliutūs ir santykiniai skaičiai – klasikinė apgaulė
Štai pavyzdys: „Vaistas sumažina vėžio riziką 50%.” Skamba revoliucingai. Bet ką tai reiškia iš tikrųjų? Jei jūsų pradinė rizika susirgti buvo 2%, tai po vaisto ji tapo 1%. Santykinis sumažėjimas – 50%. Absoliutus – vienas procentinis punktas. Tai du visiškai skirtingi pasakojimai apie tą patį faktą.
Žiniasklaida beveik visada renkasi santykinį skaičių, nes jis atrodo įspūdingiau. Farmacijos kompanijos reklamose – taip pat. Kai kitą kartą pamatysite tokį teiginį, iškart klauskite: o koks buvo pradinis dydis? Be to konteksto skaičius yra beveik beprasmis.
Imtis – ta nepatogi smulkmena, kurią visi ignoruoja
„Tyrimas parodė, kad žmonės, klausantys klasikinės muzikos, uždirba daugiau.” Įdomu. O kiek žmonių dalyvavo tyrime? Jei atsakymas yra „34 studentai iš vieno universiteto” – galite tą tyrimą drąsiai pamiršti. Maža, nereprezentаtyvi imtis gali parodyti bet ką. Statistinis atsitiktinumas egzistuoja, ir su mažomis grupėmis jis daro stebuklus.
Be to, reikia klausti, kas tie žmonės. Jei apklausėte tik miesto gyventojus, jūsų išvados apie „visus lietuvius” yra, švelniai tariant, drąsios. Reprezentatyvumas – ne techninė detalė, o pagrindinis klausimas.
Koreliacija ir priežastingumas – amžinas galvos skausmas
Šis principas žinomas, bet nuolat pamirštamas. Šalyse, kur žmonės valgo daugiau šokolado, yra daugiau Nobelio premijos laureatų. Ar šokoladas daro žmones protingus? Žinoma, ne – abi tendencijos susijusios su turtingumu, o ne viena su kita.
Tačiau žiniasklaida nuolat rašo „X susiję su Y riziką” ir skaitytojai supranta tai kaip „X sukelia Y”. Žodis „susiję” čia atlieka labai svarbų darbą – jis techniškai teisingas, bet klaidina. Kai skaitote apie kokį nors ryšį, klauskite: ar buvo kontroliuojami kiti veiksniai? Ar tai tik koreliacija, ar tikrai nustatyta priežastis?
Bazinis lygis ir kontekstas – ko niekas nepasako
„Nusikalstamumas išaugo 40%!” Skamba baisiai. Bet jei praėjusiais metais buvo užfiksuoti 10 įvykių, o šiais – 14, tai matematiškai tikrai yra 40% augimas. Praktiškai – keturi papildomi atvejai dideliame mieste. Tai tragedija ar statistinis triukšmas? Labai priklauso nuo konteksto, kurio antraštė neduoda.
Tas pats veikia ir atvirkščiai. „Beveik niekas neserga X liga” gali reikšti, kad sergamumas sumažėjo nuo 0,001% iki 0,0005% – o gal tiesiog liga reta ir visada tokia buvo. Be bazinio lygio ir istorinės perspektyvos skaičiai plaukioja ore.
Tai ne paranoja – tai elementari higiena
Nereikia tapti statistiku, kad nepakliūtumėte į paprasčiausias spąstas. Pakanka kelių įpročių: visada ieškoti originalaus tyrimo, o ne jo interpretacijos; klausti, kiek žmonių buvo tiriama ir kas jie; skirti santykinius ir absoliučius skaičius; nepriimti koreliacijos kaip priežasties. Tai nėra sudėtinga – tai tiesiog atidumas, kurio žiniasklaida dažnai neskatina, nes paprastos, dramatiškos antraštės parduodasi geriau nei niuansuoti paaiškinimai. Kitą kartą, kai skaičius jus nustebins ar išgąsdinys, sustokite sekundei. Paklauskite: o palyginti su kuo? Ir kas tai matuoja? Dažnai paaiškės, kad istorija yra visiškai kitokia.



