Skaičiai meluoja – bet ne patys
Statistika nemeluoja. Meluoja žmonės, kurie ją pateikia. Ir ne visada tyčia – kartais tiesiog pasirenkami tie duomenys, kurie geriausiai atitinka norimą žinutę, o kiti tiesiog pamirštami. Todėl mokėti skaityti statistinius duomenis šiandien yra ne akademinis įgūdis, o savigyna.
Pradėkime nuo paprasčiausio dalyko: kai matote procentą, visada klauskite – procentas nuo ko? „Pardavimai išaugo 200 procentų” skamba įspūdingai, bet jei praėjusiais metais parduota 3 vienetai, o šiemet 9 – tai vis dar labai maža absoliuti reikšmė. Santykinis ir absoliutus pokytis – du skirtingi dalykai, ir manipuliuojantys duomenimis labai mėgsta juos maišyti.
Vidurkis nėra tiesa
Vienas iš dažniausių statistinių spąstų – vidurkio fetišizavimas. Tarkime, dešimties žmonių grupėje devyni uždirba 800 eurų, o vienas – 10 000 eurų. Aritmetinis vidurkis bus apie 1700 eurų, bet tai neatspindi nė vieno realios situacijos. Tokiais atvejais daug informatyvesnė yra mediana – vidurinė reikšmė, kuri šiuo atveju būtų 800 eurų.
Todėl kai skaitote apie „vidutinį atlyginimą”, „vidutinę būsto kainą” ar „vidutinį gyvenimo trukmę” – verta pasidomėti, ar kalbama apie vidurkį, ar medianą. Skirtumas gali būti esminis.
Koreliacija – dar ne priežastis
Šis principas žinomas, bet nuolat pamirštamas. Jei du reiškiniai vyksta vienu metu arba kinta panašiai – tai nereiškia, kad vienas sukelia kitą. Klasikinis pavyzdys: šalyse, kur vartojama daugiau šokolado, daugiau Nobelio premijų laureatų. Ar šokoladas skatina genialumą? Greičiausiai abu rodikliai tiesiog koreliuoja su bendru gyvenimo lygiu.
Žiniasklaidoje ši klaida pasitaiko nuolat. „Tyrimai rodo, kad žmonės, kurie sportuoja, rečiau serga depresija” – bet ar sportas gydo depresiją, ar žmonės be depresijos tiesiog dažniau sportuoja? Priežasties ir pasekmės kryptis čia visiškai neaišku.
Imtis ir reprezentatyvumas
Apklaustas tūkstantis žmonių – daug ar mažai? Priklauso nuo to, kas klausiama ir kaip tie žmonės buvo parinkti. Jei apklausa vykdyta internetu, ji automatiškai neapima vyresnių žmonių, kaimo gyventojų ar tų, kurie tiesiog nesinaudoja tuo konkrečiu kanalu. Imtis gali būti ir dešimt tūkstančių žmonių, bet jei ji nėra reprezentatyvi – rezultatai bus šališki.
Taip pat verta atkreipti dėmesį į tai, kas finansavo tyrimą. Ne todėl, kad visi mokslininkai nesąžiningi, bet todėl, kad finansavimo šaltinis kartais lemia, kokie klausimai užduodami, o kokie – ne.
Grafikai, kurie apgaudinėja akį
Vizualizacija – galinga priemonė, bet ir lengvai išnaudojama. Dažnas triukas: stulpelinė diagrama, kurios Y ašis prasideda ne nuo nulio, o nuo, tarkime, 95. Tada skirtumas tarp 96 ir 99 atrodo milžiniškas, nors realiai tai tik 3 procentiniai punktai. Visada patikrinkite ašių skalę.
Kitas mėgstamas metodas – pasirinkti patogų laiko intervalą. Jei akcijų kaina per metus krito, bet per pastarąsias dvi savaites šiek tiek pakilo – galima rodyti tik tą dviejų savaičių grafiką ir viskas atrodys puikiai.
Kai skaičiai tampa įrankiu, o ne atsakymu
Statistiniai duomenys yra naudingi tik tada, kai žinome, ką tiksliai matuojame ir kodėl. Jie padeda pastebėti tendencijas, palyginti grupes, priimti pagrįstus sprendimus – bet tik tada, kai skaitome juos kritiškai. Tai nereiškia, kad reikia viskuo abejoti arba atmesti kiekvieną tyrimą. Tiesiog verta įprasti užduoti kelis paprastus klausimus: kas tai matuoja, kaip, kas finansavo, ir ar pateikiamas visas kontekstas. Tokios kelios sekundės dėmesio dažnai atskiria informuotą nuomonę nuo manipuliacijos aukos.



