Как да лъжем със статистика

25 март 2017 г., 13:44
3002

Sergey Nivens / Shutterstock

Имало едно време една държава, която имала 521 млн. марки положително външнотърговско салдо. Шефът на националната статистика и заместникът му гордо докладвали факта на държавното ръководство. Обаче... ръководството не било доволно. Взело листа със справката и написало, че положителното салдо трябва да бъде 910 млн. марки.

Защо точно 910 милиона, един господ знае. Обаче шефът на статистиката и заместникът му трябвало на място и на момента писмено да потвърдят, че са разбрали и ще „оправят” числата. И ги „оправили”. Листчето потънало в държавния архив и било намерено от любопитен изследовател след 20-ина години. Държавата била ГДР, а годината – 1986.

Ако разгледаме човека като същество, действащо на основата на информацията, с която разполага, то близко до ума е, че

ако успеем да вкараме вирус

(устройващи ни лъжливи или некоректни данни) в информационната му система, той може да започне да действа по начин, който води до реализация на нашите интереси. По-неинтелигентните хора могат да бъдат лъгани, но при по-интелигентните вкарването на информационния вирус е по-трудно, той трябва да е в подходяща обвивка. Много подходяща обвивка е манипулираната статистика.

Затова, както е видно и от историята по-горе, доста често поръчителите на статистическа информация изискват изкривяване и от статистиците. За да ги накарат да изкривят информацията, тези поръчители използват например господстващо положение в социалната йерархия или пък пари. И понеже това се случва често, бедните статистици са разработили различни форми на

статистическа обвивка

на информационния вирус – били те методи за подмяна на числата, или интерпретация на резултатите в угода на поръчителя.

Но където има вируси, е добре да има и ваксина. Ето защо тук ще предложим малко антивирусно четиво, разкриващо някои от триковете.

Статистически данни ни заливат от телевизия, вестници, радио, интернет и откъде ли още не. Често това са директни фалшификации на събраните данни на основата на принципа, че когато става дума за една “добра” кауза, истината не била тъй важна. А дали една кауза е „добра”, зависи от най-различни неща - например кой плаща, дали хората зад каузата са симпатични (роднини, познати). Пример – конкурси за красота или за певици, победителят от които се определя чрез есемеси. Сами можете да се сетите за купища скандали, свързани с различни манипулации на резултатите. И накрая някой праща водещия да ви гледа в очите и да ви лъже, че победителят е....

Но да минем към по-фини форми на статистическа обвивка на информационен вирус. Една от тях се нарича

„фокусът ,99” –

в магазините рядко ще срещнете цени 2,00 или 3,00 лева за нещо. Вместо това цените са винаги от сорта на 1,99 или 2,98. Човек си мисли – ех, то струва един лев и нещо или два лева и нещо... Информационният вирус сработва и човек често остава изненадан от сметката, която получава на касата.

Следващата статистическа обвивка на информационен вирус можем да наречем „сравняване на процентите без отчитане на основата на нарастването”. Пример:

заплата в България – 200 евро на месец. Увеличават я с 20 евро – нараства с 10% и става 220 евро на месец. Заплата в Германия – 3000 евро на месец. Увеличават я със 150 евро на месец – нараства с 5% и става 3150 евро на месец. Разлика в заплатите: преди увеличението – 3000 – 200 = 2800 евро на месец, след увеличението – 3150 – 220 = 2930 евро на месец. Да, ама

при нас заплатите растат с 10%,

а при ония “нещастници” там само с 5%. И от всичкото само това ще кажем на народа. Ликуй, народе! Още малко и ще ги догоним и задминем!

Интересна форма на статистическа обвивка на информационен вирус е свързана с промяната на мащаба на вертикалната ос на интересуваща ни графика. Ако например трябва да „напудрим” мижав растеж – отрязваме вертикалната ос малко под стойността в началния момент и прилагаме дребен мащаб – например 1 деление съответства на 0,05%. Е, на такава графика растеж от 0,15% за 3 години вече изглежда внушително. А сега идва друга задачка – трябва визуално „да скрием” голяма инфлация. Няма проблем! – този път оставяме вертикалната ос да тръгне от 0, слагаме началната стойност на измерваната величина да е 100 единици и поставяме едър мащаб – например едно деление съответства на 5 единици.

Така инфлация от 15% за 3 години изглежда съвсем прилично

(стига да не искате мнението на тези, които нямат повишение на заплатата и трябва да се оправят с такава инфлация – те може и да ви кажат нещо неприлично, ако се опитате да ги убедите, че инфлацията е „нормална”).

Следващият пример за статистическа обвивка на информационен вирус се нарича „ако растежът ти е малък, гордо рапортувай

растежа на растежа”.

Иначе казано – ако първата производна е малка, опитай с втората! Пример - увеличението на брутния вътрешен продукт на една държава в две поредни години е, както следва: 2009 – 100 мерни единици; 2010 – 101 мерни единици; 2011 – 102,5 мерни единици. Премиерът е притеснен – лоша работа, растежът в проценти година за година е – 2010 – 1%, 2011 – 1,49%. Ще трябва много да се лъже в предизборната кампания! Няма страшно, казва финансовият министър – моите статистици ми казаха, че за 2011 г. нарастването на растежа е (1,49-1)/1 = 49%! 49 процента – ехей, кой е като нас!

Много интересна и често срещана статистическа обвивка на информационен вирус се нарича

„манипулация на извадката”.

Китайците са по-умни от канадците! Ами да - в канадските университети на изпитите по естествени науки почти няма скъсани китайци, докато 1/3 от канадците получават двойки. Но я да помислим, стъпвайки на факта, че процентът на глупаците и гениите навсякъде по света е еднакъв. Китайските семейства пращат децата си да учат в чужбина само ако шансовете за успех са много големи (детето е било много добър ученик). Така извадката от китайците се състои почти само от силни студенти и те не получават двойки. При канадците има силни, слаби и калпави студенти. Затова там и двойките са по-често срещани.

Друга любима форма на статистическа обвивка на информационен вирус може да се нарече „манипулация на въпроса”.

Както питаш, така ти отговарят.

Пример – въпрос: Да се работи ли в събота? 95% от работниците отговарят „не“ в изследване на профсъюзите, 72% от работниците отговарят „да“ при проучване на работодателите. В изследването на профсъюзите въпросът е поставен така, че се избира между 3 възможности: 1. Аз мисля, че работата в събота е тежък удар върху семейството, върху свободното време, което прекарвам с приятели или през което спортувам или посещавам културни мероприятия. 2. Аз не смятам дългата почивка в края на седмицата за важна. 3. Не знам. И в анкетата на работодателите отговарящият може да избира между 3 отговора: 1. Съгласен съм да работя в събота, стига друг ден в седмицата освен неделята да е почивен. 2. Съгласен съм да работя в събота, стига да не е всяка събота и да ми се заплаща извънредно. 3. Не съм съгласен да работя в събота.

95% от запитаните

избират първия отговор при изследването на профсъюзите. 72% избират първия отговор при изследването на работодателите. Ето, казват профсъюзите, 95% от работниците не желаят да работят в събота. А, не, не – казват работодателите, – 72% от работниците искат да работят в събота. Искат, ама ако някой друг ден от седмицата се обяви за почивен. 
    
И така нататък. Не си мислете обаче, че ще ви разкрия всичко. Все пак има вероятност 0,0000000000000000000001% да стана шеф на статистиката в тази държава (трябва да знаете, че истинските специалисти по статистика, като гледат това число, се превиват от смях, защото знаят какво им казвам). Но по принцип вече знаете защо Бенджамин Дизраели (британски политик и министър-председател от края на XIX в. – бел. ред.) веднъж се провикнал: „Има три вида лъжи – лъжи, проклети лъжи и... статистика”. Статистиката е велика наука и си струва да се изучава. Защото ако искате да се преборите с манипулациите, достойни за (професора по математика) Мориарти, вие

трябва да сте от ранга на Ш.Х.

Ако не можете да се сетите за кого става дума, имате два пътя пред себе си. Или се примирете, че ще ви лъжат със статистика, или изучавайте математика и статистика. Тогава ще разберете и кой е Ш.Х. А може и да станете от неговия ранг. За противник не се притеснявайте – злото никога не умира, тъй че професор Мориарти е вечен. И ако успеете да разберете поне една от неговите манипулации, с вас вече ще трябва да се съобразяват.    

Автор: Проф. дмн Николай К. Витанов, Институт по механика на БАН

Използвана литература:
1.) Walter Kraemer. So luegt man mit Statistik. Piper Verlag, Muenchen, 2000.
2.) Darrel Huff. How to lie with statistics. W.W. Norton & Co. Inc., New York, 1954.

Ключови думи:
Коментари