Srđan Bogosavljević: Nije lako s podacima

4. May 2021.
Mnoštvo je primera veoma korektne i napredne upotrebe informacija i podataka. Ali rekao bih da ima naopake prakse, koja je katkad plod neznanja, a katkad deluje kao loša namera. I takvih primera je mnogo, čak previše. Najčešće podaci ne valjaju ako se kose sa interesima neke moćnije grupe, partija, na primer, ili ako takvom centru trenutno ne odgovara istina. I nerazumevanje dovodi do osporavanja podataka.

Piše: Srđan Bogosavljević

Novinarima, poslovnim ljudima, političarima, donosiocima odluka, aktivnima na društvenim mrežama, zainteresovanima i znatiželjnima… dnevno stiže velika količina podataka iz ogromne produkcije, tako da nije nimalo lako prepoznati koji su korisni i za koju svrhu ili koji su manje, a koji više pouzdani.

Sa masovnom digitalizacijom, superbrzim kompjuterima i razvojem alata za masovne obrade podataka – problem više predstavlja selekcija nego postojanje podataka. Kako je i proizvođača sve više – od državnih statističkih sistema koje koordiniraju centralne statistike preko najraznovrsnijih privatnih ili javnih baza podataka do niza istraživačkih kuća, međunarodnih organizacija i NVO-a koji manje ili više redovno proizvode podatke – sve je važnije isticati da korisnici javno dostupnih podatka imaju pravo na veoma iscrpne metodološke i sve relevantne informacije o podacima.

Ovo je, naravno, davno postalo pravilo na kojem insistiraju sve profesionalne asocijacije proizvođača podataka, kao što su Eurostat ili Međunarodno udruženje profesionalnih statističara, mnoge službe UN, MMF i Svetska banka, najprestižnije udruženje komercijalnih proizvođača podataka ESOMAR, udruženje proizvođača podataka o javnom mnjenju WAPOR i mnogi drugi.

Odavno je prepoznato da je dostupnost podataka demokratska tekovina, i to od onih koji opisuju državu do javnomnjenjskih podataka koji se prikupljaju i publikuju u svim razvijenim društvima.

Mnoštvo je primera veoma korektne i napredne upotrebe informacija i podataka. Ali rekao bih da ima naopake prakse, koja je katkad plod neznanja, a katkad deluje kao loša namera. I takvih primera je mnogo, čak previše. Najčešće podaci ne valjaju ako se kose sa interesima neke moćnije grupe (partija, na primer) ili ako takvom centru trenutno ne odgovara istina. I nerazumevanje dovodi do osporavanja podataka.

Moguće je grupisati i odnos prema činjenicama onih koji ih interpretiraju – mudriji korisnici podataka koriste ih za svoja strateška premišljanja ili bar za taktičko pozicioniranje (prilagođavanje komunikacije, npr.). Manje mudri prave od toga propagandno sredstvo. Još manje mudri izvrću smisao podataka, osporavaju pravo da se podatak pojavi ili potpuno izvrću smisao izvorne informacije. Sve to samo zbog toga što im sam podatak nije po volji. Kako ne pretendujem ovde da iscrpno analiziram sve vrste vandalizma prema numeričkim činjenicama, navešću samo nekoliko tipičnih i dobro poznatih situacija.

OSPORAVANA SVE MANJA NEZAPOSLENOST: Pad nezaposlenosti je podatak koji se dobije uz punu kontrolu Eurostata, a ozbiljno ga nadgleda i MMF, ali nailazi na neretka osporavanja protivnika vlasti. A prosta logika, a ne ozbiljna metodološka analiza, ukazuje na njegovu korektnost, a pre svega na valjanost trendova i međunarodnu uporedivost. Srbija je zemlja koja rapidno stari, pa je negativni prirodni priraštaj već dugo iznad 30.000 godišnje, a u poslednje vreme i iznad 40.000. Kada se tome doda emigracija mladih koja nije po statistikama zemlje primaoca ispod 30.000 godišnje i otvaranje novih radnih mesta (oko 50.000 godišnje), izlazi da se broj onih koji mogu da pretenduju na radna mesta smanjuje za više od 100.000 godišnje – te da nije slučajno da se već nekoliko godina u zemlji oseća nedostatak radne snage. Zapravo, činjenica da je nezaposlenost rekordno niska krije u sebi šansu vlasti da se hvali postignutim, a opoziciji da joj osporava postignuće zbog niske stope prirodnog priraštaja i značajnog iseljavanja, ali ne i da priča kako je podatak netačan ili, još gore, kako zvanična statistika laže.

KOVID-STATISTIKA: Statistika o kovidu se osporava na osnovu razlike između stope smrtnosti 2020. u odnosu na 2019. jer je tek nešto više od trećine evidentirano kao kovid. Uvećana stopa smrtnosti, čak oko 14 odsto za godinu dana, svakako je velika i zabrinjavajuća i moguće je posumnjati u evidencije žrtava kovida, ali to ne može biti dokaz da se kriju brojevi žrtava, kako se povremeno čuje u javnosti.

Jedan od argumenta je i činjenica da je u većini evropskih zemlja slična statistika, negde sa malo više, a negde sa malo manjim učešćem kovida u totalu. Računa se, s razlogom, da je deo uvećane smrtnosti nastao zbog ugroženih kapaciteta zdravstvenih sistema, te neadekvatnog tretmana obolelih od drugih bolesti, a deo da je nastao zbog neevidentiranih kovid-oboljenja. Razne spekulacije su moguće, pa i one da država ili države nešto kriju ili nisu sposobne da organizuju dobro evidenciju, ali za takvu javnu konstataciju i optužbu potrebno je mnogo više od raspoložive statistike o umrlima.

BROJ BIRAČA: Broj evidentiranih birača kao izvor izbornih manipulacija – 6,8 miliona stanovnika prisutno je u Srbiji danas na osnovu poslednjeg popisa, statistike vitalnih događaja i vrlo konzervativne procene migracionog salda. Nasuprot tome je podatak o broju upisanih birača, nešto više od 6,7 miliona. Kako god se računa, izlazi da je više od milion ili čak milion i po onih koji žive u inostranstvu, dok u pasošu i ličnoj karti Srbije imaju adrese u Srbiji. To su ljudi kojima niko ne može uzeti biračko pravo, ali zbog neregulisanog statusa stalnog prebivališta treba da doputuju u zemlju da bi glasali, te su oni praktično isključeni iz glasanja. To za posledicu ima obračun o maloj izlaznosti u odnosu na upisane birače i onda kad na izbore izađe veliki broj prisutnih u zemlji birača.

Obično se čuje i mnoštvo komentara o neregularnosti izbora ili nedovoljnom broju glasova koji podržavaju izabrane – posebno nakon demokratskih promena 2000. Neevidentirana emigracija nije samo problem Srbije, ali se u Srbiji veoma često poteže birački spisak kao izvor izbornih krađa. A zapravo je reč o logičnoj posledici običaja da ne prijavljujemo migraciona kretanja, tako da se u tom podatku ne krije nikakav dokaz manipulacija.

RANGIRANJA: Podaci koji sadrže rangiranja često se osporavaju, što je povezano i s neznanjem, ali ipak najčešće sa pogrešnom idejom o ugroženim interesima. Statistička merenja su relativno gruba, ona u rezultat unose i takozvane uzoračke i neuzoračke greške, ali su merenja i daju dobre slike zbivanja i veoma dobre ocene trendova ukoliko se radi metodološki ispravno.

U medijima, posebno za TV, merenja imaju veliku važnost za procene vrednosti reklama. Sa druge strane, kvalitet tih merenja vrlo je visok i u svetu i kod nas. Ipak, potvrđeni kvalitet nije, na primer, sprečio jednog od nekadašnjih medijskih vladalaca, kome je “bliski rođak statističar, pa zato zna da podaci ne valjaju”, da javno ospori podatke samo u trenutku kad mu nisu odgovarali. Još su glasniji oni koji potpuno neargumentovano osporavaju istraživanja javnog mnjenja. Zanimljivo da oni uspevaju i uspevali su da kroz medije provuku niz netačnosti, pa čak i falsifikovane nalaze. U svemu tome ima i sukrvice medija, koji niti proveravaju originalnost izvora i tačnost podataka niti sučeljavaju činjenice koje govore suprotno. Jedna od takvih činjenica je saglasje podataka u poslednjem objavljenom statičkom merenju pred izbore i izbornih rezultata. Naravno, podataka koje je agencija koja meri dala medijima, a ne prepričanih ili falsifikovanih izveštaja.

Nisu problem samo neistine koje se pripisuju agencijama već još više neovlašćeno “curenje” kroz prepričavanje podatka suprotno ugovorima i dogovorima – tako da bi rešenje bilo da se kao izvor navodi isključivo onaj koji je medijima neovlašćeno dostavio tuđe stvarne ili izmišljene podatke.

Voleli to ili ne – život u 21. veku okružen je brojkama i razvijeni sistemi za podršku odlučivanja su realnost. Nažalost, naš običaj da ne priznajemo neutralnost već i njih svrstamo u neprijatelje i podacima je stavio omču oko vrata.

Tekst je prenet sa portala Novi magazin.

Click