Adrian Buzatu, „De ce sondajele de opinie CSOP și INSOMAR despre alegerile prezidențiale nu se contrazic, așa cum zice presa”


________________________________________________________

STIINTAAZI

De ce sondajele de opinie CSOP și INSOMAR despre alegerile prezidențiale nu se contrazic, așa cum zice presa

Adrian Buzatu

16 octombrie 2009

________________________________________________________

AB«Vin alegerile prezidenţiale. Deja două sondaje de opinie diferite despre intenţiile de vot ale românilor au oferit rezultate diferite, iar presa deja titrează că sondajele se bat cap în cap şi că sunt masluite de cei care le comandă. Dar dacă ar lua în calcul incertitudinea statistică declarată a sondajelor, ar vedea că de fapt sondajele sunt în acord perfect. Detalii mai jos prezentate distractiv.

sondaj de opinie

Matematica distractivă: De ce sondajele de opinie CSOP şi INSOMAR despre alegerile prezidenţiale nu se contrazic, aşa cum zice presa.

În primul rând, iată un articol amplu de la Hotnews unde se prezintă detaliat aceste sondaje. Vom prezenta întâi pe scurt motivaţia pentru realizarea de sondaje de opinie şi vom prezenta în cuvinte simple, pe înţelesul tuturor, cum sunt aleşi oamenii care vor răspunde la aceste sondaje. Apoi vom exemplifica pe cazul concret al sondajelor de azi despre preferinţele românilor la alegerile prezidenţiale din decembrie.

De ce se fac sondaje de opinie?

De fapt, se doreşte a se şti cum ar vota întreaga ţară, adică întreaga populaţie cu drept de vot. Dar a îi întreba pe toţi cere un efort considerabil, atât ca şi bani, cât şi ca resurse, cât ca şi timp. Tocmai de aceea astfel de sondaje nu se fac în fiecare săptămână, ci odată la patru ani. Şi se numesc alegeri. Dar şi între timp partidele politice, precum şi indivizii populaţiei, ar dori să ştie ce gândeşte populaţia în ansamblul ei. Cum s-ar putea răspunde la această întrebare?

Ei bine, atunci când se fac alegeri, adică atunci când fiecare din individ din populaţia ţării cu drept de vot este întrebat, presupunând că îşi exercită dreptul de vot şi răspunde corect cu ceea ce crede, atunci putem spune că alegerile arată adevărul absolut despre părerea populaţiei ţării la acel moment de timp al alegerilor. Cu alte cuvinte, întrebarea fiecărui membru al populaţiei reprezintă adevărul absolut despre acea populaţie.

Cum afli cum gândeşte înteaga populaţie fără să întrebi toţi membrii ei?

Dar este costisitor să întrebi pe fiecare membru în parte mereu. Dar ai dori totuşi să ştii cum gândeşte întreaga populaţie. Cum faci, aşadar?

Răspunsul este că … mai laşi de la tine. Nu mai ceri adevărul absolut, ci doar unul parţial, unul probabilistic. Te vei mulţumi cu rezultatul că răspunsul găsit nu este cel adevărat, ci că se află într-un anumit răspuns faţă de cel adevărat, cu o anumită probabilitate. Astfel, nu întrebi pe fiecare membru în parte, ci doar pe câţiva dintre ei şi realizeze alegeri doar cu ei. Desigur, aceste alegeri nu se pun din punct de

vedere oficial, dar practic tot alegeri sunt din punct de vedere al căutării adevărului. Şi aceste alegeri poartă numele de sondaje de opinie.

POLL

Cum se realizează sondajele de opinie?

Bun, aşadar am căzut de acord că întrebăm doar pe anumiţi oameni. Dar pe care din ei îi alegem? Şi câţi de mulţi vom alege? Probabil că dacă alegem doar 10 oameni, incertitudinea măsurătorii este foa

rte mare, dacă alegem 1000 este mai mică, dacă alegem 1 milion este şi mai mică, iar dacă alegem 1 miliard este şi mai mică. Ah, dar stăi, că populaţia cu drept de vot are doar câteva milioane. Bun, deci nici nu putem să întrebăm 1 miliard de oameni, iar dacă întrebăm 1 milion e ca şi cum am întreba aproape întreaga populaţie. Numărul de oameni pe care trebuie să îl întrebăm e undeva între 10 şi 1 milion. Dar cât trebuie să fie numărul?

Ei bine, numărul depinde de cât de mult doreşti să investeşti. Cu cât întrebi mai mulţi oameni, cu atât ai precizie mai mare. Dar să îi întrebi costă. Trebuie să mergi la ei acasa, sau să le dai telefon. Iar ei trebuie să dorească să îţi răspundă. Şi aşa mai departe.

Formula magică – cheia spre înţelegerea rezultatului unui sondaj

Ei bine, din fericire există o formulă simplă pentru a vedea legătura între numărul de oameni şi incertitudinea sondajului de opinie şi anume unu supra radical din numărulu de oameni intervievaţi. Cu alte cuvinte, dacă sunt 100 de oameni, atunci radical din 100 face 10, iar unu supra zece face 0,10, iar asta înseamnă 10%. Aşadar, dacă s-ar intervieva numai 100 de oameni, eroarea măsurătorii ar fi de 10%. Cam mare, nu?

Atunci să încercăm cu 10.000. Eroarea ar fi de unu supra radical din 10.000, adică unu supra radical din 100, adica 1%. E deja mai bine.

Ei bine, în practică partidele politice şi alţii care realizează sondaje s-au găndit că e prea scump să întrebi 10.000 de oameni, aşa că au ales să întrebe în jur de 500, sau 1000, sau 2000 de persoane. Iar acum dumneavoastră ştiţi să calculaţi singuri care este incertitudinea sondajului în funcţie de numărul de persoane intervievate, chiar dacă nu vă spun ei.

Cum se aplică în cazul celor două sondaje CSOP şi INSOMAR

CSOPDar în cazul celor două sondaje chiar se spune. Sondajul CSOP a fost realizat pe 513 persoane şi ei declară o eroare a lui de 4,5 la sută. Aşa este, sau ne păcălesc ei? Ei bine, acum sunteţi pregătiţi să verificaţi INSOMARsinguri şi astfel să vă ascuţiţi spiritul critic şi să nu vă lăsaţi eventual păcăliţi de nimeni. Ei bine, radical din 513 face cam 23, iar 1 supra 23 face 4,4%. Exact, iar ei au spus 4,5%, ca să fie şi mai conservativi. Al doilea sondaj este cel realizat de INSOMAR, dar el pe un număr mai mare de persoane. Ştim deja că aceasta înseamnă un sondaj cu o marjă de eroare mai mică. A fost realizat pe 1211 persoane, iar ei spun că incertitudinea este de 3%. Să verificăm dacă este chiar aşa. Radical din 1211 face cam 35, iar 1 supra 35 face cam 2,9%. Aşadar şi ei zis 3,0% şi astfel sunt şi ei conservativi. Bun, deci nici CSOP şi nici INSOMAR nu ne-au indus în eroare cu privire la precizia sondajelor lor.

Pe lângă incertitudinea statistică, mai e şi cea sistematică

Dar, este un dar … Ceea ce am descris mai sus se numeşte incertitudine statistică sau eroare statistică. Ea devine cu atât mai mică cu cât numărul de oameni intervievaţi este mai mare. Dar mai există o a doua sursă de eroare, denumită eroare sistematică. Îi zice aşa pentru că se aplică sistematic la fiecare om intervievat în parte. De exemplu, dacă sunt întrebaţi doar oameni de la oraşe, rezultatul ar fi diferit decât dacă s-ar întreba doar oameni de la sate. La fel dacă s-ar întreba numai tineri sau numai bătrâni, numai bărbaţi sau femei, numai muncitori sau oameni de afaceri. De aceea, trebuie ca oamenii să fie aleşi cât din cât mai multe categorii posibile, după toate criteriile: din toate regiunile ţării, şi de la oras şi de la sat, dar 10% din ei să fie din Bucureşti, căci acesta este procentul bucureştenilor din populaţia ţării; să fie şi bărbaţi şi femei dar raportul dintre ei să fie acelaşi ca pentru întreaga populaţei cu drept de vot; să fie interogaţi şi români şi unguri şi ţigani, iar raportul dintre ei să reprezinte raportul populaţiei ungurilor şi cea a românilor şi cea a ţiganilor; să fie şi ţărani, şi muncitori şi profesori şi medici şi ingineri şi aşa mai departe, pentru a reprezenta cât mai multe din categoriile socioprofesionale posibile, în procente care să reprezinte întreaga populaţie. Pe scurt, trebuie aleasă o submulţime a întregii populaţii a României care să fie reprezentativă pentru întreaga populaţiei.

Aici este dificultatea unui sondaj de opinie, dar aici este unde cel care efectuează sondajul accepta ca rezultatul să nu fie perfect, ci cu o anumită incertitudine. Dar incertitudinea totală este suma (o formulă mai complexă decât simpla adunare, dar pentru scopul acestui articol e suficient să zicem suma) dintre incertitudinea statistică calculată mai sus şi cea sistematică dată de alegerea corectă a tipurilor de oameni şi numărul de oameni care să fie intervievaţi. Mai departe, oamenii din fiecare subcategorie sunt aleşi aleatoriu. Aceasta face sondajul să fie cât mai realist şi astfel să fie aleşi oameni cât mai diverşi.

Din păcate, incertitudinea statistică e mai mereu neglijată

Ei bine, aceasta a doua eroare sistematică nu este zero, dar este presupusă aproape zero în aceste sondaje de opinie, după cum am spus mai sus. Căci la CSOP eroarea statistică e de 4,4% şi ei declară doar 0,1% pentru sistematică, adică 4,5% în total, iar la INSOMAR eroarea statistică este de 2,9% li ei declară tot doar 0,1% pentru sistematică, adică 3,0% în total.

Eroarea statistică nu poate fi măsluită. În schimb, cea sistematică da.

Dacă cumva această distribuţie de mai sus nu se face corect (din lipsă de profesionalism sau cu bună voinţă din dorinţa de a manipla sondajul), atunci eroarea sistematică este mai mare. Ceea ce înseană că rezultatul anunţat de studiu se îndepărtează şi mai mult de rezultatul real, acela ce s-ar obţine dacă s-ar întreba întreaga populaţie a ţării.

Cum se compară aşadar metodologiilor sondajelor CSOP şi INSOMAR?

În concluzie, sondajul CSOP are o eroare de 4,5% şi cel INSOMAR de 3,0%. Cel de-al doilea este mai precis dintr-un motiv simplu: cine l-a făcut a depus mai mult efort şi l-a realizat pe un număr mai mare de oameni. Cum interpretăm aceste incertitudini? Dacă citim că cutare ar primi 30% din voturi conform CSOP, atunci înseamnă că de fapt nu ştim cât ar primi, ci doar că ar fi undeva în intervalul 25,5% şi 34,5%,  iar dacă ar primi 30% din voturi conform INSOMAR, atunci ar primi în realitate undeva în intervalul 27% şi 33%.

Şi iaca aşa acum sunteţi pregătiţi să comparaţi singuri rezultatele sondajelor de opinie, cu spirit critic şi constructiv, iar nu să luaţi de bună automat cum interpretează presa rezultatele.

Diferă aşadar rezultatele sondajelor CSOP şi INSOMAR?

Acum că am înţeles legile simple din baza sondejelor de opinie, putem reveni la subiectul de presă care anunţă că aceste sondaje se bat cap în cap. Oare aşa să fie? Haideţi să analizăm predicţiile rând pe rând.

Rezultatele sondajelor pentru primul tur al alegerilor prezidenţiale

PDL: CSOP 34% şi INSOMAR 32,7%. Sunt în acord sau nu? În primul rând, cei de la INSOMAR ar fi trebuit să zică 33%, căci au pus prea mare numărul de cifre signifiante, ţinând cont că eroarea lor e de 3%. Apoi, ce vrea de fapt CSOP să spună este că ei estimează că al PDL-ului candidat va lua între 29,5% şi 38,5% din voturi. Atât şi nimic mai mult nu spune sondajul! INSOMAR în schimb estimează că el va lua între 30% şi 36%. Deci există o plajă întreagă de 6% unde predicţiile celor două sondaje se suprapun! Deci sunt de acord sau nu sondajele! Ei bine, sunt! Cel puţin la întrebarea aceasta. Să trecem la următoarele şi să raţionăm pe acelaşi principiu, dar să zicem mai pe scurt.

PSD: CSOP 33% şi INSOMAR 32%. Adică CSOP estimează între 28,5% şi 37,5%, iar INSOMAR între 29% şi 25%. Iarăşi 6% de suprapunere, deci acord între predicţii!

PNL: CSOP 17% şi INSOMAR 15,5%. Adică CSOP estimează între 12,5% şi 21,5%, iar INSOMAR între 12,5% şi 18,5%. Adică iarăţi 6% de suprapunere şi acord între predicţii!

UDMR: CSOP 6% şi INSOMAR 6,5%. Adică CSOP estimează între 1,5% şi 10,5%, iar INSOMAR între 3,5% şi 9,5%. Avem 5% de suprapunere, deci acord între predicţii!

PRM: CSOP 4% şi INSOMAR 8%, adică CSOP estimează între 0% şi 8,5%, iar INSOMAR între 5% şi 11%. O suprapunere între 5% şi 8,5%, deci de 3,5%. O potrivire nu la fel de bună ca înainte, dar tot o potrivire.

PNG: CSOP 3% şi INSOMAR 3,3%, adică CSOP estimează între 0% şi 7,5%, iar INSOMAR între 0% şi 6,3%. O suprapunere aşadar de 6,3% şi estimarările sunt în acord.

Rezultatele estimate pentru turul II al alegerilor prezidenţiale

Am văzut aşadar că pentru turul I al alegerilor prezidenţiale, cele două sondaje oferă exact aceleaşi predicţii. Să analizăm acum şi sondajul pentru scenariul în care în turul doi între Traian Băsescu şi Mircea Goană.

Traian Băsescu: CSOP 55% şi INSOMAR 49,4%, adică CSOP estimează ca va lua între 50,5% şi 59,5% din intenţiile de vot, în timp ce INSOMAR estimează că va lua între 46,4% şi 52,4%. Există o suprapunere de 3% aşadar între cele două sondaje. Sigur, nu la fel de bună ca şi cei 6% de la primul tur, dar cele două sondaje sunt în acord!

Mircea Goană: CSOP 45% şi INSOMAR 50,6%, adică CSOP estimează ca va lua între 40,5% şi 49,5%, în timp ce INSOMAR estimează că va lua între 47,6% şi 53,6%. Există un acord de 1,6% între cele două sondaje!

Concluzii despre cele două sondaje CSOP şi INSOMAR

Ce înseamnă aceasta? Că dacă rezultatul final va fi 51% pentru Traian Băsescu si 49% pentru Mircea Goană, atunci acest rezultat va fi în acord cu ambele sondaje de opinie. La fel şi dacă rezultatul va fi de 50%-50%. În schimb, dacă rezultatul va fi 49% pentru Traian Băsescu şi 51% pentru Mircea Goană, atunci înseamnă că studiul realizat de INSOMAR a fost mai aproape de realitate decât cel realizat de CSOP.

În concluzie, aceste sondaje arată că cei doi candidaţi potenţiali pentru primul doi se află la un punctaj foarte strâns, dar cât de strâns nu se ştie, tocmai pentru că sondajele au o eroare de 3% pe de o parte şi 4,5% pe de altă parte. Nu se poate spune acum cine ar avea avans de cine la momentul de faţă, chiar dacă un asemenea avans ar fi real. De aceea, fiecare vot va conta şi este important pentru toată lumea să se prezinte la vot. Pentru ca nu doar vocea submulţimii care a răspuns la sondaj să se facă auzită, ci ca vocea întregii naţiuni să se facă auzită. Şi acela va fi răspunsul final şi răspunsul corect, adică dacă toţi cei care au drept de vot vor vota cu ceea ce cred ei că este mai bun, sau mai puţin rău, pentru România.

Concluzii de la autorul articolului

Acest articol s-a născut datorită faptului că Hotnews a ales să nu publice comentariul meu cu câteva fraze în care argumentam de ce cele două sondaje sunt în acord. Astfel, am scris aici un articol mai amplu, care fi folosit acum şi ca ajutor pentru lecţiile de statistică în şcoli sau facultăţi. Sper ca acest articol lung, dar lung tocmai pentru a explica pas cu pas aceste noţiuni aparent complexe de statistică şi sondaje de opinie, să vă ajute să înţelegeţi mai uşor sondajele de opinie pe viitor şi să le interpretaţi corect, dvs înşivă, fără să aşteptaţi interpretările altora. Sper ca exemplul cu cele două sondaje CSOP şi INSOMAR despre alegerile prezidenţiale să vă fi ajutat să înţelegeţi mai bine concepţiile exprimate mai sus. Vă urăm să votaţi cu cine doriţi, dar să mergeţi să votaţi!»

5 Responses to Adrian Buzatu, „De ce sondajele de opinie CSOP și INSOMAR despre alegerile prezidențiale nu se contrazic, așa cum zice presa”

  1. inga spune:

    e Bun.. articool

  2. johnd spune:

    uite, in sfarsit, ceva cu sens despre sondaje de opinie, eliberat de isteria celor care vad doar manipulari jegoase

  3. Adrian Buzatu spune:

    Cu surpriza placuta constat preluarea acestui articol. Sunt Adrian Buzatu, autorul lui. Multumesc si celor ce l-au apreciat la comentarii. Este un subiect care merita a fi inteles de mai multa lume. Totusi, as aprecia ca pe viitor sa imi trimiteti un email inainte si a imi cere permisiunea inainte de a prelua articolul. V-as fi acordat-o cu placere.

    Sper ca veti continua sa urmariti articolele noastre de la Stiinta Azi, unde a fost publicat si articolul de mai sus.

    Mult succes!

    • ALEXANDRU MITACHE spune:

      @ ADRIAN BUZATU

      Imi cer scuze, aveti perfecta dreptate, dar la data postarii nu aveam adresa dv. si nu am observat micul icon de e-mail.
      Am luat, totusi, toate masurile pentru ca autorul si sursa articolului sa fie cat se poate de evidente (inclusiv foto).

      Promit sa nu mai fac. 🙂

  4. Adrian Buzatu spune:

    Nici o problema. Ma bucur ca ne-am descoperit reciproc. Te invit sa mai preiei partial articole de la Stiinta Azi, cu aprobarea noastra preliminara. Mult succes!

Lasă un răspuns

Completează mai jos detaliile cerute sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare /  Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare /  Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare /  Schimbă )

Conectare la %s

%d blogeri au apreciat: