Mostreig: per tastar la sopa amb una culleradeta n’hi ha prou, sigui l’olla gran o petita

Pere Grima (U. Politècnica de Catalunya) Una de les preguntes que més sovint es plantegen les persones que han de fer un estudi estadístic és quina ha de ser la grandària de mostra perquè les conclusions siguin fiables. La resposta es “depèn” (comencem malament, diran alguns) , però… de què depèn? Bàsicament de la precisió amb què es vulgui donar el resultat (marge d’error i nivell de confiança) i d’algunes característiques de la població.

Marge d’error i nivell de confiança

Si es fa un estudi per estimar quina proporció de llars catalanes tenen connexió a internet i surt que és del 71,5%, això no vol dir que aquesta sigui la proporció exacta. De fet, segurament si ho tornéssim a fer sortiria una proporció diferent. Es per això que les estimacions s’acompanyen d’un més/menys un cert valor i escrivim, per exemple, 71,5 ± 3,0% sent aquest 3,0 el marge d’error.

Però… estem segurs que el percentatge a la població estarà dintre d’aquest interval? Doncs no, absolutament segurs no ho estem. Aquest interval té un cert nivell de confiança que normalment és del 95%. Això vol dir que s’ha calculat de manera que inclou el veritable valor el 95% de les vegades. No hi manera de saber si la vegada concreta que ho hem fet nosaltres l’inclou o no (si ho sabéssim, podríem dir que la confiança és del 100%, o del 0%). És com si aquesta informació ens la donés una persona que diu la veritat el 95% de les vegades, però mai podem saber si està dient la veritat o no.

Image

Proporció a la població

Que la grandària de la mostra depengui també del veritable valor de la proporció sembla allò del peix que es mossega la cua. Però si és el què estem buscant!

A través dels models matemàtics que fem servir s’observa que la màxima grandària de mostra es necessita quan la proporció que es vol estimar es del 50%. Intuïtivament ens podem imaginar que si tota la població és del mateix tipus només fa falta un element per saber de quin tipus són. Per exemple,  només fa falta una gota de sang per saber el grup sanguini quan totes són del mateix tipus i no importa si es tracta d’un nadó de 3 kg o del seu pare de 85. El nombre d’elements que fa falta mirar es va fent més gran quant més variabilitat hi ha a la població. En el cas que hi hagi només dos tipus d’elements (en el nostre cas, tenen o no tenen connexió a internet) la màxima variabilitat es dóna quan les dues proporcions són del 50%. Una solució consisteix en calcular la grandària de la mostra considerant que la proporció buscada és del 50%. D’aquesta manera ens posem en el pitjor dels casos i el nivell de confiança serà el previst si la proporció és realment del 50%, o serà més gran si és qualsevol altra. Sovint a la proporció que estem estimant se l’anomena p i a la complementària q, és per això que en la fitxa tècnica de moltes enquestes es pot veure allò de que s’ha suposat p=q=0,5.

Grandària de la població

Potser el tema que resulta més curiós és la influència de la grandària de la població. Si es mira la taula adjunta es pot veure que per un determinat marge d’error -posem del 3%-  quan la població passa de 1.000 a 10.000 individus (es multiplica per 10) la grandària de la mostra passa de 517 a 965 (es multiplica per 1,87); de 10.000 a 1.000.000 ( x100) la mostra passa de 965 a 1066 (x1,1) i si la població passa d’un milió a 50 milions, la mostra es manté pràcticament igual. Per tant, no té massa sentit dir que “aquesta mostra no és suficient ja que no arriba ni a l’1% de la població”.  En aquest terreny la proporcionalitat no funciona i es necessita la mateixa grandària de mostra per estimar la proporció d’usuaris amb connexió a  internet a una ciutat de 50.000 habitants que por tot un país de 50 milions.

Image

D’entrada sembla estrany, però si ho pensem bé no ho és tant. A casa som tres i fem servir una olla petita per fer la sopa, que també tastem amb una cullereta petita. Els diumenges normalment som 10 i cal fer servir una olla molt més gran, també la cullereta per tastar-la ha de ser molt més gran?  No, naturalment, la cullereta és la mateixa.

Image

Molt més important que la mida de la cullereta és remenar bé l’olla abans de treure la mostra. De la mateixa manera quan es fan enquestes el quid de la qüestió està en la representativitat. Si això falla el problema no es soluciona agafant mostres més grans, com bé saben els que tasten olles.

Galeria | Aquesta entrada s'ha publicat en L'Estadística feta fàcil i etiquetada amb , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Una resposta a Mostreig: per tastar la sopa amb una culleradeta n’hi ha prou, sigui l’olla gran o petita

  1. JM Manresa ha dit:

    Una aportació clara i didàctica. Enhorabuena

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s