El Cens de població 2011: com saber ”Quants som” sense comptar-nos un per un

Joan Anton Sánchez (Idescat)

Recordeu la figura de l’agent censal? Aquell enquestador que anava casa per casa deixant un qüestionari i que uns dies més tard passava a recollir-lo? Doncs bé, ara fa un any aproximadament es va portar a terme del Cens de població i habitatges 2011, amb data de referència l’1 de novembre de 2011 i del qual tot just acabem de conèixer els primers resultats: 7.519.843 habitants a Catalunya. Què dieu? Que per casa vostra no ha passat cap agent censal? No us amoïneu, segur que us hi hem comptat, tot té una explicació. Part de l’explicació es deu al fet que en el darrer cens de població s’ha prioritzat la resposta per Internet, per correu postal i per telèfon 900 gratuït, amb l’objectiu principal de reduir costos, i s’han reservat els agents censals per a visitar les llars que no havien contestat per cap dels altres canals. Però això no ho explica tot.

El Cens de població es porta a terme cada 10 anys amb l’objectiu de respondre dues preguntes: “Quants som?” i “Com som?”. Fins ara el Cens de població consistia en un recompte exhaustiu de les persones, ja que es feia coincidir amb la renovació del Padró municipal d’habitants. Amb la implantació del sistema de Padró continu això ha canviat i en 2011 s’ha implementat per primera vegada un nou sistema censal basat en la combinació de registres administratius i una enquesta a la població, l’Enquesta de població i habitatge 2011. A Catalunya han estat entrevistades unes 637 mil persones, un 8,5% de la població (per qualsevol dels 4 canals esmentats: web, correu postal, telèfon, presencial).

1170737_europe

Font: stock.xchng http://www.sxc.hu/

Però vet aquí la pregunta clau: com podem saber quants som sense haver fet un recompte exhaustiu, sinó una enquesta a una part de la població?. El Cens 2011 s’ha plantejat com una operació basada en l’aprofitament màxim dels registres administratius i un treball de camp compost per dues operacions, el Cens d’edificis i l’Enquesta de població i habitatge. Anem a explicar-ho amb detall, que no és fàcil.

Es construeix l’anomenat fitxer precensal partint del Padró municipal d’habitants. Aquest fitxer conté les variables identificatives de cada persona (nom, adreça, DNI/NIE), així com el sexe, la data de naixement, la nacionalitat i el lloc de naixement. El fitxer precensal es contrasta amb el Registre dels DNI i de les Targetes de residència del Ministeri de l’Interior, amb els naixements i defuncions, amb la Seguretat Social i amb l’Agència tributària. La gran majoria de persones presents al fitxer precensal s’aconsegueix trobar-les en algun dels altres fitxers (són treballadors, pensionistes, contribuents, etc) i es considera que la seva residència a Espanya està confirmada. A aquests registres se’ls assigna el factor de recompte 1. Altres registres tindran factor de recompte 0, per exemple, les defuncions recents que encara no han estat processades al Padró.

idescat2

Font: F. Abellan

Les persones del fitxer precensal que no s’han pogut trobar en els altres registres administratius, o tot i trobar-les no es pot assegurar la seva residència al país, es consideren inicialment amb un factor de recompte desconegut ja que no es pot confirmar la seva residència al país. La idea és assignar un factor de recompte a aquestes persones a partir de l’enquesta que el cens ha adreçat al 8,5% de la població. Com?

El conjunt de registres del fitxer precensal s’ha dividit en classes o clústers amb característiques sociodemogràfiques semblants (edat, nacionalitat i província de residència). En cada classe pot haver-hi registres dubtosos, amb factor de recompte pendent d’assignar, i registres segurs, amb factor de recompte 1. L’enquesta de població i habitatge 2011 ha permès estimar la proporció de registres dubtosos que corresponen a persones que efectivament estan residint al país i establir els seus factors de recompte. En cada classe per separat, s’ha estimat la proporció de registres que són dubtosos en el fitxer precensal i que han contestat l’enquesta, de manera que es pot considerar que corresponen a persones que estan realment presents al país. Aquesta proporció permetrà calcular un factor de recompte per als registres dubtosos de la classe. En efecte, un cop estimada la proporció “p” de dubtosos d’una classe, el factor de recompte es calcula a partir de la població segura “S” (els que tenen factor de recompte 1) i la població dubtosa “D” (els que tenen factor de recompte pendent d’assignar) de la mateixa classe,  com FR=(S*p/(1-p))/D.

El factor de recompte FR obtingut en cada classe és el que s’aplica als registres del fitxer precensal amb factor de recompte desconegut (cada registre rebrà el factor de recompte de la classe a la qual pertanyi). Amb la incorporació d’aquests factors de recompte el fitxer precensal es converteix en un fitxer precensal final ponderat i permet obtenir les xifres censals de població. Recordem que la majoria de registres tenen factor de recompte igual a 1 i la resta tenen un factor diferent de la unitat. La població d’una determinada àrea geogràfica (un municipi, una comarca, etc) s’obté com a suma dels factors de recompte dels registres del fitxer precensal final ponderat en aquesta àrea.

A Catalunya, el nombre de registres amb factor de recompte desconegut ha estat de 149.000 (un 2% del total de registres del fitxer precensal) dels quals 136.000 corresponen a estrangers i 13.000 a espanyols. El factor de recompte mitjà entre els dubtosos ha estat de 0,485, el que implica que dels 149.000 registres dubtosos es comptabilitzi una població de 72.300 persones aproximadament, a sumar a les 7.447.500 persones que eren considerades presents a Catalunya amb certesa. En certa manera, es tracta de fer una validació del Padró d’habitants sobre una mostra de la població. El procediment justifica la xifra censal des d’un punt de vista estadístic, però no des d’un punt de vista administratiu, ja que no és possible determinar quins ciutadans concrets dels dubtosos s’està comptant i quins no.

Podeu trobar més informació a

http://www.idescat.cat/cat/poblacio/censos2011/

http://www.ine.es/censos2011_datos/cen11_datos_inicio.htm

Quant a Josep Anton Sánchez Cepeda (Idescat)

Matemàtic de formació, estadístic de professió, demògraf d'adopció.
Galeria | Aquesta entrada s'ha publicat en Comptant persones i etiquetada amb , , . Afegiu a les adreces d'interès l'enllaç permanent.

15 respostes a El Cens de població 2011: com saber ”Quants som” sense comptar-nos un per un

  1. Àlvar ha dit:

    Sabent el que tot just s’acaba d’explicar, sembla poc adequat dir que “som 7.519.843 habitants”… Aquesta xifra dóna impressió de certesa, i evidentment no tots els seus dígits són significatius. Trobo que l’oficina del cens hauria de publicar els seus resultats com intèrvals de confiança, i explicitar com s’han trobat, no?
    D’altra banda, si ho he entès bé, Es considera que si una fitxa censal coincideix amb una altra dada, per exemple el DNI, es considera “validada”. Aquest mètode sembla dubtós (tot i que ara la qüestió no és estadística): crec que els DNIs, per exemple, són reconegudament inexactes (poca gent corre a actualitzar-los si es canvia). Així, la validació sembla també subjecta a error no despreciable…

    • És veritat, la xifra del Cens 2011 arriba fins a la unitat tot i estar basada parcialment en una enquesta, fet que pot donar una sensació de precisió total. Però fem-nos una reflexió: en un cens clàssic exhaustiu (a Catalunya o d’altres països), on també teníem una xifra fins a la unitat, la precisió era major?. Creus que en el cens exhaustiu totes les persones del país contesten el qüestionari? Com es pot determinar amb certesa en un cens clàssic si les llars que no contesten estan buides o hi viu algú?.
      Sota el meu punt de vista, tant els censos clàssics (exhaustius) com el Cens 2011 tenen associats un marge d’error: només hem de pensar que si es tornés a reproduir l’operació censal el resultat no seria exactament el mateix. Però tinc la sensació que la xifra del Cens 2011 és molt acurada perquè es parteix d’un registre prou actualitzat que es contrasta amb operació de camp.
      Respecte als DNI, el creuament del Fitxer precensal amb la resta de fitxers es realitza utilitzant el DNI però també el nom i cognoms, i en algun cas la data de naixement, asignant unes probabilitats de coincidència entre registres segons la concordança dels diferents camps.

      • Susana ha dit:

        I es podría coneixer la població amb un interval de confiança? o si més no, saber quin és l’error que té aquesta estimació?
        P.ex. 7.519.843 +/- 120.400
        És fàcil calcular aquest error?
        Gràcies!

      • Susana, no és gens fàcil calcular els intervals de confiança en operacions estadístiques complexes (no estem parlant d’un mostreig aleatori simple). Una tècnica per calcular-los és el remostreig, però el cas del Cens 2011 és encara més complex perquè combina una enquesta amb la gestió de registres administratius.

    • elisendavilaj ha dit:

      Estic d’acord amb l’Àlvar i entenc també la postura més “oficial”. Potser el que cal és fer una mica més de pedagogia al públic general per introduir els intervals de confiança a més a més de les estimacions puntuals.

      • Estic d’acord amb fer més pedagogia de tota la producció estadística.
        En quant als intervals de confiança (en qualsevol resultat estadístic) en general tenen associat un càlcul costós. A més, personalment no tinc clar si el públic general és capaç d’entendre la informació associada o poden causar desorientació. Pensem per exemple, en la situació que provoca tenir 2 xifres de població diferents: la censal i la padronal, o en el cas de l’atur, l’atur registrat i l’atur estimat EPA.

      • elisendavilaj ha dit:

        Crec que subestimem els usuaris. No tots tenen el mateix nivell de coneixement ni les mateixes necessitats. Hi ha exemples en estadística oficial on hi ha estimació puntual més els corresponents intervals de confiança. Per exemple en l’Enquesta d’alletament matern de l’Institut d’Estadística del Quebec (http://www.stat.gouv.qc.ca/publications/sante/pdf2006/recueil_allaitement06.pdf)

  2. Lluís Bonada ha dit:

    Per tant, les dades padronals són essencials en tot aquest procés. Com se sap que una persona ha marxat d’un municipi i ha anat a viure a un altre? Un tendeix a donar-se d’alta al nou municipi, però no de baixa en l’antic…

    • El Padró té des del 1996 un sistema de gestió contínua coordinat per l’INE. Tots els ajuntaments espanyols envien mensualment a l’INE els canvis que han esdevingut al seu padró municipal, en aquest cas, una alta d’un ciutadà. L’INE busca aquesta persona en la seva base de dades padronal i quan la troba en un altre municipi avisa a l’ajuntament corresponent per tal que faci efectiva la baixa.
      Aviat tindreu en aquest blog un post parlant sobre el Padró d’habitants!

  3. Joan C ha dit:

    Per la gent que té més de 18 anys, no valdria agafar el cens electoral i sumar els estrangers? Surt directe, no? Cal treure els catalans que no viuen a Catalunya?

    • El cens electoral s’actualitza mensualment amb la informació dels ajuntaments, oficines consulars, registres civils i reclamacions davant el propi cens electoral. Per tant, si al cens electoral afegim els estrangers i els menors de 18 anys i restem els catalans que no viuen a Catalunya obtindríem fonamentalment el mateix que al padró d’habitants. I com hem explicat al post, el cens de població obté un recompte de la població que és lleugerament inferior al padró d’habitants, ja que el padró conté algunes persones que ja no resideixen a Catalunya.

  4. Gerard Reverté ha dit:

    Tinc tres dubtes:

    1r) Entenc el factor de recompte dels desconeguts ve a ser una mena “pesca i repesca”. El dubte el tinc amb el factor de recompte dels segurs, perquè 1? No potser que hi hagi persones que siguin “segurs” però no hagin contestat? En aquest cas el factor de recompte dels “segurs” hauria de ser inferior a 1, no?

    2n) És publicaran dades a nivell de secció censal com en els anteriors censos?

    3r) Com es calcularà la xifra d’habitatges buits?

    • 1r) El caràcter de ‘segur’ o ‘dubtós’ es determina prèviament a la fase d’enquesta a partir dels registres administratius. Per tant, els ‘segurs’ ho són prèviament a l’enquesta i independentment que contestin o no.

      2n) Les variables provinents del fitxer precensal estan disponibles per a totes les persones i es podran obtenir a nivell de secció censal. Recodem que són el sexe, l’edat, la nacionalitat i el lloc de naixement. La resta de variables s’obtindrà de l’enquesta (mostra efectiva 8,5% de la població) i per tant no estaran disponibles per secció censal. De fet, segons quines variables no estaran disponibles per a tots els municipis. Això és un important canvi conceptual respecte als censos anteriors.

      3r) El cens 2011 és de població i també d’habitatges. S’ha fet un cens d’edificis exhaustiu, que combinat amb l’enquesta de població i habitatges permetrà determinar la xifra d’habitatges i les seves característiques. Està previst que al segon trimestre de 2013 es difondran les taules relatives a edificis i habitatges.

      • Gerard Reverté ha dit:

        Si ho entés bé, els “segurs” que no contestin a l’enquesta es compten com a població, però no es disposarà de les seves respostes en l’enquesta de població. S’utilitzaran mètodes d’imputació per a complimentar l’enquesta de població per als “segurs” que no han respost a l’enquesta de població?

      • Crec que ja entenc l’origen del teu dubte, però és que és més complex del que sembla!!

        En una primera etapa es calcula el FACTOR DE RECOMPTE (registres ‘segurs’ i ‘dubtosos’), que serveix ‘només’ per quantificar la població existent a cada municipi. Aquestes són les dades que s’han publicat fins ara. Tenim 7 milions i mig de persones cada un amb el seu factor de recompte.

        En una segona etapa ja es procedeix com en una enquesta qualsevol: es calcula el FACTOR D’ELEVACIÓ o ponderació, només per a la mostra de l’enquesta. Tenim 637 mil persones cada una amb el seu factor d’elevació, que deprendrà de la fracció de mostreig que s’hagi fet a cada municipi.

        Realment és complicat però alhora és inginyós. Es la manera de cobrir el doble objectiu del cens: QUANTS SOM (factors de recompte) i COM SOM (enquesta amb factors d’elevació).

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s