Els ítems dels tests com a finestra terrenal a l’espai latent dels constructes psicològics

Eva Penelo (U. Autònoma de Barcelona)

Si volguéssim mesurar quelcom físic com una distància, un pes, la temperatura o el nombre de limfòcits, el problema rau principalment en la precisió de l’instrument de mesura que fem servir, ja sigui una cinta mètrica, una bàscula, un termòmetre o qui sap quin sistema que fan servir els laboratoris per analitzar la sang, respectivament. Estudiar aquesta precisió és avaluar la fiabilitat de l’instrument de mesura. Però els constructes psicològics són un pèl més complexes de mesurar, atès que no són directament observables sinó intangibles, com indica el títol d’aquest bloc.

Així doncs, per a mesurar constructes psicològics hi ha un tema previ cabdal, que és avaluar la validesa dels instruments de mesura: els tests psicològics. És clar que per mesurar tangibles també cal assegurar la validesa… a ningú no se li acudiria mesurar una distància (p.e. l’alçada d’un edifici) directament amb un baròmetre *. I què fem els psicòlegs? Preguntar. I com normalment no n’hi ha prou amb fer una única pregunta per determinar el nivell d’ansietat, la qualitat de vida, la personalitat, la satisfacció o qualsevol dels constructes psicològics que ens interessen, es construeixen tests formats per diverses preguntes, que acostumem a nomenar ítems o reactius, que constitueixen les (úniques) respostes “observables” subjacents al constructe o tret “latent” que és objecte de mesura.

En un test que pretengui mesurar només un aspecte (“constructe”), les respostes als ítems que el formen haurien d’estar moderadament correlacionades entre sí, atès que tots els ítems pretenen mesurar detalls variats del mateix constructe. Però aquestes correlacions no han de ser excessivament elevades, ja que la idea fonamental és que els ítems siguin a l’hora específics i complementaris, és a dir, que informin de matisos diferents del constructe, ja que aquest acostuma a ser complex. Això es pot verificar fàcilment tot calculant la matriu de correlacions entre les respostes de tots els ítems dos a dos; és una matriu de [k * (k − 1)] / 2 elements diferents (on k = nombre d’ítems). Si el test és llarg, és pesat, però no és difícil. Si un parell d’ítems correlacionen molt, vol dir que són redundants: es pot triar un i descartar l’altre, ja que no cal allargar innecessàriament el test preguntant dues vegades gairebé el mateix, a menys que la intenció sigui verificar que ambdues respostes són coherents. I si un parell d‘ítems no correlacionen gens, caldrà revisar el seu contingut i/o la seva freqüència de resposta. Potser un d’ells no té a veure amb el constructe o és contestat igual per la majoria de les persones i tampoc cal mantenir-lo.

Ara bé, si el test pretén mesurar un constructe format per més d’un aspecte, estem davant d’un test amb diverses escales: multidimensional. La lògica de la matriu de correlacions bivariades és la mateixa: les respostes als ítems d‘una mateixa escala haurien de correlacionar més entre ells que amb les respostes a ítems que pertanyen a escales diferents. Però en aquest cas la inspecció visual de la matriu de correlacions (bivariades) és més difícil.

Per solucionar aquestes dificultats, disposem de tècniques multivariants que ens aporten evidències basades en l’estructura interna de la matriu de dades de les respostes als ítems d’un test: l’anàlisi factorial. Així podrem verificar si és adequat obtenir una única puntuació que resumeixi les respostes als ítems d’un test unidimensional. O si és adequat obtenir tantes puntuacions com escales tingui previstes un test multidimensional, i que cadascuna estigui formada pels ítems previstos. Es tracta, doncs, d’una tècnica de reducció de dades, on les relacions entre les respostes observables (ítems) es descriuen o resumeixen en unes poques variables no observables o factors, i per això també reben el nom de variables latents.

Dins de l’anàlisi factorial, podem distingir dues grans òptiques. La més antiga és l’anàlisi factorial exploratòria (AFE). Malgrat el terme “exploratori” del seu nom, no es tracta d’introduir les dades a l’ordinador sense cap idea preconcebuda i esperar a veure què surt. Sí tindrem alguna idea del que esperem verificar, motiu pel qual Ferrando l’anomena “no restrictiu”. Cal decidir el nombre de factors (dimensions o escales) que esperem trobar (extreure), el mètode d’estimació de la matriu factorial que contindrà el resultat principal amb les correlacions ítem-factor, i el tipus de rotació. Aquestes correlacions ítem-factor són una forma alternativa d’estudiar la discriminació dels ítems (vegeu el mètode basat en grups extrems aquí). Però tots els ítems poden pesar a qualsevol dels factors extrets i es tracta de verificar si aquesta matriu de càrregues o saturacions factorials presenta una estructura simple i interpretable. Aquesta tasca té un component artístic, ja que no hi ha una prova de significació global, sinó diverses recomanacions a considerar, i que no sempre porten a seleccionar un mateix model com el més satisfactori. En general tot va bé si les càrregues factorials (= índexs de discriminació) són majors a .30 o .40 en el factor esperat i menors per a la resta de factors.

estructura simple EFA

Posteriorment, es va desenvolupar l’anàlisi factorial confirmatòria (AFC). Aquí el terme “confirmatori” es podria substituir per la proposta de Ferrando d’anomenar-lo “restrictiu”. Ho és, i molt. Perquè a més a més cal fixar a priori el nombre de factors i quins ítems pesaran a cada factor, basant-se en la teoria que ha sustentat la construcció del test. Això significa que si un ítem no hauria de pesar a un factor (per exemple la pregunta sobre extraversió “puc animar fàcilment una festa avorrida” no pesaria als factors de neuroticisme i psicoticisme del test de personalitat d‘Eysenck), s’està fixant (o forçant) a que aquesta càrrega factorial siguin nul·la. Per tant, les càrregues factorials de les cel·les blanques no s’estimen perquè s’igualen a zero i normalment cada ítem només es permet que pesi a un sol factor (cel·les ombrejades). Aquesta és una gran exigència, ja que a AFE s’espera que siguin càrregues factorials baixes (p.e. menors a .20) o secundàries. L’avantatge de AFC és que tenim tant una prova de significació global com diferents índexs que informen sobre l’ajustament del model avaluat, i també per cada càrrega factorial tenim la seva significació per concloure si és important (salient) o no. Per contra, el fet de fixar càrregues factorials a zero sol comportar que les correlacions entre factors estiguin inflades. Ara bé, el que no tenim manera de saber és si el model avaluat és el millor o no, només podrem saber si ajusta raonablement bé a les dades. Per tant, tant per AFC com AFE convé comparar els resultats del model previst amb els d’altres possibles models alternatius plausibles (“competing” models).

I des de fa relativament poc, disposem d’un híbrid: el modelat d’equacions estructurals exploratori (ESEM, Exploratory Structural Equation Modeling), que millora les dures restriccions de l’AFC, tot mantenint les seves avantatges: tots els ítem poden pesar a tots els factors i aporta proves de significació per avaluar l’ajustament de forma menys intuïtiva que amb AFE. Segons Marsh, aquesta tècnica és la més apropiada per a molts tests multidimensionals, com els que mesuren la personalitat.

I per què és important aportar evidències basades en l’estructura interna? Perquè cal assegurar-nos que les puntuacions que obtenim i després interpretem no són resultat de l’agregació d’ítems que no tenen relació entre sí. Perquè “items and loadings are our worldly window into latent space” (John R. Nesselroade).

* excepte a Bohr, vegeu l’anècdota de com ho faria indirectament aquí

Asparouhov, T. i Muthén, B. (2009). Exploratory structural equation modeling. Structural Equation Modeling, 16, 397-438. [enllaç]

Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: Guilford Press. [enllaç]

Ferrando, P. J. i Anguiano-Carrasco, C. (2010). El análisis factorial como técnica de investigación en psicología. Papeles del Psicólogo, 31, 18-33. [enllaç]

Marsh, H. W., Lüdtke, O., Muthén, B., Asparouhov, T., Morin, A. J., Trautwein, U. i Nagengast, B. (2010). A new look at the big five factor structure through exploratory structural equation modeling. Psychological Assessment, 22, 471-491. [enllaç]

Thompson, B. (2004). Exploratory and confirmatory factor analysis: Understanding concepts and applications. Washington, D.C.: American Psychological Association. [enllaç]

Viladrich, M. C., Doval, E., Prat, R. i Vall·llovera, M. (2008). Psicometria. Barcelona: UOC.

Galeria | Aquesta entrada s'ha publicat en Mesurar l'intangible i etiquetada amb , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s