Agulles en un paller

Víctor Urrea (U. de Vic)

Tot i que l’ADN humà té més de 3000 milions de parells de bases (cadascun dels “esglaons” de la famosa doble hèlix), les cadenes d’ADN de dues persones diferents només es diferencien, de mitjana, en un 0,1% de les bases que, malgrat ser un percentatge petit en relació al genoma, representa milions de variants genètiques.

Per tant, en principi, els factors genètics que determinen o afecten un determinat fenotip cal buscar-los entre aquest percentatge de diferències genètiques. En aquest sentit, és d’especial importància l’estudi de malalties amb factors genètics de risc.

Un primer tipus de malalties genètiques el formen les malalties monogèniques o mendelianes, en les que una determinada mutació o alteració en un gen és la causant de la malaltia. Aquestes malalties són relativament fàcils de detectar i estudiar perquè presenten una alta agregació familiar.

Davant de les malalties monogèniques, ens trobem amb les malalties complexes, en que el risc o susceptibilitat a desenvolupar-les és el resultat de la combinació de diversos factors ambientals i genètics. Aquest és el cas de malalties com la diabetis, els càncers, l’alzheimer, etc.

En els darrers anys, les tècniques de seqüenciació del genoma han permès fer estudis d’associació entre aquest tipus de malalties complexes i les variants genètiques dels individus d’una població, els estudis GWAS (genome-wide association study), que han tingut una gran rellevància en la última dècada. La següent il·lustració mostra l’evolució de GWAS publicats des del 2005:

Published_GWA_Reports_2005-2012

Manolio TA. Disponible a: http://www.genome.gov/gwastudies

Els GWAS es fonamenten en l’assumpció de l’existència de factors genètics que influeixen en el risc d’una determinada malaltia, per exemple per evidències d’agregació familiar, i es basen en el estudi univariant de l’associació entre el fenotip (malat o no malalt) i variants genètiques anomenades SNPs (single-nucleotide polymorphism). Els SNPs són el tipus de variants genètiques més freqüent i es troben distribuïts per tot el genoma, el que els converteix en uns bons marcadors genètics.

Un altre aspecte important en el que es basa un GWAS és el principi de desequilibri de lligament (LD). El LD és una associació no aleatòria entre les diferents variants genètiques que s’observen en dos posicions concretes de l’ADN. En el cas dels SNPs, que consten de dos al·lels, el LD queda il·lustrat en la següent taula:

LD

Hi ha una diferència D entre la freqüència relativa esperada per atzar de la combinació d’al·les A-B dels SNPs, donada pel producte de les freqüències relatives dels al·lels A i B, i la freqüència relativa observada p11. 

Nivells alts de LD indiquen una forta correlació entre els SNPs i això fa que es pugui resumir la informació genètica que aporta el conjunt de tots els SNPs (milions) en un subconjunt degudament seleccionat (centenars de milers) que fa més factible els estudis de GWAS al reduir considerablement el nombre de variants a genotipar.

Com hi ha moltes més variants genètiques de les que es genotipen en els GWAS, és improbable, encara que no impossible, que una mutació implicada en el risc estigui genotipada i, per tant, el seu efecte normalment es detecta a través de l’associació amb una variant genotipada. Aquesta variant genotipada pot estar fortament associada amb la malaltia i serveix de marcador d’una zona del genoma implicada, si es valida posteriorment, en el risc.

Gràcies als estudis GWAS s’han identificat centenars de variants genètiques associades a malalties complexes. La imatge següent mostra un catàleg de variants genètiques associades a diferents categories de malalties publicades:

Hindorff LA, MacArthur J (European Bioinformatics Institute), Morales J (European Bioinformatics Institute), Junkins HA, Hall PN, Klemm AK, and Manolio TA. A Catalog of Published Genome-Wide Association Studies. Disponible a: www.genome.gov/gwastudies

Hindorff LA, MacArthur J (European Bioinformatics Institute), Morales J (European Bioinformatics Institute), Junkins HA, Hall PN, Klemm AK, and Manolio TA. A Catalog of Published Genome-Wide Association Studies. Disponible a: http://www.genome.gov/gwastudies

No obstant això, la majoria de les variants genètiques identificades fins ara confereixen petits increments en el risc i expliquen només una petita proporció de l’agregació familiar. Aquest fet porta a preguntar-se on resta la part de l’heretabilitat no explicada i ha obert importants debats sobre el que ja es coneix com el problema de l’heretabilitat perduda:

Evan E. Eichler, Jonathan Flint, Greg Gibson, Augustine Kong, Suzanne M. Leal, Jason H. Moore & Joseph H. Nadeau. Missing heritability and strategies for finding the underlying causes of complex disease. Nature Reviews Genetics 11, 446-450 (June 2010) | doi:10.1038/nrg2809

Galeria | Aquesta entrada s'ha publicat en Ho portem a la sang! i etiquetada amb , , . Afegiu a les adreces d'interès l'enllaç permanent.

4 respostes a Agulles en un paller

  1. Àlex Sierra ha dit:

    Tingueu cura de l’ortografia, sisplau. Només al primer paràgraf: “a pesar”, “és” i “promig”!

  2. Susana ha dit:

    Hola Victor,
    molt xulo el post.
    Un dubte respecte les dades dels GWA. SI ho he entès bé, són aproximadament 3milions de bases les que contenen tota la nostra variabilitat genètica. Entenent aquesta variabilitat com el canvi d’1 sola base. Tot i així, als estudis de GWA sembla que no s’analitzen totes aquestes bases. Generalment, quantes bases es genotipen?
    I un altre dubte: Crec que ja hi ha gens identificats i/o canvis en certes bases que se sap que estan associades a l’increment o la baixada de risc de patir una malaltia i això serveix de base per fer la tria de què genotipar. Però clar, per identificar marcadors nous..hauràs de genotipar zones noves, no? Com es trien aquestes altres bases o zones a genotipar: repartides a l’atzar pel genoma dins de les regions que contenen aquestes variacions?
    Moltes gràcies!

    • Víctor Urrea ha dit:

      El que s’analitza son SNPs, llocs del genoma on hi ha variació genètica a nivell poblacional, i entre els SNPs s’escullen els anomenats tag SNPs, que són SNPs representatius d’una zona del genoma amb un LD gran (fortes correlacions entre els SNPs). Actualment hi ha identificats per sobre de 3 milions d’SNPs, i es calcular que hi pot haver uns 10 milions en el genoma. No sóc expert en el tema però crec que fins ara, en els GWAs, s’analitzen entre 500 mil i uns 2.5 milions d’SNPs.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s