Documento descargado de http://www.elsevier.es el 18/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. CONFERENCIA CLÍNICA Editor: F. Cardellach Caso: 49-2001 Genoma humano: genómica, genética y aplicaciones en medicina Rafael Oliva Servicio de Genética. Hospital Clínic de Barcelona. Facultad de Medicina. Universidad de Barcelona. Institut d’Investigacions Biomèdiques August Pi i Sunyer (IDIBAPS). Genoma humano y proyecto genoma El genoma humano es el material genético característico de la especie humana (fig. 1)1. En las células y en estado haploide se compone de 3.000 millones de bases presentes en los 23 cromosomas del núcleo celular, más las 16.569 bases del genoma mitocondrial presente en las mitocondrias (fig. 1). No obstante, para apreciar la verdadera magnitud del genoma humano se debe considerar también la variación presente en los 5.000 millones de miembros de la especie humana cuyo genoma difiere aproximadamente un 0,1-0,01% entre cada 2 individuos. El proyecto genoma ha supuesto un extraordinario desarrollo metodológico y la determinación de la secuencia de la mayoría de bases del genoma1-3. La determinación de la secuencia requirió, en una primera fase, la construcción de mapas genéticos y de mapas físicos con una resolución creciente, hasta llegar a genotecas ordenadas en forma de cóntigos. Los cóntigos son colecciones de clones que se solapan unos Conferencia celebrada el 15-2-2001 en el Hospital Clínic de Barcelona. Correspondencia: Dr. R. Oliva. Servicio de Genética. Hospital Clínic de Barcelona. Villarroel, 170. 08036 Barcelona. Correo electrónico: [email protected] Recibido el 9-3-2001; aceptado para su publicación el 25-3-2001 Med Clin (Barc) 2001; 116: 672-675 Humanidad Individuo Célula a otros y que cubren la mayor parte del genoma. La secuencia de las bases del genoma se ha podido realizar siguiendo dos estrategias distintas: la secuenciación ordenada de los clones2 y la secuenciación al azar seguida de su ensamblado por ordenador3. El resultado de esta primera fase de la determinación de la secuencia del genoma humano ha aportado un borrador que cubre el 94% del genoma combinando la información procedente del proyecto público y la del privado2,3. La secuencia del genoma humano está actualmente disponible a través de Internet y puede ser consultada por cualquier investigador interesado (tabla 1). El análisis inicial de la secuencia del genoma humano ha aportado diversas sorpresas. Por ejemplo que el genoma humano contiene aproximadamente unos 35.000 genes, una cifra que se sitúa en el límite inferior de las previsiones iniciales1. Otro de los aspectos interesantes es que cerca de la mitad del genoma humano corresponde a secuencias repetitivas. También cabe destacar que muchos genes humanos proceden directamente de bacterias y de organismos inferiores a través de una transferencia evolutiva horizontal2,3. Respecto a la variación entre individuos, ha quedado confirmado que dos individuos de una misma etnia poseen más diferencias que las diferencias características presentes en etnias distintas de la especie humana. Aparte de todos estos aspectos básicos de evolución del genoma humano y de la especie humana, la disponibilidad de la secuencia del genoma está confiriendo un fuerte impulso a toda la investigación biomédica. Cromosoma Genes ADN Bases Adenina Citosina 5 × 109 individuos cuyo genoma difiere 0,1-0,01% 1013 células cuyo ADN es casi idéntico 23 pares de cromosomas en el núcleo, conteniendo 6 × 106 bases y genoma mitocondrial, con 16.569 bases (unos 35.000 genes) 2 moléculas de ADN Timidina Guanina Unidades hereditarias (entre 400 bases y hasta 2 × 106 bases de tamaño. Número aproximado: 35.000) Fig. 1. Niveles a los que puede considerarse el genoma humano. Al nivel más elemental el genoma humano está compuesto por cuatro tipos de bases distintas (derecha) combinadas en la secuencia de unos 3.000 millones de bases (en estado haploide) característica de la especie humana. No obstante, el verdadero genoma humano debe considerar también la variación presente en todos y cada uno de los 5.000 millones de individuos existentes en la Tierra (izquierda). 672 Documento descargado de http://www.elsevier.es el 18/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. R. OLIVA.– GENOMA HUMANO: GENÓMICA, GENÉTICA Y APLICACIONES EN MEDICINA Familias, parejas de hermanos, etc. Análisis de ligamiento, de asociación, etc. Región genómica (Clonar región genómica) (Identificar genes) A C G T (Secuenciar genes) GCTTAT... Secuencia ..AGCTAGCTAGC.. Comparar secuencia de genes candidatos entre enfermos y controles ..AGCTGGCTAGC.. Gen mutante Fig. 2. Principales pasos en la búsqueda de mutaciones responsables de enfermedades. Hasta hace poco tiempo, la identificación de un gen mutante requería un proceso laborioso que incluía la clonación de la región genómica y la identificación y secuenciación de los genes (entre paréntesis). Actualmente, con la disponibilidad de la secuencia del genoma, puede procederse directamente desde la identificación de la región genómica a la comparación de la secuencia de genes candidatos (flecha discontinua de la derecha). Investigación de enfermedades con base génica Actualmente se conocen ya las causas de más de 1.000 enfermedades con base hereditaria4. La etiología génica de la mayoría de estas enfermedades hereditarias se determinó en un pasado a través de métodos muy laboriosos que solían requerir años. Estos métodos solían consistir, o bien en la identificación de la alteración bioquímica hasta llegar a dar con el gen, o bien en la realización de estudios de ligamiento seguidos de una laboriosa clonación y secuenciación de numerosos genes (fig. 2). La disponibilidad de la secuencia del genoma aporta ahora una obra de referencia que facilitará el descubrimiento de las causas de un gran número de enfermedades con base génica cuya etiología sigue desconocida. Por ejemplo (fig. 2), TABLA 1 Bases de datos de información genómica y de enfermedades hereditarias muy útiles en la investigación y en la práctica clínica Bases de datos de secuencias de ADN y de ADNc Consulta y descarga de secuencias del genoma: http://genome.ucsc.edu Comparación, homologia y búsqueda de secuencias: http://www.ncbi.nlm.nih.gov/BLAST/ GenBank: http://www.ncbi.nlm.nih.gov/Genbank/ Búsqueda de información actualizada sobre enfermedades hereditarias OMIM (On Line Mendelian Inheritance in Man) http://www.ncbi.nlm.nih.gov/Omim/ Medline: http://www.ncbi.nlm.nih.gov/PubMed/ Búsqueda de laboratorios en donde realizar los análisis genéticos EDDNAL (European Directory DNA Laboratories) http://www.eddnal.com/ AEGH (Asociación Española de Genética Humana) http://www.uam.es/otros/AEGH/paginas/ dada una familia con diversos miembros afectados, y tras la identificación a través de ligamiento una región genómica, hoy día es posible proceder directamente a la secuenciación de genes candidatos de la región genómica en los enfermos. El gen mutante puede identificarse entonces a través del estudio comparativo de la secuencia de los enfermos con la secuencia de referencia normal2,3. Como ejemplos en los que el primer borrador del genoma humano ha facilitado el descubrimiento de genes mutantes cabe mencionar al gen BRCA2 del cáncer de mama5, el gen CNGB3 causante de la ceguera total al color6 o el gen SCA10 responsable de la ataxia espinocerebelar tipo 107. Otras estrategias disponibles actualmente en la investigación biomédica de enfermedades con base hereditaria corresponden al estudio de genes candidatos a través de estudios de asociación de casos y controles. Así, por ejemplo, se identificó que la variante 4 del gen de la apolipoproteína E (APOE) se comporta como factor de riesgo para el desarrollo de la enfermedad de Azlheimer8,9. Una consecuencia de la rapidez actual con la que se producen los avances en biomedicina y del gran número de enfermedades hereditarias existentes es la gran dificultad para mantenerse al día. Por tanto, resulta crucial conocer cuáles son las alternativas disponibles con el fin de buscar información actualizada. De forma práctica, cualquier clínico puede buscar información acerca de cualquier enfermedad con base hereditaria a través de Internet en OMIM (On Line Mendelian Inheritance in Man)4. La dirección web correspondiente se expresa en la tabla 1. Se trata de una base de datos, actualizada semanalmente, en la que es posible realizar una búsqueda por palabras clave. El resultado aporta una revisión, incluyendo las referencias originales, y una sinopsis clínica de cada enfermedad. Sin duda existen también otras alternativas en la búsqueda de la información relativa a una enfermedad concreta tales como la consulta de la base de datos Medline o la de los textos especializados (tabla 1). Aplicación en la práctica médica diaria La aplicación más inmediata del descubrimiento de las mutaciones de un gen responsables de una determinada enfermedad hereditaria es que se abre la oportunidad de realizar un diagnóstico etiológico en la práctica clínica. A su vez, es bien sabido que el conocimiento de una etiología aporta un pronóstico y abre las puertas a la prevención y/o a un tratamiento mucho más efectivo. No obstante, en el ámbito práctico se plantea qué es lo que se requiere para diagnosticar a escala molecular una enfermedad tras su sospecha clínica. El primer paso en el proceso de análisis genético suele consistir en la obtención de una muestra de sangre venosa anticoagulada en EDTA (fig. 3). Esta muestra debe ser enviada entonces al laboratorio de análisis genéticos. Normalmente, cada laboratorio de genética se especializa sólo en algunas enfermedades hereditarias; por tanto, resulta esencial determinar dónde deben remitirse las muestras para su análisis. En este sentido resulta útil la consulta a través de Internet de las bases de datos EDDNAL (European DNA Laboratories) y de la Sociedad Española de Genética Humana (tabla 1). Ambas proporcionan las direcciones de contacto, o incluso de correo electrónico de los distintos centros. Así, es posible pedir información de costes y requerimientos para el envío de muestras. Una vez las muestras de sangre son recibidas en el laboratorio de análisis genético, suele procederse a la extracción del ADN y a la amplificación del gen de interés a través de la reacción en cadena de la polimerasa o PCR. Se plantean entonces distintas posibilidades técnicas. En algunos casos 673 Documento descargado de http://www.elsevier.es el 18/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. MEDICINA CLÍNICA. VOL. 116. NÚM. 17. 2001 5-15 ml de sangre venosa anticoagulada con EDTA (estable hasta 24 h a temperatura ambiente, 2 días a 4 ºC y varios años a –25 ºC) ADN genómico PCR con oligonucleótidos específicos Electroforesis y análisis Secuenciación Enzima de restricción Otras: SSCP DGGE ADN chip ... Fig. 3. Principales posibilidades en la detección de mutaciones puntuales. En el ámbito clínico, un análisis genético suele requerir la extracción de una muestra de sangre venosa (superior). Una vez en el laboratorio de análisis, debe procederse a la extracción del ADN genómico. A continuación se procede en muchos casos a la amplificación del gen de interés por PCR y, finalmente, al análisis del producto de amplificación. GCTTAT... la observación directa del producto de PCR tras su electroforesis ya resulta diagnóstica (fig. 3). Por ejemplo, la detección de amplificación del gen DAZ en un paciente azoospérmico descarta la presencia de la pérdida de este gen. En cambio, la ausencia de amplificación en el gen DAZ (ausencia de banda en la electroforesis) es diagnóstica de una pérdida de esta región del cromosoma Y en un paciente azoospérmico, aportando un diagnóstico etiológico10. En enfermedades debidas a mutaciones puntuales dispersas en cualquier exón del gen suelen emplearse diversas técnicas (SSCP, DGGE) o incluso la secuenciación directa del supuesto gen mutante (fig. 3). Así, es posible, por ejemplo, identificar las mutaciones del gen de la presenilina 1 responsables de alguna de las formas familiares preseniles de la enfermedad de Alzheimer11, o bien las diversas mutaciones del gen BRCA1 causantes de las formas familiares del cáncer de mama12. Los resultados del estudio genético suelen aportar una información diagnóstica molecular. La utilidad de esta información depende del tipo de enfermedad. Por ejemplo, la detección de la translocación de los genes BCR-ABL en la leucemia, aparte de tener valor diagnóstico y pronóstico, orienta hacia el tratamiento13,14. En otros casos, la detección presintomática de la alteración molecular sirve para prevenir la aparición de la enfermedad. Por ejemplo, la detección de la mutación homocigota C282Y del gen HFE en una persona joven permite controlar la concentración plasmática de hierro a través de flebotomías periódicas y, de esta forma, evitar la posible aparición de una cirrosis y cáncer de hígado, entre otras alteraciones, a los 45-65 años15,16. En los casos de enfermedades letales o muy graves e incapacitantes a temprana edad, o bien que son causa de retraso mental, es posible utilizar la información molecular para el diagnóstico preimplantacional o prenatal. Por ejemplo, una mujer que desea tener hijos y cuyo hermano está afectado del síndrome del cromosoma X-frágil presenta un riesgo elevado de ser portadora. El estudio molecular permite, en este caso, determinar con una fiabilidad elevada cuál es la situación y, en el caso de que sea portadora, permitir que pueda tener hijos sanos confirmados a través del diagnóstico prenatal. En otros casos la detección de la alteración permite establecer un programa de revisiones periódicas con el fin de detectar la aparición de la enfermedad en su estadio más inicial. Éste es el caso del cáncer de mama o de colon familiar tras la detección de la mutación concreta responsable12. 674 Desarrollos futuros previsibles Una de las consecuencias del proyecto genoma ha sido el desarrollo de nuevas tecnologías de análisis génico. Dos de éstas corresponden a los microarrays y al ADN chip. Un microarray es básicamente una colección de fragmentos de ADNc o de genes de secuencia conocida unidos covalentemente sobre una superficie que, con frecuencia, suele ser la de un portaobjetos. A través de la hibridación de moléculas de ARN marcadas procedentes de una célula que se está investigando es posible determinar qué genes se están expresando en esta célula. El principio del chip de ADN es similar, aunque la finalidad es distinta. El chip de ADN consta básicamente de oligonucleótidos de secuencia conocida unidos sobre una superficie (fig. 4). Analizando en qué posición hibrida un producto de PCR sobre el chip es posible determinar la secuencia existente en el producto de amplificación (fig. 4). Se prevé que esta estrategia facilitará enormemente la identificación molecular de las posibles mutaciones presentes en un gen o incluso en un conjunto de genes. Como ejemplos cabe mencionar la detección de mutaciones en el exón 11 del 5’.. CAGTCAT.. CAGGCAT.. 5’.. CAGCCAT.. 5’.. CAG ACAT.. 5’.. 5 Hibridación CAGT CAT.. 5’.. 5’.. CAG G CAT.. 5’.. 3 Muestra paciente ..CAGCCAT.. 3’’ ..GTCGGTA.. 5’ ..GTC G GTA..5’ CAGCCAT.. 3’ 5’.. CAGACAT.. ADN chip DNA PCR Producto de PCR 5’ ..CAGCCAT.. 3’’ 3’..GTCGGTA.. 5’ Fig. 4. Principio del chip de ADN. Distintos oligonucleótidos unidos sobre una superficie son utilizados como reactivo en una hibridación con una muestra problema. La clave de la discriminación se basa en la hibridación molecular y en el apareamiento perfecto de las bases entre los oligonucleótidos del chip y la secuencia problema. Las flechas continuas del esquema indican la posición concreta que se está interrogando en este ejemplo. Documento descargado de http://www.elsevier.es el 18/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. R. OLIVA.– GENOMA HUMANO: GENÓMICA, GENÉTICA Y APLICACIONES EN MEDICINA gen BRCA1 responsable del cáncer de mama y de ovario hereditarios, donde 14 de 15 pacientes fueron correctamente diagnosticados sin detectarse ningún falso positivo17. La tecnología del ADN chip también ha sido aplicada en la detección de mutaciones del gen de la fibrosis quística, de polimorfismos en el virus de la inmunodeficiencia humana, de polimorfismos en el ADN mitocondrial y de mutaciones en la betatalasemia. Se prevé que el chip de ADN también puede resultar muy útil en la detección de variación de los genes responsables del metabolismo y respuesta diferencial de los distintos individuos a un mismo fármaco. En este sentido, se ha creado el término de «farmacogenómica» (surgido de la farmacogenética) referente a la aplicación de las tecnologías de análisis genómico en el desarrollo y uso futuro más racional de fármacos18,19. La farmacogenómica engloba básicamente los dos aspectos descritos en las secciones anteriores. La detección de variación presente en distintos individuos a través de ADN chips u otros métodos puede permitir determinar su relación con la respuesta a fármacos20. Los individuos responden de forma distinta a los fármacos porque son genéticamente heterogéneos. Esta heterogeneidad condiciona que, en algunos individuos, un fármaco no ejerza ningún efecto, mientras que en otros ocasione efectos indeseables. En un futuro es previsible que la genotipificación preceda a la administración de un fármaco, de forma que a cada individuo se le pueda administrar el medicamento idóneo. Igualmente importante es el potencial de la utilización de microarrays para el estudio de la expresión génica en la identificación de dianas terapéuticas nuevas21. En este sentido, cabe mencionar que toda la farmacología actual se basa en tan sólo unas 400 dianas terapéuticas. Dado que existe evidencia de que el genoma humano consta de unos 35.000 genes, es previsible que en los próximos años se produzca un incremento del número de dianas terapéuticas disponibles en la investigación biomédica. Dr. Francesc Cardellach. ¿Cuál es su impresión acerca de las posibilidades futuras del tratamiento personalizado y el tiempo aproximado de su desarrollo real? Dr. R. Oliva. Los avances de la genética permiten predecir que el tratamiento personalizado no es una utopía. Actualmente ya es posible detectar variación en genes clave implicados en el metabolismo de fármacos o en la destoxificación de compuestos. Por ejemplo, la compañía Affymetrix comercializa el ADN chip que permite el análisis de la variación existente en el gen CYP450 implicado en la fase I del metabolismo de un gran número de compuestos, por lo que es posible que en los próximos 5-10 años ya pueda aplicarse como ensayo piloto en algún fármaco concreto. Sin embargo, hay que ser conscientes de que desde que una investigación en el laboratorio se traduce en una aplicación práctica con un beneficio real para los pacientes, a veces pueden pasar muchos años. Y si a ello se añade que el desarrollo de fármacos por parte de la industria farmacéutica y su autorización de uso por parte de las autoridades sanitarias habitualmente también es un proceso largo, es posible que hasta dentro de unos 20 años o más no se disponga del denominado tratamiento personalizado aplicado de forma generalizada. Prof. Ciril Rozman. Respecto a la proteómica, ¿cuál es su opinión sobre las posibilidades de que a partir de un solo gen se puedan desarrollar diversas proteínas distintas? Dr. R. Oliva. Efectivamente, los genes humanos contienen exones e intrones. Los intrones son eliminados del ARN transcrito primario a través del proceso de splicing para dar lugar a un ARN mensajero que contiene todos los exones del gen, uno a continuación del otro. Pero, con frecuencia, la maquinaria de splicing se salta alguno de los exones. A este fenómeno se le conoce con el nombre de splicing alternativo y el resultado es que se origina un ARN mensajero al que le falta alguno de los exones. Se calcula que un gen humano puede dar lugar, a través del splicing alternativo, a diversos mensajeros distintos, cada uno de ellos codificando una proteína distinta. Por tanto, si se tiene en cuenta que en cada célula existe un potencial de expresión de hasta unos 35.000 genes, y que cada uno de ellos puede dar lugar a proteínas diferentes, el potencial de proteínas diferentes expresadas puede llegar a ser muy superior al número de genes del genoma humano. REFERENCIAS BIBLIOGRÁFICAS 1. Oliva R. Genoma Humano. Barcelona: Masson S.A., 1996. 2. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J et al. Initial sequencing and analysis of the human genome. Nature (Lond) 2001; 409: 860-921. 3. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG et al. The sequence of the human genome. Science 2001; 291: 1304-1351. 4. McKussick. On line Mendelian Inheritance in Man. OMIM 2001; http://www.ncbi.nlm.nih.gov/Omim/ 5. Wooster R, Bignell G, Lancaster J, Swift S, Seal S, Mangion J et al. Identification of the breast cancer susceptibility gene BRCA2. Nature (Lond) 1995; 378: 789-792. 6. Sundin OH, Yang JM, Li Y, Zhu D, Hurd JN, Mitchell TN et al. Genetic basis of total colourblindness among the Pingelapese islanders. Nat Genet 2000; 25: 289-293. 7. Matsuura T, Yamagata T, Burgess DL, Rasmussen A, Grewal RP, Watase K et al. Large expansion of the ATTCT pentanucleotide repeat in spinocerebellar ataxia type 10. Nature Genet 2000; 26: 191-194. 8. Saunders AM, Schmader K, Breitner JC, Benson MD, Brown WT, Goldfarb L et al. Apolipoprotein E E4 allele distributions in lateonset Alzheimer’s disease and in other amyloidforming diseases. Lancet 1993; 342: 710-711. 9. Blesa R, Adroer R, Santacruz P, Ascaso C, Tolosa E, Oliva, R. High apolipoprotein E e4 allele frequency in age related memory decline (ARMD). Ann Neurol 1996; 39: 548-551. 10. Oliva R, Margarit E, Ballescà JL, Carrió A, Sánchez A, Milà M et al. Prevalence of Y chromosome microdeletions in consecutive oligospermic and azoospermic ICSI candidates. Fertil Steril 1998; 70: 506-510. 11. Ezquerra M, Carnero C, Blesa R, Ballesta F, Oliva R. A novel presenilin 1 mutation (Ser169Pro) associated with early onset Alzheimer’s disease and myoclonic seizures. Neurology 1999; 52: 566-570. 12. Meijers-Heijboer EJ, Verhoog LC, Brekelmans CT, Seynaeve C, TilanusLinthorst MM, Wagner A et al. Presymptomatic DNA testing and prophylactic surgery in families with a BRCA1 or BRCA2 mutation. Lancet 2000; 355: 2015-2020. 13. De Klein A, Geurts van Kessel A, Grosveld G, Bartram CR, Hagemeijer A, Bootsma D, et al. A cellular oncogene is translocated to the Philadelphia chromosome in chronic myelocytic leukaemia. Nature (Lond) 1982; 300: 765-767. 14. Rozman C, Urbano-Ispizua A, Cervantes F, Rozman M, Colomer D, Feliz P et al. Analysis of the clinical relevance of the breakpoint location within M-BCR and the type of chimeric mRNA in chronic myelogenous leukemia. Leukemia 1995; 9: 1104-1107. 15. Sánchez M, Bruguera M, Bosch J, Rodés J, Ballesta F, Oliva R, Prevalence of the HFE Cys282Tyr and His63Asp gene mutations in Spanish patients with hereditary hemocromatosis and in controls. J Hepatol 1998; 29: 725-728. 16. Oliva R, Sánchez M, Bruguera M, Rodés J. Utilidad clínica de la detección de mutaciones del gen HFE en la hemocromatosis. Gastroenterol Hepatol 2000; 23: 433-435. 17. Hacia JG, Brody LC, Chee MS, Fodor SPA, Collins FS. Detection of heterozygous mutation in BRCA1 using high density oligonucleotide arrays and two-colour fluorescence analysis. Nat Genet 1996; 14: 441-447. 18. Evans WE, Relling MV. Pharmacogenomics: translating functional genomics into rational therapeutics. Science 1999; 286: 487-491. 19. Cantor CR. Pharmacogenetics becomes pharmacogenomics: wake up and get ready. Mol Diag 1999; 4: 287-288. 20. Melton L. From DNA to drugs. Mol Med Today 1999; 5: 468-469. 21. Debouck C, Goodfellow PN. DNA microarrays in drug discovery and development. Nat Genet 1999; 21 (Supl): 48-50. 675