TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 1 Tema 3. Origen de la variación genética en humanos Variación en el ADN: polimorfismos y mutaciones. Recombinación a nivel molecular: modelos de sobrecruzamiento y conversión génica. Mecanismos de reparación del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparación. Organización y expresión de los genes de las inmunoglobulinas. Variación en el ADN: polimorfismos y mutaciones La variación observable en los individuos se debe en gran medida a la variación genética, sobre la que se añade la variación producida por la influencia del ambiente. La variación genética se debe a la presencia de cambios genéticos heredables a nivel celular (de una célula a sus células hijas) que además son transmitidos a la siguiente generación si afectan a la línea germinal (pero no son transmitidos si solamente afectan a células somáticas). Como es sabido, un gen —localizado en un locus— puede presentarse en formas diferentes debidas a variaciones en la secuencia. Cada forma alternativa se denomina alelo, y el porcentaje de individuos de la población que presenta cada alelo se denomina frecuencia alélica. Cuando un locus se presenta, al menos, en dos formas alélicas y la frecuencia alélica del alelo más raro es del 1% o mayor, ese locus se llama locus polimórfico, y esa variación se denomina polimorfismo. La variación inter-individual garantiza la adaptación de una especie a condiciones ambientales cambiantes, pero los mismos mecanismos que crean esa variación son también responsables de originar mutaciones más graves, que en algunos individuos desencadenan una enfermedad. En humanos, la variación entre individuos se genera principalmente de dos maneras: durante el proceso de reproducción sexual, la segregación aleatoria de los cromosomas de cada progenitor a los gametos producirá gametos con distintas combinaciones de los cromosomas que estaban en la célula diploide original. Para entender esto es útil imaginarse todos los cromosomas de una célula diploide como la suma de dos conjuntos haploides, el paterno y el materno. Así, cada pareja de cromosomas homólogos consta de un homólogo de origen paterno y otro de origen materno. Cuando los homólogos se separan en la meiosis, no pasan todos los de origen paterno a una de las células hijas, y todos los de origen materno a la otra; por el contrario, se distribuyen aleatoriamente. Como los homólogos pueden tener pequeñas diferencias en los alelos presentes para algunos genes, el resultado es que cada gameto lleva una combinación única de cromosomas de origen paterno y materno mezclados. La variabilidad que se puede generar por este sencillo mecanismo es altísima, porque con 23 parejas de cromosomas el número de combinaciones posibles es igual a 223, ó lo que es lo mismo 8.388.608. Además, en cada meiosis hay intercambio de material genético por recombinación entre cromosomas homólogos, lo que genera todavía más variabilidad genética. En la especie humana se ha calculado que se producen unos 55 sobrecruzamientos por célula, porque ese es el número medio de quiasmas que se observan. Esto supone una media de al menos 2 sobrecruzamientos por par cromosómico, incluidos los cromosomas sexuales. Es probable que el número total de eventos de recombinación sea todavía mayor al número de quiasmas, porque no todas las recombinaciones producen un sobrecruzamiento (como se verá a continuación). Por tanto, el grado de intercambio de material genético entre cromátides de cromosomas homólogos es bastante alto, y hace que los cromosomas TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS que finalmente llegan a un gameto sean ligeramente distintos a los cromosomas que estaban presentes en la célula inicial. Como resultado de esto, la variabilidad genética generada durante la meiosis es alta, y por eso la probabilidad de que dos individuos tengan dos descendientes genéticamente idénticos es prácticamente nula. Esto es precisamente lo que persigue la reproducción sexual: generar descendientes distintos a sus progenitores y distintos entre sí. En el siguiente apartado estudiaremos los aspectos moleculares de este proceso. Además, durante la vida de un individuo se van introduciendo muchas nuevas mutaciones en el genoma de sus células, aunque sólo un pequeño porcentaje de estos cambios afectan a las células germinales y quedan fijados en el genoma de la especie. La tasa de nuevas mutaciones es resultado del equilibrio entre mutación y reparación de las mutaciones. En efecto, en cada división celular se incorporan 6x109 nucleótidos, y se estima que se producen unas 1017 divisiones celulares durante la vida media de un individuo: por tanto, un sistema sin errores debería tener una exactitud de 6x1026, lo que es virtualmente imposible. De hecho, se sabe que la ADN polimerasa produce un error cada 104 nucleótidos incorporados, aunque está dotada de un sistema de ―edición‖ que mejora esta tasa hasta 107. Considerando un genoma diploide de 6x109 nucleótidos, esto significa unas 600 mutaciones por cada división celular en cada célula del organismo, lo cual es muy superior a lo observado y sugiere, por tanto, la existencia de sistemas celulares de reparación del ADN que se ocupan de reparar la inmensa mayoría de las mutaciones introducidas en el genoma, contribuyendo a mantener una fidelidad alta. En efecto, las tasas de división celular son distintas en la línea germinal que en los diferentes tejidos, e incluso no son las mismas en la línea germinal masculina que en la femenina (mucho mayores en la masculina). Las tasas de mutación estimadas, mediante diversos procedimientos, se sitúan en torno a 1x10-9 substituciones por nucleótido por división en células somáticas, y 1,3x10-8 substituciones por nucleótido por generación en la línea germinal. Se ha calculado que, de media, una persona experimenta 1017 divisiones celulares somáticas a lo largo de su vida, lo cual debería traducirse en unas 6x108 mutaciones somáticas a lo largo de la vida de una persona. Recientemente, estas tasas de mutación se han podido calcular directamente, gracias a la secuenciación de genomas completos en familias en las que se ha leído el genoma de los padres y de uno o más hijos. Los estudios realizados hasta el momento indican que, en condiciones normales, cada hijo lleva entre 40 y 70 mutaciones nuevas en la línea germinal, lo que equivale a una tasa de mutación entre 0,9-1,2 x 10-8 por nucleótido por cada generación. Dando como válidas las estimaciones de que la línea germinal sufre 216 divisiones celulares por cada generación, esto supone una tasa de mutación observada en línea germinal (considerando un genoma haploide) en torno a 0,15 mutaciones por división celular. Uno de estos estudios detectó, curiosamente, una tasa de mutación paterna superior a la materna en una familia europea, mientras que la tasa de mutación materna fue superior a la paterna en una familia africana. Finalmente, hay que tener en cuenta que no todas las substituciones tendrán el mismo efecto a nivel funcional. De hecho, muchas mutaciones serán silenciosas porque no afectan a ADN codificante o a regiones importantes del genoma; otras, las más dañinas, sufrirán una fuerte presión selectiva y su frecuencia alélica será muy baja en la población. En definitiva, siempre se ha de recordar que la presencia de polimorfismos y mutaciones en las poblaciones humanas es el resultado del equilibrio entre mutación-reparación-selección. 2 TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS Recombinación a nivel molecular: modelos de 3 sobrecruzamiento y conversión génica Uno de los temas más importantes en genética es la caracterización de los mecanismos moleculares por los que se produce intercambio de material genético entre cromátides durante la meiosis, y más raramente en la mitosis. Distintos modelos han intentado explicar cómo dos moléculas de ADN homólogas pueden entrecruzarse e intercambiar material genético. El paso inicial común a todos los modelos propuestos es el alineamiento preciso de ambas moléculas, precisamente debido a que son cadenas de ADN homólogas, es decir, pertenecientes a cromosomas homólogos y por tanto con la misma secuencia de nucleótidos. En realidad, hoy sabemos que ambas moléculas no son absolutamente idénticas, ya que pueden existir diferencias alélicas en su secuencia (por ejemplo, pequeñas diferencias de un nucleótido). En cualquier caso, el alineamiento de dos secuencias homólogas es un requisito imprescindible para que se inicie el proceso de recombinación, que se denomina por eso recombinación homóloga. Dicho alineamiento, como es lógico, se produce durante la profase I de la meiosis merced al complejo sinaptonémico que mantiene estrechamente unidos los cromosomas homólogos en toda su longitud. Es lógico pensar que dicha configuración permite que dos moléculas de ADN de secuencia homóloga se mantengan en contacto. Los primeros modelos de recombinación proponían que, tras el alineamiento, ambas moléculas de ADN sufren una mella en una de sus cadenas, exactamente en la misma posición, y esto deja dos cadenas "libres" que se intercambian entre sí y se unen a la molécula homóloga por complementariedad de bases. Dado que la generación de dos mellas simultáneas en la misma posición es un evento muy improbable, Meselson y Radding propusieron otro modelo en el que una sola mella en una de las dos moléculas es suficiente para iniciar el proceso de recombinación, ya que la cadena libre puede invadir la doble hélice homóloga. Los estudios llevados a cabo en distintas especies de eucariotas en los últimos años han demostrado que la recombinación se inicia por la aparición de una rotura completa de una de las dos moléculas homólogas, es decir, una rotura bi-catenaria (de las dos cadenas de una doble hélice). Dichas lesiones, llamadas DSB (Double-Strand Break en inglés), se generan con cierta frecuencia en el ADN celular en respuesta a diversas causas; parece comprobado que la creación específica de un DSB durante profase I es el proceso iniciador de la recombinación. En levaduras, estas roturas son generadas por la proteína SPO11. Según el modelo actual de recombinación homóloga, en este proceso intervienen una serie de complejos proteicos: Complejo RAD50, también llamado MRN formado por las moléclulas MRE11, RAD50 y NBS1. El complejo RAD52, que incluye varios componentes (RAD51, RAD52, RAD54, RAD55 y RAD57 entre otros). La molécula RPA (la misma proteína A de la replicación). Tras la creación de un DSB, bien por lesiones que sufre el ADN o bien por proteínas que cortan la doble cadena de forma programada, los extremos libres son procesados mediante la actividad exonucleasa del complejo RAD50, que actúa en dirección 5’3’ y por tanto genera extremos libres más largos en la hebra 3'. Este extremo protruyente se recubre de RPA, RAD51 y otras moléculas del complejo RAD51 para formar un filamento nucleo-proteico. Este filamento tiene la capacidad de invadir la doble hebra homóloga, abriendo en ella una burbuja, y se empareja a la cadena complementaria que discurre en dirección antiparalela. A partir de este extremo 3' se extiende la cadena usando la hebra complementaria como molde, al tiempo que también se extiende también el otro extremo que había TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS quedado libre. Tras una corta extensión, los extremos libres se unen por acción de una ligasa y esto genera dos estructuras en las que una hebra salta de una molécula de ADN a la molécula homóloga. Dichas estructuras se denominan estructuras de Holliday, que fue el primero en proponer su existencia. Es importante tener en cuenta que si las dos moléculas de ADN no son inicialmente idénticas en su secuencia, durante el proceso de recombinación se pueden formar moléculas híbridas, en las que ambas cadenas no son idénticas. Dichas moléculas de ADN se llaman heteroduplex, y son muy importantes porque los desemparejamientos son corregidos por un mecanismo de reparación que se estudiará en otro capítulo; dicha corrección hace que una de las dos cadenas se modifique para hacerse perfectamente complementaria a la otra, en un proceso llamado conversión génica. Como veremos en otras partes de este texto, la conversión génica es un mecanismo que da lugar a varias enfermedades genéticas en humanos. Las estructuras de Holliday dan lugar unas estructuras cruciformes formadas por dos moléculas de ADN, llamadas también estructuras chi, que han de resolverse de algún modo para permitir la separación de las dos cromátides. La resolución de las estructuras de Holliday puede hacerse según un plano vertical o según un plano horizontal, y es precisamente el tipo de resolución que se lleva a cabo lo que determina el tipo de moléculas que se generan. Por ejemplo, si las dos estructuras de Holliday se resuelven según planos distintos, las moléculas resultantes van a dar lugar a un sobrecruzamiento (la configuración que da lugar a los quiasmas que se ven en la meiosis); en cambio, cuando las dos estructuras de Holliday se resuelven según el mismo plano se producirá recombinación sin sobrecruzamiento. A su vez, cada una de estas dos posibilidades puede darse con ó sin conversión génica, dependiendo de la presencia de heterodúplex y del modo en que se reparan esos desemparejamientos. Figura 3.1 En este video se muestra, paso a paso, el proceso de recombinación molecular según el modelo de iniciación por una rotura bicatenaria (DSB). En este otro video se explica con mayor detalle cómo se lleva a cabo la resolución de una estructura de Holliday. Curiosamente, el modelo de recombinación iniciado por una rotura bicatenaria es fruto de los estudios de reparación de este tipo de lesiones en eucariotas. Como veremos a continuación, las roturas bicatenarias son un tipo frecuente de agresión al ADN, y son reparadas en células somáticas precisamente por un mecanismo de recombinación homóloga que tiene lugar durante la fase S del ciclo celular. En los últimos años se ha visto que este mismo mecanismo explica también las predicciones acerca de la recombinación durante la meiosis, y que de hecho la maquinaria proteica responsable es básicamente la misma. Por tanto, hoy en día se considera como un mismo mecanismo que se ha adaptado a dos funciones celulares importantes como la reparación del ADN y la generación de variabilidad genética durante la formación de los gametos. Más recientemente, se ha sugerido que la recombinación homóloga también puede tener otra función importante: la reiniciación de la replicación del ADN. A menudo, la horquilla de replicación se para prematuramente durante la síntesis de ADN y toda la maquinaria replicativa se desensambla. Esto puede suceder durante la replicación de una doble cadena en la que hay una mella, o bien por el retroceso de una horquilla de replicación que se ha detenido ante la presencia de una lesión. Antes se pensaba que estas horquillas interrumpidas se reinician por el ensamblaje de un nuevo complejo de replicación en ese punto, pero cada vez hay más datos a favor de la hipótesis de que la replicación se reinicia en esas horquillas por un fenómeno de recombinación homóloga. Dicha recombinación podría darse entre las dos cromátides hermanas idénticas (la cromátide con la horquilla interrumpida y la que se ha originado por la replicación hasta ese punto), que sería lo normal, o bien puede darse entre cromátides de 4 TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 5 cromosomas homólogos, en cuyo caso se originaría un fenómeno de recombinación homóloga con posible sobrecruzamiento. Probablemente, este proceso es el responsable de los eventos de recombinación que tienen lugar durante mitosis en células somáticas (en las que, evidentemente, no hay meiosis). De hecho, algunos autores han sugerido que, originalmente, la principal función del mecanismo de recombinación fue precisamente la reparación de horquillas de replicación interrumpidas. Mecanismos de reparación del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparación A. Reparación de desemparejamientos entre nucleótidos normales. Los mecanismos de reparación mencionados actúan reparando tipos específicos de daño al ADN. Los desemparejamientos entre bases normales pueden originarse por la tautomería de las bases (la forma imina de Citosina empareja con Adenina, o la forma enólica de Timina empareja con Guanina), por desaminación de citosinas metiladas (las citosinas metiladas de los dinucleótidos CpG se desaminan a Timina), y principalmente por los errores de la ADN polimerasa durante la replicación del ADN. También se producen desemparejamientos durante la formación de heteroduplexes en los procesos de recombinación. Además, el deslizamiento de la cadena nueva sobre la cadena molde durante la replicación también puede producir bucles de inserción/deleción (IDLs=bucles de inserción/deleción). Todos estos tipos de desemparejamiento se corrigen por el sistema MMR (mismatch repair), cuyos componentes conocidos en humanos son hMLH1, hMSH2, hMSH3, hMSH6, hPMS1, hMLH3 y hPMS2 (homólogos de MutS y MutL de E. coli). Estas subunidades actúan como heterodímeros hMSH2/hMSH6, que reconocen tanto los bucles (loops) de inserciones/deleciones de 1 a 8 nucleótidos como los desemparejamientos simples de una base; o bien actúan como heterodímeros hMSH2/hMSH3, que reconoce sólo bucles. Cada uno de estos dímeros, a su vez, actúa junto con los homólogos de MutL, que son hMLH1/hPMS2 y hMLH1/hPMS1 (recientemente se ha descrito también hMLH1/hMLH3). En concreto, los heterodímeros hMSH2/hMSH6 junto con hMLH1/hPMS2 reparan los desemparejamientos simples, mientras que cualquiera de los dos complejos (hMSH2/hMSH3 ó hMSH2/hMSH6) en combinación con hMLH1/hPMS2 son capaces de reparar stem-loops (tallo-bucle) producidos por IDLs, como se muestra en la figura. La Figura 3.2 muestra algunos ejemplos de desemparejamientos entre nucleótidos normales y el funcionamiento del sistema de reparación de desemparejamientos MMR. En E. coli, este sistema actúa uniéndose al desemparejamiento y a una base metilada adyacente, corta la cadena no metilada (recién sintetizada) hasta una distancia de 1-2 kb del mismatch, una endonucleasa corta los nucleótidos contenidos en el asa, y la polimerasa rellena el hueco. En mamíferos el mecanismo no está todavía totalmente explicado, pero se ha encontrado una proteína (MBD4 ó MED1) que se une a metil-citosinas, tiene actividad N-glicosilasa y forma complejos con MLH1, además de modular el sistema de MMR. Cuando hay defectos en este proceso de reparación aparecen errores durante la replicación del ADN, errores que se pueden ver al analizar secuencias repetidas cortas tipo Microsatélite. Por tanto, los defectos en el sistema de reparación de desemparejamientos dan lugar al fenómeno conocido como Inestabilidad de Microsatélites (MIN= Microstallite INstability) o "fenotipo mutador". Se conocen algunas TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS enfermedades debidas a mutaciones en componentes de estos sistemas de reparación. Por ejemplo, 90% de los pacientes con cáncer colo-rectal no-polipósico hereditario (HNPCC ó Síndrome de Lynch) tienen mutaciones en uno de los genes hMSH2, hMLH1, hPMS1, hPMS2 o hMSH6, de forma los individuos que han heredado una mutación en uno de los alelos tienen una alta probabilidad de sufrir una segunda mutación en el otro alelo en alguna de sus células somáticas, por lo que el riesgo global de desarrollar este tipo de cáncer es del 80-85% (o del 75% a los 55 años) en estos sujetos. Estos tumores muestran inestabilidad de microsatélites, pero además la inestabilidad también afecta a genes que tienen repeticiones en sus secuencias codificantes (BAX, TGFBRII). Son las mutaciones en estos genes las que a menudo llevan al desarrollo de neoplasias. Curiosamente, los pacientes homocigotos para mutaciones en MLH1 (dos mutaciones en la línea germinal) desarrollan en la infancia neoplasias hematológicas además de otros tumores (neurofibromatosis, meduloblastoma), lo que sugiere la existencia de genes implicados en la hematopoyesis y en el control del crecimiento celular que son dianas del sistema MMR. B. Reparación de nucleótidos dañados. Otros sistemas detectan la presencia de bases anormales tales como, por ejemplo, los uracilos que aparecen por la des-aminación de una citosina. En general, estas modificaciones están debidas a la acción de mutágenos (benzopirenos del tabaco, agentes alquilantes, diversos agentes químicos de la dieta, el daño causado por especies reactivas de oxígeno, así como las alteraciones debidas a la radiación ultravioleta. Los procesos químicos que con mayor frecuencia provocan mutaciones son 1) las oxidaciones por radicales libres, especialmente la formación de 8-oxoguanina, que se empareja con T en vez de C (se calcula que se forman unas 10.000 al día en cada célula) y 2) las reacciones hidrolíticas, ya que la molécula de ADN sufre una hidrólisis espontánea lenta que hace que se pierdan unas 10.000 purinas al día en un genoma humano, con la consiguiente creación de otros tantos sitios apurínicos. También la radiación UV produce sitios apurínicos, pero sobre todo provoca dímeros de pirimidinas. La Figura 3.3 muestra la estructura de algunos nucleótidos anormales y la formación de lesiones por acción de la luz ultravioleta. En general, todas estas lesiones son graves, ya que impiden la replicación correcta del ADN y, a la larga, llevan a la muerte celular. Podemos generalizar diciendo que las lesiones del ADN producidas por la presencia de nucleótidos anormales se corrigen por cuatro mecanismos: reversión directa, BER (Base Excision Repair), NER (Nucleotide Excision Repair) ó por polimerasas capaces de pasar por encima de la lesión. Figura 3.4 Visión general de los mecanismos de reparación de lesiones que incluyen nucleótidos dañados. A continuación se ve con más detalle cada uno de estos mecanismos: 1. Al contrario que otras especies, la reversión directa por enzimas fotoreactivadoras no existe en humanos. Nuestro único recurso en este sentido consiste en un enzima llamado MGMT (metil-guanina metil-transferasa), que puede eliminar el metilo introducido por agentes alquilantes en la guanina (el cual daría lugar a transiciones GA, pues la O6-metilguanina se empareja con Timina). 6 TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 7 2. La reparación por escisión de bases (BER) elimina las bases que han sufrido ataques hidrolíticos (desaminación, por ejemplo) por ROS o la 8-oxo-guanina producida por el tabaco. El paso crítico en este tipo de reparación es la rotura del enlace N-glicosídico que une la base al esqueleto desoxi-ribosa-fosfato, catalizado por ADN glicosilasas (específicas para determinados tipos de lesión: UDG, OGG, etc). Posteriormente, el sitio AP (apurínico ó apirimidínico) es roto por una AP endonucleasa que cataliza la incisión del enlace fosfodiester en posición 5’ al sitio AP. La escisión del azúcar se completa con la eliminación del residuo desoxi-ribosa-fosfato por la acción de una desoxi-ribosa-fosfodiesterasa que corta el otro enlace fosfodiéster. Finalmente, se rellena el hueco mediante la acción de ADN pol y una ADN ligasa. Este mecanismo de reparación parece necesario para la viabilidad, ya que el ratón knockout para ADN pol es letal embrionario. Un proceso paralelo es crucial en la diversificación de los genes de las inmunoglobulinas, ya que los linfocitos B expresan un enzima llamado AID (ActivationInduced Deaminase) que desamina citosinas y las convierte en uracilos; dichos uracilos crean sitios AP que pueden ser procesados por un complejo llamado RAD50 (que veremos más adelante) que tienen una actividad liasa que rompe el esqueleto desoxi-ribosa-fosfato y rompe el ADN. Dichas roturas son necesarias para que los genes de la inmunoglobulinas se reordenen y puedan dar lugar a la diversidad necesaria para una adecuada respuesta inmune. El video de la Figura 3.5 muestra el funcionamiento del sistema de reparación por escisión de bases (BER). 3. La reparación por escisión de nucleótidos (NER) elimina fotoproductos producidos por UV y otros aductos que confieren estructuras anormales a la cadena de ADN. El mecanismo de actuación de este sistema de reparación no está totalmente claro, pero se sabe que requiere la formación de un complejo entre XPC (proteína que es esencial para NER) y RPA (proteína de unión a ADN monocatenario) con la región lesionada. Sobre este foco también se unen XPA y el complejo TFIIH (que contiene, entre otras, las proteínas XPB (ERCC3) y XPD (ERCC2), ambas con actividad helicasa necesaria para llevar a cabo NER). El paso clave es la creación de dos incisiones, flanqueando la lesión, en la cadena de ADN que está dañada: una incisión tiene lugar 3 a 9 bases en dirección 3’ de la lesión y la otra incisión se produce 16 a 25 bases en dirección 5’ de la lesión, comprendiendo unas 25-30 bases en total. En mamíferos, la incisión 3’ la lleva a cabo una nucleasa llamada XPG, y la incisión 5’ la realiza el heterodímero XPF/ERCC1. Tras las incisiones y eliminación de la región dañada, tiene lugar la resíntesis de esa región mediante la acción de un holoenzima que contiene PCNA y DNApol La Figura 3.6 incluye un video que o . muestra esquemáticamente el funcionamiento del sistema de reparación por escisión de nucleótidos (NER). Un aspecto especialmente interesante es la relación del NER con la transcripción, a través de la presencia de XPB y XPD en TFIIH (que es uno de los factores de transcripción generales), dando lugar al concepto de Reparación acoplada a la transcripción (TCR=Transcription-Coupled Repair). De hecho, se ha comprobado que el daño por UV se repara con más eficacia y más rápido en la cadena que se transcribe y en genes transcripcionalmente activos. También se ha visto que ciertos tipos de daño oxidativo puede repararse por TCR incluso cuando el NER no funciona. Además de los citados XPB y XPD, otras dos proteínas con actividad helicasa (CSA y CSB) son responsables de TCR, y también se ha implicado a hMLH1 en TCR. Las mutaciones que destruyen el sistema TCR dan lugar a una enfermedad llamada Síndrome de Cockayne. Las mutaciones en genes que codifican otras proteínas asociadas con NER dan lugar a varias enfermedades (Xeroderma pigmentosum, Tricotiodistrofia), que en su TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 8 conjunto cursan con fotosensibilidad e inestabilidad cromosómica, y aumento del riesgo de aparicion de melanoma (un tipo de cáncer de piel). Finalmente, algunos pacientes tienen una variante de Xeroderma Pigmentosum sin defectos en NER (llamada XP variante, ó XP-V), que está debida a mutaciones en el gen humano homólogo del gen RAD30 de levadura. Este gen codifica la polimerasa eta (Pol ), que puede replicar el ADN correctamente incluso en la presencia de dímeros de pirimidinas. 4. Respecto al último mecanismo de reparación de nucleótidos dañados (es decir, las polimerasas capaces de "saltarse" la lesión), recientemente se ha visto que Pol (polimerasa zeta) ó Pol (polimerasa eta) son capaces de sintetizar ADN frente a dímeros TT. Sin embargo, así como Pol introducir dos Adeninas, Pol suele introduce bases incorrectas y por tanto es un mecanismo de reparación de baja fidelidad. C. Reparación de roturas de la doble hebra del ADN. La creación de roturas bicatenarias del ADN (DSB=Double-Strand Breaks) es un paso necesario para la recombinación homóloga en meiosis y mitosis, y para la reordenación V(D)J de genes de las inmunoglobulinas y receptores de células T. Además, este tipo de roturas aparecen durante la replicación del ADN y también son causadas por diferentes agentes genotóxicos: radiación ionizante (rayos X), ROS originados por el metabolismo celular. Los DSB se reparan por dos vías principales, en diferentes fases del ciclo celular: Fusión no homóloga de extremos (NHEJ), que funciona sobre todo en G1/S (antes de la replicación del ADN) y Recombinación homóloga (HR), que teóricamente actuaría en S/G2, cuando ya hay dos cromátides hermanas (de manera que se utiliza la doble hebra homóloga como molde para la reparación). La Figura 3.7 muestra las posibilidades de respuesta celular a la aparición de roturas bicatenarias en el ADN (DSB) y sus efectos. 1. Recombinación Homóloga: como ya hemos comentado al inicio de este tema, la maquinaria responsable del mecanismo molecular de recombinación meiótica se utiliza también para reparar DSB a partir de una cromátide hermana. RAD51 (homólogo del gen RecA, que en E. coli es fundamental en la respuesta SOS) forma filamentos sobre el extremo monocatenario de ADN que resulta de la digestión de los extremos libres, y es necesario para que se pueda realizar la invasión de la cadena libre a la doble cadena homóloga. RAD51 es indetectable en G1 y se expresa en S/G2. Los ratones RAD51-/- son letales embrionarios y sus células muestran inestabilidad cromosómica. Una línea celular de pollo, en la que RAD51 está bajo el control de un promotor represible, muestra inestabilidad cromosómica y muerte celular cuando se reprime la expresión de RAD51, lo que refuerza la necesidad de este gen para la viabilidad celular. Hay otros genes implicados en reparación de DSB que tienen cierta homología con RAD51 y que podrían modular la acción de éste. Por ejemplo, se ha visto que la ausencia del gen XRCC2 (20% de homología con Rad51) disminuye la eficacia de la recombinación homóloga en la reparación de DSB, pero no es letal; lo mismo podría suceder con RAD55 o RAD57. Por otra parte, se ha comprobado en levaduras que la proteína RPA altera la eficacia con la que se forman los filamentos de RAD51. RAD52 parece actuar como el ―portero‖ del mecanismo de recombinación homóloga. Esta proteína interacciona con RPA y con RAD51, favoreciendo la formación del filamento de RAD51 en presencia de RPA. Como el ratón RAD52-/- no es letal (sólo se observa una ligara disminución en la eficacia de recombinación homóloga), se postula la existencia de genes homólogos de RAD52 complementen la ausencia de éste. TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS La expresión del complejo RAD50 no varía durante el ciclo celular, por lo que debe regularse posttraduccionalmente (mediante fosforilación o por compartimentalización en el núcleo). Este complejo tiene actividad 5’3’ exonucleasa, y parece transducir señales de daño de ADN hacia la parada del ciclo celular. Experimentos de irradiación ―en bandas‖ han mostrado, mediante anticuerpos monoclonales contra un componente de este complejo, que RAD50 se asocia a los DSB muy pronto tras la irradiación. En humanos, los pacientes con el llamado "Síndrome de Roturas de Nimega" tienen mutaciones en un componente de este complejo llamado NBS1, muestran sensibilidad a radiación ionizante e inestabilidad cromosómica, y las células de estos pacientes no son capaces de formar focos después de la irradiación con rayos X ultrablandos; por tanto, lo más probable es que la proteína NBS1 sea responsable de dirigir el complejo RAD50 a los lugares de daño del ADN. La Figura 3.8 ilustra la presencia de focos de reparación en células que han sido previamente irradiadas para generar roturas bicatenarias (DSB) en el ADN. La imagen de la Figura 3.8 demuestra que tras la irradiación (que genera muchas roturas bicatenarias en el ADN) se crean unos focos de reparación donde se concentran las maquinarias encargadas de llevar a cabo dicha reparación. Aunque en esta imagen se muestran moléculas que intervienen en la reparación no homóloga de extremos libres, la utilización de anticuerpos frente a componentes del sistema de reparación por recombinación homóloga (RAD51, NBS, etc) da lugar a imágenes similares. Una observación muy interesante es la implicación de BRCA1 y BRCA2 (genes mutados en ciertos tipos de cáncer de mama familiar) con la reparación de DSB, ya que se ha visto que las proteínas codificadas por estos genes interaccionan con RAD51, bien directamente (BRCA2) o de manera indirecta (BRCA1). ambas son proteínas nucleares que se expresan en S/G2, funcionan como activadores transcripcionales, y los ratones knock out de ambas son letales embrionarios. En cambio, un ratón que lleva una copia de BRCA2 truncada (BRCA2tr/tr) sufre linfomas del timo, alta inestabilidad cromosómica y estimulación de la vía de señalización de p53. BRCA1 se fosforila tras daño al ADN, y se ha descrito la asociación de BRCA1 con el complejo RAD50 en el momento del ciclo celular en que BRCA1 está fosforilado (S/G2). Por otra parte, en estudios de co-localización tras irradiación similares a los descritos arriba, se ha visto que BRCA1 está presente en focos nucleares que contienen RAD50 en unas células o en focos que contienen RAD51 en otras células, pero no hay células en las que se asocie con ambos a la vez. Una hipótesis atractiva es que durante la reparación de DSB por recombinación homóloga BRCA1 coopera con RAD50 en el procesamiento de los extremos del ADN dañado y que, mediante la interacción entre BRCA1 y BRCA2 (que se asocia físicamente a RAD51), facilita el acoplamiento con los procesos de recombinación mediados por RAD51. En el año 2011 se publicó otra propiedad muy interesante de BRCA1: es capaz de ubiquitinar la histona H2A de la cromatina pericentromérica, manteniéndola así silenciada. La ausencia de BRCA1 permite la transcripción del ADN satélite de esas regiones, lo cual 9 TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 10 conduce a la formación de DSBs y fallos en la reparación por recombinación homóloga, aunque no se sabe exactamente cómo se produce esto. 2. Fusión no homóloga de extremos (NHEJ): El proceso general de reparación es similar pero sin recombinación, ya que en este caso no existe una doble cadena homóloga: simplemente se fusionan los extremos libres. Tras la generación del DSB, los extremos libres también son procesados por una nucleasa; posteriormente se procede a la unión de los mismos y a la ligación, perdiéndose siempre algunas bases en la región de unión. Este mecanismo tiene lugar fisiológicamente en linfocitos, donde es responsable de la reordenación de segmentos V(D)J de los genes de inmunoglobulinas, como se verá a continuación. Un componente principal de este sistema es el complejo ADN-PK (DNAPK), una serina/treonina kinasa nuclear que consta de una subunidad catalítica (DNAPKcs) y de un heterodímero de unión a ADN llamado KU (que a su vez se compone de KU70 y KU80). El complejo ADN-PK se asocia a los extremos rotos, ayuda al alineamiento de los extremos y facilita su ligación. Este sistema de reparación es importante, sobre todo en células del sistema inmune, y de hecho las mutaciones en el gen que codifica la DNAPKcs provocan la enfermedad llamada Inmunodeficiencia Combinada Severa (SCID). Además, el complejo ADN-PK fosforila y activa una nucleasa llamada Artemis, que es la responsable de llevar a cabo el procesamiento de los extremos libres para que se puedan religar. Este último paso, la unión de los extremos ya procesados, es realizado por una ligasa (ADN ligasa IV) que actúa junto con XRCC4, una fosfoproteina nuclear que también es sustrato de ADN-PK in vitro. El video de la Figura 3.9 muestra, paso a paso, el funcionamiento del sistema de reparación por fusión de extremos (NHEJ). Es muy interesante la asociación que se ha encontrado en levaduras entre Ku70 y proteínas silenciadoras de la transcripción de telómeros (Sir2, Sir3 y Sir4), sugiriendo la posibilidad de que Ku reclute proteínas Sir a los DSB para inducir un estado de cromatina condensada que evite la transcripción o replicación y facilite el proceso de reparación, o bien evite que los extremos libres de ADN puedan interaccionar con otras moléculas de ADN. Dado que la disrupción de Ku o del complejo RAD50 lleva al acortamiento de telómeros en levaduras, es lógico pensar que Ku se una al ADN telomérico e interaccione con Sir4 para inhibir la replicación a ese nivel. Tradicionalmente se ha considerado que el principal mecanismo de reparación de DSB en mamíferos es la fusión de extremos (NHEJ), ya que se ha visto que la frecuencia de recombinación homóloga en mitosis es muy baja. Esto es lo contrario de lo que sucede en levaduras, donde el principal mecanismo de reparación de DSBs es la recombinación homóloga. Actualmente, en cambio, esto está en discusión. Por un lado, parece que la recombinación mitótica en mamíferos es más alta de lo que se creía: del orden de 10-4 a 10-5; por otro lado, los ratones incapaces de llevar a cabo NHEJ (DNAPK-/-) no son letales, mientras que los ratones incapaces de recombinación homóloga (RAD51-/- ó los RAD54-/-) sí son letales. Esto indica que HR puede de alguna forma complementar la ausencia de NHEJ, pero en cambio NHEJ no puede complementar la ausencia de HR en células somáticas. D. Mecanismos de reparación presentes en mitocondrias. Un tema reciente en patología genética humana es la alteración de los mecanismos de reparación del ADN mitocondrial. Tradicionalmente se ha considerado que las mitocondrias de mamíferos no son capaces de llevar a cabo ningún tipo de reparación, ya que los dímeros de pirimidinas no son reparados TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 11 con eficacia. Esto explicaría además la mayor tasa de mutaciones del ADN mitocondrial (ADNmt) respecto al ADN nuclear. Hoy se sabe que hay ciertos tipos de daño que sí pueden repararse en mitocondrias (por ejemplo, los sitios AP originados por daño oxidativo) y en general parece que las mitocondrias de organismos superiores son capaces de llevar a cabo BER pero no NER ni MMR. El tipo de daño que puede repararse mediante BER va a estar limitado por la presencia de ADN glicosilasas en la mitocondria, y hasta el momento se ha demostrado la presencia de uracil-ADN-glicosilasa (UDG) y de 8-oxo-guanina-glicosilasa (OGG). Además, otras glicosilasas tienen señales de localización mitocondrial en sus extremos N-terminal. Una diferencia del BER que se lleva a cabo en mitocondrias con el BER nuclear es que la polimerasa presente en mitocondrias es la ADN pol , que además posee actividad liasa (fosfodiesterasa). También existe dentro de la mitocondria una actividad ADN ligasa, que al parecer se origina a partir del gen de la ADN ligasa III por un codón de iniciación alternativo que crea una señal de localización mitocondrial. Organización y expresión de los genes de las inmunoglobulinas El sistema inmune adaptativo consta de dos tipos de respuesta ante la presencia en el organismo de elementos extraños (antígenos): una respuesta humoral, mediada por anticuerpos, y una respuesta celular mediada por linfocitos T. Los anticuerpos son inmunoglobulinas secretadas por células plasmáticas, que se originan a partir de linfocitos B que se han activado por la unión de antígenos a los receptores de membrana (que son esas mismas inmunoglobulinas). Los anticuerpos están formados por dos cadenas pesadas y dos cadenas ligeras; según las tipos de cadenas, se pueden obtener distintas clases de inmunoglobulinas. Los receptores de membrana de las células T están formados por heterodímeros de cadenas muy relacionadas evolutivamente con las de las inmunoglobulinas. Para garantizar el correcto funcionamiento del sistema inmune, es necesario generar una enorme diversidad de inmunoglobulinas y de receptores de células T, de manera que el organismo pueda reconocer y neutralizar todo aquello que no sea un antígeno propio. Sin embargo, el genoma humano sólo tiene tres loci para inmunoglobulinas (uno llamado IGH para la cadena pesada, y otros dos loci –llamados IGK e IGL- para cada una de las cadenas ligeras) y cuatro genes para las cuatro cadenas del receptor de células T (TRA, TRB, TRG y TRD). Cada linfocito B o T es monoespecífico (lleva un tipo de receptor concreto), pero se producen millones de células, cada una con una inmunoglobulina distinta. ¿Cómo se genera tal diversidad a partir de los mismos genes? La solución es generar muchas proteínas distintas a partir de un mismo gen. En el caso de los anticuerpos, la variabilidad de la proteína (que es lo que hace que reconozca antígenos distintos) viene dada por una región variable tanto en la cadena pesada como en la ligera, mientras que el resto del péptido es una región constante (C). La región constante de la cadena pesada es la que especifica el tipo de inmunoglobulina (IgM, IgG, IgE, IgA o IgD). TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 12 Figura 3.10 Estructura de una inmunoglobulina (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) La región variable está codificada por un exón que se forma a partir de varios segmentos genómicos llamados V, D o J en el caso de las cadenas pesadas (los genes de las cadenas ligeras sólo tienen segmentos V y J). Durante la maduración de los linfocitos, se dan eventos de recombinación por los que se yuxtapone un segmento D a un segmento J, y después este segmento D-J se yuxtapone a un segmento V. El resultado es un segmento V-D-J que conforma el exón que codifica la región variable de la inmunoglobulina. Después de la transcripción este exón se ayusta a un exón codificante de la región constante (C). Como el más cercano de éstos codifica la IgM, ésta inmunoglobulina es la primera en ser fabricada por los linfocitos B. Después, durante la maduración de estas células, el mismo exón VD-J puede unirse al exón que codifica para la IgD, mediante ayuste alternativo. Para los otros tipos de inmunoglobulinas es necesario un fenómeno de recombinación similar al que se describe a continuación, dando lugar a un fenómeno conocido como cambio de clase. Figura 3.11 Procesamiento de los genes de las cadenas ligeras de las inmunoglobulinas. (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 13 Dado el gran número de segmentos V, D y J que tiene este locus génico, el número de posibles combinaciones es altísimo. Como se ve en la tabla, el locus IGH tiene alrededor de 40 segmentos V, 23 segmentos D y 6 segmentos J, lo cual puede originar hasta 6.000 combinaciones diferentes de regiones variables. Como cada cadena pesada puede unirse a dos tipos distintos de cadena ligera, el número de posibilidades es todavía mayor. A esto hay que añadir otros procesos que todavía generan más diversidad, al introducir mutaciones en la propia secuencia del gen, y que hacen posible que una persona pueda generar millones de anticuerpos distintos. Figura 3.12 Número de posibles moléculas diferentes generadas en los genes de las inmunoglobulinas. (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) El mecanismo molecular por que se fusionan los distintos segmentos genómicos es peculiar, pero en líneas generales podemos decir que se trata de una variante del proceso de reparación de roturas bicatenarias de ADN por fusión de extremos no homólogos que hemos estudiado anteriormente. En este caso concreto, la rotura bicatenaria es generada de forma programada por unas recombinasas llamadas RAG1 y RAG2. Estas proteínas llevan a cabo la rotura sólo en regiones genómicas que contienen secuencias concretas. En el caso de los genes de inmunoglobulinas, cada segmento V, D ó J está flanqueado por unos motivos de ADN de 7 ó de 9 nucleótidos, llamados heptámero y nonámero respectivamente. Estos dos motivos están separados por secuencias espaciadoras de 12 o 23 nucleótidos. Las proteínas RAG reconocen estas configuraciones y llevan a cabo dos roturas bicatenarias, en los flancos de dos segmentos distintos. Después, la maquinaria de reparación por fusión de extremos no homólogos lleva a cabo la unión de los extremos sueltos (las llamadas uniones codificantes), dando además una molécula circular que se pierde. TEMA 3: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 14 Figura 3.13 Procesamiento de los extremos mediante NHEJ iniciado por recombinasas RAG. (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) La formación de los receptores de células T es similar al reordenamiento de los genes de inmunoglobulinas. En conjunto, este increíble proceso genera la diversidad necesaria para el correcto funcionamiento del sistema inmune, de ahí que las mutaciones en genes que codifican proteínas de este sistema de reparación (DNA-PK, KU, etc) se asocien con inmunodeficiencias humanas.