Continuación de BQ-14 (Aplicaciones de la Biología Molecular) y BQ-15 (Diagnóstico Molecular) Dr. G.Castaño MAPEO DE GENES. CLONAJE POSICIONAL. (En la presentación PDF del Dr. G. Castaño hay muchos ejemplo, que es imposible transcribir; cdo hago referencia a una diapositiva, pongo dos números separados por una coma; el 1º es la página (cada pág tiene 6 diapos) y el 2º es el número de la diapo) a) ESTRATEGIAS GENERALES DE MAPEO Mapeo genético: Es el ordenamiento de genes en cromosomas de acuerdo a la frecuencia de recombinación (identifica las posiciones relativas de los genes en los cromosomas mediante el análisis de ligamientos, midiendo las frecuencias de recombinación). Puede ser necesario antes de encontrar sondas útiles para mapeo físico. Mapeo físico: Es la determinación de la distancia física entre genes (en pares de bases de DNA) utilizando técnicas citogenéticas y moleculares (análisis directo de las moléculas de DNA que constituyen cada cromosoma, identificando las localizaciones físicas de los genes en un cromosoma). Se emplea en último lugar para aislar el gen de interés. b) ANÁLISIS DE LIGAMIENTO POR RFLPS RFLPs ligados a genes enfermos Cuanto más cercanos se encuentren dos marcadores genéticos en un cromosoma, tanto mayor es la probabilidad de no ser separados por entrecruzamientos entre ellos y por lo tanto ser coheredados por la progenie (ligados). Mediante el estudio de la coheredabilidad en grandes grupos familiares de un gen de interés (p. ej. algún gen relacionado con una det Enf) y un gran nº de RFLPs individuales, se pueden identificar ciertos RFLP que se cohereden frecuentemente con dicho gen (la demostración de que el ligamiento es estadísticamente significativo requiere el estudio de gran nº de individuos). S/e es de destacar que el ligamiento no será absoluto excepto si el marcador RFLP se localiza en el mismo gen (RFLP intragénico). En los demás casos el RFLP y el gen aberrante que determina la Enf se separarán con una cierta frecuencia debido al entrecruzamiento meiótico (recombinación) durante la formación de los gametos. Recordad que la frecuencia de recombinación va a depender de la distancia entre el RFLP y el gen enfermo a < distancia, más fiabilidad. Los RFLPs proporcionan marcadores para todos los cromosomas humanos Ello permite mapear genes causantes de enfermedades buscando ligamiento entre un RFLP determinado 1 y el fenotipo enfermo (Diapo 7,1; este ejemplo demuestra que es necesario determinar qué alelo cosegrega con el fenotipo enfermo en una determinada familia, porque al poder existir recombinación, existe la posibilidad de que en una familia sea el alelo “a” el que se coherede con el gen enfermo o el “A”, como ocurre en la familia del ejemplo ). Esta técnica permite determinar la posición en el mapa y aislar los genes de enfermedades genéticas para las que no se han identificado aún los genes causales. Además establecer el ligamiento entre un RFLP y un fenotipo enfermo permitirá: 1. predicción de aquellos individuos con riesgo de enfermar 2. aislamiento del gen responsable por clonaje posicional Valor predictivo de los RFLPs ligados (Diapos 7, 3-4) - - - Conocer qué RFLP está ligado al gen enfermo en ESA familia (recordad la gran variabilidad genética debida a la recombinación). Debemos tener en cuenta que la fiabilidad de este procedimiento depende del ligamiento (distancia) entre el RFLP y el gen enfermo, puesto que existe la posibilidad de recombinación entre el marcador polimórfico y el gen enfermo (posibilidad que será menor cuanta menor sea la distancia). Testar al probando (prenatal o asintomático): importante tener en cuenta que la predicción sólo sirve para la familia concreta en estudio. Si el probando tiene el mismo genotipo que otro familiar enfermo (en este ejemplo, un hermano afecto “aa”) puede predecirse que padecerá la enfermedad. Esto es cierto cuando la frecuencia de recombinación es baja. Saber (una vez más) que existe la posibilidad de recombinación entre el marcador polimórfico y el gen enfermo. La frecuencia de recombinación y, por tanto, la fiabilidad del marcador depende de la distancia entre el RFLP y el gen enfermo. Otro ejemplo: Diapo 7, 5: análisis del ligamiento en la NF-1: en la familia de la derecha, lo que se correlaciona con la enfermedad es la ausencia de la banda inferior. S/e, existe un sujeto de esta familia (*) que está enfermo sin cumplir con este criterio; esto se debe a que ha habido una recombinación. Esto demuestra que cuando aparece una recombinación en una familia, se INUTILIZA el patrón de RFLP ligado al gen enfermo en esa familia. c) AISLAMIENTO DEL GEN RESPONASABLE Para el aislamiento de un gen existen tres opciones: 1. Partir de una proteína candidata DNA proteína 2. Partir de un mRNA candidato DNA mRNA 2 3. Clonaje posicional directo (partir directamente del DNA) DNA Aislamiento del gen responsable con sondas RFLPs ligadas. Clonaje posicional (diapos 8, 1-2) El primer paso del clonaje posicional (o aislamiento de genes con sondas RFLP ligadas) es el mapeo genético, para la identificación del marcador RFLP que cohereda con el fenotipo mutante. Cuando la posibilidad de recombinación es mínima (menos de 1 cM) consideramos que el gen está muy próximo y usamos ese RFLP como punto de partida para el paseo cromosómico. A continuación se aísla un clon genómico (fragmento de cDNA) empleando como sonda un fragmento de DNA que hibride con el RFLP (mapeo genético). Posteriormente, se emplea la técnica denominada PASEO CROMOSÓMICO (chromosome walking). Esta técnica se basa el solapamiento de clones de DNA. Este proceso se inicia a partir del clon de DNA aislado mediante la sonda RFLP ligada, del que se sabe que está muy próximo al gen de interés. Tras aislar este clon, se utiliza el extremo más alejado del anterior para preparar una segunda sonda DNA que se usará para localizar un nuevo clon genómico mediante hibridación. Repetimos el proceso varias veces (empleando sondas cada vez más alejadas del RFLP inicial y, sin embargo, más cercanas al “gen enfermo”) hasta que encontramos el gen buscado. Hoy en día, el paseo cromosómico se acelera empleando genotecas clonadas en cósmidos o YAC que contienen grandes insertos de DNA. Pero, ¿cómo saber cuándo hemos llegado al gen de interés, aquél que determina la enfermedad que estamos estudiando? Cuando la frecuencia de recombinación del último RFLP que hemos aislado es 0 en todos los miembros afectos de la familia que estamos estudiando (porque frecuencia de rec 0 = se transmite siempre con la enfermadad). Criterios para la identificación positiva de un gen enfermo Una vez localizado el gen, debemos asegurarnos de que es el gen responsable de la enfermedad. Para ello, se deben cumplir los siguientes criterios: 1. Demostrar la presencia de una mutación. Para ello, debemos comparar el gen entre individuos normales y afectados, en un número suficiente para demostrar una relación estadísticamente significativa (debe observarse la misma mutación en muchos enfermos). Evidentemente, la mutación candidata deberá aparecer sólo en los afectados. 2. La mutación detectada debe impedir la función del gen. La mutación detectada debe ser capaz de impedir la expresión génica con la consiguiente pérdida de la función de la proteína. Debemos diferenciar polimorfismos benignos y verdaderas mutaciones, entre las que se incluirían: grandes delecciones, mutaciones en la pauta 3 3. 4. 5. 6. 7. de lectura, mutaciones en los sitios de splicing, mutaciones sin sentido, aparición de codones de parada... La función anómala del gen candidato debe explicar la patogénesis. Para ello, la función del gen debe ser consistente con la patología (por ejemplo, defecto de distrofina en DMD o CFTR en FQ). También debemos demostrar que el gen se expresa en los tejidos afectados por la enfermedad (nos valemos para ello de Northern Blot –mRNA- o Western Blot –proteína). Esto es realmente complejo si el gen se expresa en varios tejidos. Debemos demostrar la correlación genotipo-fenotipo. Es decir, demostrar que difererentes mutaciones dan lugar a diferente gravedad en los síntomas de la enfermedad. Demostrar la complementación génica. Es decir, demostrar que células aisladas de los pacientes recuperan la función al transferir el gen normal. Reproducir la enfermedad en animales. Normalmente se emplea el ratón. Debemos demostrar que la interrupción de la función del gen homólogo en el ratón reproduce la enfermedad. Demostrar que la corrección del defecto génico cura la enfermedad. Es decir, realizar terapia génica (la introducción del gen normal en el paciente cura la enfermedad). Éste es el último criterio de que el gen responsable ha sido identificado. d) OTRAS UTILIDADES DEL CLONAJE POSICIONAL. MAPA FÍSICO DE UN GEN ¿Qué otras cosas se pueden hacer con un gen aislado por clonaje posicional? 1. Mapear el gen en su región cormosómica y determinar si el gen se correlaciona con un sitio donde se conozca que existe una anormalidad citogenética. Esto se realiza a través de: Análisis citogenético (Diapo 8,6) Mapeo de delecciones: varias delecciones dan lugar al mismo fenotipo. Se trata de discriminar en la zona afecta por las distintas delecciones, dónde se encuentra la zona del locus responsable (la común) Análisis de los puntos de ruptura y traslocaciones: si los puntos de ruptura dan lugar a una enfermedad, es porque se encuentra un gen en esa región (y se rompe su función). Hibridación in situ contra cromosomas (FISH) (Diapo 9, 1-2): sonda de DNA marcada se hibrida con cromosomas metafísicos. Determinación de delecciones o duplicaciones: la sonda no se une o se une dos veces. Localización cromosómica de genes 4 2. Diseñar estrategias diagnósticas de mutaciones. Para ello estudiamos las distintas anormalidades del gen en diferentes casos de la misma enfermedad. Nos valemos de las siguientes técnicas: Digestión con enzimas de restricción y análisis con Southern Blott Secuenciación directa Análisis con oligonucleótidos específicos de alelo (Técnica ASO). Por ejemplo, diagnóstico de la Fibrosis Quística por detección de la mutación F508 (Diapo9, 3). Se utilizan como sondas oligonucleótidos sintéticos, que reconocen específicamente los alelos normal y mutante. Hibridamos el DNA digerido del individuo “problema” con ambos oligonucleótidos marcados, valorando la hibridación mediante un gel de agarosa. Análisis por PCR (Diapo 9, 4-). La PCR permite amplificar el DNA de una región seleccionada del genoma, siempre y cuando previamente se conozca al menos una parte de su secuencia de nucleótidos. En primer lugar se utilizan porciones de la secuencia que rodean la región que va a ser amplificada, para diseñar dos oligonts sintéticos de DNA, cada uno de los cuales es complementario de cada una de las cadenas de la doble hélice de DNA, y que corresponden a sitios opuestos de la región a amplificar. Estos oligont se utilizan como cebadores o primers para la síntesis del DNA, catalizada por una DNA polimerasa (Taq polimerasa, de Thermus aquaticus), y determinan los extremos del fragmento final de DNA que se obtiene. Después de varios ciclos, el fragmento es cada vez más pequeño hasta que sólo se amplifica el fragmento de interés. El DNA resultante se analiza por electroforesis en gel. Si con el PCR se duplica más de una secuencia de DNA, se denomina MULTIPLEX PCR [técnica empleada para el diagnóstico del Síndrome de Lesch-Nyhan, en el que se producen delecciones variables de los 9 exones del gen de la Hipoxantina-guanina fosforribosil transferasa (HGPRT)]. Se diseñan 9 pares de cebadores, de forma que en el sujeto normal deben ser amplificados 9 fragmentos. En este ejemplo, el individuo 2 no se amplifica ningún exón porque tiene una delección total del gen. Comentarios para el estudio del tema Lo más importante es el clonaje posicional y los criterios de identificación positiva de un gen enfermo. 5 BASES MOLECULARES DE LAS ENFERMEDADES GENÉTICAS. 1. DETERMINANTES DE LA EXPRESIÓN FENOTÍPICA a. Naturaleza de la mutación: Diferentes mutaciones en el mismo gen (diferentes alelos enfermos) pueden dar fenotipos más o menos severos dependiendo de los efectos que tengan las mutaciones en la expresión del gen o en la función de la proteína. b. Fondo genético (Background): Dos individuos de una misma familia aún teniendo el mismo alelo enfermo, sin embargo, tendrán ciertamente un montón de genes distintos (a no ser que sean gemelos univitelinos) y la expresión de estos genes de fondo puede influenciar el fenotipo enfermo manifestado. c. Factores ambientales: Factores como el estilo de vida, la dieta y la exposición a toxinas ambientales pueden afectar el fenotipo enfermo. 2. TIPOS DE MUTACIONES QUE AFECTAN A LOS GENES. a. Mutaciones en las secuencias reguladoras: Mutaciones en el promotor del factor IX. El gen del factor IX está localizado en el cromosoma X, en una región transcrita de más de 32.700 pares de bases, con 8 exones. El promotor del gen del factor IX tiene dos sitios reguladores de unión de factores de transcripción (FT): receptor de andrógenos (AR) y HNF4. - Receptor de andrógenos (AR): - Son dedos de zinc de la superfamilia nuclear de factores de transcripción. - Une andrógenos y éstos aumentan en la pubertad. - HNF4 (Factor nuclear de hepatocitos4): - Son dedos de zinc de la superfamilia nuclear de factores de transcripción. - Tiene un ligando desconocido, por tanto es un receptor “huérfano”. - Se expresa en el desarrollo temprano y en el hígado adulto. Mutaciones reguladoras: 6 -36 -27 AR -22 -15 HNF4 - Una mutación a -20 resulta en la hemofilia B Leyden. Esta mutación impide la unión del FT HNF4, lo cual impide la expresión del gen. S/e esta hemofilia mejora en la pubertad cuando aumentan los niveles de andrógenos que estimulan la actividad del FT AR, el cual se une a su sitio de unión intacto y compensa el déficit. - Una mutación a -26 resulta en la hemofilia B Brandenburg, en la que los niveles de factor IX permanecen bajos incluso en la pubertad al afectar la mutación la zona de unión de ambos FT. b. Mutaciones que afectan a la secuencia de proteína: Mutaciones en la βglobina. Expresión de las Hbs durante el desarrollo: - Hemoglobinas embrionarias: desaparecen al final del primer trimestre de la gestación. ζ2ε2: Gower I α2ε2: Gower II ζ2γ2: Portland - Hemoglobinas fetales: α2 γ2 (HbF) - Hemoglobinas adulto: α2δ2 (HbA2): Inferior al 3% α2β2 (HbA) Trastornos genéticos de las hemoglobinas: Mutaciones que afectan a la estructura (hemoglobinopatías): se producen por un cambio en un aa en una de las cadenas de globina (en la β más frecuente que en la α). Se trata de mutaciones puntuales, más rara vez de deleciones o inserciones. Las diferentes hemoglobinopatías son: HbS 7 (anemia falciforme), HbC y HbE (más frecuente en el sudeste asiático.) - Anemia falciforme: (más frecuente en raza negra) - Afecta al codón 6 de la βglobina. - GAG (glutámico) GTG (valina) - Los hematíes adoptan forma de hoz, y, al ser más rígidos aumenta la viscosidad sanguínea y provoca obstrucción en la circulación capilar (crisis vasooclusivas) - Hemoglobina C: (más frecuente en raza negra) - Afecta al codón 6 de la βglobina. - GAG (glutámico) AAG (lisina) - Anemia hemolítica poco severa, también por alteración en la forma del hematíe (dianocitosis), pero sin las crisis vasooclusivas de la HbS. Talasemias: disminución de la producción de cadenas α o β Persistencia hereditaria de Hb fetal (HPFH) c. Mutaciones en gran escala: 1.- Delecciones en el locus de las globinas. Talasemias Suponen la falta de síntesis total o parcial de una cadena globina. Si se trata de la cadena α, hablamos de α-talasemia. Si es β la cadena afectada, de beta-talasemia. Si son δ y β, δ-βtalasemia. La clínica de las talasemias no sólo resulta de la disminución de la HbA, sino que interviene además el desequilibrio en la producción de cadenas de globina. Alfa-talasemia: Los dos genes de la α-globina se originaron por duplicación génica y son casi idénticos. La alfa-talasemia es el resultado de la delección de alguno de los 4 genes de la cadena alfa (αα/αα), heredados dos del padre y dos de la madre debido a una recombinación por sobrecruzamiento desigual, que da lugar a la pérdida de uno de ellos. La herencia del cromosoma con la deleción de este gen α da lugar a la alfa-talasemia. En la alfa-talasemia, aumenta la síntesis de cadenas β, con lo que se forman tetrámeros β (enfermedad de la HbH o HbΒ-4). Hay diferentes formas de alfa-talasemia con diferente gravedad dependiendo del nº de genes deleccionados. 8 Normal (α α / α α) Alfa2-talasemia (portador silente) (α α / α -) Totalmente asintomático. Delección de un solo gen alfa. Los niveles de HbA2 y HbF son normales. Alfa1-talasemia (anemia leve) (α α / - -) Consecuencia de la delección de dos genes alfa. Reducción muy discreta de la Hb. Pacientes asintomáticos. Alfa1-talasemia (anemia leve) (α - / α -) Enfermedad Hb H (anemia de leve a severa) (α - / - -) Delección de tres genes alfa. Estos enfermos tienen entre un 5-40% de Hb H (beta 4) y en fetos se observa Hb Bart (exceso de cadenas γ formando tetrámeros). Hydrops fetalis (- - / - -) 9 La delección de los 4 genes alfa da lugar a la muerte intraútero (hidrops fetalis) por hipoxia. La única Hb que poseen es la Hb Bart (γ4) (no sintetizan HbA ni HbF). Hemoglobina Lepore (beta-talasemia): Es consecuencia de un sobrecruzamiento desigual entre los genes beta y delta, con el resultado de un gen híbrido (gen Lepore) que codifica una globina mixta β-δ, pero cuya síntesis está disminuida. Una recombinación por sobrecruzamiento desigual da lugar a la fusión de los genes β y δ por la alta homología que existe entre ambos (los genes son 90% homólogos). La expresión clínica es similar a una beta-talasemia severa por disminución de la síntesis de la proteína de fusión δβ por la debilidad del promotor de la δ-globina. Grandes delecciones con fenotipo escaso o nulo: o δβ-talasemia: Se produce la deleción de los genes de las cadenas δ y β. Se produce una compensación por síntesis de cadenas γ. Como resultado, la síntesis de hemoglobina F (α2γ2) continúa postnatalmente con un nivel elevado compensando la ausencia de Hb A (α2β2). o Persistencia hereditaria de Hb fetal (PHHF): En esta patología las delecciones se solapan con las de la patología anterior. Están por tanto afectadas las cadenas β y δ, y para compensar existe un 100% de HbF(se mantiene intacta la secreción de cadenas gamma).Este trastorno es más benigno que el anterior ya que se produce más cantidad de HbF. - Existen dos incógnitas en estas dos patologías: 1- ¿Si sus delecciones se solapan, por qué la PHHF presenta niveles más altos de expresión del gen de la cadena gamma? 2- ¿Por qué ambos grupos tienen expresión postnatal del gen de la cadena gamma? Beta talasemias (en clase no habló de ellas pero las pongo porque son las más frecuentes). A diferencia de las alfa-talasemias, la mayoría de las beta-talasemias son el resultado de mutaciones puntuales que causan la transcripción o procesamiento defectuoso del RNAm de la cadena beta, resultando su síntesis total o parcialmente suprimida. Algunas, poco frecuentes, son el resultado de delecciones de genes. 10 2.- Delecciones de la distrofina (sólo se hace mención a este apartado como otra mutación en gran escala, pero no lo desarrolla). Para el que quiera: La distrofina es una proteína localizada en la superficie interna del sarcolema de la fibra muscular. El gen de la distrofina se localiza en el brazo corto del cromos X y tiene un tamaño de aprox 2000 kb, siendo por tanto uno de los mayores genes humanos. El 65% de los casos de Distrofia muscular de Duchenne se deben a delecciones (pérdida de uno o más exones). Con menor frecuencia, la D. muscular de Duchenne está causada por una duplicación o por una mutación puntual. Los niños que padecen esta enfermedad carecen de distrofina. d. Mutaciones por expansión de trinucleótidos: Trastornos neuropsiquiátricos Son los siguientes: - Distrofia miotónica (Distrofia miotónica de Steinert) - Sdr del cromosoma X frágil - Atrofia muscular espinobulbar (Enfermedad de Kennedy) - Enfermedad de Huntington Para entender estas enfermedades es necesario definir los microsatélites: - son regiones cortas y repetidas en el genoma. Puesto que su contenido en G+C es usualmente mayor que la media del genoma aparecen como una banda de diferente densidad por lo que se denominan satélites. - Están frecuentemente trinucleótidos. constituidos por repeticiones de Una forma de microsatélites: las repeticiones de Trinucleotidos: · Las más comunes en el genoma humano son; CAG, CGG, CAA, TAA, GAG. · Puesto que el DNA es de doble cadena, el triplete GAG incluye; CAG, AGC, GCA, CTG, TGC y GCT. 5’ CAGCAGCAGCAGCAG 3’ 3’ GTCGTCGTCGTCGTC 5’ · El número de repeticiones y por tanto su longitud es altamente polimórfica dando lugar a VNTRs (variable number of tandem repeats). La longitud de los alelos es proporcional al número de repeticiones. Distrofia miotónica: 9q13.3. Se trata de una mutación intrónica consistente en una expansión inestable del trinucleótido CTG n veces en la región 3´del gen de la proteína kinasa miotónica en la cadena de ADN, resultando la expresión de este gen afectada. El número n de repeticiones de CTG 11 determina el estatus del individuo: normal (5-30), premutación (30-75) y afectados (>75). La clínica de este trastorno es multisistémica: cataratas, miotonía, debilidad muscular, calvicie frontal, retraso mental… La anticipación genética (aumenta la gravedad del fenotipo y la precocidad de las manifestaciones clínicas en generaciones sucesivas) se acompaña de un aumento del nº de repeticiones del trinucleótido. Síndrome de X frágil: Xq27.3. Es la repetición del triplete CGG n veces en la región 5´ del gen FMR-1 en la cadena de ADN, resultando éste afectado (se produce inhibición de la transcripción del gen por hipermetilación e inhibición de la traducción). El número n de repeticiones de CGG determina el estatus del individuo: normal (6-55), premutación (55-200) y afectados (>200). Clínica: retraso mental, disminución del tamaño cefálico, frente amplia y macroorquidia. Atrofia muscular espinobulbar (enfermedad de Kennedy): Xq12. Es la repetición del triplete CAG n veces. Este triplete se encuentra en la secuencia que codifica para el receptor de andrógeno. Se produce una expansión del componente poliglutámico de la proteína, lo que se traduce en una pérdida parcial de algunas de sus funciones fisiológicas y activación de otras. El número n de repeticiones de CGG determina el estatus del individuo: normal (13-28), premutación (28-39) y afectados (39-60). Clínica: debilidad muscular y atrofia. Enfermedad de Huntington. No se comenta en clase. 4q.Gen IT15. Es la expansión de la repetición del trinucleótido CAG que codifica una proteína que se denomina “huntingtina” (esta proteína está en todas las neuronas del cerebro y su función es desconocida). Clínica: trastornos progresivos del movimiento. e) Imprinting genético (no lo nombró en clase, ni tampoco viene en su presentación PDF. Lo he añadido porque me lo sugirió Jacobo (¿Por qué?). Imprinting genético (impronta) se define como las modificaciones en la línea germinal que producen diferencias en la expresión del material genético dependiendo de su procedencia, materna o paterna. Las contribuciones genéticas de madre y padre son, en la mayoría de los casos, complementarias. S/e existen regiones del genoma humano donde sólo el alelo materno o paterno se llegan a expresar. Varias enfermedades genéticas presentan imprinting y, por tanto, muestran una expresividad variable según que el gen defectivo sea heredado del padre o de la madre. 12 Existen dos genes en la misma región 15q11-13, implicados cada uno en la etiología del Sdr de Prader-Willi y del Sdr de Angelman, respectivamente, y que tienen un mecanismo de imprinting opuesto : - El gen causante del Sdr de Prader-Willi sufre imprinting y, por tanto, se inactiva fisiológicamente, en el cromosoma materno; la falta de la copia paterna (por una delección p ej) causa la Enf. - El gen responsable del Sdr de Angelman es inactivo en el cromosoma paterno (imprinting paterno) y la falta de expresión de la copia materna manifiesta el fenotipo de la enfermedad. 13