GENOMAS Tabla de contenidos 1.-Proyecto Genoma Humano 1 Componentes 1.1 Cromosomas 1.2 ADN intragénico 1.2.1 Genes 1.2.1.1 Genes de ARN 1.2.1.2 Distribución de genes 1.2.1.3 Secuencias reguladoras 1.2.1.4 Elementos ultraconservados 1.2.2 Pseudogenes 1.3 ADN intergénico 1.3.1 ADN repetido en tándem 1.3.1.1 Satélites 1.3.1.2 Minisatélites 1.3.1.3 Microsatélites 1.3.2 ADN repetido disperso 1.3.2.1 SINE 1.3.2.2 LINE 1.3.2.3 HERV 1.3.2.4 Transposones de ADN 2 Variabilidad 2.1 SNPs 2.2 Variación estructural 3 Enfermedades genéticas 3.1 Mutaciones 3.1.1 Trastornos de un sólo gen 3.1.2 Trastornos poligénicos y multifactoriales 3.2 Alteraciones cromosómicas 3.2.1 Numéricas 3.2.2 Estructurales 4 Evolución 4.1 Genómica comparada entre distintas especies 4.2 Genómica comparada entre genomas humanos 5 Genoma mitocondrial 2.-Genoma del arroz 3.-Genoma del chimpancé 4.-Genoma del Ratón 5.-Genoma de la planta Aranoseque 6.-Genómica de las bacterias 7.-Genoma del Perro 8.-Genoma de la caspa -Número de cromosomas de distintas especies 1.-Genoma Humano El Proyecto Genoma Humano (PGH) (Human Genome Project en inglés) consiste en determinar las posiciones relativas de todos los nucleótidos (o pares de bases) e identificar los 20.000 a 25.000 genes presentes en él. El proyecto, dotado con 3.000 millones de dólares, fue fundado en 1990 por el Departamento de Energía y los Institutos de la Salud de los Estados Unidos, con un plazo de realización de 15 años. Debido a la amplia colaboración internacional, a los avances en el campo de la genómica (especialmente, en el análisis de secuenciación), así como los avances en la tecnología informática, un borrador inicial del genoma fue terminado en el año 2003 (anunciado conjuntamente por el presidente Bill Clinton y el primer ministro británico Tony Blair el 26 de junio, 2003), dos años antes de lo planeado. Tabla de contenidos 1 Componentes o o 1.1 Cromosomas 1.2 ADN intragénico 1.2.1 Genes 1.2.1.1 Genes de ARN 1.2.1.2 Distribución de genes 1.2.1.3 Secuencias reguladoras 1.2.1.4 Elementos ultraconservados 1.2.2 Pseudogenes o 1.3 ADN intergénico 1.3.1 ADN repetido en tándem 1.3.1.1 Satélites 1.3.1.2 Minisatélites 1.3.1.3 Microsatélites 1.3.2 ADN repetido disperso 1.3.2.1 SINE 1.3.2.2 LINE 1.3.2.3 HERV 1.3.2.4 Transposones de ADN 2 Variabilidad o o 2.1 SNPs 2.2 Variación estructural 3 Enfermedades genéticas o o 3.1 Mutaciones 3.1.1 Trastornos de un sólo gen 3.1.2 Trastornos poligénicos y multifactoriales 3.2 Alteraciones cromosómicas 3.2.1 Numéricas 3.2.2 Estructurales 4 Evolución o o 4.1 Genómica comparada entre distintas especies 4.2 Genómica comparada entre genomas humanos 5 Genoma mitocondrial El genoma humano es el genoma (del griego ge-o: que genera, y -ma: acción) de Homo sapiens. Está compuesto por 24 cromosomas distintos (22 autosomas + 2 cromosomas sexuales: X, Y) con un tamaño total aproximado de 3200 millones de pares de bases de ADN (3200 Mb) que contienen unos 20.000-25.000 genes1 . De las 3200 Mb unas 2950 Mb corresponden a eucromatina y unas 250 Mb a heterocromatina. El Proyecto Genoma Humano produjo una secuencia de referencia del genoma humano eucromático, usado en todo el mundo en las ciencias biomédicas. La secuencia de ADN que conforma el genoma humano contiene codificada la información necesaria para la expresión, altamente coordinada y adaptable al ambiente, del proteoma humano, es decir, del conjunto de proteínas del ser humano. Las proteínas, y no el ADN, son las biomoléculas efectoras; poseen funciones estructurales, enzimáticas, metabólicas, reguladoras, señalizadoras..., organizándose en enormes redes funcionales de interacciones. En definitiva, el proteoma fundamenta la particular morfología y funcionalidad de cada célula. Asimismo, la organización estructural y funcional de las distintas células conforma cada tejido y cada órgano, y, finalmente, el organismo vivo en su conjunto. Así, el genoma humano contiene la información necesaria para el desarrollo básico de un ser humano completo. El genoma humano presenta una densidad de genes muy inferior a la que inicialmente se había predicho, con sólo en torno al 1,5%2 de su longitud compuesta por exones codificantes de proteínas. Un 70% está compuesto por ADN extragénico y un 30 % por secuencias relacionadas con genes. Del total de ADN extragénico, aproximadamente un 70% corresponde a repeticiones dispersas, de manera que, más o menos, la mitad del genoma humano corresponde a secuencias repetitivas de ADN. Por su parte, del total de ADN relacionado con genes se estima que el 95% corresponde a ADN no codificante: pseudogenes, fragmentos de genes, intrones, secuencias UTR... Contenido en genes y tamaño del genoma de varios organismos3 Especie Tamaño del Número genoma (Mb) de genes Mycoplasma genitalium 0,58 500 Streptococcus pneumoniae 2,2 2300 Escherichia coli 4,6 4.400 Saccharomyces cerevisiae 12 5.800 Caenorhabditis elegans 97 19.000 Arabidopsis thaliana 125 25.500 Drosophila melanogaster (mosca) 180 13.700 Oryza sativa (arroz) 466 45-55.000 Mus musculus (ratón) 2500 29.000 Homo sapiens (ser humano) 2900 27.000 Componentes [editar] Cromosomas [editar] El genoma humano (como el de cualquier organismo eucariota) está formado por cromosomas, que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de proteínas histónicas y no histónicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopía óptica convencional o de fluorescencia mediante técnicas de citogenética y se ordenan formando un cariotipo. El cariotipo humano contiene un total de 24 cromosomas distintos: 22 pares de autosomas más 2 cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamaño en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21. Representación gráfica del cariotipo humano normal.(Imagen 1) Las células somáticas de un organismo poseen en su núcleo un total de 46 cromosomas (23 pares): una dotación de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o un Y del padre. (Ver imagen 1). Los gametos -óvulos y espermatozoides- poseen una dotación haploide de 23 cromosomas. ADN intragénico [editar] Genes [editar] Un gen es la unidad básica de la herencia, y porta la información genética necesaria para la síntesis de una proteína (genes codificantes) o de un ARN no codificante (genes de ARN). Está formado por una secuencia promotora, que regula su expresión, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traducción y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que serán eliminadas en el procesamiento del ARNm (ayuste). Este diagrama esquemático muestra un gen en relación a su estructura física (doble hélice de ADN) y a un cromosoma (derecha). Los intrones son regiones frecuentemente encontradas en los genes de eucariotas, que se transcriben, pero son eliminadas en el procesamiento del ARN (ayuste) para producir un ARNm formado sólo por exones, encargados de traducir una proteína. Este diagrama es en exceso simplificado ya que muestra un gen compuesto por unos 40 pares de bases cuando en realidad su tamaño medio es de 20.000-30.000 pares de bases). Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de proteínas, estimación muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o más. Esto implica que el genoma humano tiene menos del doble de genes que organismos eucariotas mucho más simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las células humanas recurren ampliamente al splicing (ayuste) alternativo para producir varias proteínas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma humano es más amplio que el de otros organismos mucho más simples. En la práctica, el genoma tan sólo porta la información necesaria para una expresión perfectamente coordinada y regulada del conjunto de proteínas que conforman el proteoma, siendo éste el encargado de ejecutar la mayor parte de las funciones celulares. En base a los resultados iniciales arrojados por el proyecto ENCODE 4 (acrónimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de gen. Las observaciones más recientes hacen dificilmente sostenible la visión tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han hallado un número de secuencias de inicio de transcripción por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitación del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilización del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a proteínas de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una nueva definición de gen 5 , 6 : la unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, así, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definición, un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos proteínas) no solapantes debe considerarse en realidad dos genes diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios. Las nuevas evidencias aportadas por ENCODE, según las cuales las regiones UTR no son fácilmente delimitables y se extienden largas distancias, obligarían a reidentificar nuevamente los genes que en realidad componen el genoma humano. De acuerdo con la definición tradicional (actualmente vigente), sería necesario identificar como un mismo gen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las nuevas observaciones, los genes incluirían múltiples proteínas de secuencia y funcionalidad muy diversa. Colateralmente se reduciría el número de genes que componen el genoma humano. La definición propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relación más coherente entre un gen y una función biológica. Como consecuencia, con la adopción de esta nueva definición, el número de genes del genoma humano aumentará significativamente. Genes de ARN [editar] Además de los genes codificantes de proteínas, el genoma humano contiene varios miles de genes ARN, cuya transcripción produce ARN de transferencia (ARNt), ARN ribosómico (ARNr), microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosomales y de transferencia son esenciales en la constitución de los ribosomas y en la traducción de las proteínas. Por su parte, los microARN tienen gran importancia en la regulación de la expresión génica, estimándose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado más de 300 genes de miARN y se estima que pueden existir unos 500. Distribución de genes [editar] A continuación se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunque tienen valor orientativo. La densidad media de genes es de 1 gen cada 100 kb, con un tamaño medio de 20-30 kb, y un número de exones promedio de 7-8 por cada gen, con un tamaño medio de 150 nucleótidos. El tamaño medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la región codificante de 1,4 kb. Isocoros. Frecuencia y riqueza en G+C y genes, en el genoma humano. El genoma humano se caracteriza por presentar una gran heterogeneidad en su secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T) se distribuye heterogéneamente, con regiones muy ricas en G+C flanqueadas por regiones muy pobres, siendo el contenido medio de G+C del 41%, menor al teóricamente esperado (50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a concentrarse en las regiones más ricas en G+C. Este hecho era conocido ya desde hace años gracias a la separación mediante centrifugación en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de isócoros H; del inglés High) y regiones ricas en A+T (isócoros L; del inglés Low). Secuencias reguladoras [editar] El genoma humano tiene diversos sistemas de regulación de la expresión génica, basados en la regulación de la unión de factores de transcripción a las secuencias promotoras, en mecanismos de modificación epigenética (metilación del ADN o metilación-acetilación de histonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensación de la cromatina; todos ellos muy interrelacionados. Además hay otros sistemas de regulación a nivel del procesamiento, estabilidad y traducción del ARNm, entre otros. Por lo tanto, la expresión génica está intensamente regulada, lo cual permite desarrollar los múltiples fenotipos que caracterizan los distintos tipos celulares de un organismo eucariota multicelular, al mismo tiempo que dota a la célula de la plasticidad necesaria para adaptarse a un medio cambiante. No obstante, toda la información necesaria para la regulación de la expresión génica, en función del ambiente celular, está codificada en la secuencia de ADN al igual que lo están los genes. Las secuencias reguladoras son típicamente secuencias cortas presentes en las proximidades o en el interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemático de estas secuencias y de cómo actúan en complejas redes de regulación génica, sensibles a señales exógenas, es muy escaso y está comenzando a desarrollarse mediante estudios de genómica comparada, bioinformática y biología de sistemas. La identificación de secuencias reguladoras se basa en parte en la búsqueda de regiones no codificantes evolutivamente conservadas7 . Por ejemplo, la divergencia evolutiva entre el ratón y el ser humano ocurrió hace 70-90 millones de años8 . Mediante estudios de genómica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes de proteínas pero de gran importancia funcional, dado que han estado sometidas a presión selectiva. Elementos ultraconservados [editar] Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso que las secuencias codificantes de proteínas, mediante estudios de genómica comparada. Estas secuencias generalmente se solapan con intrones de genes implicados en la regulación de la transcripción o en el desarrollo embrionario y con exones de genes relacionados con el procesamiento del ARN. Su función es generalmente poco conocida, pero probablemente de extrema importancia dado su nivel de conservación evolutiva, tal y como se ha expuesto en el punto anterior. En la actualidad se han encontrado unos 500 segmentos de un tamaño mayor a 200 pares de bases totalmente conservados (100% de coincidencia) entre los genomas de humano, ratón y rata, y casi totalmente conservados en perro (99%) y pollo (95%)9 . Pseudogenes [editar] En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones completas o parciales de genes que han acumulado diversas mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no procesados (~30%) y pseudogenes procesados (~70%)10 . Los pseudogenes no procesados son copias de genes generalmente originadas por duplicación, que no se transcriben por carecer de una secuencia promotora y haber acumulado múltiples mutaciones, algunas de las cuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por poseer tanto exones como intrones. Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e insertadas en el genoma. En consecuencia carecen de intrones y de secuencia promotora. ADN intergénico [editar] Como se ha dicho, las regiones intergénicas o extragénicas comprenden la mayor parte de la secuencia del genoma humano, y su función es generalmente desconocida. Buena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrón definido y clasificable. Gran parte del ADN intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA), denominación que incluye también las secuencias intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de muchas de estas secuencias. Además el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales aún desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye también transposones codificantes) o "ADN repetitivo". Frecuencia de las diversas regiones intergénicas e intragénicas del cromosoma 22. Adaptado de: Dunham, I., et al., 1999. The DNA sequence of human chromosome 22, Nature 402(6761):489–495 Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que exigen la reformulación de nuestra visión de la organización y la dinámica del genoma humano. Según estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al menos a transcritos inmaduros en algún tejido 6 . Así, una gran parte del genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la literatura científica reciente a asignar una importancia creciente al ARN en la regulación génica. Asimismo, estudios detallados han identificado un número mucho mayor de secuencias de inicio de transcripción por gen, algunas muy alejadas de la región proxima a la traducida. Como consecuencia, actualmente resulta más complicado definir una región del genoma como génica o intergénica, dado que los genes y las secuencias relacionadas con los genes se extienden en las regiones habitualmente consideradas intergénicas. ADN repetido en tándem [editar] Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idénticas, o casi, se disponen unas detrás de otras. Satélites [editar] El conjunto de repeticiones en tándem de tipo satélite comprende un total de 250 Mb del genoma humano. Son secuencias de entre 5 y varios cientos de nucleótidos que se repiten en tándem miles de veces generando regiones repetidas con tamaños que oscilan entre 100 kb (100.000 nucleótidos) hasta varias megabases. Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del ADN genómico fragmentado, que reportaban una banda principal correspondiente a la mayor parte del genoma y tres bandas satélite de menor densidad. Esto se debe a que las secuencias satélite tienen una riqueza en nuclétidos A+T superior a la media del genoma y en consecuencia son menos densas. Hay principalmente 6 tipos de repeticiones de ADN satélite 9 : 1. Satélite 1: secuencia básica de 42 nucleótidos. Situado en los centrómeros de los cromosomas 3 y 4 y el el brazo corto de los cromosomas acrocéntricos (en posición distal respecto al cluster codificante de ARNr). 2. Satélite 2: la secuencia básica es ATTCCATTCG. Presente en las proximidades de los centrómeros de los cromosomas 2 y 10, y en la constricción secundaria de 1 y 16. 3. Satélite 3: la secuencia básica es ATTCC. Presente en la constricción secundaria de los cromosomas 9 e Y, y en posición proximal respecto al cluster de ADNr del brazo corto de los cromosomas acrocéntricos. 4. Satélite alfa: secuencia básica de 171 nucleótidos. Forma parte del ADN de los centrómeros cromosómicos. 5. Satélite beta: secuencia básica de 68 nucleótidos. Aparece en torno al centrómero en los cromosomas acrocéntricos y en la constricción secundaria del cromosoma 1. 6. Satélite gamma: secuencia básica de 220 nucleótidos. Próximo al centrómero de los cromosomas 8 y X. Minisatélites [editar] Están compuestas por una unidad básica de secuencia de 6-259 nucleótidos que se repite en tándem generando secuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano contiene unos 30.000 minisatélites. Diversos estudios han relacionado los minisatélites con procesos de regulación de la expresión génica, como el control del nivel de transcripción, el ayuste (splicing) alternativo o la impronta (imprinting). Asimismo, se han asociado con puntos de fragilidad cromosómica dado que se sitúan próximos a lugares preferentes de rotura cromosómica, translocación genética y recombinación meiótica. Por último, algunos minisatélites humanos (~10%) son hipermutables, presentando una tasa media de mutación entre el 0.5% y el 20% en las células de la línea germinal, siendo así las regiones más inestables del genoma humano conocidas hasta la fecha. En el genoma humano, aproximadamente el 90% de los minisatélites se sitúan en los telómeros de los cromosomas. La secuencia básica de seis nucleótidos TTAGGG se repite miles de veces en tándem, generando regiones de 5-20 kb que conforman los telómeros. Algunos minisatélites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. Se consideran polimorfismos multialélicos, dado que pueden presentarse en un número de repeticiones muy variable, y se denominan VNTR (acrónimo de Variable number tandem repeat). Son marcadores muy utilizados en genética forense, ya que permiten establecer una huella genética característica de cada individuo, y son identificables mediante Southern blot e hibridación. Microsatélites [editar] Están compuestos por secuencias básicas de 2-4 nucleótidos, cuya repetición en tándem origina frecuentemente secuencias de menos de 150 nucleótidos. Algunos ejemplos importantes son el dinucleótido CA y el trinucleótido CAG. Los microsatélites son también polimorfismos multialélicos, denominados STR (acrónimo de Short Tandem Repeats) y pueden identificarse mediante PCR, de modo rápido y sencillo. Se estima que el genoma humano contiene unos 200.000 microsatélites, que se distribuyen más o menos homogéneamente, al contrario que los minisatélites, lo que los hace más informativos como marcadores. ADN repetido disperso [editar] Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genoma humano. Los elementos cuantitativamente más importantes son los LINEs y SINEs, que se distinguen por el tamaño de la unidad repetida. Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenómeno se produce con una baja frecuencia, estimándose que 1 de cada 100-200 neonatos portan una inserción nueva de un Alu o un L1, que pueden resultar patogénicos por mutagénesis insercional, por desregulación de la expresión de genes próximos (por los propios promotores de los SINE y LINE) o por recombinación ilegítima entre dos copias idénticas de distinta localización cromosómica (recombinación intra o intercromosómica), especialmente entre elementos Alu. Frecuencias y tipos de repeticiones dispersas en el genoma de varios organismos9 Tipo repetición Homo sapiens Drosophila melanogaster Caenorhabditis Arabidopsis elegans thaliana LINE,SINE 33,4% 0,7% 0,4% 0,5% LTR/HERV 8,1% 1,5% 0% 4,8% Transposones ADN 2,8% 0,7% 5,3% 5,1% Total 3,1% 6,5% 10,4% 44,4% SINE [editar] Acrónimo del inglés Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos). Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma humano. Suponen el 13% del genoma humano9 , un 10% debido exclusivamente a la familia de elementos Alu (característica de primates). Los elementos Alu son secuencias de 250-280 nucleótidos presentes en 1.500.0009 de copias dispersas por todo el genoma. Estructuralmente son dímeros casí idéticos, excepto que la segunda unidad contiene un inserto de 32 nucleótidos, siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable riqueza en G+C (56%)9 , por lo que predominan en las bandas R, y ambos monómeros presentan una cola poliA (secuencia de adeninas) vestigio de su origen de ARNm. Además poseen un promotor de la ARN polimerasa III para transcribirse. Se consideran retrotransposones no autónomos, ya que dependen para propagarse de la retrotranscripción de su ARNm por una retrotranscriptasa presente en el medio. LINE [editar] Esquema simplificado del mecanismo de retrotransposición de un elemento LINE y un SINE. Un elemento LINE es transcrito produciendo un ARNm que sale del núcleo celular. En el citoplasma se traduce en sus dos marcos de lectura abiertos generando ambas proteínas (véase el texto), que para simplificar se han representado como ORF1p y ORF2p. Ambas permiten retrotranscribir el ARNm del LINE y de otros retrotransposones no autónomos, como SINEs y pseudogenes procesados. Durante la retrotranscripción la nueva secuencia de ADN se integra en otro punto del genoma. Acrónimo del inglés Long Interspersed Nuclear Elements (Elementos nucleares dispersos largos). Constituyen en 20% del genoma humano. La familia de mayor importancia cuantitativa es LINE-1 o L1 que es una secuencia de 6 kb repetida unas 800.000 veces de modo disperso por todo el genoma, aunque la gran mayoría de las copias es incompleta al presentar el extremo 5' truncado por una retrotranscripción incompleta. Así, se estima que hay unas 5.000 copias completas de L1, sólo 90 de las cuales son activas9 , estando el resto inhibidas por metilación de su promotor. Su riqueza en G+C es del 42%9 , próxima a la media del genoma (41%) y se localizan preferentemente en las bandas G de los cromosomas. Poseen además un promotor de la ARN polimerasa II. Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos proteínas: 1. Proteína de unión a ARN (’’RNA-binding protein’’): codificada por el marco de lectura abierto 1 (ORF1, acrónimo del inglés ‘’Open reading Frame 1’’) 2. Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Por lo tanto, se consideran retrotransopsones autónomos, ya que codifican las proteínas que necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este ARNm se traduce en ambos marcos de lectura produciendo una retrotranscriptasa que actúa sobre el ARNm generando una copia de ADN del LINE, potencialmente capaz de insertarse en el genoma. Asimismo estas proteínas pueden ser utilizadas por pseudogenes procesados o elementos SINE para su propagación. Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulación de la expresión génica, habiéndose comprobado que los genes próximos a LINE presentan un nivel de expresión inferior. Esto es especialmente relevante porque aproximadamente el 80% de los genes del genoma humano contiene algún elemento L1 en sus intrones9 . HERV [editar] Acrónimo de Human endogenous retrovirus (retrovirus endógenos humanos). Los retrovirus son virus cuyo genoma está compuesto por ARN, capaces de retrotranscribirse e integrar su genoma en el de la célula infectada. Así, los HERV son copias parciales del genoma de retrovirus integrados en el genoma humano a lo largo de la evolución de los vertebrados, vestigios de antiguas infecciones retrovirales que afectaron a células de la línea germinal. Algunas estimaciones establecen que hay unas 98.00011 secuencias HERV, mientras que otras afirman que son más de 400.0009 . En cualquier caso, se acepta que en torno al 5-8% del genoma humano está constituído por genomas antiguamente virales. El tamaño de un genoma retroviral completo es de en torno a 6-11 kb, pero la mayoría de los HERV son copias incompletas. A lo largo de la evolución estas secuencias sin interés para el genoma hospedador han ido acumulando mutaciones sin sentido y deleciones que los han inactivado. Aunque la mayoría de las HERV tienen millones de años de antigüedad, al menos una familia de retrovirus se integró durante la divergencia evolutiva de humanos y chimpancés, la familia HERV-K(HML2), que supone en torno al 1% de los HERV. Transposones de ADN [editar] Bajo la denominación de transposones a veces se incluyen los retrotransposones, tales como los pseudogenes procesados, los SINEs y los LINEs. En tal caso se habla de transposones de clase I para hacer referencia a los retrotransposones, y de clase II para referirse a transposones de ADN, a los que se dedica el presente apartado. Los transposones de ADN completos poseen la potencialidad de autopropagarse sin un intermediario de ARNm seguido de retrotranscripción. Un transposón contiene en gen de una enzima transposasa, flanqueado por repeticiones invertidas. Su mecanismo de transposición se basa en cortar y pegar, moviendo su secuencia a otra localización distinta del genoma. Los distintos tipos de transposasas actúan de modo diferente, habiendo algunas capaces de unirse a cualquier parte del genoma mientras que otras se unen a secuencias diana específicas. La transposasa codificada por el propio transposón lo extrae realizando dos cortes flanqueantes en la hebra de ADN, generando extremos cohesivos, y lo inserta en la secuencia diana en otro punto del genoma. Una ADN polimerasa rellena los huecos generados por los extremos cohesivos y una ADN ligasa reestablece los enlaces fosfodiéster, recuperando la continuidad de la secuencia de ADN. Esto conlleva una duplicación de la secuencia diana en torno al transposón, en su nueva localización. Se estima que el genoma humano contiene unas 300.000 copias9 de elementos repetidos dispersos originados por transposones de ADN, constituyendo un 3% del genoma. Hay múltiples familias, de las que cabe destacar por su importancia patogénica por la generación de reordenaciones cromosómicas los elementos mariner, así como las familias MER1 y MER2. Variabilidad [editar] Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadísimo (en torno al 99,9%)9 de su secuencia de ADN, lo que nos permite trabajar con una única secuencia de referencia, pequeñas variaciones genómicas fundamentan buena parte de la variabilidad fenotípica interindividual. Una variación en el genoma, por sustitución, deleción o inserción, se denomina polimorfismo o alelo genético. No todo polimorfismo genético provoca una alteración en la secuencia de una proteína o de su nivel de expresión, es decir, muchos son silenciosos y carecen de expresión fenotípica. SNPs [editar] La principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones en un sólo nucleótido, conocidas como SNPs (Single nucleotide polimorphisms), en las cuales se han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad existe un proyecto internacional (International HapMap Project) para catalogar a gran escala los SNPs del genoma humano. En este contexto, la denominación de SNP frecuentemente se restringe a aquellos polimorfismos de un sólo nucleótido en los que el alelo menos frecuente aparece en al menos el 1% de la población. Los SNP son marcadores tetralélicos, dado que en teoría en una posición puede haber cuatro nucleótidos distintos, cada uno de los cuales identificaría un alelo; sin embargo, en la práctica suelen presentar sólo dos alelos en la población. Se estima que la frecuencia de SNPs en el genoma humano es de un SNP cada 500-100 pares de bases9 , de los que una parte relevante son polimorfismos codificantes, que causan la sustitución de un aminoácido por otro en una proteína. Gracias a su abundancia y a que presentan una distribución aproximadamente uniforme en el genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta fundamental del Proyecto Genoma Humano. Además son fácilmente detectables a gran escala mediante el empleo de chips de ADN (comunmente conocidos como microarrays). Variación estructural [editar] Recientemente, se ha comenzado a estudiar una nueva forma de variación en el genoma humano: la estructural. Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el número de copias de segmentos grandes del genoma (por lo general de 1000 nucléotidos o más). Estas variantes implican a una gran proporción del genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.12 A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los años 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los que se basó el Proyecto HapMap. Aunque aún quedan dudas acerca de las causas de este tipo de variantes, cada vez existe más evidencia a favor de que es un fenómeno recurrente que todavía continua moldeando y creando nuevas variantes del genoma. Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad estática, sino que se encuentra en constante cambio y evolución. Enfermedades genéticas [editar] La alteración de la secuencia de ADN que constituye el genoma humano puede causar la expresión anormal de uno o más genes, originando un fenotipo patológico. Las enfermedades genéticas pueden estar causadas por mutación de la secuencia de ADN, con afectación de la secuencia codificante (produciendo proteínas incorrectas) o de secuencias reguladoras (alterando el nivel de expresión de un gen), o por alteraciones cromosómicas, numéricas o estructurales. La alteración del genoma de las células germinales de un individuo se transmite frecuentemente a su descendencia. Actualmente el número de enfermedades genéticas conocidas es aproximadamente de 4.000, siendo la más común la fibrosis quística. El estudio de las enfermedades genéticas frecuentemente se ha englobado dentro de la genética de poblaciones. Los resultados del Proyecto Genoma Humano son de gran importancia para la identificación de nuevas enfermedades genéticas y para el desarrollo de nuevos y mejores sistemas de diagnóstico genético, así como para la investigación en nuevos tratamientos, incluída la terapia génica. Mutaciones [editar] Las mutaciones génicas pueden ser: Sustituciones (cambios de un nucleótido por otro): Las sustituciones se denominan transiciones si suponen un cambio entre bases del mismo tipo químico, o transversiones si son un cambio purina (A,G)→pirimidina (C,T) o pirimidina→purina. Deleciones o inserciones: son respectivamente la eliminación o adición de una determinada secuencia de nucleótidos, de longitud variable. Las grandes deleciones pueden afectar incluso a varios genes, hasta el punto de ser apreciables a nivel cromosómico con técnicas de citogenética. Inserciones o deleciones de unas pocas pares de bases en una secuencia codificante pueden provocar desplazamiento del marco de lectura (frameshift), de modo que la secuencia de nucleótidos del ARNm se lee de manera incorrecta. Las mutaciones génica pueden afectar a: ADN codificante: Si el cambio en un nucleótido provoca en cambio de un aminoácido de la proteína la mutación se denomina no sinónima. En caso contrario se denominan sinónimas o silenciosas (posible porque el código genético es degenerado). Las mutaciones no sinónimas asimismo se clasifican en mutaciones con cambio de sentido (missense) si provocan el cambio de un aminoácido por otro, mutaciones sin sentido (non-sense) si cambian un codón codificante por un codón de parada (TAA, TAG, TGA) o con ganacia de sentido si sucede a la inversa. ADN no codificante: Pueden afectar a secuencias reguladoras, promotoras o implicadas en el ayuste (splicing). Estas últimas pueden causar un erróneo procesamiento del ARNm, con consecuencias diversas en la expresión de la proteína codificada por ese gen. Trastornos de un sólo gen [editar] Son enfermedades genéticas causadas por mutación en un sólo gen, que presentan una herencia de tipo mendeliano, fácilmente predecible. En la tabla se resumen los principales patrones de herencia que pueden mostrar, sus características y algunos ejemplos. Patrón hereditario Autosómico dominante Descripción Ejemplos Enfermedades que se manifiestan en individuos heterocigóticos. Es suficiente con una mutación en una de las dos copias (recuérdese que cada individuo posee un par de cada cromosoma) de un gen para que se manifieste la enfermedad. Los individuos enfermos generalmente tienen uno de sus dos progenitores enfermos. La probabilidad de tener descendencia afectada es del 50% dado que cada progenitor aporta uno de los cromosomas de cada par. Frecuentemente corresponden a mutaciones con ganancia de función (de modo que el alelo mutado no es inactivo sino que posee una nueva función que provoca el desarrollo de la enfermedad) Enfermedad de Huntington, Neurofibromatosis 1, Sindrome de Marfan, Cáncer colorrectal hereditario no polipósico o por pérdida de función del alelo mutado con efecto de dosis génica también conocido como haploinsuficiencia. Frecuentemente son enfermedades con baja penetrancia, es decir, sólo una parte de los individuos que portan la mutación desarrollan la enfermedad. Autosómico recesivo La enfermedad sólo se manifiesta en individuos homocigóticos recesivos, es decir, aquellos en los que ambas copias de un gen están mutadas. Son mutaciones que causan pérdida de función, de modo que la causa de la enfermedad es la ausencia de la acción de un gen. La mutación sólo en una de las dos copias es compensada por la existencia de la otra (cuando una sóla copia no es suficiente se origina haploinsuficiencia, con herencia autosómica dominante). Habitualmente un individuo enfermo tiene ambos progenitores sanos pero portadores de la mutación (genotipo heterocigótico: Aa). En tal caso un 25% de la descendencia estará afectada. Dominante ligado al X Las enfermedades dominantes ligadas al cromosoma X están causadas por mutaciones en dicho cromosoma, y presentan un patrón hereditario especial. Sólo unas pocas enfermedades hereditarias presentan este patrón. Las mujeres tienen mayor prevalencia de la enfermedad que los hombres, dado que reciben un cromosoma X de su madre y otro de su padre, cualquiera de los cuales puede portar la mutación. Los varones en cambio Hipofosfatemia, Síndrome siempre reciben el cromosoma Y de su padre. de Aicardi Así, un varón enfermo (xY) tendrá todos sus hijos varones sanos (XY) y todas las hijas enfermas (Xx), mientras que una mujer enferma (Xx) tendrá un 50% de su descendencia enferma, independientemente del sexo. Algunas de estas enfermedades son letales en varones (xY), de modo que sólo existen mujeres enfermas (y varones con Síndrome de Klinelfelter, XxY). Recesivo Las enfermedades recesivas ligadas al X Hemofilia Fibrosis quística, Anemia falciforme, Enfermedad de Tay-Sachs, Atrofia muscular espinal A, Distrofia ligado al X Ligado a Y también están causadas por mutaciones en el cromosoma X. Los varones están más frecuentemente afectados. Un varón portador siempre será enfermo (xY) dado que sólo posee un cromosoma X, que está mutado. Su descendencia serán varones sanos (XY) e hijas portadoras (Xx). Una mujer portadora, tendrá una descendencia compuesta por un 50% de hijas portadoras y un 50% de varones enfermos. Muscular de Duchenne, Daltonismo, Distrofia muscular Alopecia androgénica Son enfermedades causadas por mutación en el cromosoma Y. En consecuencia, sólo puede manifestarse en varones, cuya descendencia será del 100% de hijas sanas y Infertilidad el 100% de hijos varones enfermos. Dadas hereditaria las funciones del cromosoma Y, frecuentemente estas enfermedades sólo causan infertilidad, que a menudo puede ser superada terapéuticamente. Enfermedades causadas por mutación en genes del genoma mitocondrial. Dadas la particularidades de dicho genoma, su transmisión es matrilineal (el genoma mitocondrial se transfiere de madres a hijos). Neuropatía Mitocondrial La gravedad de una mutación depende del hereditaria porcentaje de genomas afectados en la (LHON) población de mitocondrias, fenómeno denominado heteroplasmia (en contraste con heterocigosis), que varía por segregación mitótica asimétrica. masculina de óptica Leber Trastornos poligénicos y multifactoriales [editar] Otras alteraciones genéticas pueden ser mucho más complejas en su asociación con un fenotipo patológico. Son las enfermedades multifactoriales o poligénicas, es decir, aquellas que estan causadas por la combinación de múltiples alelos genotípicos y de factores exógenos, tales como el ambiente o el estilo de vida. En consecuencia no presentan un patrón hereditario claro, y la diversidad de factores etiológicos y de riesgo dificulta la estimación del riesgo, el diagnóstico y el tratamiento. Algunos ejemplos de enfermedades multifactoriales con etiología parcialmente genética son: autismo enfermedad cardiovascular hipertensión diabetes obesidad cáncer Alteraciones cromosómicas [editar] Las alteraciones genéticas pueden producirse también a escala cromosómica (cromosomopatías), causando severos trastornos que afectan a múltiples genes y que en muchas ocasiones son letales provocando abortos prematuros. Frecuentemente están provocadas por un error durante la división celular, que sin embargo no impide su conclusión. Las alteraciones cromosómicas reflejan una anormalidad en el número o en la estructura de los cromosomas, por lo que se clasifican en numéricas y estructurales. Provocan fenotipos muy diversos, pero frecuentemente presentan unos rasgos comunes: Retraso mental y retraso del desarrollo. Alteraciones faciales y anomalías en cabeza y cuello. Malformaciones congénitas, con afectación preferente de extremidades, corazón, etc. Numéricas [editar] Frecuencias de aneuploidías por cada 1000 nacidos vivos9 Aneuploidía Frecuencia (/1000) Síndrome Trisomía 21 1,5 de Down Trisomía 18 0,12 de Edwards Trisomía 13 0,07 de Patau Monosomía X 0,4 de Turner XXY 1,5 de Klinefelter XYY 1,5 del XYY Es una alteración del número normal de cromosomas de un individuo, que normalmente presenta 23 pares de cromosomas (46 en total), siendo cada dotación cromosómica de un progenitor (diploidía). Si la alteración afecta a un sólo par de cromosomas se habla de aneuploidía, de manera que puede haber un sólo cromosoma (monosomía) o más de dos (trisomía, tetrasomía...). Un ejemplo de gran prevalencia es la trisomía 21, responsable del Síndrome de Down. Si por el contrario la alteración afecta a todos los cromosomas se habla de euploidías, de manera que en teoría el individuo tiene una sóla dotación cromosómica (haploidía, 23 cromosomas en total) o más de dos dotaciones (triploidía: 69 cromosomas; tetraploidía: 92 cromosomas...). En la práctica las euploidías causan letalidad embronaria (abortos) siendo muy pocos los nacidos vivos, y fallecen muy tempranamente. Las aneuploidías son mayoritariamente letales, salvo las trisomías de los cromosomas 13, 18, 21, X e Y (XXY, XYY), y la monosomía del cromosoma X. En la tabla se muestran las frecuencias de nacidos vivos con estas alteraciones. Estructurales [editar] Se denominan así las alteraciones en la estructura de los cromosomas, tales como las grandes deleciones o inserciones, reordenaciones del material genético entre cromosomas... detectables mediante técnicas de citogenética. Deleciones: eliminación de una porción del genoma. Algunos trastornos conocidos son el Síndrome de Wolf-Hirschhorn por deleción parcial del brazo corto del cromosoma 4 (4p), y el Síndrome de Jacobsen o deleción 11q terminal. Duplicaciones: una región considerable de un cromosoma se duplica. Un ejemplo es la enfermedad de Charcot-Marie-Tooth tipo 1A, que puede ser causada por duplicación del gen codificante de la proteína mielínica periférica 22 (PMP22) en el cromosoma 17. Translocaciones: cuando una porción de un cromosoma se transfiere a otro cromosoma. Hay dos tipos principales de translocaciones: la translocación recíproca, en la que se intercambian segmentos de dos cromosomas distintos, y la translocación Robertsoniana, en la que dos cromosomas acrocéntricos (13, 14, 15, 21, 22) se fusionan por sus centrómeros (fusión céntrica). Inversiones: una parte del genoma se rompe y se reorienta en dirección opuesta antes de reasociarse, con lo que dicha secuencia aparece invertida. Pueden ser paracéntricas (si afectan sólo a una brazo) o pericéntricas (si la secuencia invertida incluye el centrómero). Cromosomas en anillos: una porción del genoma se rompe y forma un anillo por circularización. Esto puede ocurrir con pérdida de material o sin pérdida de material. Isocromosomas: cromosomas simétricos, con sus dos brazo idénticos por deleción de uno de los brazos y duplicación del otro. El más habitual es el isocromosoma X, en el que se pierde el brazo corto del cromosoma X, originando fenotipos de Síndrome de Turner. Los síndromes de inestabilidad cromosómica son un grupo de trastornos caracterizados por una gran inestabilidad de los cromosomas, que sufren con gran frecuencia alteraciones estructurales. Están asociados con un aumento de la malignidad de neoplasias. Evolución [editar] Los estudios de genómica comparada se basan en comparación de secuencias genómicas a gran escala, generalmente mediante herramientas bioinformáticas. Dichos estudios permiten ahondar en el conocimiento de aspectos evolutivos de escala temporal y espacial muy diversa, desde el estudio de la evolución de los primeros seres vivos hace miles de millones de años o las radiaciones filogenéticas en mamíferos, hasta el estudio de las migraciones de seres humanos en los últimos 100.000 años, que explican la actual distribución de las distintas razas humanas. Genómica comparada entre distintas especies [editar] Los estudios de genómica comparada con genomas de mamíferos sugieren que aproximadamente el 5% del genoma humano se ha conservado evolutivamente en los últimos 200 millones de años; lo cual incluye la gran mayoría de los genes y secuencias reguladoras. Sin embargo, los genes y las secuencias reguladoras actualmente conocidas suponen sólo el 2% del genoma, lo que sugiere que la mayor parte de la secuencia genómica con gran importancia funcional es desconocida. Un porcentaje importante de los genes humanos presenta un alto grado de conservación evolutiva. La similitud entre el genoma humano y el del chimpancé (Pan troglodytes) es del 98,77%. En promedio, una proteína humana se diferencia de su ortóloga de chimpancé en tan sólo dos aminoácidos, y casi un tercio de los genes tiene la misma secuencia. Una diferencia importante entre los dos genomas es el cromosoma 2 humano, que es el producto de una fusión entre los cromosomas 12 y 13 del chimpancé 13 . Otra conclusión de la comparación del genoma de distintos primates es la notable pérdida de genes de receptores olfativos que se ha producido paralelamente al desarrollo de la visión en color (tricrómica) durante la evolución de primates.14 . Genómica comparada entre genomas humanos [editar] Mapa de las migraciones humanas creado a partir de genómica comparada con los genomas mitocondriales de individuos actuales. Los números de la leyenda representan miles de años antes del presente. La línea azul rayada delimita el área cubierta de hielo o de tundra durante la última glaciación. Las letras englobadas por círculos indican los halogrupos de ADN mitocondrial; los halogrupos se usan para definir subpoblaciones genéticas, que frecuentemente tienen una correlación geográfica. Los principales halogrupos de ADNmt son: Africa: L, L1, L2, L3. Oriente próximo: J, N. Europa meridional: J, K. Europa (general): H, V. Europa septentrional: T, U, X. Asia: A, B, C, D, E, F, G (en el dibujo: M está compuesta por C, D, E, y G). Nativos Americanos: A, B, C, D y a menudo X. Véase el artículo: Haplogrupos de ADN mitocondrial humano Durante décadas las únicas evidencias que permitían profundizar en el conocimiento del origen y la expansión del Homo sapiens han sido los escasos hallazgos arqueológicos. Sin embargo, en la actualidad, los estudios de genómica comparada a partir de genomas de individuos actuales de todo el mundo, están aportando información muy relevante. Su fundamento básico consiste en identificar un polimorfismo, una mutación, que se asume que se originó en un individuo de una población ancestral, y que ha heredado toda su descendencia hasta la actualidad. Además, dado que las mutaciones parecen producirse a un ritmo constante, puede estimarse la antigüedad de una determinada mutación en base al tamaño del haplotipo en el que se sitúa, es decir, el tamaño de la secuencia conservada que flanquea la mutación. Esta metodología se ve complicada por el fenómeno de recombinación entre los pares de cromosomas de un individuo, procedentes de sus dos progenitores. Sin embargo, hay dos regiones en las que no existe dicho inconveniente porque presentan una herencia uniparental: el genoma mitocondrial (de herencia matrilineal), y el cromosoma Y (de herencia patrilineal). En las últimas décadas, los estudios de genómica comparada basada en el genoma mitocondrial, y en menor medida en el cromosoma Y, han reportado conclusiones de gran interés. En diversos estudios se ha trazado la filogenia de estas secuencias, estimándose que todos los seres humanos actuales comparten un antepasado femenino común que vivió en África hace unos 150.000 años. Por su parte, por razones aún poco conocidas, la mayor convergencia del ADN del cromosoma Y establece que el antepasado masculino común más reciente data de hace unos 60.000 años. Estos individuos han sido bautizados como Eva mitocondrial e Y-cromosoma Adan. La mayor diversidad de marcadores genéticos y en consecuencia, los haplotipos de menor longitud, se han hallado en África. Todo el resto de la población mundial presenta sólo una pequeña parte de estos marcadores, de modo que la composición genómica del resto de la población humana actual es sólo un subconjunto de la que puede apreciarse en África. Esto induce a afirmar que un pequeño grupo de seres humanos (quizá en torno a un millar) emigró del continente africano hacia las costas de Asia occidental, hace unos 50.000-70.000 años, según estudios basados en el genoma mitocondrial. Hace unos 50.000 años alcanzaron Australia y hace en torno a 40.00030.000 años otras subpoblaciones colonizaron Europa occidental y el centro de Asia. Asimismo, se estima que hace 20.000-15.000 años alcanzaron el continente americano a través del estrecho de Bering (el nivel del mar era menor durante la última glaciación, o glaciación de Würm o Wisconsin), poblando Sudamérica hace unos 15.000-12.000 años. No obstante, estos datos sólo son estimaciones, y la metodología presenta ciertas limitaciones. En la actualidad, la tendencia es combinar los estudios de genómica comparada basados en el ADN mitocondrial con análisis de la secuencia del cromosoma Y. Genoma mitocondrial [editar] Es el genoma propio de las mitocondrias de células eucariotas. La mitocondria es un orgánulo subcelular esencial en el metabolismo aerobio u oxidativo de las células eucariotas. Su origen es endosimbionte, es decir, antiguamente fueron organismos procariotas independientes captados por una célula eucariota ancestral, con la que desarrollaron una relación simbiótica. Las características de su genoma, por tanto, son muy semejantes a las de un organismo procariota actual, y su código genético es ligeramente distinto al considerado universal. Para adaptarse al nicho intracelular y aumentar su tasa de replicación, el genoma mitocondrial se ha ido reduciendo sustancialmente a lo largo de su coevolución, presentando en la actualidad un tamaño de 16.569 pares de bases. Así, la gran mayoría de las proteínas localizadas en las mitocondrias (~1500 en mamíferos) están codificadas por el genoma nuclear (al que hacen referencia todos los apartados anteriores), de modo que muchos de estos genes fueron transferidos de la mitocondria al núcleo celular durante la coevolución de la célula eucariota. En la mayoría de mamíferos, sólo la hembra transmite al zigoto sus mitocondrias, por lo que presentan, como ya se ha dicho, un patrón hereditario matrilineal. En general una célula humana media contiene 100-10.000 copias del genoma mitocondrial por cada célula, a razón de unas 2-10 moléculas de ADN por mitocondria. Diagrama simplificado del genoma mitocondrial. Pueden apreciarse los 37 genes y la secuencia origen de replicación no codificante. En este esquema no se señala la cadena ligera y la pesada. El genoma mitocondrial posee 37 genes9 : 13 genes codificantes de proteínas: codifican 13 polipéptidos que forman parte de los complejos multienzimáticos de la fosforilación oxidativa (sistema OXPHOS). Son 7 subunidades del Complejo I (NADH deshidrogenasa), una subunidad del complejo III (citocromo b), 3 subunidades del Complejo IV (citocromo oxidasa) y 2 subunidades del Complejo V (ATPsintasa). 2 genes ARNr, que codifican las dos subunidades del ARN ribosomal de la matriz mitocondrial. 22 genes ARNt, que codifican los 22 ARN transferentes necesarios para la síntesis proteica en la matriz mitocondrial. Al contrario de lo que sucedía con el genoma nuclear, donde sólo el 1,5% era codificante, en el genoma mitocondrial el 97% corresponde a secuencias codificantes. Es una única molécula de ADN doble hebra circular. Una de las hemihebras recibe el nombre de cadena pesada o cadena H, y contiene 28 de los 37 genes (2 ARNr, 14 ARNt y 12 polipéptidos). La hemihebra complementaria (cadena ligera o L) codifica los 9 genes restantes. En ambas cadenas, los genes de los ARNt aparecen distribuidos entre dos genes ARNr o codificantes de proteínas, lo cual es de gran importancia para el procesamiento del ARN mitocondrial. ------------------------------------------------------Beneficios [editar] El trabajo de interpretación del genoma no ha hecho nada más que empezar. Los beneficios de conocer e interpretar el genoma se esperan fructíferos en los campos de la medicina y de la biotecnología, eventualmente conduciendo a tratamientos o curas de cáncer, Enfermedad de Alzheimer y otras enfermedades. En un nivel más filosófico, el análisis de semejanzas entre secuencias de ADN de diferentes organismos abre un nuevo camino en el campo de la evolución. En muchos casos, preguntas que permanecían sin respuesta pueden ser ahora estudiadas o contestadas en términos de biología molecular. El año 2003 marca dos hitos en la historia de la genómica o La finalización de la secuencia del genoma humano o El 50 aniversario del descubrimiento de la doble hélice del ADN (Número especial de Nature Cronología [editar] 2003 [editar] Completado cromosoma 6, octubre 2003. Completado cromosoma 7, julio 2003. Completado cromosoma Y, junio 2003. Completado Proyecto Genoma Humano, abril 2003. Completado cromosoma 14 - es el cuarto cromosoma terminada su secuencia. Nota: Los enlaces de los cromosomas son direcciones a los artículos publicados (Nature, Science...) ELSI [editar] Uno de los objetivos del PGH desde su inicio fue la creación de un programa que analizara sus implicaciones éticas, legales y sociales: el ELSI (siglas de Ethical, Legal and Social Implications). Los capítulos de dicha declaración incluyen los siguientes temas: 1. 2. 3. 4. 5. 6. Dignidad humana y genoma humano Derecho de los individuos Investigación sobre el genoma humano Condiciones para las actividades científicas Solidaridad y cooperación internacional Promoción e implementación de la declaración Internet y las bases de datos electrónicas [editar] La gran cantidad de información que generaba y genera el PGH, exigió el desarrollo de bases de datos electrónicos para poder almacenar y manejar de forma más fácil y rápida toda esta información. Hay dos tipos de bases de datos: Las que guardan información sobre mapeo y secuenciación. Nacieron incluso antes del PGH, pero algunas construidas para guardar información sobre una sola especie son de reciente creación, como Genome Database, que guarda información específica sobre el genoma humano. Las que almacenan información generada en los grandes centros del genoma. Otra base de datos interesante es GenBank que contiene todos los datos públicos de secuencia de proteínas o ADN. Nociones básicas sobre el “Proyecto Genoma Humano” En el transcurso de una reunión científica en Alta (California), en 1984, un grupo de investigadores abordó el debate sobre la conveniencia de poner en marcha un ambicioso programa. Un proyecto encaminado a la detección de aquellas mutaciones génicas causantes de enfermedades. Sería dos años después, durante un congreso en Santa Fe (California), auspiciado por el Ministerio de Energía (DOE), cuando formalmente se propuso el “Human Genome Project”: como medio para afrontar sistemáticamente la evaluación del efecto de las radiaciones sobre el material hereditario. El proyecto se presentaba ambicioso, tanto en su presupuesto económico como en su duración. Para James Watson, Premio Nobel junto con Francis Crick por el descubrimiento de la estructura de la “doble” hélice del ADN e impulsor del proyecto: “Aunque el costo global de la secuenciación total del ADN humano será inferior en un orden de magnitud al de enviar al hombre a la luna, las repercusiones serán mucho mayores”. Se trataba, en fin, de descifrar el genoma humano para poder comprender y erradicar el cáncer, así como otras enfermedades de determinación génica. Un proyecto de esta envergadura sólo podía plantearse partiendo de los grandes avances en Biología Molecular y en las Ciencias de la Computación. Por lo que se refiere a la Biología ha sido determinante el gran desarrollo, a partir de la década de los ochenta, de la metodología del ADN recombinante con todas sus técnicas asociadas: vectores de clonación, enzimas de restricción, secuenciación genética inversa, reacción en cadena de la polimerasa,… En cuanto a la Bioinformática, no sólo está permitiendo la secuenciación de genomas, sino la detallada comparación de los mismos. Más allá de las aplicaciones terapéuticas que pudieran derivarse del desciframiento de nuestro genoma, en el trasfondo del proyecto subyace una motivación no menos ambiciosa: profundizar en el enigma insoldable sobre nuestro origen. En este sentido, son esclarecedoras las palabras de Jacques Monod (1977), Premio Nobel por sus investigaciones sobre la expresión de los genes: “la ambición última de la ciencia entera es fundamentalmente dilucidar la relación del hombre con el universo… a la Biología le corresponde un lugar central, por ser la disciplina que intenta ir más directamente al centro de los problemas que se deben haber resuelto antes de poder proponer el de la «naturaleza humana»”. Y no menos significativas las de Francis Crack: “un hombre honesto que estuviera provisto de todo el saber que esté hoy a su alcance, debería afirmar que el origen de la vida parece provenir de un milagro… Sólo un milagro puede definir las condiciones que sería preciso reunir para el establecimiento de la vida”. Y es el que el proyecto, según Walter Gilbert (Premio Nobel por el desarrollo de una de las técnicas de secuenciación), “traerá consigo un cambio en la concepción filosófica sobre nosotros mismos”. El Proyecto Genoma Humano (PGH, en su acrónimo) fue refrendado por el Congreso Norteamericano en 1988, tras recibir la aprobación de la Academia de las Ciencias, el Instituto Nacional de la Salud y el Gobierno. Y se puso en marcha en 1990 en Estados Unidos. Posteriormente entraron a participar Gran Bretaña, Francia, Alemania, Japón y China. Esta internacionalización exigió la creación del “Human Genome Organization” (HUGO): un órgano rector y coordinador presidido, inicialmente, por el genetista Victor McKusic. El planteamiento original (1988) marcaba ocho objetivos, encaminados a habilitar soluciones mediante técnicas de terapia génica u otras aplicaciones biotecnológicas: 1. Descifrar todo el genoma humano. Es lo que se conoce como “genómica estructural”: ¿qué información contiene el genoma? 2. Desarrollar una tecnología eficiente para la secuenciación de todo el genoma. 3. Identificar las variaciones alélicas. 4. Interpretar las funciones. Es lo que se conoce como “genómica funcional”: ¿qué codifican los genes?, ¿qué genes, en qué orden, dónde y cuándo se expresan en relación con el desarrollo? 5. Descifrar y analizar las secuencias de “organismos modelos”. Concretamente: una levadura (Saccharomyces cerevisiae), un nemátodo (Caenorhabditis elegans), la mosca de la fruta (Drosophila melanogaster) y el ratón común (Mus musculus). 6. Examinar las implicaciones éticas, legales y sociales de la investigación genómica. El programa internacional ELSI (“Ethics, Legal and Social Implications”). 7. Desarrollar herramientas de bioinformática y estrategias de computación para el uso de los datos de genes y secuencias. 8. Adiestrar científicos para la investigación y análisis de los genomas. Por la parte estadounidense han corrido con la financiación y la coordinación: NHGRI (“National Human Genome Research Institute”), NIH (“National Institute of Health”) y DOE (“Department of Energy”). Y por la británica: el “Wellcome Trust”. Inicialmente en el proyecto se implicaron dieciséis centros de investigación de Estados Unidos, además de numerosos departamentos de los otros países partícipes. En base a los ocho objetivos señalados se marcaron dos etapas: la primera de ellas, referida a la genómica estructural, habría de finalizar concluyendo el 2001 con la realización de un “borrador” del genoma. Sin embargo, esta primera fase culminó antes de lo previsto: en el 2000 se anunciaba ese “working draft” del genoma. En esta acelerada consecución de objetivos ha resultado relevante el desarrollo de un amplio programa de investigación pública y, paralelamente, otro privado: dirigido por el Dr. Craig Venter, del grupo “Celera Genomics”. No menos importante es el carácter altruista que, hasta la fecha, ha caracterizado el desarrollo del programa. Así por ejemplo, todos los hallazgos se han ido publicando en Internet en tiempo real. Si bien el Proyecto Genoma Humano se inició en 1990, ya desde los años setenta y ochenta se venían descifrando genomas de muy diferentes organismos. Entre 1976 y 2004: seis virus, once bacterias, un hongo, dos plantas, dos invertebrados, dos vertebrados, así como el ADN de las mitocondrias humanas. En la Tabla-I se exponen algunos ejemplos. Inicialmente el PGH se presupuestó en 3.000 millones de $ USD, estimándose su duración en quince años. Ahora bien, las innovaciones tecnológicas han posibilitado un considerable recorte en costes y tiempo. La primera fase concluyó en trece años, invirtiéndose 2.600 millones de $ USD. Reseñable es la creciente relevancia que ha ido tomando la investigación privada. En 1993 los fondos públicos ascendían a 170 millones de $ USD, frente a los 80 invertidos por compañías biotecnológicas privadas. En mayo de 1998 la empresa TIGR formó un consorcio con Perkin-Elmer, un fabricante de secuenciadotes automáticos, con el fin de abaratar y abreviar el proyecto público. De hecho, esta carrera competitiva está reduciendo costes. A modo de ejemplo, el aislamiento y secuenciación del gen responsable de la fibrosis quística costó 30 millones de $ USD, actualmente sólo habría supuesto 200.000. Dos técnicas para un mismo proyecto Desde los comienzos de su andadura el Proyecto Genoma Humano ha contado con un aliciente extra. Nos referimos al empleo de dos técnicas, paralelamente, en la secuenciación del genoma. Evidentemente, cuanto más amplio es el enfoque de estudio sobre un hecho: más fino resulta el análisis final y más fiables las conclusiones. Ambas metodologías fueron decisión de los principales investigadores, de su -podríamos decirpropia idiosincrasia o metodología de trabajo. La primera de las estrategias fue la propuesta por James Watson y Francis Collins, entre otros, contando con la mayor parte de la financiación pública. Esta metodología resulta la más compleja, pues se enfoca a un conocimiento más exhaustivo del genoma. Es, por ende, la de uso más generalizado. Si bien más adelante detallaremos su método, podemos resumirlo como sigue. Básicamente consiste en secuenciar el genoma completo, cromosoma a cromosoma: de un extremo al otro. Podríamos hablar de “fragmentación total”, que es la que explicaremos, por su mayor complejidad, con mayor detalle. Craig Venter y otros, bajo la financiación de “Celera Genomics” y otras compañías biotecnológicas privadas, emplearían una segunda técnica, más práctica. Consistiría en la secuenciación de genes expresados en las células diferenciadas en las que se encuentran activos, partiendo de los ARNm resultantes de su traducción. Fragmentación total La técnica propuesta por Watson, Collins et al, podría ejemplificarse con el clásico “corta y pega”, a no ser por la magnitud de la secuencia a analizar. Podría especificarse en los siguientes pasos. 1. Aislamiento del ADN, partiendo de núcleos de células, usualmente, en cultivo. 2. Escisión del genoma en miles de fragmentos manejables. E inserción de los mismos en los llamados “vectores de clonación” (plásmidos, por ejemplo). 3. Clonar dichos fragmentos en microorganismos, lo que posibilita la conservación “aislada” de secuencias de ADN perfectamente “ubicadas” (aunque aun no descifradas). Es lo que se conoce como “librerías genómicas”. Es decir, insertar los vectores portadores de fragmentos en microorganismos, manteniendo estos en cultivo. 4. Aislamiento de los mencionados fragmentos, a partir de las “librerías”. 5. Localizar las regiones contiguas (los puntos de cohesión) entre los fragmentos, de forma que, analizando detalladamente la secuencia se determinen esos “cóntigos” o fragmentos contiguos. 6. Secuenciación de cada fragmento y ensamblado completo de todas las secuencias dentro de sus “cóntigos”. Fragmentación y clonación La fragmentación del ADN sería imposible sin el empleo de las endonucleasas de restricción, unas enzimas de Escherichia coli, descubiertas por Werner Arber en los años setenta, implicadas en su defensa contra la infección por bacteriófagos. Las endonucleasas son capaces de cortar la secuencia de ADN, independientemente de su origen, en lugares específicos. Esta especificad hace de estas enzimas unas herramientas sumamente precisas. Un ejemplo es la enzima EcoRI, que reconoce y corta la siguiente secuencia de seis pares de nucleótidos en el ADN de cualquier organismo: Se generan así un par de extremos cohesivos, que pueden unirse entre sí o con cualquier otro extremo con una secuencia complementaria: es decir, con un fragmento cortado por la misma enzima. Se denominan “palíndromos” a esas secuencias diana que son reconocidas por las endonucleasas de restricción. El término hace referencia a que ambas cadenas de ADN tiene comparten la misma secuencia nucleotídica en una orientación antiparalela, conforme a la corresponsabilidad de bases: Guanina con Citosina, Adenina con Timina. En general, la mayoría de estas enzimas reconocen palíndromos específicos. Fragmentado pues el ADN en trozos, que puedan contener uno o varios genes, el siguiente paso sería la clonación de los mismos. Para ello, se insertarán en moléculas con capacidad de autorreplicación: plásmidos, cósmidos, cromosomas artificiales de levadura (YACs), cromosomas artificiales de bacteria (BACs),… Cada uno de estos vectores aceptan secuencias de distinta longitud: los cósmidos unas 40 kb, los YACs entre 100 y 2.000 kb, por ejemplo. Los plásmidos son pequeños anillos de ADN (de doble cadena) extracromosómico, presentes en microorganismos tales como las bacterias, que pueden utilizarse como vectores. Para la inserción de ADN foráneo en los plásmidos, se recurre a las comentadas endonucleasas de restricción. Por ejemplo, puede cortarse el ADN vector (el del plásmido) y el ADN donante (el humano, pongamos por caso) con la enzima EcoRI, generándose unos extremos cohesivos que podrán unirse entre sí constituyendo un vector recombinante. Finalmente, el plásmido modificado será insertado en una bacteria receptora, en orden a su clonación (Fig.-1). El procedimiento parece sencillo, pero a priori plantea una duda razonable. ¿Cómo se puede tener certeza de que el ADN donante se ha insertado eficientemente en el plásmido vector? Para la resolución de este problema, la Biología Molecular se aprovecha de una propiedad de los plásmidos: el hecho de que porten genes que les confieren resistencia a antibióticos. Así por ejemplo, el plásmido pBR322 (un anillo de ADN de doble hélice, de 4.600 pares de bases) porta dos genes de resistencia a dos antibióticos: el tetR, frente a la tetraciclina; el ampR, frente a la ampicilina. Ambos genes contienen secuencias diana de corte específico para determinadas endonucleasas de restricción: HindIII, BamH1 y SalI para tetR; PstI, PouI, EcoR1, AvaI, PouII y ClaI para ampR. Al tratar el plásmido pBR322 con la enzima BamH1 resultará cortado el gen tetR, con lo que el anillo quedará abierto y receptivo para la inserción del ADN donante. Consecuentemente, el plásmido perderá su resistencia a la tetraciclina. Una vez mezclado el plásmido “abierto” y el ADN foráneo, ambos tratados con la BamH1, es de esperar que este último fragmento se inserte en el primero: cerrándose de nuevo el anillo del primero. Para cerciorarse de una eficiente inserción, se introducirán estos plásmidos en bacterias para su multicultivo. Se seleccionarán las colonias bacterianas que muestren resistencia a la ampicilina y la hayan perdido frente a la tetraciclina. Una bacteria transformada con una sola molécula de ADN recombinante comenzará a dividirse exponencialmente, en un medio sólido, dando lugar a una colonia con millones de células hijas, todas ellas portando ese fragmento de ADN foráneo inserto en un plásmido. De este modo, se van obteniendo colonias transformadas de bacterias, que constituirán clones portadores de un determinado plásmido con un mismo inserto de ADN donante. Cada colonia sólo habrá de contener una única molécula recombinante del fragmento de genoma que se desea estudiar. Esto no significa, sin embargo, limitaciones extremas en los fragmentos de ADN foráneo a insertar en los plásmidos, ni tampoco en el tipo de vectores de clonación. Se pueden insertar secuencias nucleotídicas de mayor o menor longitud. No obstante, en orden a afinar lo más posible el desciframiento se ha procedido a ordenar los pequeños fragmentos, pertenecientes a una común región mayor, entre sí: y así, sucesivamente, en orden ascendente. Se obtendrá así una inmensa colección de clones, para cada fragmento del ADN original seccionado (sobre un total de 3.175.490.000 pares de bases y 30.000 genes, en el caso del ser humano): lo que se conoce como una “librería genómica”. Librerías genómicas Debido a los distintos tipos de vectores empleados, así como al tamaño de las secuencias insertadas -como más arriba comentábamos-, para el “Human Genome Project” se han constituido varias de esas librerías genómicas. Una simplificación del trabajo, con vistas a facilitar la reconstrucción (desfragmentación) del ADN previamente fragmentado, ha llevado a partir de cada uno de los cuarenta y seis cromosomas aislados: el trabajo se planteó cromosoma a cromosoma. Así, una librería genómica habrá de albergar miles o millones de fragmentos del ADN a estudiar. Pero, ¿cuál sería su magnitud? Por lo general, el número de clones será, cuando menos, el doble de la suma de los tamaños medios de las secuencias insertadas, una vez fragmentado el genoma. Por ejemplo, un genoma de 3.000 Mb tendría cabida en 3.000 cultivos de levadura (una región de 1 Mb/cultivo), o bien en unos 210.000 plásmidos (una región de 15 kb/plásmido). Y aún así, el número de cultivos habría de ser el doble, puesto que las endonucleasas de restricción reconocen unas específicas secuencias dianas y, por tanto: i) pueden quedar zonas de corte fuera de su acción; ii) pueden cortar segmentos de ADN, más o menos largos, que representen la misma región del genoma (con segmentos comunes y otros que solapen con regiones colindantes). ¿Cómo ordenar? Llegados a este punto, nos encontraríamos en una situación que podríamos calificar de “sin orden ni concierto”. ¿Cómo ordenar, cómo reconstituir? En el proceso de enlazado hay que buscar regiones solapantes entre los fragmentos: secuencias comunes en los insertos clonados. Así se irán obteniendo cóntigos (“contigs”): conjuntos de fragmentos de un genoma que se han clonado por separado, pero que son contiguos y que están parcialmente solapados. En la elaboración de los mapas físicos del genoma, se irán ensamblando dichos “contigs”. Se utilizan marcadores moleculares. Por la técnica de la PCR (Reacción en Cadena de la Polimerasa), desarrollada por el Premio Nobel Kary B. Mullis, se analizarán detalles de secuencias. Los marcadores indican las posiciones de cortas secuencias (Fig.-2), únicas y comunes a todos los fragmentos indicados; de forma que así se pueden conocer la posición y el orden de éstos. Hay un tipo de marcadores particularmente eficaces, por su alta resolución y rapidez de ejecución: los STS (“Sequence Tagged Sites”: lugares etiquetados por su secuencia). Se trata de secuencias cortas de ADN, de entre 100 y 1.000 pb conocidas, fácilmente reconocibles y presentes, únicamente, en un lugar de un cromosoma o del genoma. Los STS pueden detectarse en distintos fragmentos que tengan extremos solapantes, pero que se hayan conservado en clones separados. Una vez que un investigador descifra un STS, cualquier otro puede obtener su secuencia fabricando in vitro los cebadores correspondientes a sus extremos, y amplificando la STS mediante la mencionada PCR. Los STS constituirían una suerte de balizas en la elaboración de los mapas físicos. Entre los objetivos principales del proyecto figuraba la elaboración de mapas físicos con alrededor de 30.000 de esas balizas (STS), quedando los marcadores separados entre sí por unas 100 kb. Objetivo ya cumplido, gracias precisamente al empleo de los STS: se han obtenido mapas de cóntigos conforme al contenido de marcadores de los clones solapantes. Secuenciación En esta fase final del proceso es donde técnicas como la nanotecnología, la bioinformática y la biología computacional han resultado de inestimable ayuda. Los avances en las nuevas estrategias de secuenciación automática han posibilitado secuenciar un fragmento de 700 bases en pocos minutos. Además, un secuenciador automático puede realizar cerca de 100 análisis simultáneos. Es conocido el famoso laboratorio francés “Génethon”, provisto de varios robots especializados en procesar y analizar las muestras. Se puede secuenciar un fragmento de ADN amplificado por PCR, o directamente un inserto en un plásmido. Existen varios métodos de secuenciación. De los siguientes, los tres primeros son los básicos, en tanto que el resto corresponden a nuevas metodologías aún en desarrollo. 1. Método químico de Maxam y Gilbert. Actualmente en desuso. 2. Método enzimático de Sanger, también conocido como de “terminación de cadena”, de “secuenciación automática”, o de los didesoxinucleótidos (ddNTP). Más adelante nos detendremos en explicarlo con más detalle. 3. Microscopía de barrido (“scanning”) de efecto túnel (STM). Próxima a la muestra de ADN se mantiene una sonda, mediante un control basado en la detección de una ínfima corriente eléctrica inducida por el “efecto túnel” entre la punta de la sonda y el ADN. Los movimientos en vertical de la sonda a lo largo de la muestra se irán midiendo y registrando, generándose una imagen de la superficie del ADN. Se han obtenido imágenes del esqueleto desoxirribosaácido ortofosfórico, pero aún no de las bases nitrogenadas. De llegar a desarrollarse satisfactoriamente, este método podría secuenciar 1 Mb cada día. 4. Microscopía de fuerza atómica (AFM). Método similar al anterior, donde el control de la sonda se debe a la medición de las fuerzas de van der Waals entre aquella y la muestra. 5. Secuenciación por hibridación en chips con oligonucleótidos. Esta técnica bioinformática se basa en la síntesis de distintas sondas de oligonecleótidos, que luego se unirán en disposiciones ordenadas (“arrays”) sobre un “chip”. Este se probará frente a una muestra de ADN fluoromarcado: el patrón y cantidad de fluorescencia emitada informará sobre la secuencia del ácido desoxirriblonucleico. Una técnica donde la nanotecnología está logrando llamativos avances. La compañía “Affimetrix”, por ejemplo, ha conseguido resecuenciar las 16’5 kb del ADN mitocondrial humano, mediante un “biochip” de 135.000 oligonucleótidos (de unas 20 bases cada uno). En el 2003 el Centro Nacional de Investigaciones Oncológicas, dirigido por el Dr. Mariano Barbacid, presentó el primer “biochip” español. Por lo que respecta al método de Sanger, habitualmente se utiliza una síntesis de secuencias complementarias mediada por una polimerasa, y se emplea la molécula a secuenciar como molde: molde que irá incorporando nucleótidos en la nueva cadena. En la mezcla de reacción se añadirán los cuatro dNTPs (deoxinucleótidos trifosfatos de A, T, G y C), que tienen el grupo 3’-OH (enlace fosfodiester entre 3’-OH y 5’-OH del siguiente dNTP), así como los cuatro ddNTPs (dideoxinucleótido trifosfatos de A, T, G y C), caracterizados por carecer de la terminación 3’-OH (en cualquiera de las bases). Esta modificación presente en los ddNTPs impide la unión de nuevos nucleótidos, en su incorporación a la nueva molécula que se va sintetizando. Un fluorcromo específico marca cada uno de los ddNTPs, generando una señal de color diferente. Al incorporar un ddNTP marcado se interrumpe la síntesis de la molécula; al tiempo, se incorporan otros dNTPs no marcados. Así, la menor concentración de ddNTPs (marcados) frente a dNTPs (no marcados), hace que al final de la síntesis sólo se produzcan incorporaciones ocasionales. Transcurrido un cierto tiempo, de la reacción de síntesis resultarán numerosas moléculas de diversa longitud, que finalizarán en la posición ocupada por una base característicamente marcada por una señal fluorescente (A, T, C o G): Fig.-3. Fig.-3: Lectura de síntesis resultante con marcaje fluorcromo de ddNTPs . Seguidamente se separarán, en función de su tamaño, los productos de la reacción de síntesis mediante una electroforesis. La separación se efectúa a tiempo real mediante un lector láser. Los secuenciadores automáticos emplean programas altamente sofisticados, que integran todos los resultados para concluir una secuencia gráfica. Mapas genómicos Entre los principales objetivos del PGH figura la creación de una serie de mapas, cada vez más finos de cada cromosoma humano. Trazar un mapa supone dividir los cromosomas en fragmentos menores, que se puedan amplificar, caracterizar y ordenar. El segundo objetivo, una vez obtenido un mapa, sería determinar la secuencia de ADN de cada uno de los fragmentos ordenados. En último término se trata de encontrar todos los genes en la secuencia de ADN. Se distinguen tres tipos de mapas: 1. Mapas de ligamiento genético. Muestran la localización relativa de marcadores específicos de ADN a lo largo del cromosoma. Los marcadores son regiones de ADN (codificantes o no) cuya forma o patrón de herencia puede seguirse. Dos marcadores localizados uno junto a otro en el mismo cromosoma, tienden a pasar juntos de padres a hijos. Los marcadores deben ser polimórficos (color de ojos, grupos sanguíneos, susceptibilidad a una enfermedad,…). 2. Mapas físicos. Según el nivel de resolución, pueden obtenerse diferentes mapas físicos: 1. Mapa cromosómico. Se trata de un mapa físico de baja resolución, basado en el patrón de bandas distintivo que presentan los cromosomas teñidos cuando se observan al microscopio óptico. 2. Mapa de ADNc (ADN clínico). Muestra la localización de los genes (exones) en el mapa cromosómico. El ADNc identifica las partes del genoma con mayor importancia biomédica. 3. Mapa de “contings”. Por “cotings” (cóntigos) se entienden fragmentos de ADN ordenado que forman un bloque continuo. Este tipo de mapa físico de alta resolución construye una colección de fragmentos pequeños (“contings”), de manera que se superponen estos fragmentos con un orden conocido y que se corresponden a un segmento completo de un cromosoma. 4. Mapa de restricción. De menor resolución que los anteriores, se construyen a partir de un cromosoma individual. El cromosoma se corta con enzimas de restricción, resultando fragmentos grandes que luego se ordenan y subdividen en fragmentos más pequeños, que a su vez se reordenan. El mapa resultante muestra el orden de los sitios de restricción, así como la distancia que existe entre ellos. 3. Secuenciación del ADN. El mapa físico definitivo del genoma humano será la secuencia de ADN completa, donde se determinen todos los pares de bases de cada uno de los cromosomas. En la secuenciación y ordenación, no sólo se puede recurrir a diferentes técnicas, sino que puede recurrirse a diversos vectores de clonación. En este sentido, la cartografía genómica de “contings” suele aprovechar la diversa capacidad de insertos para cada clase de vector con capacidad de autorreplicación. Las posibilidades son varias y no excluyentes. Veamos un ejemplo. Un primer paso sería la realización de mapas físicos de baja resolución. Para ello se partiría de clones solapados de aquellos insertos con mayor longitud: los YACs (entre 100 y 2.000 kb). Seguidamente se amplificaría la resolución de los mapas, subclonando en cósmidos (con capacidad para insertos de 40 kb) fragmentos aleatorios de aquellos mayores en YACs. Como última fase, se fragmentarían aleatoriamente los insertos de cósmidos clonados, para subclonarlos en vectores de menor capacidad como los plásmidos (15 kb de capacidad de inserto/plásmido) o virus como el fago M13 (400 pb de capacidad de inserto/fago). Aunque esta secuenciación aleatoria (“shotgun”) garantiza una alta fiabilidad, al secuenciar entre 8 y 10 veces un mismo segmento, sigue ofreciendo una tasa de errores considerable: entre el 0’02 y el 0’2 %. Y es que los YACs son vectores inestables, que frecuentemente se comportan como quimeras por su no absoluta fidelidad. Este modelo de secuenciación requiere disponer, previamente, de una cartografía aceptable. En 1996 Venter et al desarrollaron una estrategia alternativa, recurriendo a cromosomas artificiales de bacterias (BACs), para paliar las dificultades surgidas con los de levadura (YACs). Los BACs permiten insertos menores (100-350 kb), pero ofrecen una mayor fidelidad. Aunque económicamente ventajosa, la estrategia BAC no está tampoco exenta de polémicas: centralizaría el PGH, pues obligaría al intercambio de placas con clones. Esta novedosa técnica puede explicarse como sigue: 1. Creación de una genoteca humana de BACs, con un tamaño medio de insertos de 150 kb y alrededor de 300.000 clones. 2. Para cada extremo del inserto de cada clon se secuencian unas 500 bases. Así, las 600.000 secuencias (llamadas STCs, o “conectores etiquetados por su secuencia”) de todos los extremos se reparten a razón de una cada 5 kb de genoma: constituyendo el 10 % de la secuencia genómica. Estas secuencias STC se hacen públicas, en tiempo real, en Internet. 3. Los STCs posibilitan que, en términos medios, cada BAC pueda conectarse con otros 30. Un inserto medio de 150 kb dividido por 5 kb, está representado en 30 BACs. 4. El paso siguiente sería tomar la “huella dactilar” (un patrón compartido de dianas para endonucleasas de restricción) de cada clon BAC. 5. Para identificar los clones solapados se secuenciará un clon BAC y se comparará con la base de datos STCs: es el denominado “BAC semilla”. 6. Secuenciación de los dos clones BAC que muestren consistencia interna entre las huellas dactilares y el solapamiento mínimo en ambos extremos en relación al “BAC semilla”. 7. La repetición de este proceso, a ambos lados del “BAC semilla”, permitiría secuenciar todo el genoma humano a partir de sólo 20.000 clones BAC. Resultados del Proyecto Genoma Humano Cumpliendo las perspectivas del PGH en 1990, en los primeros años del 2000 se han hecho públicos los genomas de varios organismos modelos muy diferentes (Tabla-I). Ya se conocen los genomas completos de más de cien bacterias y seis eucariotas. Se trabaja en el genoma de alrededor de mil especies de todos los phylums. Por lo que se refiere al ser humano, cuyo genoma es el objetivo central del proyecto, el primer éxito lo constituyó la publicación, a finales de 1999 (revista Nature), de la secuencia completa de del más pequeño de nuestros cromosomas: el 22, con 33 Mb y la información de unos 650 genes. La misma revista publicaría, el 8 de mayo de 2000, la secuencia de un segundo cromosoma especialmente relevante, por su implicación en varias mutaciones (Síndrome de Down, por ejemplo): el 21. Y el 6 de junio de 2000, en la Casa Blanca y ante el Presidente Bill Clinton, se presentó un avanzadísimo -aunque incompleto- “working draft”, el borrador del genoma humano, por parte de Francis Collins, en nombre del consorcio público, y Craig Venter, por la privada Celera Genomics. Coincidiendo con el quincuagenario aniversario del descubrimiento de la estructura en doble hélice del ADN, el 13 de abril de 2003 Francis Collins hacía pública la culminación de la primera fase del PGH, aquella referida a la genómica estructural: completándose así el borrador, la secuenciación podía darse por concluida. Ha habido que afrontar un problema paralelo, de gestión e índole más práctica: la publicación de una ingente cantidad de datos, su disponibilidad en tiempo real y su libre accesibilidad. Obviamente, la publicación de secuencias de ADN en revistas científicas no ofrece, precisamente, facilidad alguna a los investigadores interesados en su consulta. Además, el volumen de datos se ha ido duplicando cada año. Desde sus inicios, los resultados del PGH se han ido publicando en varias páginas web para su consulta en Internet. Dos son las principales bases de datos genómicos: 1. El Consorcio Internacional de Bases de Datos de Secuencias, constituido por el Genbank, el Banco de datos de ADN de Japón (DDBJ) y el del EMBL. Estas tres genotecas intercambian información sobre secuencias. A su vez, se interconexionan con otras bases, como la del Centro Nacional de Biotecnología en Madrid. 2. La Genome Data Base (GDB), más restringida a la cartografía y metodología en sí. Para aquellas enfermedades cuyo origen genético ya ha sido determinado, es posible localizar los mapas genéticos e incluso las secuencias. Ello es posible gracias al vínculo entre la base de datos bibliográfica MEDLINE con la OMIM (“Herencia mendeliana on-line”). El Proyecto Genoma Humano: una proyección hacia el futuro Los progresivos hallazgos que se van derivando del PGH, encaminados hacia una secuenciación plena de nuestro genoma, no deben conducir a un reduccionismo. Richard Lewontin lamentaba: “hace falta algo más que el ADN para constituir a un ser vivo… Una vez escuché a un destacado investigador, líder en Biología Molecular, decir en la sesión de apertura de un congreso que si tuviera un computador muy potente, y la secuencia completa del ADN de un ser vivo, podría computar al organismo. Es decir, describir totalmente su anatomía, fisiología y comportamiento. Esto es una falacia. Aunque tuviésemos la capacidad de computar toda esta información, el organismo es más que su ADN”. El PGH se plantea un desarrollo ulterior más complejo: el “proteoma”. El proteoma es el conjunto de proteínas que intervienen en los procesos biológicos de una especie. Y es que el ADN está constituido en base a sólo 4 bases nitrogenadas, mientras que las proteínas están constituidas en base a 20 aminoácidos diferentes. Además, hay que establecer la estructura tridimensional adecuada, pues esa estructura espacial es la que interviene decisivamente en el papel que cumple la proteína. La deducción de cada gen y su expresión servirá para conocer las alteraciones proteicas responsables de muchas patologías. Tres campos clínicos son los beneficiados directamente por los avances del PGH: 1. El diagnóstico. Para aquellas enfermedades con una base genética, el conocimiento de nuestro genoma permite desarrollar pruebas diagnósticas a nivel, incluso, preembrionario. Mediante la técnica del “clonaje posicional” puede localizarse el gen responsable de determinada enfermedad (Tabla-II). 2. El terapéutico. Pueden desarrollarse terapias génicas, en base a la corrección de secuencias que porten genes alterados, que posibiliten el tratamiento de determinadas enfermedades. Las células pueden modificarse genéticamente en un cultivo para, posteriormente, reinsertarlas (procedimiento “ex vivo”); pero también pueden tratarse directamente células o tejidos somáticos (procedimiento “in vivo”): Tabla-III. 3. El farmacológico. La ingeniería genética está posibilitando la producción a gran escala de proteínas con interés farmacológico: insulina, hormonas, factores de coagulación, etc. (Tabla-IV). Para ello, basta insertar -como hemos visto- las secuencias responsables en plásmidos, YACs o BACs para su clonación en organismos transgénicos (bacterias, levaduras, plantas o animales). Ahora bien, los avances que el PGH y la “big-science” están brindando a la Ciencia, no están exentos de ciertos riesgos en su aplicación. La clonación de embriones o la experimentación con sus células troncales son algunos de esos potenciales peligros a los que deben hacer frente, bajo la perspectiva de la ética, biólogos y filósofos, pero también: economistas, sociólogos, médicos, teólogos, juristas,… Ante las alarmantes posibilidades abiertas en la experimentación con seres humanos, surgió una nueva disciplina: la Bioética. Aunque este tema se tratará, con más detalle, en capítulo aparte, adelantemos una breve reflexión. Por más rentable que resulte para las compañías biotecnológicas, en modo alguno resulta lícito experimentar con seres humanos, ni hacer con nuestro ADN todo tipo de quiméricas y aberrantes investigaciones. En relación con ello, cabe detallar los objetivos que, para el periodo 1998-2003, se planteaba el programa internacional ELSI. Recordemos que el “Ethics, Legal and Social Implications” figuraba entre los objetivos que el PGH se marcaba en 1988. 1. Examinar todo lo relativo a la complejidad de las secuencias del ADN humano y la variación genética en el hombre. 2. Examinar todo lo que se refiera a la integración de las nuevas tecnologías y su utilización con fines clínicos y salud pública. 3. Examinar todo lo que se refiera a la integración del conocimiento sobre genómica e interacciones de genes y medio ambiente en objetivos no clínicos. 4. Explorar cómo el conocimiento genético puede inferir con una variedad de conceptos filosóficos, teológicos y perspectivas éticas. 5. Explorar factores raciales, étnicos y socio-económicos que afectan al uso, comprensión e interpretación de la información genética, uso de servicios genéticos y desarrollo de normas jurídicas. 2.-Genoma del arroz ( 1994-1995 ) Se ha logrado desvelar la secuencia completa del genoma del arroz mediante un ,el cual revela un genoma que consta de alrededor de 450 millones de bases de ADN, distribuidas en 37.544 genes de los 12 cromosomas del arroz. Este estudio se realizó en Tsukuba, una de las varias ciudades científicas del Japón, en la cual se levanta un moderno edificio de cinco plantas que alberga a los investigadores del Programa Japonés de Investigación del Genoma del Arroz. El proyecto lleva ya muchos años funcionando, con 53 científicos dedicados al mismo, siendo fruto de la colaboración entre la industria y la Administración, con un presupuesto anual equivalente a unos 660 millones de pesetas. En 7 años se espera tener completa la secuencia del genoma, con sus 12 cromosomas y sus 450 millones de pares de bases. Con ello se posibilitará aislar y caracterizar genes importantes agronómicamente que pueda conducir a la obtención de variedades más robustas y productivas. Ya se está trabajando sobre el gen Se-1, que determina el momento del florecimiento en la planta, así como sobre el gen Xa-1 relacionado con la resistencia frente a bacterias. También sobre el gen Xa-1, que tiene que ver con la resistencia frente a bacterias. Hasta ahora las miles de secuencias ya dilucidadas del conocido como cADN se han puesto a disposición de los científicos de todo el mundo, a través de los bancos públicos de datos genéticos existentes. El genoma del arroz ya es, formalmente, el segundo en la historia de la investigación en biología vegetal que ha sido completamente secuenciado tras el de la planta modelo Arabidopsis thaliana. Pero es el primero de cuya carga genética se espera extraer la base científica necesaria para impulsar el conocimiento de las claves fisiológicas que explican el crecimiento y desarrollo de un alimento fundamental para la supervivencia de 800 millones de personas, además de establecer líneas maestras sólidas para investigar en nuevas variedades más resistentes a condiciones climatológicas adversas o con mayor productividad. La secuenciación completa del genoma del arroz ha sido posible gracias a la participación de centenares de investigadores de 10 países, con Japón (que ha aportado el 55% de la secuencia), China (10%) y Estados Unidos (18%) a la cabeza. Francia, India, Taiwán, Corea del Sur, Brasil, Tailandia y el Reino Unido, completan la lista de participantes en el IRGSP, un consorcio puesto en marcha en 1998 y que, en apenas cuatro años, seis menos de lo previsto, ha logrado un objetivo comparable por su complejidad a la secuenciación del genoma humano. La secuencia establece que el genoma del arroz contiene 400 millones de pares de bases químicas (los componentes fundamentales del ADN) y entre 40.000 y 60.000 genes, cifra que podría doblar al número de genes contenido en el genoma humano (entre 30.000 y 40.000, según diversas estimaciones). El grado de confianza o de "cobertura" de la secuencia es, en términos científicos, de "10x" (10 lecturas completas del genoma), nivel que limita la presencia de errores a menos de uno por cada 10.000 bases químicas. Y este genoma presenta multitud de aspectos comunes con el estudio del genoma humano, no en cuanto a su estructura, pero sí en cuanto al desarrollo de su estudio y a la importancia que ,en su medida ha ido tomando Público contra privado Como ya ocurriera con el genoma humano, en el caso del arroz se ha dado una carrera espectacular entre investigadores de los sectores público y privado para lograr descodificar su código genético. Si en el humano fue la empresa Celera, dirigida por aquel entonces por Craig Venter, la que lideró al sector privado, mientras que en el público se integraban investigadores de prácticamente todo el mundo, en el del arroz ha pasado prácticamente lo mismo. Syngenta, en colaboración con investigadores del Instituto de Genómica de Pequín, han impulsado un primer borrador que se publicó en la revista Science el pasado mes de abril. El consorcio público IRSGP, en el que participan empresas del sector como Monsanto, anunció la disponibilidad de su base de datos "para finales de año", como finalmente así ha sido. Pero no acaban aquí las coincidencias. El sector privado ha utilizado para la secuenciación del genoma del arroz el mismo método que utilizó Venter para el humano, el denominado shotgun, consistente en 'romper' la cadena de ADN en miles de pedazos para reconocer con mayor facilidad las 'letras' de cada fragmento, para ensamblar posteriormente mediante robots informáticos cada uno de ellos. Por el contrario, el IRSGP ha empleado un método similar al del consorcio público del genoma humano. Según distintos expertos consultados, el primer método, aunque mucho más rápido, presenta un índice de errores más elevado. Asimismo, su nivel de cobertura es menor, por lo que la asignación de 'letras genéticas' a genes o a grupos de secuencia reales es también menor. Las coincidencias se extienden también a la accesibilidad de los datos obtenidos. Desde el sector privado, la posibilidad de consulta ha quedado restringida, tras múltiples presiones, a grupos de investigadores concretos que acceden a las bases de datos mediante la firma de convenios económicos. En el público, en cambio, las bases de datos están disponibles online desde el primer momento a científicos de todo el mundo, incluidas las de la compañía Monsanto que ha aportado entre el 25% y el 30% de los genes secuenciados, así como información de un primer borrador obtenido por esta compañía en 2000. En la actualidad, ambos sectores han iniciado un proceso de acercamiento para compartir y difundir conjuntamente sus informaciones respectivas. Secuencia estratégica La secuencia del genoma del arroz está considerada estratégica no sólo por el conocimiento científico que genera, sino también por las enormes repercusiones económicas que implica. No en vano, se calcula que un tercio de la humanidad se alimenta diariamente con las distintas variedades existentes y que al menos 800 millones de personas subsisten gracias a él, especialmente en países del continente asiático. Pero es que, además, el genoma del arroz se ha definido también como el del primer alimento vegetal modelo. Su conocimiento podría aclarar similitudes y diferencias respecto de las funciones de genes de multitud de cereales empleados como alimento o como base para su elaboración. Este es el caso del maíz, trigo, cebada, sorgo o mijo, además de la caña de azúcar. Del mismo modo, el conocimiento del código genético permitirá abrir la puerta para establecer los genes que regulan no sólo la expresión de proteínas de interés alimentario, sino también aquellos que participan del crecimiento, desarrollo y adaptación del vegetal a distintas condiciones ambientales. Por ejemplo, el nivel de tolerancia a sales, uno de los principales factores limitantes en los deltas donde se cultiva el arroz; las necesidades hídricas de la planta, la resistencia a enfermedades o a plagas vegetales o la fijación del nitrógeno, fundamental para reducir la presencia de abonos químicos. Todas estas opciones deberían permitir la obtención de vegetales mejorados genéticamente para incrementar su resistencia a condiciones adversas o incrementar su productividad con el menor coste ambiental posible. De la misma manera, abre la posibilidad de introducir con mayor eficacia genes de interés sanitario como en el caso del arroz dorado, variedad transgénica ideada para combatir déficits en el aporte de pro vitamina A en países del sudeste asiático, así como de otras variedades actualmente en estudio que pretenden aumentar el aporte de minerales esenciales como el hierro. Así como el Proyecto del Genoma Humano ha revolucionado la biología, el genoma del arroz promete inspirar nuevas líneas de investigación respecto a los cereales. Este es un importante paso hacia adelante para la agricultura. Como dato apuntar que pese a que España es uno de los principales productores de arroz en el continente europeo, su participación en la secuencia del genoma del arroz ha sido nula, como es normal en muchos de estos estudios .La ausencia de España en la investigación del genoma del arroz es comparable a su nula participación en la del genoma humano. La ciencia española perdió entonces la oportunidad de engancharse al tren científico internacional pese a disponer de una generación de investigadores reconocida internacionalmente sobre todo en el ámbito biomédico. Ern el ámbito vegetal, aunque el número de investigadores es inferior, existe suficiente nivel y capacidad tecnológica como para haber participado del proyecto como ya se hiciera con la secuenciación de la planta modelo, Arabidopsis thaliana, en la que dos grupos (uno de Valencia y otro de Barcelona) aportaron secuencias genéticas al cómputo global. La ausencia española, según distintos expertos, se traducirá en la falta de acceso a información básica para investigación y en el pago de royalties tanto en el uso de la tecnología generada como para la obtención de conocimiento. Es lo que, en términos científicos, se conoce como dependencia tecnológica. -Cromosoma 1 del genoma del arroz : Mapa genético para cada cromosoma del arroz (Chr 1 – 12) en el lado izquierdo y los segmentos contiguos PAC/BAC a la derecha. La posición de los PAC/BAC es mostrada en verde. La escala de los mapas estimada en centimorgans (cM). Tomado de Nature 436:793-800. 3.-Genoma del chimpancé La secuencia del genoma del chimpancé muestra que comparte un 96% con el humano Un consorcio de 67 investigadores procedentes de cinco países publica en la revista 'Nature' el borrador del genoma del chimpancé Portada de la revista 'Nature' donde se publica el borrador de la secuenciación del -El 96% del ADN de estos animales es similar al de los humanos -El análisis comparado de los dos genomas puede ser una fuente de nuevos descubrimientos con implicaciones para la salud humana Clint, un chimpancé de 24 años, murió el año pasado de insuficiencia cardiaca. Su nombre y su diagnóstico pasarían inadvertidos de no ser porque su sangre es la que se ha utilizado para el análisis y secuenciación por primera vez del genoma del chimpancé. Hoy la revista 'Nature' publica el primer borrador con el ADN de este tipo de primates que comparten con el humano el 96% del material genético. Para hacernos una idea más clara: el número de diferencias genéticas entre los humanos y los chimpancés es aproximadamente 60 veces menor que entre los humanos y los ratones y unas 10 veces menos que entre los ratones y las ratas. Al mismo tiempo, la cantidad de disparidades genéticas entre un hombre y un chimpancé es unas 10 veces más que entre dos personas cualesquiera. De hecho, ambos genomas son casi un 99% idénticos si no se tienen en cuenta en el análisis ciertos aspectos del ADN que se han reorganizado de forma distinta en las dos especies. Pero si se consideran las sustituciones de nucleótidos o bases, que difieren en el 1,23%, y otras variaciones como las repeticiones que ocurren en casi el 3%, las similitudes entre las secuencias de ADN de ambas especies sólo llegan al 96%. Casi un monográfico dedica 'Nature', a este primate. Además de los datos de la secuenciación del genoma de este animal, la revista publica cuatro artículos sobre el 'Pan troglodytes' o chimpancé común: la cultura, el comportamiento, la psicología y la evolución neurológica. En el primer borrador del genoma del chimpancé han participado 67 investigadores procedentes en su mayoría del Instituto de Tecnología de Massachusetts, de la Universidad de Harvard y de la de Washington. Otros centros que también han participado en el trabajo proceden de otros países como Israel, Italia, Alemania y España. Cuánto nos diferenciamos "La secuenciación del genoma del chimpancé es un logro histórico que está destinado a encabezar un gran número de descubrimientos con implicaciones para la salud humana", ha declarado el doctor Francis S. Collins, director del Instituto para la Investigación del Genoma de EEUU. Esta secuenciación representa la primera de un genoma de primate no humano y la cuarta de un mamífero (antes fue la del hombre, ratón y rata). El primer borrador de la secuenciación del genoma humano se publicó en febrero de 2001, aunque el texto con todo el genoma vio la luz en octubre de 2004. Los datos nos dicen que el ADN de este animal difiere de nuestra información genética sólo en un pequeño porcentaje: un 4%. Sin embargo, esa cifra significa que lo que nos aleja de estos primates son 35 millones de bases diferentes (las letras que conforman la estructura de ADN) y muchas variaciones cromosómicas. "Todavía no tenemos en nuestras manos la respuesta a la mayoría de las cuestiones fundamentales como '¿Qué nos hace humanos?'. Pero esta comparación genómica nos acerca increíblemente a la búsqueda de las claves Las muestras de sangre del chimpancé Clint son las que han utilizado los científicos para biológicas sobre las diferencias entres especies", explica el doctor Robert Waterston, catedrático del secuenciar el genoma. (Foto: 'Nature') departamento de ciencias genómicas de la Universidad de Washington en Seattle, EEUU. Existe una opinión común en todos los científicos de que estos datos son el primer paso para un gran número de futuras investigaciones que nos permitirán conocer más profundamente lo que nos aparta de esta especie, qué particularidades hemos desarrollado y qué parte de nuestro genoma influye más en ciertas patologías propias del ser humano. La mayor divergencia encontrada hasta el momento entre el cromosoma del chimpancé y el humano es para el cromosoma Y la menor para el cromosoma X. Los nuevos datos indican que el cromosoma Y de este primate se está quedando atrás, mientras que el humano ha mantenido su 'status quo' a lo largo de seis millones de años. Las mutaciones acumuladas en el cromosoma Y del chimpancé le están haciendo menos útil. Sin embargo, no se sabe por qué se han creado estas diferencias entre ambas especies. Según los investigadores que han analizado este cromosoma, afirman que los nuevos estudios sugieren que en el humano el cromosoma es capaz de limpiar por sí mismo los errores genéticos por un proceso que denominan 'selección purificadora'. "Estos resultados sugieren que la 'selección purificadora' del cromosoma Y ha sido más eficaz durante la reciente evolución humana de lo que previamente se suponía", concluyen los autores Particularidades genéticas Los investigadores han detectado que unos cuantos genes han cambiado inusualmente más rápido tanto en humanos y chimpancés que en otros mamíferos. Entre estos genes se encuentran los involucrados en la percepción de los sonidos, la transmisión de las señales nerviosas, la producción de esperma y el transporte celular de los iones o moléculas con carga eléctrica. En cambio, se han localizado otros genes que parecen haber evolucionado más rápido en humanos que en chimpancés. Entre éstos se encuentran aquellos que codifican los factores de transcripción, que son moléculas que regulan la actividad de otros genes y que juegan un papel clave en el desarrollo embrionario. La aportación del grupo español, dirigido por Carlos López Otín, catedrático de Bioquímica de la Universidad de Oviedo, ha estado dirigida en torno al análisis de 1.000 genes seleccionados por su relevancia en enfermedades humanas y, fundamentalmente, en el cáncer. Se han detectado más de 50 genes presentes en el hombre que han desaparecido total o parcialmente del genoma del chimpancé. Entre éstos se encuentran tres genes que están involucrados con la inflamación y que posiblemente puedan explicar algunas de las diferencias entre las dos especies respecto a la respuesta defensiva e inflamatoria de ambos organismos. Por otro lado, los primates cuentan con un gen, que ha desaparecido en los hombres, y que produce una proteína que ayuda a protegerles del Alzheimer. "Esto representa justo la punta del iceberg de lo que queda por explorar del origen genómico de nuestras diferencias biológicas", ha declarado LaDeana W. Hillier, del Centro de Secuenciación del Genoma de la Universidad de Washington. "Dado el poco tiempo desde que se separaron los humanos y los chimpancés, es probable que algunas mutaciones de gran efecto sean responsables de parte de las actuales diferencias -fenotípicas- que separan a los humanos de los chimpancés y de otros simios mayores", afirman Wen-Hsiung Li y Matthew A. Saunders, del departamento de ecología y evolución de la Universidad de Chicago, Illinois (EEUU). Una ayuda a la comparación genómica El borrador del genoma del chimpancé es una pieza más en la lista de los genomas de vertebrados secuenciados. Junto con el genoma humano, será el más útil para comprender la biología y evolución humana. Pero los datos todavía dejan muchas preguntas sin contestar. El doctor Evan Eichle, profesor asociado de ciencias genómicas en la Universidad de Washington y principal autor de uno de los estudios que pública 'Nature', ha sido el responsable del primer análisis que compara el genoma del chimpancé y el humano. Los datos muestran que una parte importante de las divergencias entre ambos genomas se encuentra en una región del ADN que antes se pensaba que no tenía función, y que ahora se sabe que está involucrada en la regulación o duplicación. Cinco millones de estos trozos de ADN, o un 1,23%, difieren debido a la inserción o destrucción de algún nucleótido o letra del AND. Alrededor del 33% de los segmentos duplicados del hombre son específicos para el humano. Estos segmentos pueden moverse a regiones diferentes del genoma. En el hombre, hay alrededor de 7.000 elementos 'transportables' frente a los 2.300 encontrados en el chimpancé, lo que indica que estos elementos han sido menos activos en estos primates. Además, muchos de los genes situados dentro de los segmentos duplicados del genoma, (específicos para cualquiera de las dos especies, chimpancés o humanos) se expresan de forma diferente en cada una. O lo que es lo mismo, en cada especie se utiliza de distinta forma la información genética para las estructuras y funcionamiento de las células. Las investigaciones que se avecinan irán enfocadas a la confirmación de algunas de las hipótesis que actualmente se plantean los científicos. Como la de 'menos es más', es decir, la pérdida de algunas características específicas a los primates se corresponden con rasgos humanos como la pérdida de vello corporal. Otra teoría es la que baraja la posibilidad de que la evolución del chimpancé al hombre se debe a aquellas regiones del ADN en las que se produce la duplicación. Sin embargo, ésta es la más difícil de comprobar 4.-Genoma del Ratón Humanos y ratones somos parecidos Ambas especies poseen 30.000 genes, el 80% es idéntico; el trabajo se anuncia hoy en Nature · La decodificación del genoma de los roedores estuvo en manos de un consorcio internacional · Afirman que servirá para entender el genoma humano Suele decirse que el perro es el mejor amigo del hombre... pero cuando el humano en cuestión pertenece a la especie del investigador biomédico, bien podría afirmarse que ese lugar lo ocupa el ratón de laboratorio: él acapara su atención día tras día, sobre él experimenta y de él obtiene muchos de sus conocimientos. Por eso, el anuncio de que se acaba de secuenciar más del 95% del genoma de Mus musculus adquiere una trascendencia especial: dadas las similitudes que existen entre el genoma de estos roedores y el humano, los 25 mil millones de letras químicas del código genético del ratón se consideran algo así como una piedra Rosetta de la genética, un diccionario que permitirá traducir y entender el libro de la vida de los seres humanos. "Es un avance importantísimo -afirma Alberto Kornbliht, investigador de la Facultad de Ciencias Exactas de la UBA-. No sólo es el segundo mamífero cuya secuencia se completa, sino también un modelo de genética, de fisiología, de comportamiento, en el que se pueden bloquear genes fácilmente, generar animales transgénicos... Se diría que es el tubo de ensayo que permite investigar sobre muchas condiciones humanas. Y si este avance adquiere importancia como punto de comparación, también la tiene para entender la relevancia de los experimentos que se venían haciendo hasta ahora." Un ejército enjaulado Cada día, alrededor de 25 millones de ratones ayudan a los investigadores de todo el mundo a diseñar tratamientos para dolencias humanas, incluyendo el cáncer, las cardiopatías, el HIV y la malaria. Una buena medida de la trascendencia de este avance la ofrece el interés de los propios investigadores: en los últimos seis meses, el buscador Ensembl del Instituto Europeo de Bioinformática recibió 2,6 millones de pedidos de información detallada acerca del genoma del ratón y 3,2 millones acerca de la secuencia humana. La historia de esta hazaña comenzó entre 1998-99, cuando los Institutos Nacionales de Salud de los Estados Unidos publicaron un plan de acción para descifrar la genómica del ratón que llamaba a completar un boceto de la secuencia genética de los roedores para 2003. El consorcio científico internacional que se formó desde entonces acaba de llegar a la meta. El producto de su trabajo conforma una enorme biblioteca de uso libre que contiene secuencias químicas. El análisis de este texto arroja algunas conclusiones notables. Por ejemplo, que hay un equivalente ratonil de casi cada gen humano -el 99%-. Todo indica que, en el idioma de los genes, no hay mucha diferencia entre los ratones y los seres humanos. Ambos tenemos alrededor de 30.000, pero sólo 300 son propios de cada especie. Es más, los humanos hasta tenemos genes para construir una cola . "El 80% de los genes del ratón es idéntico a los humanos", explicó Eric Lander, director del Whitehead Institute Center for Genomic Research, de Cambridge, Massachusetts. Precisamente, se reconocieron 1200 nuevos genes humanos a partir de la comparación con el genoma del ratón. Pero hay diferencias. Se descubrió que los ratones tienen muchos más genes relacionados con el olfato y el apareamiento que las personas. Además, el genoma del ratón es más corto que el nuestro: el primero posee dos mil quinientos millones de letras químicas, comparado con dos mil novecientos millones del último. Según escribe en Nature Joseph Nadeau, de la Case Western Reserve University, en un artículo de análisis, los ratones vienen siguiendo al ser humano en un viaje de 10.000 años alrededor del mundo como Passepartout seguía a Phileas Fogg. Pero estos animalitos se transformaron en algo más que compañeros de viaje cuando, en 1909, el genetista Clarence Cook Little comprendió que colecciones de roedores genéticamente homogéneos podrían transformarse en un poderoso recurso de la investigación biomédica. Compañeros inseparables En las dos últimas décadas, estos ratones se transformaron en una herramienta fundamental para los científicos. En primer lugar, porque son mamíferos, de modo que se pueden establecer con ellos innumerables paralelismos fisiológicos, anatómicos y metabólicos. Según escribe Allan Bradley, del Wellcome Trust Sanger Institute, de Cambridge, "a pesar de que las diferencias anatómicas entre los humanos y los ratones parecen notables (...), el análisis detallado de tejidos, órganos y células revela muchas similitudes, que se extienden a los sistemas de órganos, reproducción, comportamiento y enfermedades". Desde este punto de vista, el ratón es un espejo que refleja con precisión la biología y patología de las personas, el desarrollo embrionario, el metabolismo de las enfermedades y el comportamiento del cáncer. Por otro lado, la manipulación genética en el ratón vivo es moneda corriente y los investigadores están en condiciones de realizarla con extraordinaria precisión, algo que sería impensable en humanos. Las lesiones genéticas infligidas a los ratones permiten explorar en detalle diversas patologías. "En un nivel muy fundamental, ahora tenemos una lista de partes del ratón. Algunas, las unidades de transcripción, son los elementos que mejor entendemos - afirma Mark Boguski, del Fred Hutchinson Cancer Research-. Hasta ahora habíamos estado disparando en la oscuridad” 5.-Genoma de la planta Aranoseque Completan mapa genético de una planta LONDRES, Inglaterra. (Reuters). – Después de seis años de un intenso esfuerzo multinacional, científicos anunciaron haber terminado de recorrer el mapa genético de una planta, en un logro que podría conducir a una ‘‘revolución verde’’ para la producción de cultivos más fuertes, lo que también abre la perspectiva para el tratamiento de algunas enfermedades que afectan al ser humano. No lo parece, pero la secuencia del genoma de la pequeña hierba Arabidopsis thaliana, o mastuerzo tales, y sus casi 26 mil genes, dibujan el capítulo verde en el libro de la vida y constituyen una guía para un mejor entendimiento de todas las plantas. De acuerdo con los científicos, conocer cómo funcionan los genes de las plantas conducirá a cultivos más vigorosos y nutritivos, a alimentos de mejor sabor y mayor duración, y a una nueva perspectiva sobre las enfermedades humanas y cómo tratarlas. ‘‘Las secuencias del genoma cambian la forma en que practicamos la biología. De ahora en adelante la ciencia de las plantas nunca será la misma y la genética nunca será la misma’’, dijo ayer en conferencia de prensa el profesor Mike Bevan, del centro de investigación John Innes, de Inglaterra. Junto al genoma humano y los mapas genéticos de la levadura, la lombriz del grupo nemátodos, la mosca mediterránea y varias bacterias, Arabidopsis es un organismo modelo que según los científicos incrementará el conocimiento sobre el ser humano y el mundo en que vivimos. Hasta 300 científicos de Europa, Estados Unidos y Japón trabajaron en la iniciativa del genoma Arabidopsis, que tuvo financiamiento público y costó cerca de 60 millones de dólares. La secuencia de los tres últimos cromosomas, que fue publicada en la más reciente edición de la revista Nature, es el resultado de cuatro años de investigaciones. Los primeros dos cromosomas fueron representados gráficamente hace un año. El genoma de Arabidopsis, con cerca de 26 mil genes, es muy compacto pero contiene muchos de los genes de cultivos como el trigo, el arroz y la cebada, así como otros muy relacionados con genes humanos vinculados a la sordera hereditaria, la ceguera y varios tipos de cáncer. Una cuarta parte de los medicamentos que se producen actualmente se deriva de plantas y por eso los científicos creen que Arabidopsis podría ofrecer pistas sobre nuevos remedios y tratamientos. El genoma Arabidopsis es dos veces mayor que el de la mosca mediterránea, pero es solo una fracción del tamaño del genoma humano, que tiene de 60 mil a 100 mil genes, 97% de los cuales ya ha sido representado. Los científicos creen que la representación del genoma de la planta tiene una importancia similar, si no mayor, al del genoma humano. ‘‘Si usted toma una perspectiva del ecosistema es definitivamente más importante que el genoma humano’’, dijo Ottoline Leyser, de la Universidad de York, quien trabajó en el proyecto. ‘‘Si usted quiere mejorar los ecosistemas o la salud humana tiene que comenzar con el genoma de la planta’’, agregó. La belleza de la Arabidopsis, una delgada pariente de la planta de mostaza y la col, que se encuentra cerca de los raíles y en campos y jardines de todo el mundo, es que crece rápidamente y completa su ciclo de vida en seis semanas. También es más fácil de clonar para los científicos y es menos costoso realizar la secuencia de sus genes, en comparación con otros más grandes. La Arabidopsis ha sido descrita como la central eléctrica del mundo de las plantas; los científicos la adoran porque es fácil de estudiar. Hasta ahora solo se conoce la función del 10% de los genes de la planta, pero ya le está ofreciendo nueva información a los biólogos. ‘‘Esta planta tiene un gran número de sorpresas para los científicos’’, dijo Bevan. ‘‘Nuestro análisis muestra que hay cerca de 100 genes en la Arabidopsis que están muy vinculados a genes de enfermedades humanas. Enfermedades como sordera, ceguera y cáncer’’. Además de ofrecer muchos nuevos genes para estudiar, el genoma de la planta puede ayudar a los científicos a responder preguntas y calmar los temores públicos sobre organismos genéticamente modificados y cómo interactúan con otras plantas. 6.-Genómica de las bacterias -LOS CROMOSOMAS DE LAS BACTERIAS: ORGANIZACIÓN EN DOMINIOS La información hereditaria de las bacterias se encuentra fundamentalmente en un único cromosoma consistente en una molécula de ADN doble hélice circular. El tamaño de esta molécula varia según la especie bacteriana de 0,1 x 10 9 a 8 x 109 dalton. Una de las bacterias más estudiadas desde el punto de vista genético es Escherichia coli cuyo ADN mide 1.100 de longitud y tiene 3.200.000 pares de nucleótidos. E. coli dividiéndose (nucleoides en el centro) La circularidad del cromosoma de E. coli se demostró mediante estudios genéticos de construcción de mapas de tiempo mediante la técnica de la conjugación interrumpida (Jacob y Wollman, 1958). Sin embargo, la primera evidencia citológica de la circularidad del cromosoma de E. coli se obtuvo más tarde (Cairns, 1963) marcando radiactivamente el ADN, realizando una auto radiografía y analizando los resultados al microscopio óptico. F. Jacob E. L. Wollman J. Cairns ADN circular en E. coli (replicación) 7.-Genoma del Perro El genoma del perro tiene unos 20.000 genes, poco menos que el ser humano. Así ha sido publicado en la revista «Nature». Este descubrimiento ayudara a mejorar no solo la comprensión de las enfermedades de los canes, sino también la del hombre. El ADN y secuencia se logro gracias a la intervención de una hembra bóxer llamada Tasha (foto), hasta antes de la investigación, solo se había descifrado un 75 por ciento del genoma de un perro macho, pero con una calidad menor: El equipo, liderado por Kerstin Lindblad-Toh del Instituto Broad de Boston, descifró alrededor de 2,400 millones de nucleótidos de ADN en los 39 cromosomas de Tasha. Los perros son interesantes para los genetistas porque viven en el mismo ambiente que los seres humanos. Casi igual que sus dueños, los canes sufren cáncer, problemas cardíacos y circulatorios, así como una serie de otras enfermedades, lo que le da a los científicos la posibilidad de investigar en el perro determinados males muy comunes entre las personas. Alrededor del cinco por ciento del genoma representa del perro, según los primeros análisis, son similares en el ser humano, en el perro y en el ratón. Posiblemente sean muy similares en todos los mamíferos, señalaron los científicos. El análisis del genoma presentado en “Nature” también ayudará a comprender la evolución de los perros, a determinar diferencias entre las distintas razas y también sus pros y contras para las necesidades humanas, así como la propensión a enfermar. Desde que el perro, un descendiente de los lobos asiáticos, se convirtió (hace al menos 15.000 años) en un animal doméstico, los criadores han desarrollado varios cientos de razas. El que fuera cazador, guardián o ayudante del ser humano se convirtió cada vez más en un perro faldero. Hoy existen en el mundo cerca de 400 millones de perros de compañía. 8.-Genoma de la caspa El Malassezia globosa es el hongo que produce la mayoría de los casos de caspa en el cuero cabelludo, 300 veces más pequeño que el genona humano y con apenas 4.285 genes. El descubrimiento del genoma del hongo ha sido posible gracias al trabajo de un equipo internacional, dirigido por Thomas L. Dawson, de la Universidad de Ohio (EEUU) en colaboración con expertos de la multinacional Procter&Gamble. El Malassezia globosa vive y se alimenta de piel humana, concretamente del sebo que se genera para proteger e impermeabilizar el pelo y la dermis. El hongo produce ocho enzimas lipasas y tres fosfolipasas. Las lipasas son las que metabolizan las grasas que secretan las glándulas sebáceas del cuero cabelludo. Así es como se crea un compuesto de ácido oleico que provoca un aumento del ritmo al que mueren las células, que caen en grandes bloques. Es lo que conocemos como caspa Las fosfolipasas son las que digieren el aceite del cuero cabelludo. Si en una persona sin este problema, la renovación celular se produce cada mes y por tanto no llega a verse la caspa, en las personas con un exceso de este hongo tiene lugar cada 15 días, generando la insidiosa capilla blanquecina -Número de cromosomas de distintas especies Todas las especies animales y vegetales tienen un número de cromosomas constante y determinado que constituyen su cariotipo (ley de la constancia numérica de los cromosomas) El número de cromosomas de la distintas especies es muy variabale, p.e.: Ser Humano ( Homo sapiens) ---- 46 cromosomas Chimpancé ---- 48 cromosomas Gorila---- 46cromosomas Perro---- 78 cromosomas Gato---- 38 cromosomas Caballo---- 66 cromosomas Abeja---- 16 cromosomas Pato ---- 80 cromosomas Paloma ---- 80 cromosomas Maiz ---- 20 cromosomas Guisante ---- 14 cromosomas Mosca de la fruta ---- 8 cromosomas Ascaris megalocephala ---- sólo 2 cromosomas Cebolla ---- 16 cromosomas Drosophila melanogaster ---- 8 cromosomas Bibliografía -Wikipedia -Revista Nature -http://www.ucm.es/info/genetica -Artículo: Pérez-Almeida, I. y T. Ghneim-Herrera. 2006. AVANCES EN LA DISECCIÓN DEL GENOMA DEL ARROZ. Revista Digital CENIAP HOY Nº 12 septiembre-diciembre 2006, Maracay, Aragua, Venezuela. ISSN: 1690-4117 Depósito Legal: pp.200302AR1449 Sitio: www.ceniap.gov.ve. -Nociones básicas sobre el “Proyecto Genoma Humano” por Jesús Romero-Samper ( Anderson, Ch., 1994. NIH drops bid for gene patents. Science, 263: 909-910. Anderson, W.F., 1989. El tratamiento de las enfermedades genéticas. Mundo Científico, 6: 275-291. Anderson, W.F., 1995. Terapia génica. Investigación y Ciencia, noviembre 1995: 60-63. Arana, J., 2001. Materia, universo, vida. Ed. Tecnos, Madrid. Argüelles, J.C., 2002. El genoma humano. Un año después. Investigación y Ciencia, marzo 2002: 30-31. Ayala, F., 1980. Origen y evolución del hombre. Alianza Editorial, Madrid. Collins, F.S. et al, 1998. New goals for the U.S. Human Genome Project. Science, 282: 682-689. Crick, F., 1979. ¿Ha muerto el vitalismo? Antoni Bosch, Barcelona. D’Agostino, F., 1998. Bioetica, nella prospectiva della filosofia dil diritto. Torino. Elles, R. ed., 1996. Molecular diagnosis of genetic diseases. Humana Press. Jacob, F., 1977. La lógica de lo viviente. Una historia de la herencia. Ed. Laia, Barcelona. Jouve de la Barreda, N., 1994. Clonación y manipulación de embriones humanos. Tapia, 74: 47-52. Jouve de la Barreda, N., 1995. Polémicas de la manipulación del genoma humano. Anuario del Derecho Eclesiástico del Estado, vol. X: 447-461. Jouve de la Barreda, N., 1996. Avances en Genética y su utilización en la enseñanza no universitaria. Alambique, 10: 69-79. Jouve de la Barreda, N., 2001. Genoma Umano e nuova Biología. Emmeciquadro, SEED: Scienza Educaciones e Didactica, Euresis, Milan, 13: 7-20. Jouve de la Barreda, N., 2004. Biología, vida y sociedad. Antonio Machado Libros, Madrid. 187 pp. Jouve de la Barreda, N., Gerez Kraemer, G. y Saz Díaz, J., 2003. Genoma humano y clonación: perspectivas e interrogantes sobre el hombre. Ed. Universidad de Alcalá, Madrid. 176 pp. ) -Página : http://images.google.es/imgres?imgurl=http://mensual.prensa.com/mensual/contenido/2000/12/14/hoy/fot os/geno.gif&imgrefurl=http://mensual.prensa.com/mensual/contenido/2000/12/14/hoy/portada/index.htm &h=401&w=450&sz=87&hl=es&start=2&um=1&tbnid=AxrATqeHFmNzsM:&tbnh=113&tbnw=127&p rev=/images%3Fq%3D%2522genoma%2BArabidopsis%2522%26svnum%3D10%26um%3D1%26hl%3 Des