EL GENOMA ESTÁ GENE-CIFRADO, QUIEN LO GENE-DESCIFRARÁ…? Gabriela Olmedo Alvarez, Alejandro Sánchez y Juan Campos Guillén Departamento de Ingeniería Genética, CINVESTAV del IPN, AP 629 Irapuato, Gto. México, [email protected] RESUMEN El DNA es una larga cadena de instrucciones para la vida. Todos los seres vivos tienen DNA y las diferencias en las instrucciones codificadas en el DNA son lo que hace posible la gran diversidad de seres vivos. Las instrucciones en el DNA se llaman genes y, dependiendo del organismo, encontraremos cientos o miles de genes. El avance de la tecnología de secuenciación ha permitido conocer la secuencia de cada una de las cadenas de DNA de más de 100 bacterias, 200 virus, 30 hongos, algunas plantas, animales y el ser humano, es decir, conocemos el “genoma” de cada uno de estos organismos. Sabemos que el humano, por ejemplo, tiene unos 30,000 genes. El reto ahora es descifrar el significado de cada gen, es decir saber su función. La metodología para el estudio de los genes ha evolucionado enormemente a fin de abarcar el máximo o el total de genes de cada organismo. Una de estas metodologías es la de los “microarreglos”. En mi laboratorio utilizamos esta metodología para entender cómo en una bacteria llamada Bacillus subtilis se descifran las instrucciones del DNA. Un organismo no utiliza todos sus genes al mismo tiempo, sólo lee las instrucciones que requiere en un momento dado, extrayéndolas en forma de otra cadena llamada RNA. También es importante poder deshechar algunas de las instrucciones (RNA) cuando ya no se requieran. En mi laboratorio investigamos cuáles son los genes que B. subtilis copia a RNA durante su crecimiento, por cuanto tiempo los usa, y qué hace para deshechar el RNA cuando ya no lo necesita. INTRODUCCIÓN Conceptos generales: genes, genomas y proteínas. El cuerpo humano tiene 100 billones de células y cada célula tiene un juego completo de instrucciones genéticas que se encuentran en el DNA. Todo el DNA de cada célula representa un genoma. El genoma de distintas personas es muy parecido, todos tienen instrucciones para ser humanos. Otros organismos tienen sus propias instrucciones: hay genomas de maíz, genoma de gusano, genomas de bacteria, etc. ¿Cómo se almacena la información genetica en el DNA? El DNA codifica para las proteínas. Las proteínas son la fuerza de trabajo de las células. Hay miles de proteínas distintas y cada una tiene una función diferente. Las proteínas son cadenas de amino ácidos. Hay 20 amino ácidos distintos y cada uno tiene características fisicoquímicas distintas; dependiendo de el número, orden y tipo de amino ácido en cada proteína, ésta tendrá una forma, tamaño y función diferente. En el DNA se llama gen a un segmento que determina el número, orden y tipo de amino ácido para formar una proteína. Es decir cada gen tiene las instrucciones para sintetizar una proteína. Por ejemplo, si un organismo tiene 25,000 proteínas distintas, tiene también 25,000 genes. Todos los seres vivos usan el mismo código genetico basado en 4 letras (ACGT) para el DNA y 20 amino ácidos para las proteínas. Existe un “código universal” que hace posible deducir el orden de amino ácidos de una proteína a partir de la secuencia de DNA de cualquier organismo, por lo que no es necesario secuenciar cada proteína. De hecho esta “traducción” del DNA a proteína se hace actualmente de manera automatizada. La década de la secuenciación y el “Proyecto del Genoma Humano” Desde 1977 se describió por primera vez la metodología para “secuenciar” el DNA, es decir, para conocer el orden de las bases (A, C, G y T) en un segmento dado de DNA. Este método se ha automatizado y actualmente con una sóla máquina es possible conocer la secuencia de DNA de 1 millon de nucleotidos en un día. Esto hizo que en la pasada década se dedicara gran esfuerzo a tener la secuencia de genomas completos de muchos organismos,porsupuesto, incluído el humano.¿Que sabemos del genoma humano ahora que se ha secuenciado? Sabemos que tiene 2.85 billones de nucleótidos y que sólo el 1.5% tiene genes; no sabemos para que sirve lo demás. No sabemos tampoco cuál sea la función de la mayoría de los 30,000 genes que se encontraron. El reto es encontrar la manera de ordenar y catalogar esta vasta cantidad de información para que resulte útil. Se espera que haya un gran impacto de este proyecto en la medicina, pero sólo se ralizará en la medida en que conozcamos la función de los genes. La comparación de genomas como estrategia para entender la función de los genes. Tal vez nos preguntamos por qué invertir tanto dinero y esfuerzo en secuenciar el genoma humano si resulta tan difícil averiguar la función de cada gen. Entonces, ¿por qué seguir con el genoma del ratón, el caballo, la rana,…? Muchos otros organismos han sido también secuenciados dado que la simple comparación entre los genes de todos los organismos nos provee ya de información valiosísima sobre su función. En primer lugar, mientras más secuencias tenemos es más robusto el análisis estadístico que se puede aplicar. Las similitudes entre los genes de diferentes organismos refleja una relación evolutiva y además la conservación es un indicador de la importancia functional de una secuencia. Durante la evolución, ocurren cambios en el DNA (mutaciones) pero estos cambios sólo se toleran si no afectan la viabilidad del organismo. Las mutaciones en el material hereditario y la selección natural permiten el perfeccionamiento, adaptación y complejidad de los seres vivos. Por ejemplo, en un organismo unicelular, como una bacteria, hay genes que codifican para proteínas que le permiten a la bacteria “replicar su DNA’, es decir, copiar su DNA para poder pasarlo a las nuevas bacterias que reproduce. Seguramente que si se muta este gen esencial será el final de esta bacteria y por tanto no recuperaremos bacterias con esta mutación. Este gen tan importante debe estar conservado evolutivamente y esperaríamos encontrarlo en todos los seres vivos. Efectivamente, hay genes básicos que encontramos en todos los seres vivos. ¿Que esperaríamos de genes que cumplen finciones especializadas, por ejemplo, los genes que codifican para proteínas del sistema inmune o del nervioso? Desde luego que no los encontraríamos en organismos simples, pero podríamos buscarlos en los primeros animales que presentan ya sistema inmune o nervioso. Este es el caso de la manta raya ('Raja erinacea'), elegida rcientemente para secuenciar su genoma por tener un sistema inmune adaptativo similar al de los humanos, tener un sistema circulatorio cerrado y presurizado, y la mielinización del sistema nervioso (http://www.genome.gov/). La comparación de genes de esta manta raya con la de otros organismos superiores permitirá ubicar genes potencialmente importantes para el desarrollo del sistema inmune y nervioso. ¿A qué llamamos “expresión génica”? Prácticamente todas las células de un organismo multicelular contienen un juego de cromosomas completo y por tanto genes idénticos. Sin embargo, sólo algunos de estos genes se “encienden” mientras que otros se quedan “apagados”. La fracción de genes “encendidos” comprende lo que llamamos “expresión génica” y le confiere propiedades únicas a cada tipo de célula. El mecanismo de “encendido” de genes es la transcripción, que consiste en convertir la información del DNA comprendida en un gen a moléculas de “RNA mensajero” (RNAm). Estos RNAms se “traducen” para sintetizar proteínas, que a fin de cuentas son las que hacen casi todas las funciones críticas en la célula. Si conocemos cuales son los genes que se expresan en una célula, podremos deducir en qué proceso celular participa. Por ejemplo, si analizamos la expresión de diferentes genes de un humano podemos ver si se expresan en el pancreas, en cerebro o en hígado; podemos ver si se expresan en tejidos sanos o enfermos.. Podemos así formar grupos de genes específicos para cada tejido o condición. Los microarreglos nos permiten estudiar la expresión de muchos genes a la vez La enorme cantidad de secuencias de genes derivados de la década de la secuenciación forzó a buscar metodologías que permitieran estudiar simultaneamente cientos o miles de genes. Una de las metodologías más empleadas es la llamada de “microarreglos”. Permite a los científicos analizar la expresión de muchos genes de manera rápida y eficiente. Se basa en la habilidad de una molécula de RNAm de unirse específicamente al gen del cual se originó. Para hacer un “microarreglo” se ponen en un soporte, en forma ordenada, muestras de DNA de cada uno de los genes de un organismo. Un arreglo puede contener 4,500 genes (que serían todos los genes de una bacteria, como Bacillus subtilis) o hasta 24,000 genes (todos los de la pequeña planta Arabidopsis thaliana), y para para cada uno de los genes se conoce su identidad y posición con exactitud. Si detectamos la unión o “hibridización” del RNAm a varios de los genes ordenados en el soporte, sabremos que esos genes se “expresaron”. Con ayuda de una computadora se puede analizar la hibridización que ocurrió en cada gen y así tener un perfil de expresión de una célula. Por ejemplo, si queremos comparar la población de RNAm expresada en células en la condición “A” con la expresada en la condición “B”, purificamos por separado el RNA de las células en la condición “A” y “B”. Cada muestra de RNA se marca con un color distinto, usando una molécula que fluoresce en rojo para “A” y una que floresce en verde para “B”. El RNA marcado se pone en contacto con el DNA ordenado en el microarreglo, en donde cada RNAm se unirá sólo al DNA complementerio. El siguiente paso es detectar la fluorescencia roja (A) y la florescencia verde (B) y comparar las dos (Fig. 1). La mejor manera de comparar es superponer las imágenes con ayuda de la computadora (AB). Si no hay expresión se ve un círculo negro pues el DNA que está alli no fluoresce si no se le une RNA marcado. Si un gen se expresa tanto en A como en B se verá un círculo amarillo. No todo es tan sencillo como rojo, verde o amarillo, la computadora podrá darnos toda un rango de valores que nos permitirá conocer las diferencias en la cantidad de RNAm unido a cada muestra de DNA. Fig 1. La expression del RNAm se puede medir con “microarreglos” INVESTIGACION SOBRE SINTESIS Y DEGRADACION DEL RNA ¿Cómo se “apagan” los genes?¿ Y que pasa con el RNAm que se sintetizó? Ahora bien, ¿que pasa si cambiamos las células de la condición “A” a la condición “B”? Es obvio que ya no necesitará varios de los genes que expresó antes y requerirá expresar nuevos genes para adaptarse. Tendrán que “encenderse” nuevos genes, es decir se sintetizará nuevo RNAm de éstos. ¿Pero que hacer con el RNAm que se sintetizó en “A” y que ya no necesita en “B”? Las células cuentan con mecanismos que les permiten deshacerse de su RNA cuando ya no lo necesitan y pueden deshacerlo nucleótido a nucleótido a gran velocidad en un proceso llamado de degradación. El proceso de degradación del RNA utiliza proteínas especializadas llamadas RNasas. En mi laboratorio estudiamos cuanto tiempo dura un RNAm y cuáles son los mecanismos de degradación del RNA en la bacteria B. subtilis (Ver revisión sobre este tema de Condon), 2003). ¿Cuál es el tiempo de vida de un mRNA? ¿Cómo se estudia? La vida media del RNA es un parámetro que nos ayuda a estimar por cuanto tiempo es útil un RNA. Para medir este parámetro se determina, a partir de un tiempo dado, cuánto tiempo pasa para que quede la mitad de las moléculas que había en un inicio. Para ello se usa un antibiótico que evita la síntesis de nuevos RNAs y se parte entonces de los RNAs existents para tomar muestras cada cierto tiempo y determinar cuándo se obtiene la mitad del RNA que se tenía al principio del experimento. Los microarreglos son útiles para este tipo de experimento. Se toman muestras de RNA a diferentes tiempos después de añadir el antibiótico y el RNA se marca y se hibrida a tantos microarreglos como tiempos muestreados. La señal se cuantifica y se hace una gráfica para cada una de los genes para determinar el tiempo de vida de su RNAm. En B. subtilis encontramos desde RNAms que tienen una vida media de apenas uno o dos minutos (inestables) a los que tienen vidas medias de 15 minutos o más (estables). La Fig. 2 muestra la gráfica de un grupo de RNAms que muestran distinta vida media pero todos con una tendencia a ser estables en contraste con el grupo de RNAms que son inestables.. Figura 2. Uso de microarreglos para medir la vida media del RNAm ¿Cómo se degrada un RNA? El RNA es una molecula de cadena sencilla, por lo que puede doblarse sobre sí mismo y fomar estructuras secundarias que lo hacen sumamente difícil de degradar. Esto ocurre por dos razones, la primera, porque a medida que una RNAsa va degradando uno a uno los nucleótidos debe ir deshaciendo la estructura secundaria, y segundo, porque las nucleases que degradan desde el extremo final al RNA no pueden comenzar a degradar si no hay al menos un segmento accessible. En bacterias, para hacer el RNA accessible hay enzimas del tipo “polimerasa” que añaden nucleotidos, principalmente As, al final del RNA que se quiere degradar, para facilitar la unión de una RNasa que entonces comienza a degradar (Figura 3). Figura 3. Expresión genetica y mecanismo de degradación del RNA. CONCLUSION La década de la secuenciación de DNA abrió paso a la búsqueda de la función de miles de genes que prometen incrementar nuestro conocimiento sobre la biodiversidad y tener un fuerte impacto en la medicina actual. La metodología de microarreglos nos permite analizar simultáneamente miles de genes para poder obtener información que nos ayude a conocer la función de cada gen. BIBLIOGRAFÍA 1. C. Condon, “RNA processing and degradation in Bacillus subtilis”, Microbiol. Mol. Biol. Rev., Vol. 67, 2003, pp. 157-174. 2. J. Campos-Guillén, P. Bralley, G. H. Jones, D. H. Bechhofer y G Olmedo-Alvarez, “Addition of poly(A) and heteropolymeric 3’ ends in Bacillus subtilis wild-type and PNPase-deficient strains,” J. Bacteriology, 2005, in press.