Función de los genes: el ADN y el código de la vida Después de que la ciencia de la genética se estableciera y de que se clarificaran los patrones de la herencia a través de los genes, las preguntas más importantes permanecieron sin respuesta durante más de cincuenta años: ¿cómo se copian los cromosomas y sus genes de una célula a otra, y cómo determinan éstos la estructura y conducta de los seres vivos? A principios de la década de 1940, dos genetistas estadounidenses, George Wells Beadle y Edward Lawrie Tatum, proporcionaron las primeras pistas importantes. Trabajaron con el hongo Neurospora y Penicillium, y descubrieron que los genes dirigen la formación de enzimas a través de las unidades que los constituyen. Cada unidad (un polipéptido) está producida por un gen específico. Este trabajo orientó los estudios hacia la naturaleza química de los genes y ayudó a establecer el campo de la genética molecular. Desde hace tiempo se sabe que los cromosomas están compuestos casi en su totalidad por dos tipos de sustancias químicas, proteínas y ácidos nucleicos. Debido en parte a la estrecha relación establecida entre los genes y las enzimas, que son proteínas, al principio estas últimas parecían la sustancia fundamental que determinaba la herencia. Sin embargo, en 1944, el bacteriólogo canadiense Oswald Theodore Avery demostró que el ácido desoxirribonucleico (ADN) era el que desempeñaba esta función. Extrajo el ADN de una cepa de bacteria y lo introdujo en otra cepa. La segunda no sólo adquirió las características de la primera sino que también las transmitió a generaciones posteriores. Por aquel entonces, se sabía que el ADN estaba formado por unas sustancias denominadas nucleótidos. Cada nucleótido estaba compuesto a su vez por un grupo fosfato, un azúcar conocido como desoxirribosa, y una de las cuatro bases que contienen nitrógeno. Las cuatro bases nitrogenadas son adenina (A), timina (T), guanina (G) y citosina (C). En 1953, el genetista estadounidense James Dewey Watson y el británico Francis Harry Compton Crick aunaron sus conocimientos químicos y trabajaron juntos en la estructura del ADN. Esta información proporcionó de inmediato los medios necesarios para comprender cómo se copia la información hereditaria. Watson y Crick descubrieron que la molécula de ADN está formada por dos cadenas, o filamentos, alargadas que se enrollan formando una doble hélice, algo parecido a una larga escalera de caracol. Las cadenas, o lados de la escalera, están constituidas por moléculas de fosfato e hidratos de carbono que se alternan. Las bases nitrogenadas, dispuestas en parejas, representan los escalones. Cada base está unida a una molécula de azúcar y ligada por un enlace de hidrógeno a una base complementaria localizada en la cadena opuesta. La adenina siempre se vincula con la timina, y la guanina con la citosina. Para hacer una copia nueva e idéntica de la molécula de ADN, sólo se necesita que las dos cadenas se extiendan y se separen por sus bases (que están unidas de forma débil); gracias a la presencia en la célula de más nucleótidos, se pueden unir a cada cadena separada bases complementarias nuevas, formando dos dobles hélices. Si la secuencia de bases que existía en una cadena era AGATC, la nueva contendría la secuencia complementaria, o "imagen especular", TCTAG. Ya que la "base" de cada cromosoma es una molécula larga de ADN formada por dos cadenas, la producción de dos dobles hélices idénticas dará lugar a dos cromosomas idénticos. La estructura del ADN es en realidad mucho más larga que la del cromosoma, pero se halla muy condensada. Ahora se sabe que este empaquetamiento se basa en diminutas partículas llamadas nucleosomas, sólo visibles con el microscopio electrónico más potente. El ADN está enrollado secuencialmente alrededor de cada nucleosoma formando una estructura en forma de rosario. Entonces la estructura se repliega aún más, de manera que las cuentas se asocian en espirales regulares. Por esta razón, el ADN tiene una configuración en espiral enrollada, parecida al filamento de una bombilla. Tras los descubrimientos de Watson y Crick, quedó el interrogante de saber cómo el ADN dirigía la formación de proteínas, los compuestos principales de todos los procesos vitales. Las proteínas no son sólo los componentes principales de la mayoría de las estructuras celulares, sino que también controlan casi todas las reacciones químicas que se producen en la materia viva. La capacidad de una proteína para formar parte de 1 una estructura, o para ser una enzima que influye sobre la frecuencia de una reacción química particular, depende de su estructura molecular. Esta estructura depende a su vez de su composición. Cada proteína está formada por uno o más componentes denominados polipéptidos, y cada polipéptido está constituido por una cadena de subunidades llamadas aminoácidos. En los polipéptidos hay veinte tipos distintos de aminoácidos. Al final, el número, tipo y orden de los aminoácidos en una cadena determina la estructura y función de la proteína de la que forma parte. Desoxirribonucleótidos Los nucleótidos estructurales del ADN; todos tienen como pentosa la 2'−desoxi−D−ribosa y difieren entre sí en función de la base nitrogenada, que posean, de la cuál reciben el nombre. Hay cuatro tipos de bases nitrogenadas que forman parte de los desoxirribonucleótidos: adenina, guanina (ambos derivados de la purina), citosina y timina (estos últimos derivados de la pirimidina). Así encontramos desoxirribonucleótidos de adenina, de guanina, de citosina y de timina. Hebras de ADN Los ácidos nucleicos son moléculas complejas producidas por la célula, esenciales para todos los organismos. Determinan el desarrollo del cuerpo y todas sus características, para ello almacenan información hereditaria y dirigen la síntesis de proteínas. Este modelo generado por ordenador muestra dos cadenas de ácido desoxirribonucleico (ADN) enrolladas en forma de doble hélice. Replicación o Duplicación del ADN Proceso mediante el cuál se sintetizan dos moléculas hijas de ADN de doble hélice a partir de un ADN progenitor, que actúa como molde. Por lo tanto tiene lugar en el núcleo, justo antes de la división celular (Mitosis). Empieza con la separación de las dos cadenas de polinucleótidos, cada una de las cuales actúa a continuación como plantilla para el montaje de una nueva cadena complementaria. A medida que la cadena original se abre, cada uno de los nucleótidos de las dos cadenas resultantes atrae a otro nucleótido complementario previamente formado por la célula. Los nucleótidos se unen entre sí mediante puentes de hidrógeno para formar los travesaños de una nueva molécula de ADN. A medida que los nucleótidos complementarios van encajando en su lugar, una enzima llamada ADN polimerasa los une enlazando el grupo fosfato de uno con la molécula de azúcar del siguiente, para así construir la hebra lateral de la nueva molécula de ADN. Este proceso continúa hasta que se ha formado una nueva cadena de polinucleótidos a lo largo de la antigua; se reconstruye así un nueva molécula con estructura de doble hélice. En la mayoría de las células eucariotas la replicación del ADN lleva finalmente a la mitosis, pero en las células reproductoras (espermatocitos y oocitos primarios) lleva a la meiosis. Existen varios tipos de replicación: conservadora, semiconservadora, y dispersora. Replicación conservadora del ADN Replicación en la que cada una de las hebras del ADN progenitor se duplica o replica, produciendo dos moléculas de ADN hijas una de las cuáles son la molécula de ADN progenitora intacta y la otra una molécula de ADN cuyas dos hebras son nuevas. Replicación dispersora 2 Replicación en la que las cadenas de ADN progenitoras se rompen a intervalos, y las dos moléculas de ADN de doble cadena resultante (moléculas hijas) presentan fragmentos del ADN progenitor combinados con nuevos fragmentos. Replicación semiconservadora Replicación en la que el ADN de doble hélice progenitor separa sus cadenas complementarias y cada una de ellas se replica sirviendo como molde para la síntesis de una cadena nueva complementaria, obteniéndose así dos moléculas de ADN hijas de doble cadena, y cada molécula hija tiene una de las cadenas que es la del ADN progenitor y la otra nueva, que ha sido sintetizada utilizando como molde la del progenitor. Este tipo de replicación es la propuesta por el modelo de Watson y Crick. Modelo de Watson − Crick Otra clasificación de la replicación se da basándose en la dirección en que se realiza a partir de un único punto de iniciación. Así existe una replicación unidireccional, que se realiza a partir de un punto de iniciación en una única dirección, es aquélla que se da en el ADN circulares de las mitocondrias y en los de muchos virus; y una replicación bidireccional, en la que a partir de un único punto de iniciación, las dos hebras de ADN progenitor se replican simultáneamente en dos direcciones hasta que ambos puntos de crecimiento se encuentran, momento en el cuál se separan las dos moléculas de ADN hijas; este tipo de replicación se da en los cromosomas eucariotas y en los cromosomas circulares procariotas pero el proceso de replicación es más complejo en los primeros, habiendo varios puntos de iniciación. La replicación del ADN se lleva a cabo por una serie de mecanismos enzimáticos. Ribonucleótidos Los nucleótidos estructurales del ARN. De modo semejante a los desoxirribonucleótidos constan de una molécula de ácido fosfórico, una molécula de pentosa, en este caso la D−ribosa y una base nitrogenada que puede ser de cuatro tipos: adenina, guanina, citosina y uracilo. Así como las tres primeras son comunes también para el ADN, el uracilo se halla presente en el ARN y muy raras veces en el ADN, mientras que la timina es una base habitual del ADN. Por tanto, desoxirribonucleótidos y ribonucleótidos difieren en la pentosa que posean que puede ser desoxiribosa o ribosa, y, además, los desoxirribonucleótidos no suelen llevar uracilo así como los ribonucleótidos no suelen llevar timina. Los nucleótidos se unen entre sí por enlaces covalentes, entre el ácido fosfórico de un nucleótido y el carbono en posición 3' de la molécula de pentosa de otro nucleótido, formando así la estructura covalente de las cadenas de los ácidos nucleicos. Estructura y Función de las Proteínas La función biológica de una proteína está determinada por la secuencia de aminoácidos que la componen y por la configuración espacial (estructura en el espacio). En la década de 1960, John Kendrew, propuso el modelo de estructura espacial de la mioglobina, a partir de la proteína purificada y mediante cristalografía de rayos X. A continuación, Max Peratz, lo hizo con una molécula más compleja, la hemoglobina. La hemoglobina está compuesta por cuatro subunidades tipo mioglobina. Para conocer el orden aminoácido de una proteína se secuencia ADN, sin embargo, el análisis estructural de la misma se realiza sintetizando proteínas a partir de un gen clónico (gen idéntico, que se inserta por ejemplo, en el genoma de una bacteria). De ese modo se obtiene proteína en gran cantidad. Además se pueden introducir cambios específicos en el ADN genómico, mediante una mutación localizada, para que la bacteria sintetice una proteína alterada. Los estudios de proteínas alteradas, han logrando demostrar la relación de la secuencia de aminoácidos con la estructura y función de la proteína restante. 3 Síntesis proteica El ADN incorpora las instrucciones de producción de proteínas. Una proteína es un compuesto formado por moléculas pequeñas llamadas aminoácidos, que determinan su estructura y función. La secuencia de aminoácidos está a su vez determinada por la secuencia de bases de los nucleótidos del ADN. Cada secuencia de tres bases, llamada triplete, constituye una palabra del código genético o codón, que especifica un aminoácido determinado. Así, el triplete GAC (guanina, adenina, citosina) es el codón correspondiente al aminoácido leucina, mientras que el CAG (citosina, adenina, guanina) corresponde al aminoácido valina. Por tanto, una proteína formada por 100 aminoácidos queda codificada por un segmento de 300 nucleótidos de ADN. De las dos cadenas de polinucleótidos que forman una molécula de ADN, sólo una, llamada paralela, contiene la información necesaria para la producción de una secuencia de aminoácidos determinada. La otra, llamada antiparalela, ayuda a la replicación. La síntesis proteica comienza con la separación de la molécula de ADN en sus dos hebras. En un proceso llamado transcripción, una parte de la hebra paralela actúa como plantilla para formar una nueva cadena que se llama ARN mensajero o ARNm. El ARNm sale del núcleo celular y se acopla a los ribosomas, unas estructuras celulares especializadas que actúan como centro de síntesis de proteínas. Los aminoácidos son transportados hasta los ribosomas por otro tipo de ARN llamado de transferencia (ARNt). Se inicia un fenómeno llamado traducción que consiste en el enlace de los aminoácidos en una secuencia determinada por el ARNm para formar una molécula de proteína. Un gen es una secuencia de nucleótidos de ADN que especifica el orden de aminoácidos de una proteína por medio de una molécula intermediaria de ARNm. La sustitución de un nucleótido de ADN por otro que contiene una base distinta hace que todas las células o virus descendientes contengan esa misma secuencia de bases alterada. Como resultado de la sustitución, también puede cambiar la secuencia de aminoácidos de la proteína resultante. Esta alteración de una molécula de ADN se llama mutación. Casi todas las mutaciones son resultado de errores durante el proceso de replicación. La exposición de una célula o un virus a las radiaciones o a determinados compuestos químicos aumenta la probabilidad de mutaciones. Síntesis de proteínas Las proteínas se ensamblan en el citoplasma celular. La operación tiene tres fases básicas. En la primera (izquierda, final), una pequeña molécula llamada ribosoma reúne todos los elementos necesarios. Durante la 4 fase de prolongación se enlazan aminoácidos, que son los bloques constitutivos de las proteínas, en forma de largas cadenas. La secuencia de incorporación de aminoácidos está determinada por el ARN mensajero (ARNm), que es una copia del ADN contenido en el núcleo celular. La terminación (derecha, final) tiene lugar cuando la secuencia del ARNm contiene uno o varios codones de parada. En esta secuencia se une al ARNm un factor de liberación que desencadena la disgregación del complejo ribosómico. La cadena liberada forma la llamada estructura primaria de la proteína. Transcripción La síntesis de una cadena de ARN mensajero, de transferencia o ribosomal a partir de una plantilla de ADN se llama transcripción. La molécula helicoidal de ADN se desenrolla y deja accesible la hebra paralela, a partir de la cual se inicia la síntesis del ARN. La enzima que controla la reacción detecta una región de la secuencia del ADN, llamada promotor, que marca el punto de inicio de la síntesis. Los nucleótidos se añaden uno por uno en orden complementario: a la citosina (C) del ADN corresponde la guanina (G) del ARN; a la G corresponde la C; a la timina (T) la adenosina (A), y a ésta el uracilo (U). Código genético. Información genética cifrada en las secuencias nucleotídicas del ácido desoxirribonucleico (ADN), que integra el mensaje para la síntesis de proteínas. Las proteínas de un individuo son específicas, por lo que lógicamente, la información para su síntesis que se encuentra cifrada en el código genético también debe serlo, en consecuencia el código genético es específico. Una molécula de ADN es una sucesión de nucleótidos, cada uno de los cuales está formado por ácido fosfórico, desoxirribosa y una base nitrogenada (púrica o pirimídica), siendo tales componentes universales en el ADN de todos los seres vivos. Por lo tanto las diferencias entre el ADN de los distintos individuos residen en la proporción y orden de cómo se suceden los pares de bases púricas y pirimidínicas, en el ADN, siendo estas bases nitrogenadas, las que establecen la especificidad y diferencia para cada individuo. De acuerdo con ello se considera, que el ADN puede mandar sus órdenes utilizando un alfabeto de cuatro letras, representadas por cada una de las cuatro bases púricas y pirimidínicas, es decir, adenina (A), timina (T), citosina (C) y guanina (G). Estas bases nitrogenadas se agrupan de tres en tres formando tripletes, también llamados codógenos, como por ejemplo ATC, AGG, TAA, etc., y cada triplete es una palabra cifrada, o señal para un determinado aminoácido; dos o más tripletes pueden conducir al mismo aminoácido. Con las cuatro bases nitrogenadas (A, T, C, G) se puede construir un número suficiente de tripletes o codógenos para sintetizar los veinte aminoácidos que forman las proteínas. Si la agrupación de estas bases fuera de dos en dos en lugar de tres en tres el total posible de grupos diferentes 5 fuese 4 x 4 = 16, de modo que si existen 20 aminoácidos proteicos distintos faltarían grupos para designarlos. Pero siendo los grupos de tres (tripletes) las probabilidades de combinación permiten un total de 64 tripletes o codógenos (4 x 4 x 4 = 64); así aparecen más tripletes que aminoácidos existentes, pero se ha llegado a demostrar que cada aminoácido puede responder a la señal de más de un triplete, por cuya razón se dice que el código o lenguaje genético está degenerado. Los codógenos o tripletes son universales, es decir, especifican al mismo aminoácido en todos los seres vivos, por ello solamente con tripletes sueltos el lenguaje del ADN no podría ser específico. Lo que le da especificidad, es la forma como se suceden los tripletes en el ADN. Metafóricamente el código genético, podría compararse con un código de lenguaje escrito, de manera que las cuatro bases nitrogenadas, para entenderlo, podrían equiparse con letras, los tripletes (agrupación de estas bases en grupos de tres), podrían llamarse palabras de tres letras, y el ordenamiento de tripletes que lleva la información, para el ordenamiento de aminoácidos en la proteína, podría comparase con una frase del lenguaje. Un ejemplo de ordenamiento o sucesión de tripletes sería: ATT _ GGC _ CGA _ AAC _ ACG _ AAA La información del código genético contenida en los tripletes del ADN se transcribe en una información complementaria en los tripletes de ARN−mensajero (ARNm), (llamados codones), y ésta se traduce en el orden de aminoácidos en la proteína. 6