1 Clase Teórico-Práctica N° 3 Tema: Expresión del material hereditario. Transcripción, traducción y regulación génica. Concepto de gen. Dogma central. Código genético. Objetivos: Conocer los mecanismos de transcripción, traducción y de regulación génica. Interpretar como se decodifica la información almacenada en el ADN. Biliografía: KLUG, W. S. y CUMMINGS, M. R. Conceptos de Genética. INTRODUCCIÓN EL CONCEPTO DE GEN Poco después del redescubrimiento de las leyes de Mendel, Wilhelm Johannsen introduce el término "gen" en 1909. El gen fue definido como la unidad hereditaria (partícula discreta) que determinaba un carácter o rasgo genético, pudiendo existir en formas alternativas (alelos). El gen constituye la unidad de cambio o mutación a otros estados alternativos (alelos), la unidad de recombinación (capacidad de intercambiar información con unidades similares) y la unidad funcional: capaz de producir en el organismo algún fenotipo particular. EXPRESIÓN DE LA INFORMACIÓN GENÉTICA Características del Código Genético - El código está organizado en tripletes o codones Si cada nucleótido determinara un aminoácido, se podrían sólo codificar cuatro aminoácidos diferentes, puesto que en el ADN únicamente hay cuatro nucleótidos distintos. Este número es inferior a los 20 aminoácidos existentes. En el caso que dos nucleótidos codificarán un aminoácido, el número de dinucleótidos diferentes serían 16, variaciones con repetición de cuatro elementos tomados de dos en dos , esta cantidad también es inferior al número de aminoácidos existentes. Las variaciones con repetición de cuatro elementos tomados de tres en tres son 64, más que suficiente para codificar los 20 aminoácidos distintos (ver tabla 1). - El código genético es degenerado La existencia de 64 tripletes o codones diferentes indica que un aminoácido puede ser codificado por más de un codón. Las moléculas encargadas de transportar los aminoácidos hasta el ribosoma y de reconocer los codones del ARN mensajero, por medio del anticodón (triplete de bases complementarias al codón), durante el proceso de traducción son los ARN transferentes (ARNt). Como ya analizamos al ver el tema ácidos nucleicos, el ARNt adopta una estructura conocida como modelo de hoja de trébol. La degeneración del código se explica por los siguientes motivos: 2 1- Hay aminoácidos que pueden ser transportados por ARNt que poseen distintos anticodones. 2. En los ARNt la flexibilidad de la 3ª base del anticodón, la que ocupa la posición 5', en algunos casos puede emparejarse con distintas bases del codón. - El código genético es no solapado Los tripletes no se solapan, cada tres bases se corresponden con un aminoácido. Cada nucleótido sólo forma parte de un codón. - El código genético es continuo. La lectura es "sin comas" A partir de un punto de inicio, la lectura es seguida "sin comas". Se efectúa de tres en tres bases, sin interrupciones o espacios vacíos. Por lo tanto si se incorpora un nucleótido (adición) a la secuencia, a partir de ese punto se altera el cuadro de lectura pudiendo modificar los aminoácidos. Esto también ocurre si se pierde (deleción) un nucleótido de la secuencia. A partir del nucleótido delecionado se altera el marco de lectura y cambian todos los aminoácidos. Si la adición o la deleción es de tres nucleótidos o múltiplo de tres, se añade un aminoácido o más a la secuencia que sigue siendo la misma a partir del la última adición o deleción. Una adición y una deleción sucesivas vuelven a restaurar el marco de lectura. - El código genético es universal El código genético nuclear es universal, esto significa que un determinado triplete o codón lleva información para el mismo aminoácido en diferentes especies. Esta característica ha permitido que la información genética introducida de un organismo de una especie en otro de otra especie permita que el organismo receptor de la información produzca la misma proteína que el organismo donante. El código genético del ADN de las mitocondrias es la única excepción a la universalidad del código, esto significa que los aminoácidos determinados por un codón o triplete en el núcleo son diferentes a los determinados en la mitocondria. - El codón de iniciación es AUG y el de terminación UAG, UAA, y UGA. La señal para el inicio de la síntesis de proteínas es el codón AUG, que en eucariotas codifica para metionina. En las bacterias AUG al comienzo del RNAm codifica la incorporación de N- formil metionina, en cualquier otra posición codifica metionina. La señal de terminación está dada por los codones UAG, UAA y UGA. Cuando el ribosoma llega al codón de terminación la cadena polipeptídica se completa y es liberada. Los codones UAG, UAA y UGA no son reconocidos por ARNt especiales pero si por ciertas proteínas los factores de liberación, que ayudan en la terminación de la síntesis. Tabla 1. Código genético. SEGUNDA LETRA PRIMERA LETRA (5´) U C A G U UUU fenilalanina UUC fenilalanina UUA leucina UUG leucina CUU leucina CUC leucina CUA leucina CUG leucina AUU isoleucina AUC isoleucina AUA isoleucina AUG metionina GUU valina GUC valina GUA valina GUG valina C UCU serina UCC serina UCA serina UCG serina CCU prolina CCC prolina CCA prolina CCG prolina ACU treonina ACC treonina ACA treonina ACG treonina GCU alanina GCC alanina GCA alanina GCG alanina A UAU tirosina UAC tirosina UAA terminación UAG terminación CAU histidina CAC histidina CAA glutamina CAG glutamina AAU asparagina AAC asparagina AAA lisina AAG lisina GAU ac. aspártico GAC ac. aspártico GAA ac. glutámico GAG ac. glutámico G UGU cisteína UGC cisteína UGA terminación UGG triptófano CGU arginina CGC arginina CGA arginina CGG arginina AGU serina AGC serina AGA arginina AGG arginina GGU glicina GGC glicina GGA glicina GGG glicina U C A G U C A G U C A G U C A G TERCERA LETRA (3´) 3 La hipótesis de la secuencia propuesta por Crick (1958), que postula que la secuencia de bases en una cadena de ADN codifica la secuencia de aminoácidos en una proteína, implicaba también la existencia de un proceso que permitiera el pasaje de información desde los ácidos nucleicos a una estructura química como la de las proteínas. En las células eucariontes los cromosomas se ubican en el núcleo y la síntesis de proteínas ocurre en el citoplasma. Se hipotetizó la existencia de una molécula intermediaria en el flujo de la información desde el ADN a las proteínas. En el año 1961 Jacob y Monod propusieron la Hipótesis del mensajero: "debe existir una molécula que transporte la información fielmente desde el ADN hasta las proteínas". Brenner y colaboradores en ese mismo año comprobaron la existencia de esa molécula intermediaria, una molécula de ácido ribonucleico que se denominó ARN mensajero (ARNm). Crick, en el año 1970 propone el Dogma Central de la Biología Molecular. El dogma sintetiza el flujo de la información genética (figura 1). La información genética contenida en el ADN se mantiene mediante su capacidad de replicación y se expresa dando lugar a proteínas, a través del proceso de transcripción (la información contenida en el ADN es transferida a una molécula de ARNm) y el proceso de traducción (el mensaje transportado por el ARNm se traduce a proteína). Figura 1: Dogma Central de la información genética El esquema del flujo de la información se modificó al comprobarse que la información no siempre fluye del ADN hacia el ARN (ADN ARN). Hay casos donde la información va del ARN al ADN (ARN ADN), 4 se produce la síntesis de ADN usando como molde el ARN. Este último proceso se denomina transcripción inversa (figura 2). Figura 2: Flujo de la información genética y transcripción inversa. H.Temin recibió el Premio Nobel en 1975 por el descubrimiento de la transcripción inversa en virus. El papel biológico de la enzima capaz de sintetizar ADN a partir de ARN es fundamental en los retrovirus, como el virus del SIDA. TRANSCRIPCIÓN Características generales de la transcripción La transcripción implica la síntesis de ARN tomando como molde el ADN, es decir el paso de la información contenida en el ADN hacia el ARN. Como vimos en el tema ácidos nucleicos, en las células hay diferentes tipos de ARN. Hay moléculas de ARN donde la información genética que poseen no se traduce a proteína. Dentro de esta categoría están el ARN ribosómico (ARNr) que forma parte de los ribosomas y el ARNt cuya función es transportar a los aminoácidos durante el proceso de traducción. El ARNm es el que se va a traducir a proteínas. La región del ADN que codifica o posee información para la síntesis de un polipéptido se denomina cistrón. La ARN polimerasa, transcriptasa o ARN polimerasa dependiente del ADN es la enzima que efectúa la transcripción. La enzima utiliza como molde solo una de las cadenas del ADN, se dice por lo tanto que la transcripción es asimétrica. Se transcribe sólo una de las hebras del ADN, la cadena codificante o “con sentido”. La cadena de ARN es complementaria a la del ADN codificante, una forma de comprobar experimentalmente que existe complementariedad entre el ADN y el ARN es realizar experimentos de hibridación, de manera que el ADN se desnaturaliza y se mezcla con el ARN que se sintetiza en su presencia. Cuando se lleva a cabo la renaturalización (mediante un enfriamiento lento), se producen híbridos ADN-ARN. La dirección en la que las ARN polimerasas sintetizan el ARN es siempre 5'3', es decir el ARN producto de la transcripción crece solamente en esta dirección. Por acuerdo entre los investigadores, los nucleótidos del ADN con información necesaria para la transcripción se numeran. A cada par de bases se le asigna un número positivo o negativo a partir del sitio de iniciación de la transcripción, a este sitio se lo designa como +1. Los nucleótidos ubicados en posiciones previas a él se dice que tienen ubicación río arriba o corriente arriba (en inglés, upstream). Y los nucleótidos ubicados en lugares posteriores a él están río abajo o aguas abajo. No existe el nucleótido con posición cero. La ARN polimerasa para poder sintetizar la cadena de nucleótidos, debe reconocer señales genéticas: los sitios precisos de iniciación y terminación de la síntesis de ARN. 5 La zona donde están las secuencias de ADN para el inicio de la transcripción se denomina promotor, allí se produce la unión de la ARN polimerasa al ADN. Transcripción en procariontes En procariontes el ARNm, el ARNr y el ARNt son transcriptos por la misma ARN polimerasa. El transcrito primario o ARN recién sintetizado ya es el ARN-m maduro y puede traducirse a proteínas. En la figura 3, se presenta un esquema de cómo está organizada en el ADN la información para la síntesis del ARNm en los organismos procariontes. La secuencia de bases posteriores a la secuencia del promotor se denomina operador y su función es muy importante en la modulación o regulación de la expresión génica. Antilíder cistrón cistrón Promotor /operador Antitrailer Terminación -2 -1 +1 + 2 Región intercistrónica Figura 3: Organización de la información para la síntesis del ARN mensajero en procariontes La secuencia de nucleótidos que se transcribe incluye la zona denominada antilíder, cistrones, región intercistrónica y de la región denominada antitrailer. La función de la zona líder la mencionaremos al ver la traducción del ARNm. Los ARNm procariontes al contener varios cistrones están codificando para varios polipéptidos y se los denomina policistrónicos. Las secuencias de los promotores no son idénticas pero se han encontrado secuencias que son particularmente comunes en ciertas posiciones y se las ha denominado secuencia consenso. Estas secuencias han sido identificadas o halladas a través de la secuenciación de las regiones promotoras en diferentes genes. Hay dos secuencias consenso en el promotor, una se encuentra 10 bases antes de la primera que se transcribe y se denomina Caja de Pribnow y la segunda se localiza 35 bases antes. La ARN polimerasa activa de procariontes (holoenzima) está formada por 4 subunidades (2 ,, ’) y el factor sigma (). El factor sigma reconoce en el promotor secuencias de bases denominadas secuencias de consenso de la cadena “con sentido” del ADN. En el proceso de transcripción del ARNmse pueden diferenciar las siguientes etapas: Inicio de la transcripción El corazón o núcleo central de la ARN polimerasa (polipétidos 2 ,, ’) se une al factor σ para poder acoplarse al ADN y producir la separación de las cadenas de la región ubicada en el lugar –10 (rica en pares AT). Elongación de la transcripción No necesita del factor σ, una vez iniciada la transcripción el factor sigma se suelta y el núcleo central de la ARN polimerasa comienza a sinterizar el ARN en la dirección 6 5' 3'. La región del ADN que se transcribe es la comprendida entre el nucleótido +1, hasta el fin de la zona denominada antitrailer. Terminación de la transcripción La terminación de la transcripción en estudios efectuados in vitro en procariontes puede tener lugar por dos mecanismos distintos: - La existencia de unas secuencias terminadoras en el ADN: Estas secuencias son una región rica en pares CG, seguida por una serie de 6 o más adeninas (A). Cuando la región rica en pares CG se transcribe da lugar en el ARN a una secuencia rica en estos nucleótidos, seguida de 6 o más uracilos (U). La región rica en pares GC forma una estructura en forma de horquilla (por autoapareamiento). Este lazo en horquilla seguido de uracilos actúa como señal para la separación de la ARN polimerasa del ADN y terminación de la transcripción. - Terminación dependiente de la actuación del factor proteico rho (ρ). Rho es una gran proteína hexamérica que es capaz de interaccionar físicamente con el ARN para producir la terminación de su síntesis. Transcripción en eucariontes En eucariontes hay diferentes polimerasas encargadas de sintetizar los distintos tipos de ARN. La ARN polimerasa I sintetiza los precursores del ARNr. La ARN polimerasa II produce ARN heterogéneo nuclear (ARNhn) que tras el procesamiento da lugar a los ARNm que se traducen a proteínas. La ARN polimerasa III transcribe los precursores de los ARNt, y para el ARNr 5S el cual forma parte de la subunidad grande de los ribosomas. Los ARNm de los organismos eucariontes codifican para un solo polipéptido son por ende monocistrónicos. El ARN recién transcrito se denomina ARN heterogéneo nuclear (ARNhn) y es un pre-ARNm porque debe ser procesado antes de convertirse en el ARNm maduro para su traducción. Ambos procesos están separados, la transcripción ocurre en el núcleo y la traducción tiene lugar en el citosol. La actividad de los promotores puede modificarse por la presencia de otras secuencias estimuladoras o "enhancers" que aumentan la tasa de transcripción o por secuencias atenuadoras que disminuyen la tasa de transcripción. El inicio de la transcripción es más complejo que en E. coli y depende de la presencia de proteínas llamadas factores de transcripción (TF). El modo en que estas proteínas ejercen su acción lo analizaremos al ver la regulación génica de la expresión, ya que la “decisión” de iniciar la transcripción de un gen es un evento fundamental en la regulación de la expresión génica, tanto en células procariontes como eucariontes. En las células eucariótas ocurren otros eventos postranscripcionales que analizaremos a continuación. La organización del ADN con información para la síntesis del ARN precursor del ARNmcontiene la secuencia de la zona antilíder, las secuencias de exones, intrones y la secuencia del antitrailer. En una primera etapa la enzima ARN polimerasa sintetiza un ARN denominado ARNhn o transcripto primario que contiene las secuencias de los exones e intrones flanqueadas por las secuencias lider y trailer. En el 7 interior del núcleo los intrones son eliminados por un mecanismo llamado "splicing" (en inglés), en el que actúa una maquinaria molecular llamada “spliceosoma”. Otras modificaciones del ARN hn son el agregado en el extremo 5´ de un capuchón o cap de 7-metil guanosina y una cola de poli-A en el extremo 3´ (la secuencia trailer del ARNm sirve como señal para el agregado de la cola de poli A). Procesamiento alternativo del ARN hn En diferentes tejidos de un mismo individuo con la misma información codificada en el ADN, pueden producirse procesamientos distintos del mismo ARNhn o pre ARNm y como consecuencia se originan diferentes polipéptidos. Un ejemplo del mecanismo de procesamiento alternativo del ARN heterogéneo ocurre en humanos en la tiroides y en el hipotalamo, donde a partir del la misma información contenida en el ARNhn se producen dos polipéptidos diferentes: calcitonina en la tiroides y CGRP en el hipotálamo. Síntesis de ARN r y ARN t en procariontes y eucariontes En procariontes y eucariontes los ARNr y ARNt recién sintetizados también requieren procesamiento antes de ser maduros o funcionales. En el ADN de bacterias hay varias copias de las secuencias con información para ARNr, entre 5 y 10 copias. El nucleolo y biogénesis del ARNr Los ribosomas eucarióticos tienen un coeficiente de sedimentación de 60 S en la subunidad mayor y de 40 S en la subunidad menor. La subunidad mayor contiene ARNr de 28 S, 5,8 S y 5 S. La subunidad menor contiene ARNr de 18S. El ADN con la información para ARN de 18 S, 28 S y 5,8 S se encuentra en los cromosomas en una zona conocida como NOR (región organizadora del nucleolo). En esa zona hay muchas copias para esta información. Por ejemplo en Xenopus el ADN de la zona NOR tiene 450 copias de genes ribosómicos. Las copias en tandem a lo largo de la hebra de ADN. Cada copia está separada de la siguiente por espaciadores que no se transcriben. Cada copia se transcribe en una gran molécula de 45 S la que por procesamiento dará lugar a los ARNr de 18S, 28 S y 5,8 S. El sitio donde se efectúa el procesamiento o maduración de este ARN es el nucleolo. La síntesis de ARN de 5 S se produce en otra zona del genoma. TRADUCCIÓN O SÍNTESIS DE PROTEÍNAS En el proceso de traducción o síntesis proteica, los ribosomas sirven como una especie de andamio para la interacción ordenada de las numerosas moléculas que intervienen en la síntesis de proteínas. La traducción comienza en el extremo 5’ del ARNm donde está el codón AUG. El sentido de la traducción es de 5’ a 3’. En los ribosomas se enfrentan el ARNm y los aminoacil-ARNt. La secuencia líder del ARNm se une a la subunidad pequeña del ribosoma y a este complejo se incorpora la subunidad grande. Los ARNt sirven como moléculas adaptadoras durante la síntesis de las proteínas. 8 Como vimos previamente, cada ARNt tiene un anticodón que puede reconocer un codón en el ARNm, la capacidad de unir un aminoácido específico a uno de sus extremos, el lazo T ψ C para enlazarse al ribosoma y el lazo dihidrouracilo (DHU) para unirse a la aminoacil ARNt sintetasa (enzima encargada de unir un aminoácido a su correspondiente ARNt). La activación de los aminoácidos para formar los complejos de transferencia es el paso previo necesario para que pueda comenzar la traducción, y consiste en la unión de cada aminoácido a su ARNt específico mediante la intervención de la aminoacil-ARNt sintetasa y el aporte de energía del ATP. aa1 + ARNt1 + ATP → ARNt1-aa1 + AMP + Ppi El aminoácido se une al ARNt en su extremo 3’ donde está la secuencia CCA. Una vez que los aminoacil-ARNt están formados en el citoplasma deben encontrar a los ribosomas. En los ribosomas es donde se enfrentan el ARNm y los aminoacil-ARNt, por medio del apareamiento de bases codón - anticodón. Los ribosomas tienen lugares o sedes con la estructura espacial adecuada para que en ellos se produzca la traducción del mensaje. Una de estas sedes se conoce con el nombre de sede peptidil o sede P y otra como sede aminoacil o sede A. El primer aminoácido con el que se inicia la síntesis de proteína es metionina en eucariotas (codón AUG) o N-formil metionina en procariotas. La cadena polipeptídica se sintetiza de tal modo que el grupo libre del primer aminoácido es un grupo amino y el del último es el carboxilo. La síntesis de la cadena polipeptídica avanza en la dirección NH2 COOH. El último paso en la síntesis de la cadena polipeptídica es su liberación del ribosoma cuando ya está completa toda la secuencia de aminoácidos. Este proceso se produce cuando el ribosoma llega a encontrar un codón sin sentido en el ARNm. El codón sin sentido no es reconocido por ningún ARNt pero si por una proteína que produce la liberación de la reciente cadena polipeptídica. Revisión del concepto de gen Luego de los experimentos de Beadle y Tatum 1941 y la comprobación del ADN como el material hereditario por Avery, McLeod y McCarty, en 1944 el concepto de gen se modifica; pasa a ser el fragmento de ADN que codifica para la síntesis de una enzima o proteína. Al conocerse la base molecular de la mutación el gen dejo de ser la unidad de cambio o mutación, ya que en una secuencia se podían producir muchos cambios. Se incorporó entonces un nuevo término «mutón». El mutón es la unidad de mutación y corresponde a un par de nucleótidos complementarios (uno en cada cadena de ADN). Como el gen es una secuencia de ADN, existe la probabilidad de que el sobrecruzamiento pueda ocurrir dentro del gen, y como consecuencia exista intercambio de información intragénica. Benzer en el año 1957 acuño el término «recón» haciendo referencia a la unidad más pequeña que puede ser intercambiada, no divisible por recombinación genética, pero que puede identificarse con técnicas de análisis a nivel molecular. 9 De acuerdo a la hipótesis de Beadle y Tatum, el gen como unidad funcional codifica información para la síntesis de una proteína. Pero hay ocasiones en las cuales una proteína está constituida por más de un polipéptido y no se puede considerar entonces al gen como unidad de función. La unidad de función es el cistrón «un cistrón - un polipéptido». Cuando la proteína está formada por un solo polipéptido el concepto un gen - una proteína coincide con el concepto «un cistrón - un polipéptido». En este caso se puede aceptar que el gen según lo establecido en la concepción clásica es la unidad funcional. Con los avances de la Genética molecular el concepto de gen es ahora más amplio: El gen es una secuencia de ADN o ARN esencial para una función específica. La ejecución de esa función no siempre requiere de la traducción de su información y en ocasiones ni siquiera su transcripción. De acuerdo a esta definición amplia de gen (algunos autores consideran que un gen debe al menos codificar para un ARN) se distinguen distintos tipos de genes: Los genes estructurales: codifican para proteínas (las cuales pueden ser reguladoras) o especifican para distintos tipos de ARN, que solo se transcriben. Genes reguladores sin transcriptos: los genes o secuencias que especifican el sitio de iniciación de la replicación del ADN, los genes o secuencias del ADN que reconocen e interactúan con proteínas, hormonas y otras moléculas, etc. Actividades 1. En un sistema de síntesis de proteínas in vitro, la adición de un ARNm específico humano al aparato de traducción de E. coli (ribosomas, ARNt, etc) conduce la síntesis de una proteína similar a la cifrada en dicho ARNm. ¿Qué nos dice este resultado? 2. ¿Qué anticodón tendrá un ARNt portador de isoleucina? ¿Es posible más de una respuesta? ¿Por qué? Explique e indique todas las alternativas posibles. 3. En el esquema se observa una secuencia lineal de codones. ¿De qué molécula se trata? 5´-UUU UCU UAU UGG UAG AUA GGC-3´ 1 2 3 1 2 3 a- Empleando el código genético escriba la cadena peptídica codificada si comienza la lectura desde la base 1 del primer codón. b- Si comienza la lectura desde la base 2 del primer codón ¿la proteína codificada será la misma que en el punto anterior? ¿Por qué? Explique y escriba su secuencia. c- El cambio de la primera base U del segundo codón por la base C provoca solamente la sustitución de un aminoácido. ¿Cuál es la sustitución que ocurre? ¿Qué propiedad del código genético permite explicar este suceso? 4. Teniendo en cuenta sus respuestas a los puntos 1,2, y 3 resuma las propiedades del código genético. 5. Compare la transcripción en procariotas y eucariotas. 10 6. Ingrese al sitio http://blast.ncbi.nlm.nih.gov/Blast.cgi >Seq.Contig1 TCCATATGGTCGACCTGCAGGCGGCCGCGAATTCACTAGTGATTCTTCTG GCCCAGGATCTGGAGTTCATCCCCTCCCCTCATATCTTCAGCATATTCCT TAATCTTCATAGCGGAATCTTCAAGTTGAGGGCTGTCTACAAGTGTGATA ATTTTCAATGAATAAATATCCCCAAAACTAGGCGGAATCTTTTCAAGATC ACAATATCCCTCCAGTTTCAATTTCTCAAGTGCAGGAAAGGATTCCTCTC CAACCTCCCACCTGGCAAGAGTAACTTGATGCAACTCCAAATATTTGAGA TTCTCAAAGGTGTCTTCCTCCCCCATGTTCCATTCTTCCCCCCATATGAT TGTATAATAAAGGAACAACTCTTCAAGGTTGGGCAGTCTCACTATTGTAG ATAGTGAATTGGATGTCAGAGGAAACTCATCCAACAACAATATTTTCAAA TTCGAAGGGAAGTGAAAATCCCATAGCCGATTTATGGCTGCAGGGGACCC ACTGTCATTTATGTTTGAACTTGCAAAATACACAGTGAGTTCTTCTAGTT CAGTTAGGAAATCCAATTTCGGGAACCAATGTTGCTCTGCTGAATAATCC CATGATTCCTTGAGATCAAACTTAAGCACTTGAAGATTGGGAAGCCTTTT GAAAATATCCTCTGTATCTTTCGAATAGGAAAGCATGGGTTTCCCTAATA TTCTCAAGTTCTCTAACTTTGTGTCCTCTGCTATCAGTATTGATTCATCT GCATCCAAATCAAAGAAAGAACAAGCACTCACGGACAGACCTTGCAACTT TACAAGATCACCAATTCTTGGTAATAGTACCAAGGTTGATCCTTCGTTAA ACACCAACAGGATTTCTAGATTCCAGAGATTTGAGAAAGACAAAGGCAGA TATTTAACTTGTGTCCCAATGCTTAAGTACCTCAAATGATTCAACATGCA TATTTCATTCAGCAAAGAATCTTCCACCGTGATAAAAGAGGTATGCAGTT CCAAGGCTCTAAGATGCCTCAAGTGTCTTAGATGAAATGTATCAGAAACA CTATCTGCCAGCTTGTCTCCATCTATGGTCAAAGAATAGAGGTGTTTACG AGAATGCCTTTTCTTATTTGAATCAAACAGGACAAAATTGTTAAGCCCCA ATAACTCGCTGTTATAATGAATGGCCACTATACGTGGCATCAAATCTGAA GAAGAAGATGGTTTACTTGAACTTATATGGTCAAACAACTTTTCCTCTCT TGCTTTTATCAAACAAAATTCATGCACAAGATCATGAAGTTGGTAAGTCG GGTCATCACCTATCTCATTGAAAGCAATTACCAAGCTACTGGAAATTAAG TTATCCAAATAAACCTTCATCACTTCTTTCACACTCTTCATCTCTGTCTA TACCACAAGTCCTTCAGCATGCCATAAACCATTCAACACAAAGATTAAGA TTGCAGTGTCCTTCGGAAAGCTTGCAAGGTCAAGAAAGCATGGTTTGATG TGATGTGGCAAATGGTCATAACTTAATTCTATAACCTTCATGACCTCCAC CTCGCCGTTCAGCCCAGGATCTGAAGTTCGTCCAGGATCTGGAATTCATA ACCTCCACCTCGCCGTTCAAATCGAATTCCCGCGGCCG 6.1. Para buscar a qué gen corresponde esta secuencia en la sección “Basic Blast” elija “nucleotide blast”. Copie la secuencia de nucleótidos anterior y péguela en la ventana “Enter accesion..” , vaya al final de la página y haga click en el botón “BLAST”. Analice los resultados obtenidos y responda: A. ¿A qué especie o especies pertenece la secuencia? B. ¿Qué proteínas codifica? C. ¿Qué función tendría esta secuencia? 11 6.2. Ingrese al sitio http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi, pegue la secuencia de nucleótidos en la ventana y para buscar los “Marcos de lectura Abiertos”, ORF (en inglés por Open Reading Frame) haga click en el botón ORFfind. Responda: A. ¿Cuantos ORFs encuentra? B. ¿Cuál es el que más probablemente codifique para un gen? C. ¿Cuántos aminoácidos codifica?