1 ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010 PRÁCTICO: “ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS” Objetivos Profundizar en el análisis de secuencias nucleotídicas/aa utilizando la base de datos del Genbank. Introducir conceptos básicos de anotación genómica mediante el uso del programa Artemis. Tareas previas que el estudiante debe realizar antes de la clase práctica Adjunto a este archivo se encuentra una secuencia nucleotídica (Ava1). Usted deberá responder las siguientes interrogantes utilizando la base de datos del GenBank a través de herramientas como el BLAST. Recuerde que la secuencia puede ser cargada para su análisis directamente en upload file o bien ser abierta con un bloc de nota o un programa que reconozca el formato fasta. 1) 2) 3) 4) 5) 6) ¿A qué organismo corresponde? ¿Cuál es el nombre completo de la secuencia? ¿Cuál es su número de acceso? ¿A qué tipo de secuencia corresponde y dentro de ella, a que familia, clase, etc? ¿Cuál es la cita del PubMed? ¿Qué localización genómica presenta? Anotación de genomas con Artemis Artemis es un programa de anotación de secuencias que permite analizar y visualizar éstas de forma gráfica. A fin de familiarizarnos con este programa, en este práctico analizaremos la secuencia Ava1, que se encuentra en la carpeta “Práctico de Análisis genómico” en el escritorio de su PC. 1) Abra la secuencia Ava1, utilizando el comando File/Open. Observe que al abrir el archivo, aparecen tres ventanas, una inferior vacía y dos superiores que muestran la secuencia nucleotídica y las secuencias aminoacídicas correspondientes a las traducciones en los seis marcos de lectura posibles (tres marcos de lectura por hebra) (Figura 1). 2) Utilizando la opción Create/Mark ORF (open reading frames), establezca los posibles ORFs, con un largo superior a 100 aminoácidos. Sección Genética Evolutiva 2 3) El programa identifica diversas regiones de una secuencia, como unidades con un determinado significado, a las cuales se les pueden asignar nombres y anotar datos acerca de ellas. Estas regiones se denominan “features” (características o marcas), y pueden ser ORFs, exones, etc. Analice los features (en este caso ORFs) obtenidos utilizando BLAST. Los features aparecen indicados en la ventana inferior como CDS. Debe seleccionar cada uno de los CDS y presionando el botón derecho del mouse sobre el feature, y utilizando la opción View/Amino Acids of selection as FASTA (también se puede seleccionar la secuencia nucleotidíca View/Bases of selection as FASTA) podrá obtener la secuencia de cada CDS para su análisis. 4) Utilizando la información obtenida mediante BLAST, ahora puede editar la información contenida en los features, haciendo click con el botón derecho, y seleccionando la opción Edit/Selected feature in editor. En la ventana que se abre se puede modificar el nombre del feature con la opción Key, y agregar información, colores, etc., con la opción Add Qualifiers. 5) Los features pueden estar separados de la secuencia en un archivo aparte denominado “entry”. Abra la entry localizada en el archivo Ava1_entry y observe los features ahí contenidos (File/read an entry). Este archivo fue realizado por el investigador que depositó la secuencia en el GenBank). 6) Compare el tamaño de los ORFs obtenidos con los anotados en Ava1_entry. ¿Se encuentran diferencias? Si es así, explique por qué. Si es necesario, modifique el tamaño de los ORF de acuerdo a los datos obtenidos mediante BLAST. 7) Usted también puede bajar el archivo con todas las anotaciones o features directamente del Genbank. Para esto utilice la opción File/Open from EBI y coloque el número de accessión (Acc. Number: DQ985395). Para obtener información adicional sobre los features anotados vaya a View/view selected features. Qué información posee el tercer CDS?. Incluya la información adicional en el panel de features (panel 5, Figura 1). Sección Genética Evolutiva 3 Figura 1. Ventana principal de artemis. 1: Menú desplegable principal 2. “entry” activas. Las “entry” actúan como capas o layers en las que puedo realizar anotación. Puedo crear tantas como desee y se utilizan para organizar la información en unidades independientes. 3. Panel principal de visualización de las secuencias. Las líneas grises representan las hebra forward (superior) y reverse (inferior). Se representa también las secuencias aminoacídicas correspondientes a las traducciones en los seis marcos de lectura posibles (tres marcos de lectura por hebra). Las líneas negras verticales representan los codones stop. Las regiones coloreadas representan los distintos “features” que han sido anotados en la secuencia. 4. Este panel tiene la misma estructura que el panel principal de visualización pero ha sido aumentado para visualizar las secuencias nucleotídicas y aminoacídicas. 5. Este panel indica los distintos “features” que presenta la secuencia. 6. Barras para aumentar o disminuir los paneles 7. Barras para movilizarse en la secuencia 8. Barras para desplazar los “features”. Sección Genética Evolutiva 1 ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010 PRÁCTICO: “ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS” Objetivos Introducir conceptos básicos acerca de la predicción y anotado de genes en un genoma bacteriano mediante la utilización de Artemis. Introducción Las herramientas de Artemis pueden ser utilizadas, entre otras cosas, para la predicción y anotado de genes en un genoma. En el caso de este práctico, analizaremos el genoma de Mycobacterium tuberculosis, el agente causante de la tuberculosis. Utilizaremos tres criterios para la identificación de genes en esta bacteria: 1) La predicción de marcos abiertos de lectura que comiencen con codones de inicio típicos de proteínas procariotas. 2) Comparación con información de genes homólogos en otros organismos obtenida mediante BLASTX. 3) Variación de la composición de bases en el ADN codificante y no codificante. Actividades 1) Cargue el archivo M. tuberculosisi fasta en Artemis, tal y como lo realizó en la parte anterior del práctico. 2) Marque los ORF mayor a 100 aminoácidos de la misma manera que lo hizo en el ejemplo anterior. 3) Vaya a Select/All, ahora podrá ver seleccionados todos los ORF generados en la actividad 2. 4) Vaya a Edit/Trim Selected Features/To Any. Esta opción modificará los ORF para que comience con un codón de inicio procariota (TTG, ATG, GTG), Se genera el siguiente mensaje “some features could not be trimmed (they are now selected)”. Éstos Features seleccionados no presentan en el primer tercio de su secuencia dichos codones de inicio. Para eliminarlos vaya a Edit/Selected Features/Delete. Sección Genética Evolutiva 2 5) Cargar información de genes homólogos: para crear un Entry con esta información vaya a File/Read an Entry y seleccione el archivo Hits.blastx. Ahora podrá ser capaz de observar nuevas anotaciones en el genoma. 6) Analizar las diferencias en la composición de bases de regiones codificantes y no codificantes: para esta actividad utilizaremos los gráficos de GC Frame Plot (Graph/GC Frame Plot). Preguntas 1) ¿Qué puede observar al comparar las anotaciones realizadas por usted y las cargadas en la Entry con información de genes homólogos? 2) ¿Qué diferencias existen en la composición de bases entre secuencias codificantes y no codificantes? 3) ¿Qué otra etapa podría adicionarse a esta estrategia de predicción para que los resultados sean más fiables? Sección Genética Evolutiva 1 ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010 PRÁCTICO: “GENÓMICA COMPARATIVA UTILIZANDO ACT” Objetivos Introducir conceptos básicos sobre el funcionamiento del programa ACT (Artemis Comparison Tool) y su aplicación en la comparación de genomas. Introducción a ACT ACT es un programa que permite ver de forma gráfica la comparación de dos o más genomas. El programa utiliza el algoritmo BLASTN o tBLASTx para generar un archivo de comparación entre los genomas de interés. La información generada en este archivo de comparación es utilizada por el ACT para representar en forma gráfica el grado de similitud entre los genomas. Generación del archivo de comparación La manera más sencilla de generar un archivo de comparación es utilizar el servicio disponible en www.webact.org. Esta dirección web permite subir los archivos de secuencia a comparar y genera automáticamente el archivo de comparación. Interpretación de los resultados El ACT muestra como bloques de color rojo las secuencias conservadas en ambos genomas y que se encuentran en el mismo sentido. Por otro lado, las secuencias conservadas pero que se encuentran invertidas en un genoma con respecto al otro, se muestran como bloques azules. Las secuencias que están presentes en un genoma pero no en el otro se ven como bloques de color blanco. Sección Genética Evolutiva 2 Actividades que debe desarrollar el estudiante Tarea I. Comparación entre dos alelos de un gen de D. melanogaster. 1 – Ingrese a la página www.webact.org. 2 – Diríjase a la pestaña Generate 3 – Suba los archivos sequence1 y sequence2 de la carpeta “Práctico ACT/Tarea I” 4 – Presione el botón Submit en la parte inferior de la pantalla y espere que aparezca la ventana siguiente. 5 – Presione el botón Download para bajar el archivo de comparación a su PC. 6 – Descomprima los archivos que se encuentran dentro del .zip. 6 – Abra el programa ACT y seleccione el comando File/Open 8 – Cargue la secuencia 1, el archivo de comparación (denominado blast_out1) y la secuencia 2. 9 – Se abrirán tres ventanas, superior e inferior conteniendo cada una de las secuencias a comparar y una ventana central indicando con bloques de diferentes colores las homologías y diferencias entre ambas secuencias. Preguntas: 1) 2) 3) 4) ¿Cuál es la longitud en pb de cada una de las secuencias a comparar? ¿Qué puede decir acerca de la comparación entre ambas secuencias? ¿A que gen corresponden dichas secuencias? ¿A qué son debidas las diferencias encontradas? Tarea II: Comparación de los genomas de Salmonella enterica serovar. typhi y Escherichia coli K12. 1 – Ambos genomas se cargaron y el archivo de comparación fue generado siguiendo los pasos indicados en la tarea I y se encuentran disponibles en la carpeta del “Práctico ACT/Tarea II” como EcoliK12, Styphi y comparisonES. 2 – Abra el programa ACT y seleccione el comando File/Open. 4 – Cargue la secuencia 1, el archivo de comparación y la secuencia 2. Preguntas: 1) ¿Existen regiones conservadas en ambos genomas? 2) ¿Qué puede decir acerca de la conservación en la posición de los genes (sintenia)? 3) ¿Se aprecia algún reordenamiento genómico? Tarea III: Comparación del genoma de Escherichia coli K12 (no patógena) con el genoma de Escherichia coli 0157:H7 (enteropatógeno humano). 1 – En la carpeta del “Práctico ACT/Tarea III” se encontrará con los tres archivos para cargar en el ACT y seguirá los mismos pasos que en las tareas anteriores. Preguntas: 1) ¿Existen regiones del genoma que sean exclusivas de una u otra cepa?, de ser así ¿qué genes están presentes en dichas regiones? 2) ¿Qué rol podrían jugar estar regiones en el fenotipo de estas cepas? Sección Genética Evolutiva