Mapeo, Ensamble y Comparación del Genoma José Antonio Molinet Berenguer C INVESTAV 30 de julio del 2013 José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 1 / 45 1 Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 2 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Introducción Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 3 / 45 Mapeo, Ensamble y Comparación del Genoma Introducción Introducción La Genómica es el estudio de los genomas. Estos estudios se caracterizan por el análisis simultáneo de un gran número de genes obtenidos con herramientas automatizadas de recolección de datos. Los temas de genómica van desde el mapeo del genoma, la secuenciación y el análisis genómico funcional, hasta el análisis genómico comparativo. El advenimiento de la genómica y la explosión de información sobre secuencias son la principal fuerza impulsora del rápido desarrollo de la bioinformática en la actualidad. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 4 / 45 Mapeo, Ensamble y Comparación del Genoma Introducción Introducción El estudio de la Genómica se puede dividir en genómica estructural y genómica funcional. La Genómica estructural se refiere a la fase inicial de análisis del genoma, que incluye la construcción de mapas genéticos y físicos de un genoma, la identificación de genes, la anotación de las características de los genes, y la comparación de las estructuras del genoma. La Genómica estructural ha sido utilizada para determinar estructuras tridimensionales de las proteínas en una célula (proteómica estructural). José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 5 / 45 Mapeo, Ensamble y Comparación del Genoma Introducción Introducción En esta presentación, de la estructura genómica nos ocupa principalmente las estructuras de secuencias del genoma. La Genómica funcional se refiere al análisis de la expresión genética global y funciones de los genes en un genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 6 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Mapeo del genoma Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 7 / 45 Mapeo, Ensamble y Comparación del Genoma Mapeo del genoma Mapeo del genoma El primer paso para la comprensión de la estructura de un genoma es a través de mapeo del genoma, siendo este el proceso de identificar las localizaciones de los genes, mutaciones o rasgos específicos en un cromosoma. Un enfoque de baja resolución al mapeo de genomas es describir el orden y la distancia relativa de marcadores genéticos en un cromosoma. Los marcadores genéticos son partes identificables de un cromosoma, cuyos patrones hereditarios pueden ser seguidos. Para muchas células eucariotas, los marcadores genéticos representan fenotipos morfológicos. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 8 / 45 Mapeo, Ensamble y Comparación del Genoma Mapeo del genoma Mapeo del genoma Además de los mapas de relación genética, existen otros tipos de mapas del genoma, tales como los mapas físicos y los mapas citológicos, que describen los genomas en diferentes niveles de resolución. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 9 / 45 Mapeo, Ensamble y Comparación del Genoma Mapeo del genoma Mapeo del genoma Figura : Descripción general de los diversos mapas del genoma en relación con la secuencia de ADN genómico. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 10 / 45 Mapeo, Ensamble y Comparación del Genoma Mapeo del genoma Mapeo del genoma Los mapas genéticos identifican las posiciones de los marcadores genéticos en un cromosoma y se basan en la frecuencia con que los marcadores se heredan juntos. La razón detrás del mapeo genético es que cuanto más cerca están dos marcadores, lo más probable es que se hereden juntos y no se separan en un evento de cruce genético. La distancia entre dos marcadores genéticos se mide en centiMorgans (cM), que es la frecuencia con que son recombinados, o sea, cuando se observa separación de los dos marcadores genéticos en un experimento de cruce genético. Un centiMorgan es de aproximadamente 1 Mb en humanos y 0.5 Mb en Drosophila José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 11 / 45 Mapeo, Ensamble y Comparación del Genoma Mapeo del genoma Mapeo del genoma Los mapas físicos representan localizaciones de puntos de referencia en el ADN genómico, independientemente de los patrones de herencia. La distancia entre los marcadores genéticos se mide directamente en Kb o Mb. Los mapas citológicos se refieren a los patrones de bandas vistos en los cromosomas teñidos, que pueden ser observados directamente bajo un microscopio. La luz visible y las bandas oscuras son los marcadores visualmente distintos en un cromosoma. Un marcador genético puede estar asociado con una banda o región cromosómica específica. Los patrones de bandas, sin embargo, no son siempre constantes y están sujetos a cambios. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 12 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Secuenciación del Genoma Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 13 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma La más alta resolución del mapa del genoma es la secuencia de ADN genómico, que puede ser considerado como un tipo de mapa físico describiendo un genoma al nivel de pares de bases. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 14 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma Método de Sanger para la secuenciación de ADN: El uso de ADN polimerasas para sintetizar cadenas de ADN de diferentes longitudes. La síntesis de ADN se detiene mediante la adición de didesoxinucleótidos. Los didesoxinucleótidos son etiquetados con colorantes fluorescentes, que terminan la síntesis de ADN en las posiciones que contienen todas las cuatro bases, lo que resulta en fragmentos anidados que varían en longitud por una sola base. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 15 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma Los rastros fluorescentes de las secuencias de ADN son leídos por un programa de computadora que asigna bases para cada pico en un cromatograma. Este proceso automatizado se denomina base-calling. Durante el base-calling se pueden generar errores y la intervención humana es a menudo necesaria para corregirlos. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 16 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma Hay dos estrategias principales para la secuenciación de todo el genoma: el enfoque shotgun y el enfoque jerárquico. El enfoque shotgun secuencia al azar los clones, desde ambos extremos del ADN clonado. Este enfoque genera un gran número de fragmentos de ADN secuenciados. El número de fragmentos al azar tiene que ser muy grande, tan grande que los fragmentos de ADN se solapen lo suficiente como para cubrir todo el genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 17 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma No requiere conocimientos del mapeo físico de los fragmentos clonados, sino más bien un robusto programa de ensamblaje para unir las piezas de fragmentos aleatorios en una única secuencia de todo el genoma. Está diseñado para reducir al mínimo los errores de secuenciación y asegurar el montaje correcto de una secuencia contigua. Es por esto que normalmente se obtienen secuencias solapadas con una longitud total de seis a diez veces el tamaño del genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 18 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma El enfoque de la secuenciación jerárquica es similar al enfoque shotgun, pero en una escala más pequeña. Los cromosomas se mapean inicialmente utilizando la estrategia del mapeo físico. Fragmentos más largos de ADN genómico (100 a 300 kB) se obtienen y se clonan en un vector bacteriano de alta capacidad llamado cromosoma artificial bacteriano (CAV). Basándose en los resultados de mapeo físico, las ubicaciones y órdenes de los clones CAV en un cromosoma pueden ser determinados. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 19 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma Mediante la secuenciación sucesiva de fragmentos de clones CAV adyacentes todo el genoma puede ser cubierto. La secuencia completa de cada clon CAV individual puede ser obtenida usando el enfoque de shotgun. La superposición de clones CAV posteriormente se ensambla en una secuencia completa del genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 20 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma Hay ventajas y desventajas en ambos enfoques: El enfoque jerárquico es más lento y más costoso que el enfoque de shotgun porque implica una etapa inicial de mapeo físico del clon. Sin embargo, una vez que se genera el mapa, el montaje de todo el genoma se hace relativamente fácil y menos propenso a errores. Por el contrario, el enfoque de shotgun puede producir un borrador de secuencia muy rápidamente, ya que se basa en la secuenciación directa. Sin embargo, es computacionalmente muy costoso ensamblar los cortos fragmentos aleatorios que obtiene. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 21 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 22 / 45 Mapeo, Ensamble y Comparación del Genoma Secuenciación del Genoma Secuenciación del Genoma José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 23 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Ensamble de la secuencia del genoma Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 24 / 45 Mapeo, Ensamble y Comparación del Genoma Ensamble de la secuencia del genoma Ensamble de la secuencia del genoma Las reacciones de secuenciación de ADN generan secuencias cortas leídas a partir de clones de ADN. La longitud media de las lecturas es de aproximadamente 500 bases. Para ensamblar una secuencia de todo el genoma, estos fragmentos cortos se unen para formar fragmentos más grandes después de la eliminación de las superposiciones. Estas secuencias más largas, fusionadas se denominan contigs, que son por lo general 5.000 a 10.000 bases de longitud. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 25 / 45 Mapeo, Ensamble y Comparación del Genoma Ensamble de la secuencia del genoma Ensamble de la secuencia del genoma Un número de contigs superpuestos pueden ser aún más fusionados formando los llamados supercontigs (30.000-50.000 bases), que son orientadas unidireccionalmente a lo largo de un mapa físico de un cromosoma. La superposición de los supercontigs se conectan entonces para crear el mapa final de más alta resolución del genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 26 / 45 Mapeo, Ensamble y Comparación del Genoma Ensamble de la secuencia del genoma Ensamble de la secuencia del genoma La correcta identificación de superposiciones y montaje de contigs es como unir un rompecabezas, que puede ser computacionalmente muy costoso cuando se trata de datos a nivel de todo el genoma Los principales retos en el montaje del genoma son los errores de secuenciación, la contaminación por vectores bacterianos y las regiones de secuencias repetitivas. Los errores de secuenciación a menudo se pueden corregir mediante la elaboración de un consenso de un alineamiento de múltiples secuencias solapadas. Las secuencias de vectores bacterianos pueden ser eliminadas mediante programas de filtrado antes del montaje. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 27 / 45 Mapeo, Ensamble y Comparación del Genoma Ensamble de la secuencia del genoma Ensamble de la secuencia del genoma Para eliminar el problema de las repeticiones de secuencias, programas tales como RepeatMasker se pueden utilizar para detectar y eliminar repeticiones. Una técnica comúnmente usada para evitar errores causados por las repeticiones de secuencia es la denominada restricción forward–reverse. Esta técnica se basa en que al generar una secuencia de ambos extremos de un único clon, la distancia entre los dos fragmentos opuestos de un clon se fija a un cierto rango, lo que significa que siempre están separados por una distancia definida por la longitud del clon (normalmente 1.000 a 9.000 bases). José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 28 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Programas de base-calling y ensamble Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 29 / 45 Mapeo, Ensamble y Comparación del Genoma Programas de base-calling y ensamble Programas de base-calling y ensamble El primer paso hacia el ensamble del genoma es realizar el proceso de base-calling y asignar puntajes de calidad. El siguiente paso es ensamblar las secuencias leídas en secuencias contiguas. Este paso incluye la identificación de los solapamientos entre fragmentos de secuencias, asignando el orden de los fragmentos y obteniendo una secuencia de consenso general. El ensamble de todos los fragmentos obtenidos por shotgun en un genoma completo es un paso computacionalmente muy difícil. Hay una variedad de programas disponibles para este proceso. La siguiente es una selección de programas de montaje comúnmente utilizados en los proyectos de secuenciación del genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 30 / 45 Mapeo, Ensamble y Comparación del Genoma Programas de base-calling y ensamble Programas de base-calling y ensamble Phred (www.phrap.org/) es un programa de UNIX para realizar detección de bases. Se utiliza un análisis de Fourier para resolver los rastros de fluorescencia y predecir posiciones de pico reales de bases. También da una puntuación de probabilidad para cada base, que puede ser atribuible a un error. Si el valor de la puntuación está por debajo del umbral, es necesaria la intervención humana. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 31 / 45 Mapeo, Ensamble y Comparación del Genoma Programas de base-calling y ensamble Programas de base-calling y ensamble VecScreen (www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html) es una aplicación web que ayuda a detectar la contaminación por secuencias de vectores bacterianos. Se analiza una secuencia de nucleótidos de entrada y la compara con una base de datos de secuencias de vectores conocidos usando el programa BLAST. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 32 / 45 Mapeo, Ensamble y Comparación del Genoma Programas de base-calling y ensamble Programas de base-calling y ensamble EULER (http://nbcr.sdsc.edu/euler/) es un algoritmo de montaje que utiliza el enfoque del camino de Euler, que es un algoritmo polinomial para resolver los puzzles, como el famoso "problema del viajante de comercio". En este enfoque, un fragmento de secuencia se descompone en tuplas de veinte nucleótidos. Las tuplas se distribuyen en un diagrama con numerosos nodos que están todos interconectados. Las tuplas son convertidas a vectores binarios en los nodos. Mediante el uso de un algoritmo de Viterbi, el camino más corto entre los vectores se puede encontrar, que es la mejor manera de conectar las tuplas en una secuencia completa. Debido a que este enfoque no se basa directamente en la detección de solapamientos, puede ser ventajoso en el montaje de secuencias con motivos repetitivos. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 33 / 45 Mapeo, Ensamble y Comparación del Genoma Programas de base-calling y ensamble Programas de base-calling y ensamble ¿Cuántos genes posee un genoma? Una de las principales tareas de la anotación del genoma es tratar de dar una explicación precisa del número total de genes en un genoma. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 34 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Genómica comparativa Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 35 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa La genómica comparativa es la comparación de genomas completos de diferentes organismos, que incluye la correlación del número de genes, la localización de los genes, y el contenido de los genes. La comparación ayuda a revelar el grado de conservación entre los genomas, lo cual aporta conocimientos sobre el mecanismo de la evolución del genoma y la transferencia de genes entre los genomas. Además, permite entender el patrón de adquisición de genes extraños a través de la transferencia lateral de genes y a revelar el conjunto básico de los genes comunes entre diferentes genomes, que deben corresponder a los genes que son cruciales para la supervivencia. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 36 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa La genómica comparativa incluye la alineación de todo el genoma, la comparación del orden de genes entre los genomas, la construcción de genomas mínimos, y la transferencia lateral de genes entre los genomas. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 37 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa La alineación del genoma completo Para comprender la conservación de la secuencia entre los genomas se puede realizar una comparación directa entre genomas o el alineamiento del genoma. La alineación del genoma no difiere en gran medida de la alineación de secuencias básicas. Sin embargo, la alineación de las secuencias extremadamente grandes presenta nuevas complejidades. Los programas de alineamiento regulares tienden a ser propenso a errores e ineficientes al tratar con largos tramos de ADN que contengan cientos o miles de genes. No se puede realizar una visualización efectiva de los resultados de la alineación. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 38 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa MUMmer (Maximal Unique Match, www.tigr.org/tigr-scripts/CMR2/webmum/ El programa es esencialmente un BLAST modificado que, en la etapa de siembra, encuentra los partidos aproximados más largos que incluyen desajustes en lugar de encontrar exactamente k-mer coincidencias como en BLAST regular. El resultado de la alineación de los genomas enteros se muestra como un gráfico de puntos con líneas de puntos conectados para indicar colinealidad de los genes. Está optimizado para la comparación por pares de genomas microbianos estrechamente relacionados mumplot es un programa libre de TIGR para la alineación de dos secuencias completas del genoma y la comparación de las ubicaciones de ortólogos. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 39 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa BLASTZ (http://bio.cse.psu.edu/) es un programa modificado de BLAST para la alineación de grandes secuencias de ADN genómico. El programa BLAST modificado primero enmascara secuencias repetitivas y busca "palabras"muy similares que se definen como doce coincidencias idénticas con un tramo de diecinueve nucleótidos. Las palabras sirven como semillas para la extensión de la alineación en ambas direcciones hasta que las puntuaciones caen por debajo de un cierto umbral. Realiza el alineamiento de regiones cercanas y estas se unen mediante el uso de un esquema de peso que emplea un sistema de penalización por hueco único que tolera variaciones menores. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 40 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa Búsqueda de un genoma mínimo Uno de los objetivos de la comparación del genoma es entender lo que constituye un genoma mínimo, que es un conjunto mínimo de genes necesarios para el mantenimiento de un organismo celular de vida independiente. Este análisis consiste en la identificación de genes ortólogos compartidos entre un número de genomas divergentes. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 41 / 45 Mapeo, Ensamble y Comparación del Genoma Genómica comparativa Genómica comparativa Búsqueda de un genoma mínimo Coregenes (http://pasteur.atcc.org:8050/CoreGenes1.0//) es un programa basado en la web que determina un núcleo de genes sobre la base de comparación de cuatro genomas pequeños. El usuario proporciona los números de acceso NCBI de los genomas de interés. El programa realiza una comparación BLAST iterativo para encontrar genes ortólogos mediante el uso de un genoma como una referencia y la otra como una consulta. Se lleva a cabo esta comparación por pares de los cuatro genomas. Como resultado de ello, los genes comunes se compilan como un conjunto básico de los genes de los genomas. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 42 / 45 Mapeo, Ensamble y Comparación del Genoma 1 Conclusiones Mapeo, Ensamble y Comparación del Genoma Introducción Mapeo del genoma Secuenciación del Genoma Ensamble de la secuencia del genoma Programas de base-calling y ensamble Genómica comparativa Conclusiones José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 43 / 45 Mapeo, Ensamble y Comparación del Genoma Conclusiones Conclusiones El mapeo del genoma utilizando las posiciones relativas de los marcadores genéticos sin el conocimiento de la secuencia de datos, es un enfoque de baja resolución para describir las estructuras del genoma. Un genoma se puede describir a la máxima resolución mediante la secuencia completa del genoma. La secuenciación de todo el genoma puede llevarse a cabo utilizando el enfoque shotgun o el enfoque jerárquico. La anotación del genoma incluye la búsqueda de genes y la asignación de la función de estos genes. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 44 / 45 Mapeo, Ensamble y Comparación del Genoma Conclusiones Conclusiones El número de genes, sin embargo, no dicta complejidades de un genoma. Los genomas se pueden comparar sobre la base del contenido de sus genes y de su orden. Se han desarrollado varios programas especializados en comparación de genomas mediante la alineación transversal. La comparación de genomas a través del orden de los genes a menudo ayuda a descubrir potenciales operones y asignar funciones. José A. M OLINET B. (C INVESTAV) Mapeo, Ensamble y Comparación Genómica 30 de julio del 2013 45 / 45