Mapeo, Ensamble y Comparación del Genoma

Anuncio
Mapeo, Ensamble y Comparación del Genoma
José Antonio Molinet Berenguer
C INVESTAV
30 de julio del 2013
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
1 / 45
1
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
2 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Introducción
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
3 / 45
Mapeo, Ensamble y Comparación del Genoma
Introducción
Introducción
La Genómica es el estudio de los genomas. Estos estudios se
caracterizan por el análisis simultáneo de un gran número de
genes obtenidos con herramientas automatizadas de recolección
de datos.
Los temas de genómica van desde el mapeo del genoma, la
secuenciación y el análisis genómico funcional, hasta el análisis
genómico comparativo.
El advenimiento de la genómica y la explosión de información
sobre secuencias son la principal fuerza impulsora del rápido
desarrollo de la bioinformática en la actualidad.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
4 / 45
Mapeo, Ensamble y Comparación del Genoma
Introducción
Introducción
El estudio de la Genómica se puede dividir en genómica
estructural y genómica funcional.
La Genómica estructural se refiere a la fase inicial de análisis del
genoma, que incluye la construcción de mapas genéticos y físicos
de un genoma, la identificación de genes, la anotación de las
características de los genes, y la comparación de las estructuras
del genoma.
La Genómica estructural ha sido utilizada para determinar
estructuras tridimensionales de las proteínas en una célula
(proteómica estructural).
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
5 / 45
Mapeo, Ensamble y Comparación del Genoma
Introducción
Introducción
En esta presentación, de la estructura genómica nos ocupa
principalmente las estructuras de secuencias del genoma.
La Genómica funcional se refiere al análisis de la expresión
genética global y funciones de los genes en un genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
6 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Mapeo del genoma
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
7 / 45
Mapeo, Ensamble y Comparación del Genoma
Mapeo del genoma
Mapeo del genoma
El primer paso para la comprensión de la estructura de un
genoma es a través de mapeo del genoma, siendo este el
proceso de identificar las localizaciones de los genes, mutaciones
o rasgos específicos en un cromosoma.
Un enfoque de baja resolución al mapeo de genomas es describir
el orden y la distancia relativa de marcadores genéticos en un
cromosoma.
Los marcadores genéticos son partes identificables de un
cromosoma, cuyos patrones hereditarios pueden ser seguidos.
Para muchas células eucariotas, los marcadores genéticos
representan fenotipos morfológicos.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
8 / 45
Mapeo, Ensamble y Comparación del Genoma
Mapeo del genoma
Mapeo del genoma
Además de los mapas de relación genética, existen otros tipos de
mapas del genoma, tales como los mapas físicos y los mapas
citológicos, que describen los genomas en diferentes niveles de
resolución.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
9 / 45
Mapeo, Ensamble y Comparación del Genoma
Mapeo del genoma
Mapeo del genoma
Figura : Descripción general de los diversos mapas del genoma en relación
con la secuencia de ADN genómico.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
10 / 45
Mapeo, Ensamble y Comparación del Genoma
Mapeo del genoma
Mapeo del genoma
Los mapas genéticos identifican las posiciones de los marcadores
genéticos en un cromosoma y se basan en la frecuencia con que
los marcadores se heredan juntos.
La razón detrás del mapeo genético es que cuanto más cerca
están dos marcadores, lo más probable es que se hereden juntos
y no se separan en un evento de cruce genético.
La distancia entre dos marcadores genéticos se mide en
centiMorgans (cM), que es la frecuencia con que son
recombinados, o sea, cuando se observa separación de los dos
marcadores genéticos en un experimento de cruce genético.
Un centiMorgan es de aproximadamente 1 Mb en humanos y 0.5
Mb en Drosophila
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
11 / 45
Mapeo, Ensamble y Comparación del Genoma
Mapeo del genoma
Mapeo del genoma
Los mapas físicos representan localizaciones de puntos de
referencia en el ADN genómico, independientemente de los
patrones de herencia. La distancia entre los marcadores
genéticos se mide directamente en Kb o Mb.
Los mapas citológicos se refieren a los patrones de bandas vistos
en los cromosomas teñidos, que pueden ser observados
directamente bajo un microscopio. La luz visible y las bandas
oscuras son los marcadores visualmente distintos en un
cromosoma.
Un marcador genético puede estar asociado con una banda o
región cromosómica específica. Los patrones de bandas, sin
embargo, no son siempre constantes y están sujetos a cambios.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
12 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Secuenciación del Genoma
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
13 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
La más alta resolución del mapa del genoma es la secuencia de
ADN genómico, que puede ser considerado como un tipo de
mapa físico describiendo un genoma al nivel de pares de bases.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
14 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
Método de Sanger para la secuenciación de ADN:
El uso de ADN polimerasas para sintetizar cadenas de ADN de
diferentes longitudes.
La síntesis de ADN se detiene mediante la adición de
didesoxinucleótidos. Los didesoxinucleótidos son etiquetados con
colorantes fluorescentes, que terminan la síntesis de ADN en las
posiciones que contienen todas las cuatro bases, lo que resulta
en fragmentos anidados que varían en longitud por una sola base.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
15 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
Los rastros fluorescentes de las secuencias de ADN son leídos
por un programa de computadora que asigna bases para cada
pico en un cromatograma. Este proceso automatizado se
denomina base-calling. Durante el base-calling se pueden
generar errores y la intervención humana es a menudo necesaria
para corregirlos.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
16 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
Hay dos estrategias principales para la secuenciación de todo el
genoma: el enfoque shotgun y el enfoque jerárquico.
El enfoque shotgun secuencia al azar los clones, desde ambos
extremos del ADN clonado. Este enfoque genera un gran número
de fragmentos de ADN secuenciados.
El número de fragmentos al azar tiene que ser muy grande, tan
grande que los fragmentos de ADN se solapen lo suficiente como
para cubrir todo el genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
17 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
No requiere conocimientos del mapeo físico de los fragmentos
clonados, sino más bien un robusto programa de ensamblaje para
unir las piezas de fragmentos aleatorios en una única secuencia
de todo el genoma.
Está diseñado para reducir al mínimo los errores de
secuenciación y asegurar el montaje correcto de una secuencia
contigua.
Es por esto que normalmente se obtienen secuencias solapadas
con una longitud total de seis a diez veces el tamaño del genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
18 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
El enfoque de la secuenciación jerárquica es similar al enfoque
shotgun, pero en una escala más pequeña. Los cromosomas se
mapean inicialmente utilizando la estrategia del mapeo físico.
Fragmentos más largos de ADN genómico (100 a 300 kB) se
obtienen y se clonan en un vector bacteriano de alta capacidad
llamado cromosoma artificial bacteriano (CAV).
Basándose en los resultados de mapeo físico, las ubicaciones y
órdenes de los clones CAV en un cromosoma pueden ser
determinados.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
19 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
Mediante la secuenciación sucesiva de fragmentos de clones
CAV adyacentes todo el genoma puede ser cubierto.
La secuencia completa de cada clon CAV individual puede ser
obtenida usando el enfoque de shotgun. La superposición de
clones CAV posteriormente se ensambla en una secuencia
completa del genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
20 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
Hay ventajas y desventajas en ambos enfoques:
El enfoque jerárquico es más lento y más costoso que el enfoque
de shotgun porque implica una etapa inicial de mapeo físico del
clon. Sin embargo, una vez que se genera el mapa, el montaje de
todo el genoma se hace relativamente fácil y menos propenso a
errores.
Por el contrario, el enfoque de shotgun puede producir un
borrador de secuencia muy rápidamente, ya que se basa en la
secuenciación directa. Sin embargo, es computacionalmente muy
costoso ensamblar los cortos fragmentos aleatorios que obtiene.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
21 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
22 / 45
Mapeo, Ensamble y Comparación del Genoma
Secuenciación del Genoma
Secuenciación del Genoma
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
23 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Ensamble de la secuencia del genoma
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
24 / 45
Mapeo, Ensamble y Comparación del Genoma
Ensamble de la secuencia del genoma
Ensamble de la secuencia del genoma
Las reacciones de secuenciación de ADN generan secuencias
cortas leídas a partir de clones de ADN. La longitud media de las
lecturas es de aproximadamente 500 bases.
Para ensamblar una secuencia de todo el genoma, estos
fragmentos cortos se unen para formar fragmentos más grandes
después de la eliminación de las superposiciones.
Estas secuencias más largas, fusionadas se denominan contigs,
que son por lo general 5.000 a 10.000 bases de longitud.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
25 / 45
Mapeo, Ensamble y Comparación del Genoma
Ensamble de la secuencia del genoma
Ensamble de la secuencia del genoma
Un número de contigs superpuestos pueden ser aún más
fusionados formando los llamados supercontigs (30.000-50.000
bases), que son orientadas unidireccionalmente a lo largo de un
mapa físico de un cromosoma.
La superposición de los supercontigs se conectan entonces para
crear el mapa final de más alta resolución del genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
26 / 45
Mapeo, Ensamble y Comparación del Genoma
Ensamble de la secuencia del genoma
Ensamble de la secuencia del genoma
La correcta identificación de superposiciones y montaje de
contigs es como unir un rompecabezas, que puede ser
computacionalmente muy costoso cuando se trata de datos a
nivel de todo el genoma
Los principales retos en el montaje del genoma son los errores de
secuenciación, la contaminación por vectores bacterianos y las
regiones de secuencias repetitivas.
Los errores de secuenciación a menudo se pueden corregir
mediante la elaboración de un consenso de un alineamiento de
múltiples secuencias solapadas.
Las secuencias de vectores bacterianos pueden ser eliminadas
mediante programas de filtrado antes del montaje.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
27 / 45
Mapeo, Ensamble y Comparación del Genoma
Ensamble de la secuencia del genoma
Ensamble de la secuencia del genoma
Para eliminar el problema de las repeticiones de secuencias,
programas tales como RepeatMasker se pueden utilizar para
detectar y eliminar repeticiones.
Una técnica comúnmente usada para evitar errores causados por
las repeticiones de secuencia es la denominada restricción
forward–reverse.
Esta técnica se basa en que al generar una secuencia de ambos
extremos de un único clon, la distancia entre los dos fragmentos
opuestos de un clon se fija a un cierto rango, lo que significa que
siempre están separados por una distancia definida por la
longitud del clon (normalmente 1.000 a 9.000 bases).
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
28 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Programas de base-calling y ensamble
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
29 / 45
Mapeo, Ensamble y Comparación del Genoma
Programas de base-calling y ensamble
Programas de base-calling y ensamble
El primer paso hacia el ensamble del genoma es realizar el
proceso de base-calling y asignar puntajes de calidad.
El siguiente paso es ensamblar las secuencias leídas en
secuencias contiguas. Este paso incluye la identificación de los
solapamientos entre fragmentos de secuencias, asignando el
orden de los fragmentos y obteniendo una secuencia de
consenso general.
El ensamble de todos los fragmentos obtenidos por shotgun en un
genoma completo es un paso computacionalmente muy difícil.
Hay una variedad de programas disponibles para este proceso. La
siguiente es una selección de programas de montaje comúnmente
utilizados en los proyectos de secuenciación del genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
30 / 45
Mapeo, Ensamble y Comparación del Genoma
Programas de base-calling y ensamble
Programas de base-calling y ensamble
Phred (www.phrap.org/) es un programa de UNIX para realizar
detección de bases. Se utiliza un análisis de Fourier para resolver
los rastros de fluorescencia y predecir posiciones de pico reales
de bases. También da una puntuación de probabilidad para cada
base, que puede ser atribuible a un error. Si el valor de la
puntuación está por debajo del umbral, es necesaria la
intervención humana.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
31 / 45
Mapeo, Ensamble y Comparación del Genoma
Programas de base-calling y ensamble
Programas de base-calling y ensamble
VecScreen (www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html) es
una aplicación web que ayuda a detectar la contaminación por
secuencias de vectores bacterianos. Se analiza una secuencia de
nucleótidos de entrada y la compara con una base de datos de
secuencias de vectores conocidos usando el programa BLAST.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
32 / 45
Mapeo, Ensamble y Comparación del Genoma
Programas de base-calling y ensamble
Programas de base-calling y ensamble
EULER (http://nbcr.sdsc.edu/euler/) es un algoritmo de montaje
que utiliza el enfoque del camino de Euler, que es un algoritmo
polinomial para resolver los puzzles, como el famoso "problema
del viajante de comercio". En este enfoque, un fragmento de
secuencia se descompone en tuplas de veinte nucleótidos.
Las tuplas se distribuyen en un diagrama con numerosos nodos
que están todos interconectados. Las tuplas son convertidas a
vectores binarios en los nodos. Mediante el uso de un algoritmo
de Viterbi, el camino más corto entre los vectores se puede
encontrar, que es la mejor manera de conectar las tuplas en una
secuencia completa.
Debido a que este enfoque no se basa directamente en la
detección de solapamientos, puede ser ventajoso en el montaje
de secuencias con motivos repetitivos.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
33 / 45
Mapeo, Ensamble y Comparación del Genoma
Programas de base-calling y ensamble
Programas de base-calling y ensamble
¿Cuántos genes posee un genoma?
Una de las principales tareas de la anotación del genoma es
tratar de dar una explicación precisa del número total de genes en
un genoma.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
34 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Genómica comparativa
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
35 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
La genómica comparativa es la comparación de genomas
completos de diferentes organismos, que incluye la correlación
del número de genes, la localización de los genes, y el contenido
de los genes.
La comparación ayuda a revelar el grado de conservación entre
los genomas, lo cual aporta conocimientos sobre el mecanismo
de la evolución del genoma y la transferencia de genes entre los
genomas.
Además, permite entender el patrón de adquisición de genes
extraños a través de la transferencia lateral de genes y a revelar el
conjunto básico de los genes comunes entre diferentes genomes,
que deben corresponder a los genes que son cruciales para la
supervivencia.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
36 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
La genómica comparativa incluye la alineación de todo el
genoma, la comparación del orden de genes entre los genomas,
la construcción de genomas mínimos, y la transferencia lateral de
genes entre los genomas.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
37 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
La alineación del genoma completo
Para comprender la conservación de la secuencia entre los
genomas se puede realizar una comparación directa entre
genomas o el alineamiento del genoma.
La alineación del genoma no difiere en gran medida de la
alineación de secuencias básicas. Sin embargo, la alineación de
las secuencias extremadamente grandes presenta nuevas
complejidades.
Los programas de alineamiento regulares tienden a ser propenso
a errores e ineficientes al tratar con largos tramos de ADN que
contengan cientos o miles de genes.
No se puede realizar una visualización efectiva de los resultados
de la alineación.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
38 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
MUMmer (Maximal Unique Match,
www.tigr.org/tigr-scripts/CMR2/webmum/
El programa es esencialmente un BLAST modificado que, en la
etapa de siembra, encuentra los partidos aproximados más largos
que incluyen desajustes en lugar de encontrar exactamente k-mer
coincidencias como en BLAST regular.
El resultado de la alineación de los genomas enteros se muestra
como un gráfico de puntos con líneas de puntos conectados para
indicar colinealidad de los genes. Está optimizado para la
comparación por pares de genomas microbianos estrechamente
relacionados mumplot es un programa libre de TIGR para la
alineación de dos secuencias completas del genoma y la
comparación de las ubicaciones de ortólogos.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
39 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
BLASTZ (http://bio.cse.psu.edu/) es un programa modificado de
BLAST para la alineación de grandes secuencias de ADN
genómico.
El programa BLAST modificado primero enmascara secuencias
repetitivas y busca "palabras"muy similares que se definen como
doce coincidencias idénticas con un tramo de diecinueve
nucleótidos.
Las palabras sirven como semillas para la extensión de la
alineación en ambas direcciones hasta que las puntuaciones
caen por debajo de un cierto umbral.
Realiza el alineamiento de regiones cercanas y estas se unen
mediante el uso de un esquema de peso que emplea un sistema
de penalización por hueco único que tolera variaciones menores.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
40 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
Búsqueda de un genoma mínimo
Uno de los objetivos de la comparación del genoma es entender
lo que constituye un genoma mínimo, que es un conjunto mínimo
de genes necesarios para el mantenimiento de un organismo
celular de vida independiente.
Este análisis consiste en la identificación de genes ortólogos
compartidos entre un número de genomas divergentes.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
41 / 45
Mapeo, Ensamble y Comparación del Genoma
Genómica comparativa
Genómica comparativa
Búsqueda de un genoma mínimo
Coregenes (http://pasteur.atcc.org:8050/CoreGenes1.0//) es un
programa basado en la web que determina un núcleo de genes
sobre la base de comparación de cuatro genomas pequeños. El
usuario proporciona los números de acceso NCBI de los
genomas de interés.
El programa realiza una comparación BLAST iterativo para
encontrar genes ortólogos mediante el uso de un genoma como
una referencia y la otra como una consulta.
Se lleva a cabo esta comparación por pares de los cuatro
genomas. Como resultado de ello, los genes comunes se
compilan como un conjunto básico de los genes de los genomas.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
42 / 45
Mapeo, Ensamble y Comparación del Genoma
1
Conclusiones
Mapeo, Ensamble y Comparación del Genoma
Introducción
Mapeo del genoma
Secuenciación del Genoma
Ensamble de la secuencia del genoma
Programas de base-calling y ensamble
Genómica comparativa
Conclusiones
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
43 / 45
Mapeo, Ensamble y Comparación del Genoma
Conclusiones
Conclusiones
El mapeo del genoma utilizando las posiciones relativas de los
marcadores genéticos sin el conocimiento de la secuencia de
datos, es un enfoque de baja resolución para describir las
estructuras del genoma.
Un genoma se puede describir a la máxima resolución mediante
la secuencia completa del genoma.
La secuenciación de todo el genoma puede llevarse a cabo
utilizando el enfoque shotgun o el enfoque jerárquico.
La anotación del genoma incluye la búsqueda de genes y la
asignación de la función de estos genes.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
44 / 45
Mapeo, Ensamble y Comparación del Genoma
Conclusiones
Conclusiones
El número de genes, sin embargo, no dicta complejidades de un
genoma.
Los genomas se pueden comparar sobre la base del contenido de
sus genes y de su orden. Se han desarrollado varios programas
especializados en comparación de genomas mediante la
alineación transversal.
La comparación de genomas a través del orden de los genes a
menudo ayuda a descubrir potenciales operones y asignar
funciones.
José A. M OLINET B. (C INVESTAV)
Mapeo, Ensamble y Comparación Genómica
30 de julio del 2013
45 / 45
Descargar