ÁRBOLES FILOGENÉTICOS ¿Por qué usar filogenias? El conocimiento del pasado es importante para poder resolver muchas cuestiones relacionadas con procesos biológicos. Las filogenias nos permiten obtener relaciones entre ancestros y descendientes mediante la topología del árbol. Las filogenias nos permiten obtener distancias evolutivas mediante la longitud de las ramas del árbol. Terminología del árbol filogenético Nodes = nodos Branches = ramas Root = raíz Topología del árbol: patrón de ramas Misma topología Taxón = operational taxonomic unit (OTU) S1-S5 Politomía: árbol no resuelto (se puede intentar añadir más secuencias para resolverlo) Árboles sin raíz (unrooted) o enraízados (rooted) Outgroup: secuencia/s relacionadas con las secuencias del árbol (ingroup) Dendrograma: indica solo relaciones de parecido Cladograma: indica relaciones de parecido y evolutivas Filograma: indica relaciones de parecido, evolutivas y de distancia Escala de distancia: número de diferencias entre secuencias (Ej.: 0,1 = 10%) Homoplasia Homoplasia Homoplasia Modelos de evolución de DNA La tasa de mutación en una secuencia de DNA depende de: - La región del genoma - La posición de la base en el codón Modelos de sustitución de nucleótidos Modelos de evolución de proteínas Modelos de evolución ¿Cómo estimar el árbol filogenético? •A partir de información de secuencias de ADN o proteínas Edición: GBLOCKS Evolución molecular: un ejemplo AAGACTT AAGACTT AAGGCTT _GGGCTT T_GACTT TAGACCTT A_CACTT Evolución molecular: lo que observamos en el presente Evolución molecular: la hipótesis más probable ¿Cómo encontrar la hipótesis más probable? ¿Cómo encontrar la hipótesis más probable? Métodos de reconstrucción filogenética Basados en distancias: UPGMA Neighbor-joining Basados en caracteres: Máxima parsimonia Máxima verosimilitud Métodos bayesianos Métodos basados en distancias. Métodos basados en distancias. Métodos basados en distancias. UPGMA • Es el método más simple. • UPGMA significa Unweighted Pair-Group Method with Arithmetic means (agrupamiento pareado no ponderado utilizando media aritmética). • Asume la existencia de un reloj molecular evolutivo. • Ultramétrico, se obtiene un árbol enraizado. • La hipótesis del reloj molecular supone que para una determinada macromolécula (proteína o gen) el ritmo de cambio es constante y proporcional al tiempo. UPGMA Métodos basados en distancias. Neighbor-joining • No asume la existencia de un reloj evolutivo. • Principio de “minimum evolution”: el mejor árbol es aquél que minimiza la longitud total de las ramas. • Heurístico. Greedy algorithm. • Muy rápido. • Aditivo, se obtiene un árbol sin raíz. Primer paso: se calcula la matriz de distancias Segundo paso: se calcula la divergencia de cada nodo con el resto de nodos Tercer paso: se calcula una nueva matriz de distancias usando la fórmula: Cuarto paso: se elige la pareja de nodos con menor Mij y se calcula su distancia a un nodo interno U Quinto paso: se calcula la distancia del nodo U al resto de nodos externos y se construye una nueva matriz de distancias Sexto paso: partiendo de un árbol estrellado, se construye el árbol resultante. Séptimo paso: se repite el proceso a partir del paso 2 hasta que se termina el árbol. Neighbour-joining Métodos basados en distancias. Ventajas y desventajas Métodos basados en caracteres. Se basan en características del árbol filogenético. -Máxima parsimonia -Máxima verosimilitud - Métodos bayesianos Búsqueda de árboles Búsqueda de árboles Búsqueda de árboles Métodos heurísticos: stepwise addition Métodos basados en caracteres. Máxima parsimonia. Árbol más parsimonioso Árbol más parsimonioso Métodos basados en caracteres. Máxima parsimonia. Métodos basados en caracteres. Máxima verosimilitud. Aplicación en filogenia Métodos basados en caracteres. Máxima verosimilitud. Métodos basados en caracteres. Métodos bayesianos. Métodos basados en caracteres. Métodos bayesianos. Métodos basados en caracteres. Métodos bayesianos. Contrastes de hipótesis de árboles Métodos para comprobar la robustez de un árbol Bootstrap: reestimación del árbol mediante la variación en la posición y la repetición de caracteres de la secuencia. http://evolution.genetics.washington.edu/phylip/software.html http://www.megasoftware.net/ http://evolution.genetics.washington.edu/phylip.html http://paup.csit.fsu.edu/ http://www.phylogeny.fr/ http://www.tree-puzzle.de/ http://atgc.lirmm.fr/phyml/ http://mrbayes.csit.fsu.edu/ http://taxonomy.zoology.gla.ac.uk/rod/treeview.html http://www.jalview.org/index.html http://molevol.cmima.csic.es/castresana/Gblocks_server.html http://www.ebi.ac.uk/cgi-bin/readseq.cgi