1 Métodos y Técnicas Experimentales en Biología Animal Introducción al programa PAUP 4.0 El programa PAUP (Phylogenetic Analysis Using Parsimony), elaborado por el profesor David L. Swofford (Laboratorio de Sistemática Molecular, Instituto Smithsoniano) es, hoy por hoy, el más completo y potente programa informático de análisis de caracteres morfológicos y moleculares. PAUP 4.0 incorpora la gran mayoría de los algoritmos para la elaboración de árboles fenéticos y filogenéticos, según los criterios de distancia y parsimonia. La versión que manejaremos es una versión beta, es decir, en periodo de pruebas, lo cual puede dar lugar a pequeños problemas durante la ejecución del programa. Este guión pretende orientar al usuario en el manejo del PAUP, pero no puede sustituir al manual de 130 páginas que acompaña al programa. Sólo una pequeña parte de las posibilidades de PAUP son recogidas aquí, pero hemos intentado proporcionar un punto de partida. Tras una breve descripción del programa, pasaremos a realizar algunos ejercicios que ilustran las posibilidades más importantes. Características de PAUP 4.0 Para aquellos que hayan manejado versiones de PAUP iguales o anteriores a la 3.0, y que sólo estaban disponibles en formato Macintosh, esta nueva versión les va a parecer algo engorrosa de manejar. En efecto, PAUP 4.0 utiliza un sistema de comandos, no de menús desplegables, con objeto de ser compatible con los principales sistemas operativos (Mac, Windows, Unix...). Por tanto, cuando arranquemos PAUP, nos pedirá que le indiquemos el archivo de trabajo, en modo EDIT (editar el archivo) o EXECUTE (ejecutarlo, o sea, empezar a trabajar con él). A partir de ahí sólo podremos proseguir tecleando comandos en la línea que a este efecto aparece bajo la ventana de trabajo. Los comandos pueden escribirse con mayúsculas o minúsculas, e incluso ser truncados, siempre que la truncación no produzca comandos ambiguos (p.e. SHOWMATRIX puede ser truncado a SHOWM, pero no a SHOW, porque hay varios comandos que empiezan así). 2 Los archivos de trabajo (Nexus) PAUP sólo trabaja con archivos Nexus. Esto quiere decir archivos de texto organizados de la siguiente forma: 1) Antes de nada la palabra #NEXUS 2) Se puede introducir cualquier comentario o referencia, pero siempre entre corchetes ([....]). PAUP ignorará cualquier cosa que vaya entre corchetes. 3) El archivo va dividido en bloques. Cada bloque comienza con la palabra "begin" y el nombre del bloque. Cada bloque termina con "end ;". Los bloques contienen comandos imprescindibles y otros opcionales. Todos los comandos acaban con ";". 4) Los bloques más importantes son los siguientes: Bloque: Comandos: taxa [Se especifican las dimensiones y los dimensions ntax=[número de taxones]; nombres de los caracteres] taxlabels [nombres de los taxones]; characters [Se especifican las dimensiones y dimensions nchar=[número de los nombres de los caracteres] caracteres]; charlabels [nombres de los caracteres]; matrix [se expone la matriz de datos]; assumptions [se pueden seleccionar taxset [lista de taxones]; subgrupos de taxones o caracteres, definir charset [lista de caracteres]; coeficientes de ponderación para los cambios, deftype [ORD, UNORD, IRREV]; definir el tipo de cambios, etc.] paup constraints [impone determinadas topologías en una parte del árbol]; De todas formas, los ejercicios que vamos a hacer no requieren el saber aplicar este formato, puesto que ya trabajaremos con archivos nexus. Ejercicio 1 Empezamos abriendo el ejercicio 1 de la carpeta "Ejercicios". Se trata de un ejercicio sencillo, con taxones y caracteres imaginarios. Una vez abierto, tecleamos los siguientes comandos: • Edit ejercicio1: Accedemos al archivo nexus, y podemos comprobar su estructura. Una vez visto, cerramos la ventana de edición. • Showmatrix: Vemos la matriz de datos. • Alltrees: Este comando realiza una búsqueda exhaustiva de todos los árboles posibles, seleccionando el de menor longitud (4 pasos en este caso). También muestra las frecuencias de todos los árboles encontrados. • Describe: Si no especificamos, describe muestra el árbol más corto. Si decimos "describe all" muestra todos los árboles obtenidos en una búsqueda. Observad que todas las ramas tienen la misma longitud. 3 • Describe/plot=phylogram: Esta opción proporciona un árbol cuyas ramas • • • • son proporcionales al número de cambios (a su longitud). Una vez establecida la opción, PAUP la mantendrá en lo sucesivo. Observad que el árbol no está enraizado. Vamos a hacerlo ahora. Outgroup ancestrus: Hemos determinado la dirección de los cambios, al situar a "ancestrus" como grupo externo. Comprobad el resultado con otro "describe". Vamos a ver otras posibilidades. Describe/brlens=yes: Proporciona la longitud de las ramas. Describe/apolist: Proporciona la lista de apomorfías (caracteres derivados). Reconstruct [número de carácter]: Reconstruye la historia de cada carácter en el árbol seleccionado. Ejercicio 2 En este ejercicio vamos a trabajar con datos reales, para reconstruir la filogenia de diversos vertebrados. Abrid el archivo ejercicio2, y seguid los mismos pasos que en el caso anterior, seleccionando la lamprea como outgroup. Después de haber hecho esto, vamos a trabajar con otros comandos: • Describe/homoplasy: Proporciona una lista de homoplasias. Comprobad que es la endotermia el carácter homoplásico, tecleando el comando exclude • • • • 9, que elimina dicho carácter. Comprobad que el índice de consistencia ha subido. Volved a incluir el carácter 9 (include 9). NJ: Obtiene un árbol utilizando el algoritmo Neighbor-joining. Comprobad que, en este caso, es idéntico al de máxima parsimonia. Showdist: Muestra el número de diferencias, en valores absolutos y relativos. ¿Qué dos taxones son las más diferentes? ¿Y los más parecidos? UPGMA: Genera un árbol a partir de los datos de distancia y el algoritmo UPGMA. Comparad los árboles obtenidos por este método y por el de máxima parsimonia. Bootstrap: Se trata de una técnica de valoración de las agrupaciones mediante remuestreos (resampling). Después de 100 replicaciones, se obtienen los porcentajes en los que aparece una agrupación determinada. Comprobad cuáles son los grupos más fiables. Ejercicio 3 Este ejercicio es una aproximación a la filogenia molecular mediante un problema clásico: saber cuáles son las más emparentadas de estas tres especies: humano/gorila/chimpancé. Para abordar el problema utilizaremos la secuencia de bases del gen de la alfa-globina, convenientemente alineadas. Para enraizar el árbol, utilizaremos la secuencia de la alfa-globina de rata. Seguid los mismos 4 pasos que en el ejercicio 1, haced un análisis Bootstrap, estudiad la matriz de distancias, obtened un árbol UPGMA y comparad con el de parsimonia. Luego explorad estas posibilidades: • Alltrees keep=170: La opción keep permite retener árboles subóptimos, más largos que el óptimo. Es probable que en una primera búsqueda hayáis obtenido un árbol más parsimonioso de 156 pasos, en el que humanos y chimpancés son grupos hermanos. La pregunta es: ¿no es posible que árboles alternativos ligeramente más largos se nos estén escapando? Keep=170 permite retener todos los árboles menores o iguales de esta longitud. Valorad las alternativas a la agrupación chimpancés-humanos. ¿Cuánto mide el árbol más corto con una agrupación chimpancés/gorilas? • Lake: El método de los invariantes de Richard Lake proporciona un potente algoritmo de análisis de secuencias nucleotídicas, basado en métodos de parsimonia, en el que se analizan cuartetos de especies, comparando las frecuencias de transiciones (cambios purina-purina, pirimidina-pirimidina) y transversiones (cambios purina-pirimidina, pirimidina-purina), menos frecuentes que las primeras. Al final se aplica un test de probabilidades. Ejercicios 4, 5 y 6 Una vez familiarizados con el programa PAUP, trabajad con estos archivos, bastante más complejos, y estudiad otras posibilidades. El gran número de caracteres y taxones hacen que las búsqueda exhaustivas (alltrees) sean demasiado largas y poco prácticas. Utilizad otros algoritmos más rápidos, como Branch and Bound (comando bandb) y búsqueda heurística (comando hsearch). Otra posibilidad, que no hemos aplicado hasta ahora, debe ser utilizada en el ejercicio 4, en el que se obtienen 34 árboles más parsimoniosos. Cuando esto suceda teclead el comando: • Contree: Genera un árbol consenso, en el que todas las alternativas quedan reflejadas como politomías.