Guión del programa PAUP

Anuncio
1
Métodos y Técnicas Experimentales en Biología Animal
Introducción al programa PAUP 4.0
El programa PAUP (Phylogenetic Analysis Using Parsimony), elaborado
por el profesor David L. Swofford (Laboratorio de Sistemática Molecular,
Instituto Smithsoniano) es, hoy por hoy, el más completo y potente programa
informático de análisis de caracteres morfológicos y moleculares. PAUP 4.0
incorpora la gran mayoría de los algoritmos para la elaboración de árboles
fenéticos y filogenéticos, según los criterios de distancia y parsimonia. La
versión que manejaremos es una versión beta, es decir, en periodo de pruebas,
lo cual puede dar lugar a pequeños problemas durante la ejecución del
programa.
Este guión pretende orientar al usuario en el manejo del PAUP, pero no
puede sustituir al manual de 130 páginas que acompaña al programa. Sólo una
pequeña parte de las posibilidades de PAUP son recogidas aquí, pero hemos
intentado proporcionar un punto de partida. Tras una breve descripción del
programa, pasaremos a realizar algunos ejercicios que ilustran las posibilidades
más importantes.
Características de PAUP 4.0
Para aquellos que hayan manejado versiones de PAUP iguales o
anteriores a la 3.0, y que sólo estaban disponibles en formato Macintosh, esta
nueva versión les va a parecer algo engorrosa de manejar. En efecto, PAUP 4.0
utiliza un sistema de comandos, no de menús desplegables, con objeto de ser
compatible con los principales sistemas operativos (Mac, Windows, Unix...). Por
tanto, cuando arranquemos PAUP, nos pedirá que le indiquemos el archivo de
trabajo, en modo EDIT (editar el archivo) o EXECUTE (ejecutarlo, o sea,
empezar a trabajar con él). A partir de ahí sólo podremos proseguir tecleando
comandos en la línea que a este efecto aparece bajo la ventana de trabajo. Los
comandos pueden escribirse con mayúsculas o minúsculas, e incluso ser
truncados, siempre que la truncación no produzca comandos ambiguos (p.e.
SHOWMATRIX puede ser truncado a SHOWM, pero no a SHOW, porque hay
varios comandos que empiezan así).
2
Los archivos de trabajo (Nexus)
PAUP sólo trabaja con archivos Nexus. Esto quiere decir archivos de
texto organizados de la siguiente forma:
1) Antes de nada la palabra
#NEXUS
2) Se puede introducir cualquier comentario o referencia, pero siempre entre
corchetes ([....]). PAUP ignorará cualquier cosa que vaya entre corchetes.
3) El archivo va dividido en bloques. Cada bloque comienza con la palabra
"begin" y el nombre del bloque. Cada bloque termina con "end ;". Los bloques
contienen comandos imprescindibles y otros opcionales. Todos los comandos
acaban con ";".
4) Los bloques más importantes son los siguientes:
Bloque:
Comandos:
taxa [Se especifican las dimensiones y los dimensions ntax=[número de taxones];
nombres de los caracteres]
taxlabels [nombres de los taxones];
characters [Se especifican las dimensiones y dimensions
nchar=[número
de
los nombres de los caracteres]
caracteres];
charlabels [nombres de los caracteres];
matrix [se expone la matriz de datos];
assumptions [se pueden seleccionar taxset [lista de taxones];
subgrupos de taxones o caracteres, definir charset [lista de caracteres];
coeficientes de ponderación para los cambios, deftype [ORD, UNORD, IRREV];
definir el tipo de cambios, etc.]
paup
constraints
[impone
determinadas
topologías en una parte del árbol];
De todas formas, los ejercicios que vamos a hacer no requieren el saber
aplicar este formato, puesto que ya trabajaremos con archivos nexus.
Ejercicio 1
Empezamos abriendo el ejercicio 1 de la carpeta "Ejercicios". Se trata de
un ejercicio sencillo, con taxones y caracteres imaginarios. Una vez abierto,
tecleamos los siguientes comandos:
• Edit ejercicio1: Accedemos al archivo nexus, y podemos comprobar su
estructura. Una vez visto, cerramos la ventana de edición.
• Showmatrix: Vemos la matriz de datos.
• Alltrees: Este comando realiza una búsqueda exhaustiva de todos los
árboles posibles, seleccionando el de menor longitud (4 pasos en este caso).
También muestra las frecuencias de todos los árboles encontrados.
• Describe: Si no especificamos, describe muestra el árbol más corto. Si
decimos "describe all" muestra todos los árboles obtenidos en una
búsqueda. Observad que todas las ramas tienen la misma longitud.
3
• Describe/plot=phylogram: Esta opción proporciona un árbol cuyas ramas
•
•
•
•
son proporcionales al número de cambios (a su longitud). Una vez
establecida la opción, PAUP la mantendrá en lo sucesivo. Observad que el
árbol no está enraizado. Vamos a hacerlo ahora.
Outgroup ancestrus: Hemos determinado la dirección de los cambios, al
situar a "ancestrus" como grupo externo. Comprobad el resultado con otro
"describe". Vamos a ver otras posibilidades.
Describe/brlens=yes: Proporciona la longitud de las ramas.
Describe/apolist: Proporciona la lista de apomorfías (caracteres derivados).
Reconstruct [número de carácter]: Reconstruye la historia de cada carácter
en el árbol seleccionado.
Ejercicio 2
En este ejercicio vamos a trabajar con datos reales, para reconstruir la
filogenia de diversos vertebrados. Abrid el archivo ejercicio2, y seguid los
mismos pasos que en el caso anterior, seleccionando la lamprea como outgroup.
Después de haber hecho esto, vamos a trabajar con otros comandos:
• Describe/homoplasy: Proporciona una lista de homoplasias. Comprobad
que es la endotermia el carácter homoplásico, tecleando el comando exclude
•
•
•
•
9, que elimina dicho carácter. Comprobad que el índice de consistencia ha
subido. Volved a incluir el carácter 9 (include 9).
NJ: Obtiene un árbol utilizando el algoritmo Neighbor-joining. Comprobad
que, en este caso, es idéntico al de máxima parsimonia.
Showdist: Muestra el número de diferencias, en valores absolutos y
relativos. ¿Qué dos taxones son las más diferentes? ¿Y los más parecidos?
UPGMA: Genera un árbol a partir de los datos de distancia y el algoritmo
UPGMA. Comparad los árboles obtenidos por este método y por el de
máxima parsimonia.
Bootstrap: Se trata de una técnica de valoración de las agrupaciones
mediante remuestreos (resampling). Después de 100 replicaciones, se
obtienen los porcentajes en los que aparece una agrupación determinada.
Comprobad cuáles son los grupos más fiables.
Ejercicio 3
Este ejercicio es una aproximación a la filogenia molecular mediante un
problema clásico: saber cuáles son las más emparentadas de estas tres especies:
humano/gorila/chimpancé. Para abordar el problema utilizaremos la secuencia
de bases del gen de la alfa-globina, convenientemente alineadas. Para enraizar
el árbol, utilizaremos la secuencia de la alfa-globina de rata. Seguid los mismos
4
pasos que en el ejercicio 1, haced un análisis Bootstrap, estudiad la matriz de
distancias, obtened un árbol UPGMA y comparad con el de parsimonia. Luego
explorad estas posibilidades:
• Alltrees keep=170: La opción keep permite retener árboles subóptimos, más
largos que el óptimo. Es probable que en una primera búsqueda hayáis
obtenido un árbol más parsimonioso de 156 pasos, en el que humanos y
chimpancés son grupos hermanos. La pregunta es: ¿no es posible que
árboles alternativos ligeramente más largos se nos estén escapando?
Keep=170 permite retener todos los árboles menores o iguales de esta
longitud. Valorad las alternativas a la agrupación chimpancés-humanos.
¿Cuánto mide el árbol más corto con una agrupación chimpancés/gorilas?
• Lake: El método de los invariantes de Richard Lake proporciona un potente
algoritmo de análisis de secuencias nucleotídicas, basado en métodos de
parsimonia, en el que se analizan cuartetos de especies, comparando las
frecuencias de transiciones (cambios purina-purina, pirimidina-pirimidina)
y transversiones (cambios purina-pirimidina, pirimidina-purina), menos
frecuentes que las primeras. Al final se aplica un test de probabilidades.
Ejercicios 4, 5 y 6
Una vez familiarizados con el programa PAUP, trabajad con estos
archivos, bastante más complejos, y estudiad otras posibilidades. El gran
número de caracteres y taxones hacen que las búsqueda exhaustivas (alltrees)
sean demasiado largas y poco prácticas. Utilizad otros algoritmos más rápidos,
como Branch and Bound (comando bandb) y búsqueda heurística (comando
hsearch). Otra posibilidad, que no hemos aplicado hasta ahora, debe ser
utilizada en el ejercicio 4, en el que se obtienen 34 árboles más parsimoniosos.
Cuando esto suceda teclead el comando:
• Contree: Genera un árbol consenso, en el que todas las alternativas quedan
reflejadas como politomías.
Descargar