- PAUP* es un programa para análisis filogenético que implementa métodos de parsimonia, máxima verosimilitud y distancias PAUP*: Phylogenetic Analysis Using Parsimony (and other methods) DE SECUENCIAS DE ADN - La única versión que tiene una interfase gráfica completa (para su uso a través de menús) es la versión para Macintosh OS9. El resto de la versiones funcionan a través de línea de comandos - Este programa fue desarrollado por David Swofford y constituye el programa de análisis filogenético más utilizado en la actualidad Francisco X. González-Cózatl CEAMISH - UAEM PAUP y Parsimonia - Sitio web: http://paup.csit.fsu.edu/index.html 1 - PAUP* versión para Macintosh OS9. En general, esta versión permite ejecutar comandos a través de los menús o usando la línea de comando @2007González-Cózatl PAUP y Parsimonia - Además tiene distintas opciones para trabajar con árboles filogenéticos entre las que se incluyen su importación, combinación, comparación, enraizado, evaluación de hipótesis, etc. - PAUP* esta disponible en versiones para distintas plataformas como Macintosh, Windows, UNIX/VMS, ó formatos basados en DOS, EN LA INFERENCIA FILOGENÉTICA @2007González-Cózatl - Posee una gran variedad de opciones de análisis y selección de modelos, y permite evaluar distintos tipos de información como ADN, ARN, proteínas y otros datos 3 @2007González-Cózatl PAUP y Parsimonia 2 PAUP* versión para Windows. Aunque algunos menús están disponibles, estas funciones solo incluyen operaciones para manejo de archivos y edición. Esta versión (además de DOS y Unix) ejecutan ordenes a través de la línea de comandos. @2007González-Cózatl PAUP y Parsimonia 4 1 - PAUP* utiliza archivos con el formato NEXUS, que esta estructurado en distintos módulos -El formato NEXUS fue diseñado por David Maddison, Wayne Maddison, y David Swofford para facilitar el intercambio de archivos de datos entre programas usados en filogenia y clasificiación - Los archivos NEXUS pueden ser visualizados y editados en cualquier procesador de texto - La estructura básica de un archivo NEXUS incluye dos módulos: - Bloque de Taxa (Taxa block → begin taxa; ) - Bloque de caracteres (Character block → begin characters; ) - Sin embargo, estos bloques pueden ser combinados en uno solo -Bloque de datos (Data block → begin data; ) - Cada bloque comienza con begin “block”; y termina con end; @2007González-Cózatl PAUP y Parsimonia 5 - Estructura básica de un archivo NEXUS - Estructura básica de un archivo NEXUS #NEXUS begin data; dimensions ntax=12 nchar=120; format datatype=dna missing=? gap=matrix Lemur_catta Homo_sapiens Pan Gorilla Pongo Hylobates Macaca_fuscata AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATT AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATT AAGCTTCACCGGCGCAATTATCCTCATAATCGCCCACGGACTTACATCCTCATTATTATT AAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATCATTATTATT AAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTCCCTACTGTT AAGCTTTACAGGTGCAACCGTCCTCATAATCGCCCACGGACTAACCTCTTCCCTGCTATT AAGCTTTTCCGGCGCAACCATCCTTATGATCGCTCACGGACTCACCTCTTCCATATATTT Lemur_catta Homo_sapiens Pan Gorilla Pongo Hylobates Macaca_fuscata ; end; CTGTCTAGCCAACTCTAACTACGAACGAATCCATAGCCGTACAATACTACTAGCACGAGG CTGCCTAGCAAACTCAAACTACGAACGCACTCACAGTCGCATCATAATCCTCTCTCAAGG CTGCCTAGCAAACTCAAATTATGAACGCACCCACAGTCGCATCATAATTCTCTCCCAAGG CTGCCTAGCAAACTCAAACTACGAACGAACCCACAGCCGCATCATAATTCTCTCTCAAGG CTGCCTAGCAAACTCAAACTACGAACGAACCCACAGCCGCATCATAATCCTCTCTCAAGG CTGCCTTGCAAACTCAAACTACGAACGAACTCACAGCCGCATCATAATCCTATCTCGAGG CTGCCTAGCCAATTCAAACTATGAACGCACTCACAACCGTACCATACTACTGTCCCGAGG @2007González-Cózatl 6 - Bloque de suposiciones (Assumptions block → begin assumptions; ) begin taxa; dimensions ntax=7; taxlabels Lemur_catta Homo_sapiens Pan Gorilla Pongo Hylobates Macaca_fuscata ; end; begin assumptions; outgroup Macaca_fuscata; charset coding = 2-457 660-896; charset noncoding = 1 458-659 897-898; charset 1stpos = 2-457\3 660-896\3; charset 2ndpos = 3-457\3 661-896\3; charset 3rdpos = 4-457\3 662-.\3; usertype 2_1 = a c [a] . 2 [c] 2 . [g] 1 2 [t] 2 1 ; begin characters; dimensions nchar=120; format missing=? gap=- matchchar=. interleave datatype=dna; options gapmode=missing; matrix AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATT AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATT..... @2007González-Cózatl PAUP y Parsimonia - Adicionalmente, se puede incluir un módulo opcional para hacer algunas consideraciones o definiciones de los datos: #NEXUS Lemur_catta Homo_sapiens ; end interleave ; 4 g 1 2 . 2 [weights transversions 2 times transitions] t 2 1 2 . taxset hominoids = Homo_sapiens Pan Gorilla Pongo Hylobates; end; PAUP y Parsimonia 7 @2007González-Cózatl PAUP y Parsimonia 8 2 - Finalmente, se puede agregar otro módulo opcional para ejecutar distintos comandos (batch file) - Bloque de comandos - En un archivo NEXUS se puede incluir cualquier comentario o referencia, pero mientras vayan entre corchetes ([....]) PAUP los ignorará (Paup block → begin paup; ) #NEXUS [Ejemplo de archivo NEXUS con información entre corchetes que será ignorada] BEGIN DATA; DIMENSIONS NTAX=7 NCHAR=96; FORMAT DATATYPE=DNA MISSING=? GAP=- INTERLEAVE ; MATRIX [ 10 20 30 40 ] 'SMY074-SMaYa' ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'SYM158-SMaYa' ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'FXG927-CoPap' ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'FXG908-CoPap' ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'DSR4980-SJua' ATGACAAACATCCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'DSR4977-SJua' ATGACAAACATCCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] 'JMV1357-SJua' ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC [48] [ 50 60 70 80 90 ] 'SMY074-SMaYa' TCGTTCATTGATCTTCCAACTCCATCCAATATCTCATCTTGATGAAAC [96] 'SYM158-SMaYa' TCGTTCATTGATCTTCCAACTCCATCCAATATCTCATCTTGATGAAAC [96] 'FXG927-CoPap' TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC [96] 'FXG908-CoPap' TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC [96] 'DSR4980-SJua' TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC [96] 'DSR4977-SJua' TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC [96] 'JMV1357-SJua' TCGTTCATTGATCTTCCAACTCCACCCAATATCTCATCTTGATGAAAC [96] ; END; begin paup; set autoclose=yes warntree=no warnreset=no; log start file=Paup_MP_practice.log replace; 1 exe primate-mtDNA.nex; include coding/only; delete Lemur_catta Hylobates; set criterion=parsimony; weights 2:2ndpos; ctype 2_1:all; cstatus; hsearch start=stepwise addseq=random swap=spr; outgroup Lemur_catta Macaca_fuscata Saimiri_sciureus; showtrees all; describetrees 1/plot=phylogram brlens=yes rootmethod=outgroup outroot=monophyl; savetrees file=Primates_MP_TBR_practice.tre brlens=yes replace; BootStrap treefile=MP_BootstrapTreeFilea.tre nreps=1000 conlevel=50 brlens=yes replace=yes format=nexus search=heuristic /addseq=random nreps=1; end; @2007González-Cózatl PAUP y Parsimonia 9 - Aunque es posible realizar el análisis especificando los comandos correspondientes en el “Bloque Paup” (Batch file) dentro del archivo NEXUS, también se puede realizar este procedimiento desde la línea de comandos - PAUP* ofrece ayuda desde la línea de comandos usando las siguientes instrucciones help : lista de comandos utilizados en PAUP help cmds : descripción breve de cada comando <comando> ? : describe como usar el comando y cuales con los parámetros establecidos por definición @2007González-Cózatl PAUP y Parsimonia 11 @2007González-Cózatl PAUP y Parsimonia 10 > help The following commands are always available: CD Defaults DSet Edit Execute Factory FStatus Help Leave Log LSet Quit Set Time ToNEXUS The following commands require data from a DATA (or TAXA and CHARACTERS) or DISTANCES block (* = requires only TAXA block): *Agree AllTrees AncStates Assume BandB BaseFreqs Bootstrap CharPartition CharSet *ClearTrees Condense *Constraints *ConTree CStatus CType *Delete *DerootTrees *DescribeTrees DScores Exclude Export ExSet *Filter GammaPlot *GenerateTrees *GetTrees HomPart HSearch Include *Ingroup Jackknife Lake @2007González-Cózatl *LoadConstr LScores *MatrixRep MPRSets NJ *Outgroup PairDiff Permute PScores PSet Puzzle RandTrees *RateSet Reconstruct *Restore RevFilter Reweight *RootTrees SaveAssum SaveDist *SaveTrees ShowAnc *ShowConstr ShowDist ShowMatrix ShowCharParts ShowRateSets ShowTaxParts *ShowTrees ShowUserTypes *SortTrees StarDecomp PAUP y Parsimonia SurfCheck *TaxPartition *TaxSet *TreeDist *TreeInfo *TreeWts *TStatus TypeSet *Undelete UPGMA UserType Weights Wts WtSet 12 3 > help cmds > help cmds The following commands are always available: CD Change working directory Defaults Set default options DSet Set options for distance analysis Edit Edit a file Execute Execute an input file Factory Reset all options to factory default settings FStatus Show current status of data, log, and tree files Help Show list of available commands Leave Cancel batch-processing of a file Log Start/stop logging of output to file LSet Set options for maximum likelihood analysis Quit Exit PAUP* Set Set general options Time Output the current time and date ToNEXUS Convert a file to NEXUS format *ClearTrees Condense Empty tree buffer Condense trees (collapse branches and/or eliminate duplicate trees) *Constraints Define constraint tree or specify taxon partition for convexity constraints *ConTree Compute consensus trees CStatus Show character status (types, weights, etc.) CType Set character types *Delete Delete taxa from analysis *DerootTrees Convert rooted trees to unrooted trees *DescribeTrees Show tree diagram(s) and associated information DScores Calculate scores of trees in memory according to distance criterion Exclude Exclude characters from subsequent analyses Export Export current data and/or trees to a file in various formats ExSet Define an 'exset' (character-exclusion set) *Filter Hide trees failing to satisfy certain criteria GammaPlot Show plot of gamma rate distribution *GenerateTrees Generate random or all-possible trees *GetTrees Get trees from a file HomPart Perform test for homogeneity of partitioned data sets HSearch Perform a heuristic search Include Restore characters to analysis (or exclude those not in list) *Ingroup Return taxa to ingroup Jackknife Perform jackknife analysis Lake Evaluate Lake's linear invariants *LoadConstr Load constraints from treefile LScores Calculate likelihoods of trees in memory *MatrixRep Output tree(s) in matrix representation The following commands require data from a DATA (or TAXA and CHARACTERS) or DISTANCES block (* = requires only TAXA block): *Agree AllTrees AncStates Assume BandB BaseFreqs Bootstrap CharPartition CharSet Calculate agreement subtrees Perform exhaustive search Define ancestral character states Set character assumptions Perform branch-and-bound search Show base frequencies for each taxon Perform bootstrap analysis Define a partition of the characters Define a 'charset' (character set) @2007González-Cózatl PAUP y Parsimonia 13 > help cmds PAUP y Parsimonia 14 > help cmds MPRSets NJ *Outgroup PairDiff Permute PScores Plot possible character-state assignments (MPR-sets) Calculate tree using neighbor-joining method Move taxa to outgroup Show nucleotide-pair frequencies Perform Archie-Faith-Cranston randomization tests Calculate parsimony lengths (and fit measures) of trees in memory PSet Set options for parsimony analysis Puzzle Estimate a tree using quartet puzzling RandTrees Evaluate random trees *RateSet Define a "rate set" Reconstruct Plot character-state reconstructions *Restore Synonym for "Undelete" RevFilter Reverse previous filter command. Reweight Reweight characters based on fit criteria *RootTrees Convert unrooted trees to rooted trees SaveAssum Save current assumptions to a file SaveDist Save distance matrix to a file *SaveTrees Save trees currently in memory to a file ShowAnc Show current ancestral states *ShowConstr Show topological constraints ShowDist Show matrix of distances between pairs of taxa ShowMatrix Show character-data matrix ShowCharParts Show one or all character-partition definitions. ShowRateSets Show one or all rate-set definitions. ShowTaxParts Show one or all taxon-partition definitions *ShowTrees Show tree diagram(s) ShowUserTypes Show user-defined character types *SortTrees Sort trees according to current optimality criterion @2007González-Cózatl @2007González-Cózatl PAUP y Parsimonia StarDecomp SurfCheck *TaxPartition *TaxSet *TreeDist *TreeInfo *TreeWts *TStatus TypeSet *Undelete UPGMA UserType Weights Wts WtSet 15 Find a tree by star-decomposition search Check likelihood surface for multiple peaks Define a partition of the taxa Define a "taxset" (taxon-set) Show matrix of partition-metric distances between trees Show status of trees in memory Show current tree weights or specify new tree weights Show taxon deletion/outgroup status Define a "typeset" (character-type specification) Restore previously deleted taxa (or delete taxa not in list) Calculate UPGMA tree Define a character type (stepmatrix or character-state tree) Assign character weights Assign character weights (synonym for Weights) Define a "wtset" (character-weight set) @2007González-Cózatl PAUP y Parsimonia 16 4 > Hsearch ? -Análisis de máxima parsimonia usando la versión Windows de PAUP* a través de bloques de comandos (batch file) Usage: HSearch [options...] ; - El set de datos que se utilizará corresponde al archivo “primatemtDNA-interleaved.nex” (disponible en la carpeta Sample Nexus Data dentro del directorio de PAUP* en cualquier versión) Available options: Keyword ---- Option type ------------------------ Current default setting -Swap None|NNI|SPR|TBR TBR Keep <real-value>|No No MulTrees No|Yes Yes Enforce No|Yes No Constraints <constraint-name> <none> Converse No|Yes No ReconLimit <integer-value>|Infinity Infinity NChuck <integer-value> 0 ChuckScore <real-value>|No No Start Stepwise|NJ|Current| <tree-number>[-<tree-number>] *Stepwise AddSeq Simple|Closest|AsIs|Random|Furthest Simple NReps <integer-value> 10 RSeed <integer-value> 0 RStatus No|Yes No SaveReps No|Yes No RefTax <integer-value> 0 Hold <integer-value>|No 1 NBest <integer-value>|All All AllSwap No|Yes No UseNonMin No|Yes No Steepest No|Yes No AbortRep No|Yes No Retain No|Yes *No Status No|Yes Yes @2007González-Cózatl PAUP y Parsimonia - Los bloques de comandos se encuentran en el archivo “Archivo PAUP blocks” - Bloque 1: Búsqueda “Branch and Bound” sin pesos - Bloque 2: Búsqueda heurística sin pesos - Bloque 3: Búsqueda heurística asignado pesos distintos a cada posición del codón - Bloque 4: Búsqueda heurística asignado pesos distintos a transiciones y transversiones -Bloque 5: Búsqueda heurística integrando distintas opciones 17 @2007González-Cózatl PAUP y Parsimonia 18 5