PAUP*: Phylogenetic Analysis Using Parsimony (and other methods)

Anuncio
- PAUP* es un programa para análisis filogenético que implementa
métodos de parsimonia, máxima verosimilitud y distancias
PAUP*: Phylogenetic Analysis Using
Parsimony (and other methods)
DE SECUENCIAS DE ADN
- La única versión que tiene una interfase gráfica completa (para su uso
a través de menús) es la versión para Macintosh OS9. El resto de la
versiones funcionan a través de línea de comandos
- Este programa fue desarrollado por David Swofford y constituye el
programa de análisis filogenético más utilizado en la actualidad
Francisco X. González-Cózatl
CEAMISH - UAEM
PAUP y Parsimonia
- Sitio web: http://paup.csit.fsu.edu/index.html
1
- PAUP* versión para Macintosh OS9. En general, esta versión permite
ejecutar comandos a través de los menús o usando la línea de comando
@2007González-Cózatl
PAUP y Parsimonia
- Además tiene distintas opciones para trabajar con árboles
filogenéticos entre las que se incluyen su importación, combinación,
comparación, enraizado, evaluación de hipótesis, etc.
- PAUP* esta disponible en versiones para distintas plataformas como
Macintosh, Windows, UNIX/VMS, ó formatos basados en DOS,
EN LA INFERENCIA FILOGENÉTICA
@2007González-Cózatl
- Posee una gran variedad de opciones de análisis y selección de
modelos, y permite evaluar distintos tipos de información como ADN,
ARN, proteínas y otros datos
3
@2007González-Cózatl
PAUP y Parsimonia
2
PAUP* versión para Windows. Aunque algunos menús están disponibles,
estas funciones solo incluyen operaciones para manejo de archivos y
edición. Esta versión (además de DOS y Unix) ejecutan ordenes a
través de la línea de comandos.
@2007González-Cózatl
PAUP y Parsimonia
4
1
- PAUP* utiliza archivos con el formato NEXUS, que esta estructurado
en distintos módulos
-El formato NEXUS fue diseñado por David Maddison, Wayne
Maddison, y David Swofford para facilitar el intercambio de archivos
de datos entre programas usados en filogenia y clasificiación
- Los archivos NEXUS pueden ser visualizados y editados en cualquier
procesador de texto
- La estructura básica de un archivo NEXUS incluye dos módulos:
- Bloque de Taxa
(Taxa block → begin taxa; )
- Bloque de caracteres
(Character block → begin characters; )
- Sin embargo, estos bloques pueden ser combinados en uno solo
-Bloque de datos
(Data block → begin data; )
- Cada bloque comienza con begin “block”; y termina con end;
@2007González-Cózatl
PAUP y Parsimonia
5
- Estructura básica de un archivo NEXUS
- Estructura básica de un archivo NEXUS
#NEXUS
begin data;
dimensions ntax=12 nchar=120;
format datatype=dna missing=? gap=matrix
Lemur_catta
Homo_sapiens
Pan
Gorilla
Pongo
Hylobates
Macaca_fuscata
AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATT
AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATT
AAGCTTCACCGGCGCAATTATCCTCATAATCGCCCACGGACTTACATCCTCATTATTATT
AAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATCATTATTATT
AAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTCCCTACTGTT
AAGCTTTACAGGTGCAACCGTCCTCATAATCGCCCACGGACTAACCTCTTCCCTGCTATT
AAGCTTTTCCGGCGCAACCATCCTTATGATCGCTCACGGACTCACCTCTTCCATATATTT
Lemur_catta
Homo_sapiens
Pan
Gorilla
Pongo
Hylobates
Macaca_fuscata
;
end;
CTGTCTAGCCAACTCTAACTACGAACGAATCCATAGCCGTACAATACTACTAGCACGAGG
CTGCCTAGCAAACTCAAACTACGAACGCACTCACAGTCGCATCATAATCCTCTCTCAAGG
CTGCCTAGCAAACTCAAATTATGAACGCACCCACAGTCGCATCATAATTCTCTCCCAAGG
CTGCCTAGCAAACTCAAACTACGAACGAACCCACAGCCGCATCATAATTCTCTCTCAAGG
CTGCCTAGCAAACTCAAACTACGAACGAACCCACAGCCGCATCATAATCCTCTCTCAAGG
CTGCCTTGCAAACTCAAACTACGAACGAACTCACAGCCGCATCATAATCCTATCTCGAGG
CTGCCTAGCCAATTCAAACTATGAACGCACTCACAACCGTACCATACTACTGTCCCGAGG
@2007González-Cózatl
6
- Bloque de suposiciones (Assumptions block → begin assumptions; )
begin taxa;
dimensions ntax=7;
taxlabels
Lemur_catta
Homo_sapiens
Pan
Gorilla
Pongo
Hylobates
Macaca_fuscata
;
end;
begin assumptions;
outgroup Macaca_fuscata;
charset coding = 2-457 660-896;
charset noncoding = 1 458-659 897-898;
charset 1stpos = 2-457\3 660-896\3;
charset 2ndpos = 3-457\3 661-896\3;
charset 3rdpos = 4-457\3 662-.\3;
usertype 2_1 =
a c
[a]
. 2
[c]
2 .
[g]
1 2
[t]
2 1
;
begin characters;
dimensions nchar=120;
format missing=? gap=- matchchar=. interleave datatype=dna;
options gapmode=missing;
matrix
AAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATT
AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATT.....
@2007González-Cózatl
PAUP y Parsimonia
- Adicionalmente, se puede incluir un módulo opcional para hacer
algunas consideraciones o definiciones de los datos:
#NEXUS
Lemur_catta
Homo_sapiens
;
end
interleave ;
4
g
1
2
.
2
[weights transversions 2 times transitions]
t
2
1
2
.
taxset hominoids = Homo_sapiens Pan Gorilla Pongo Hylobates;
end;
PAUP y Parsimonia
7
@2007González-Cózatl
PAUP y Parsimonia
8
2
- Finalmente, se puede agregar otro módulo opcional para ejecutar
distintos comandos (batch file)
- Bloque de comandos
- En un archivo NEXUS se puede incluir cualquier comentario o
referencia, pero mientras vayan entre corchetes ([....]) PAUP los
ignorará
(Paup block → begin paup; )
#NEXUS
[Ejemplo de archivo NEXUS con información entre corchetes que será ignorada]
BEGIN DATA;
DIMENSIONS NTAX=7 NCHAR=96;
FORMAT DATATYPE=DNA MISSING=? GAP=- INTERLEAVE ;
MATRIX
[
10
20
30
40
]
'SMY074-SMaYa'
ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'SYM158-SMaYa'
ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'FXG927-CoPap'
ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'FXG908-CoPap'
ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'DSR4980-SJua'
ATGACAAACATCCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'DSR4977-SJua'
ATGACAAACATCCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
'JMV1357-SJua'
ATGACAAACATTCGAAAAAAACACCCACTATTCAAAATCATCAACGAC
[48]
[
50
60
70
80
90
]
'SMY074-SMaYa'
TCGTTCATTGATCTTCCAACTCCATCCAATATCTCATCTTGATGAAAC
[96]
'SYM158-SMaYa'
TCGTTCATTGATCTTCCAACTCCATCCAATATCTCATCTTGATGAAAC
[96]
'FXG927-CoPap'
TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC
[96]
'FXG908-CoPap'
TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC
[96]
'DSR4980-SJua'
TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC
[96]
'DSR4977-SJua'
TCGTTCATTGATCTTCCAACCCCATCCAATATCTCATCTTGATGAAAC
[96]
'JMV1357-SJua'
TCGTTCATTGATCTTCCAACTCCACCCAATATCTCATCTTGATGAAAC
[96]
;
END;
begin paup;
set autoclose=yes warntree=no warnreset=no;
log start file=Paup_MP_practice.log replace;
1 exe primate-mtDNA.nex;
include coding/only;
delete Lemur_catta Hylobates;
set criterion=parsimony;
weights 2:2ndpos;
ctype 2_1:all;
cstatus;
hsearch start=stepwise addseq=random swap=spr;
outgroup Lemur_catta Macaca_fuscata Saimiri_sciureus;
showtrees all;
describetrees 1/plot=phylogram brlens=yes rootmethod=outgroup
outroot=monophyl;
savetrees file=Primates_MP_TBR_practice.tre brlens=yes replace;
BootStrap treefile=MP_BootstrapTreeFilea.tre nreps=1000 conlevel=50
brlens=yes replace=yes format=nexus search=heuristic /addseq=random
nreps=1;
end;
@2007González-Cózatl
PAUP y Parsimonia
9
- Aunque es posible realizar el análisis especificando los comandos
correspondientes en el “Bloque Paup” (Batch file) dentro del archivo
NEXUS, también se puede realizar este procedimiento desde la línea
de comandos
- PAUP* ofrece ayuda desde la línea de comandos usando las siguientes
instrucciones
help :
lista de comandos utilizados en PAUP
help cmds :
descripción breve de cada comando
<comando> ? : describe como usar el comando y cuales con los
parámetros establecidos por definición
@2007González-Cózatl
PAUP y Parsimonia
11
@2007González-Cózatl
PAUP y Parsimonia
10
> help
The following commands are always available:
CD
Defaults
DSet
Edit
Execute
Factory
FStatus
Help
Leave
Log
LSet
Quit
Set
Time
ToNEXUS
The following commands require data from a DATA (or TAXA and CHARACTERS) or
DISTANCES block (* = requires only TAXA block):
*Agree
AllTrees
AncStates
Assume
BandB
BaseFreqs
Bootstrap
CharPartition
CharSet
*ClearTrees
Condense
*Constraints
*ConTree
CStatus
CType
*Delete
*DerootTrees
*DescribeTrees
DScores
Exclude
Export
ExSet
*Filter
GammaPlot
*GenerateTrees
*GetTrees
HomPart
HSearch
Include
*Ingroup
Jackknife
Lake
@2007González-Cózatl
*LoadConstr
LScores
*MatrixRep
MPRSets
NJ
*Outgroup
PairDiff
Permute
PScores
PSet
Puzzle
RandTrees
*RateSet
Reconstruct
*Restore
RevFilter
Reweight
*RootTrees
SaveAssum
SaveDist
*SaveTrees
ShowAnc
*ShowConstr
ShowDist
ShowMatrix
ShowCharParts
ShowRateSets
ShowTaxParts
*ShowTrees
ShowUserTypes
*SortTrees
StarDecomp
PAUP y Parsimonia
SurfCheck
*TaxPartition
*TaxSet
*TreeDist
*TreeInfo
*TreeWts
*TStatus
TypeSet
*Undelete
UPGMA
UserType
Weights
Wts
WtSet
12
3
> help cmds
> help cmds
The following commands are always available:
CD
Change working directory
Defaults
Set default options
DSet
Set options for distance analysis
Edit
Edit a file
Execute
Execute an input file
Factory
Reset all options to factory default settings
FStatus
Show current status of data, log, and tree files
Help
Show list of available commands
Leave
Cancel batch-processing of a file
Log
Start/stop logging of output to file
LSet
Set options for maximum likelihood analysis
Quit
Exit PAUP*
Set
Set general options
Time
Output the current time and date
ToNEXUS
Convert a file to NEXUS format
*ClearTrees
Condense
Empty tree buffer
Condense trees (collapse branches and/or eliminate duplicate
trees)
*Constraints
Define constraint tree or specify taxon partition for
convexity constraints
*ConTree
Compute consensus trees
CStatus
Show character status (types, weights, etc.)
CType
Set character types
*Delete
Delete taxa from analysis
*DerootTrees
Convert rooted trees to unrooted trees
*DescribeTrees Show tree diagram(s) and associated information
DScores
Calculate scores of trees in memory according to distance
criterion
Exclude
Exclude characters from subsequent analyses
Export
Export current data and/or trees to a file in various formats
ExSet
Define an 'exset' (character-exclusion set)
*Filter
Hide trees failing to satisfy certain criteria
GammaPlot
Show plot of gamma rate distribution
*GenerateTrees Generate random or all-possible trees
*GetTrees
Get trees from a file
HomPart
Perform test for homogeneity of partitioned data sets
HSearch
Perform a heuristic search
Include
Restore characters to analysis (or exclude those not in list)
*Ingroup
Return taxa to ingroup
Jackknife
Perform jackknife analysis
Lake
Evaluate Lake's linear invariants
*LoadConstr
Load constraints from treefile
LScores
Calculate likelihoods of trees in memory
*MatrixRep
Output tree(s) in matrix representation
The following commands require data from a DATA (or TAXA and CHARACTERS) or
DISTANCES block (* = requires only TAXA block):
*Agree
AllTrees
AncStates
Assume
BandB
BaseFreqs
Bootstrap
CharPartition
CharSet
Calculate agreement subtrees
Perform exhaustive search
Define ancestral character states
Set character assumptions
Perform branch-and-bound search
Show base frequencies for each taxon
Perform bootstrap analysis
Define a partition of the characters
Define a 'charset' (character set)
@2007González-Cózatl
PAUP y Parsimonia
13
> help cmds
PAUP y Parsimonia
14
> help cmds
MPRSets
NJ
*Outgroup
PairDiff
Permute
PScores
Plot possible character-state assignments (MPR-sets)
Calculate tree using neighbor-joining method
Move taxa to outgroup
Show nucleotide-pair frequencies
Perform Archie-Faith-Cranston randomization tests
Calculate parsimony lengths (and fit measures) of trees in
memory
PSet
Set options for parsimony analysis
Puzzle
Estimate a tree using quartet puzzling
RandTrees
Evaluate random trees
*RateSet
Define a "rate set"
Reconstruct
Plot character-state reconstructions
*Restore
Synonym for "Undelete"
RevFilter
Reverse previous filter command.
Reweight
Reweight characters based on fit criteria
*RootTrees
Convert unrooted trees to rooted trees
SaveAssum
Save current assumptions to a file
SaveDist
Save distance matrix to a file
*SaveTrees
Save trees currently in memory to a file
ShowAnc
Show current ancestral states
*ShowConstr
Show topological constraints
ShowDist
Show matrix of distances between pairs of taxa
ShowMatrix
Show character-data matrix
ShowCharParts Show one or all character-partition definitions.
ShowRateSets Show one or all rate-set definitions.
ShowTaxParts Show one or all taxon-partition definitions
*ShowTrees
Show tree diagram(s)
ShowUserTypes Show user-defined character types
*SortTrees
Sort trees according to current optimality criterion
@2007González-Cózatl
@2007González-Cózatl
PAUP y Parsimonia
StarDecomp
SurfCheck
*TaxPartition
*TaxSet
*TreeDist
*TreeInfo
*TreeWts
*TStatus
TypeSet
*Undelete
UPGMA
UserType
Weights
Wts
WtSet
15
Find a tree by star-decomposition search
Check likelihood surface for multiple peaks
Define a partition of the taxa
Define a "taxset" (taxon-set)
Show matrix of partition-metric distances between trees
Show status of trees in memory
Show current tree weights or specify new tree weights
Show taxon deletion/outgroup status
Define a "typeset" (character-type specification)
Restore previously deleted taxa (or delete taxa not in list)
Calculate UPGMA tree
Define a character type (stepmatrix or character-state tree)
Assign character weights
Assign character weights (synonym for Weights)
Define a "wtset" (character-weight set)
@2007González-Cózatl
PAUP y Parsimonia
16
4
> Hsearch ?
-Análisis de máxima parsimonia usando la versión Windows de PAUP* a
través de bloques de comandos (batch file)
Usage: HSearch [options...] ;
- El set de datos que se utilizará corresponde al archivo “primatemtDNA-interleaved.nex” (disponible en la carpeta Sample Nexus
Data dentro del directorio de PAUP* en cualquier versión)
Available options:
Keyword ---- Option type ------------------------ Current default setting -Swap
None|NNI|SPR|TBR
TBR
Keep
<real-value>|No
No
MulTrees
No|Yes
Yes
Enforce
No|Yes
No
Constraints <constraint-name>
<none>
Converse
No|Yes
No
ReconLimit
<integer-value>|Infinity
Infinity
NChuck
<integer-value>
0
ChuckScore
<real-value>|No
No
Start
Stepwise|NJ|Current|
<tree-number>[-<tree-number>]
*Stepwise
AddSeq
Simple|Closest|AsIs|Random|Furthest Simple
NReps
<integer-value>
10
RSeed
<integer-value>
0
RStatus
No|Yes
No
SaveReps
No|Yes
No
RefTax
<integer-value>
0
Hold
<integer-value>|No
1
NBest
<integer-value>|All
All
AllSwap
No|Yes
No
UseNonMin
No|Yes
No
Steepest
No|Yes
No
AbortRep
No|Yes
No
Retain
No|Yes
*No
Status
No|Yes
Yes
@2007González-Cózatl
PAUP y Parsimonia
- Los bloques de comandos se encuentran en el archivo “Archivo
PAUP blocks”
- Bloque 1: Búsqueda “Branch and Bound” sin pesos
- Bloque 2: Búsqueda heurística sin pesos
- Bloque 3: Búsqueda heurística asignado pesos distintos a cada
posición del codón
- Bloque 4: Búsqueda heurística asignado pesos distintos a
transiciones y transversiones
-Bloque 5: Búsqueda heurística integrando distintas opciones
17
@2007González-Cózatl
PAUP y Parsimonia
18
5
Descargar