Efecto de la utilización de costos diferenciales “interacciones entre

Anuncio
Efecto de la utilización de costos diferenciales “interacciones entre costos” en
análisis de sensibilidad para la reconstrucción de relaciones filogenéticas.
Fredy Alonso Zafra Serrano
Sistemática. Facultad de Ciencias. Escuela de Biología.
Universidad Industrial de Santander. Bucaramanga, Colombia. 2009
INTRODUCCIÓN
Los resultados de cualquier análisis dependen principalmente de los supuestos utilizados para
obtenerlo. Entre varias aproximaciones que un investigador puede tomar en una análisis
filogenético diseñado para reconstruir las relaciones de parentesco entre diferentes numero de
taxa; se encuentran los costos relativos asignados a las transformaciones. En sistemática
molecular se presentan a menudo en términos de costos
de indels y tasas
transición/transversión. En los últimos tiempos varios resultados filogenéticos (Morrison and
Ellis, 1997) mostraron la dependencia de estos análisis, de acuerdo a los costos relativos
asignados a los diferentes parámetros evaluados.
Wheeler (1995) propuso un método de análisis de sensibilidad para explorar los efectos de la
variación de estos y otros parámetros, tales como costos de extensión y apertura del gap,
aunque él solo utilizó costos indels y tasa transición/transversión. El análisis anterior va
acompañado por el cálculo del índice de incongruencia ILD (Farris et al., 1995); en esta
estructura, el set de parámetros que minimice la incongruencia entre las particiones es
considerado como el óptimo.
Hasta ahora, en la mayoría de análisis filogenéticos se han utilizado costos iguales para cada una
de las particiones. El objetivo de este estudio fue determinar el efecto de la utilización de costos
diferenciales lo que llamaremos “interacciones entre costos” para cada una de las particiones y
así determinar su posible utilización en los análisis de sensibilidad posteriores para la
reconstrucción de relaciones filogenéticas.
METODOLOGÍA
Para evaluar la conducta del análisis de sensibilidad utilizando las interacciones de los costos en
los diferentes genes; se dispuso de la utilización de seis sets de datos que comprendían tres
genes y una matriz morfológica provenientes de diferentes estudios (Fritsch et al., 2001;
Petersen et al., 2004; Boyer and Giribert, 2006; Espinasa et al., 2007 Peruzi et al., 2008; Schuh et
al., 2009) y cuatro set de costos (g1ts1tv1; g1ts1tv2; g1ts2tv2; g1ts2tv4).
En este estudio en particular, se realizó el análisis de sensibilidad para el estudio filogenético de
Cubacubaninae (Espinosa et al., 2007), usando el programa POY 4.0. (Varón et al., 2008). Los
resultados aquí obtenidos fueron confrontados con los resultados del estudio inicial.
Con el ánimo de dilucidar aún mejor el efecto de las interacciones entre costos en análisis de
sensibilidad para la reconstrucción de relaciones filogenéticas; se hizo la respectiva comparación
entre los estudios iniciales llevados a cabo por los autores citados y, los estudios secundarios,
realizados en el curso de sistemática 2009.
En el análisis diferentes costos de alineamiento son explorados. Los costos óptimos son
identificados por medio de medidas de congruencia y se selecciona como óptimo el set de
costos que produce la más alta congruencia entre las particiones. Esta técnica es originalmente
implementada en el programa POY (Varón et al., 2008).
RESULTADOS
Después de realizado el análisis de sensibilidad para el estudio filogenético de Cubacubaninae
(Espinosa et al., 2007), el mejor costo de acuerdo al Índice de Incongruencia de Farris fue la
interacción g1ts1tv1 para el gen 1, con un valor ILD de 0.019 (Tabla 2 vs. Tabla 1), lo que indica
que esta interacción de costos es la que minimiza la incongruencia de las particiones de los
datos moleculares y morfológicos.
DISCUSIONES
Es imperativo señalar que los análisis filogenéticos presentados hasta la fecha, evaluaban una
gran cantidad de set de costos, pero en estos análisis una sola matriz de Sankoff era utilizada
para evaluar la congruencia entre ellos. Aunque las características específicas de cada set de
datos pueden variar; la forma de analizar los datos para un análisis de evidencia total en una
estructura de optimización directa presentada aquí, permite examinar la influencia de variar el
set de costos para cada gen utilizado, en un mismo análisis, lo que se podría llamar interacción
de costos.
Los resultados presentados en este estudio, muestran que los ILDs más bajos y por ende los set
de costos más óptimos para las posteriores reconstrucciones filogenéticas, fueron presentados
cuando en los análisis se realizaron las interacciones entre costos en cada uno de los estudios
analizados (Tabla 3). Cabe señalar que el cambio se presenta exclusivamente en la longitud o el
menor número de pasos en las topologías generadas para cada interacción y para costos
iguales, lo que señalaría el posible error en el que han caído los estudios donde se realiza un
análisis de sensibilidad pero sin interacción de costos.
Esta variación en el tipo de análisis para encontrar el set de costos óptimo, es análoga
lógicamente guardando las distancias, a los análisis de reconstrucción filogenética basado en
modelos como Máxima Likelihood y Bayes, donde se asume que cada gen evoluciona de una
manera diferente, aunque podría darse que los tres genes tengan el mismo modelo y se
recuperara todavía una interacción, una posibilidad que se tendría que analizar posteriormente.
Por último se recomienda a los posteriores estudios filogenéticos, implementar este tipo de
metodología ya que es congruente con la lógica misma del análisis de sensibilidad.
BIBLIOGRAFÍA
Boyer, S. and Giribert, G. 2006. A new model Gondwanan taxon: systematics and biogeography
of the harvestman family Pettalidae (Arachnida, Opiliones, Cyphophthalmi), with a taxonomic
revision of genera from Australia and New Zealand, Cladistics. 23:337–36.
Espinasa, L., Flick, C. and Giribet, G. 2007. Phylogeny of the American silverfish Cubacubaninae
(Hexapoda: Zygentoma: Nicoletiide): a combined approach using morphology and five
molecular loci. Cladistics. 23: 22-40.
Farris, J. S., Källersjö, M., Kluge, A. G. and Bult, C. 1995. Constructing a significance test for
incongruence. Syst. Biol. 44:570-572.
Fritsch, Peter W., Morton, Cynthia M., Chen, Tao and Meldrum, Candice. 2001. Phylogeny and
Biogeography of the Styracaceae. International Journal of Plant Sciences. 162: 95-116
Morrison, D.A. and Ellis, J.T. 1997. Effects of nucleotide sequence alignment on phylogeny
estimation: a case study of 18S rDNAs of apicomplexa. Mol Biol Evol. 14: 428-441.
Peruzi, L., Peterson, A., Tison, J. and Peterson J. 2008. Phylogeny relationships of Gagea Salisb.
(Liliaceae) in Italy, inferred from molecular and morphological data matrices. Plant Syst. Evol.
276: 219-234.
Petersen G., Seberg O. and Baden C. 2004. A phylogenetic analysis of the genus Psathyrostachys
(Poaceae) based on one nuclear gene, three gene, three plastid genes, and morphology Plant
Systematics and Evolution. 249:99-110.
Schuh, R. T., Weirauch, Christiane and Wheeler, Ward C. 2009. Phylogenetic relationships within
the Cimicomorpha (Hemiptera: Heteroptera): a total-evidence analysis. Systematic Entomology.
34:15–48.
Varón, A., L. S. Vinh., I. Bomash and Wheeler W. C. 2008. POY 4.0.2911. American Museum of
Natural History. http://research.amnh.org/scicomp/projects/poy.php.
Wheeler, W.C. 1995. Sequence alignment, parameter sensitvity, and the phylogenetic analysis
of molecular data. Systematic biology 44: 321-331.
ANEXOS
Tabla 1. Set de costos iguales para el Test de Incongruencia de Farris ILD, tomados de Espinasa et al.,
2007.
Costos
Gen1
Gen2
Gen3
Morfología Molecular
Evidencia
ILD
Iguales
Total
g1ts1tv1
1345
350
517
54
2212
2500
0,093562446
g1ts1tv2
1766
353
554
110
2673
4135
0,326964933
g1ts2tv2
2255
900
729
216
3884
4234
0,316485593
g1ts2tv4
2868
608
802
432
4272
5559
0,15272531
Tabla 2. Valor óptimo del Test de Incongruencia de Farris ILD por interacción entre costos para el
estudio realizado por Espinasa et al., 2007.
Interacción
Gen1
Gen2
Gen3
Morfología Molecular
Evidencia
ILD
Total
g1ts1tv1
(gen1)
1340
344
779
54
2463
2512
0.019
Tabla 3. Valores óptimos del Test de Incongruencia de Farris ILD por interacción entre costos para los
estudios realizados por a). Fritsch et al., 2001; b). Petersen et al., 2004; c). Boyer y Giribert, 2006; d).
Peruzi et al., 2008 y e). Schuh et al., 2009.
Interacción
Gen1
Gen2
Gen3
Morfología Molecular
Evidencia
ILD
Total
1331
942
619
429
123
1990
2214
0.045619 [a]
4128
4128
2390
274
130
6792
3100
0.05096774 [b]
1414
157
17686
2032
380
19875
20561
0.014882545[c]
1414
792
8191
3712
252
12695
15252
0.15112772 [d]
1148
3177
2809
1477
269
7463
3456
0.07783565 [e]
Descargar