Efecto de la utilización de costos diferenciales “interacciones entre costos” en análisis de sensibilidad para la reconstrucción de relaciones filogenéticas. Fredy Alonso Zafra Serrano Sistemática. Facultad de Ciencias. Escuela de Biología. Universidad Industrial de Santander. Bucaramanga, Colombia. 2009 INTRODUCCIÓN Los resultados de cualquier análisis dependen principalmente de los supuestos utilizados para obtenerlo. Entre varias aproximaciones que un investigador puede tomar en una análisis filogenético diseñado para reconstruir las relaciones de parentesco entre diferentes numero de taxa; se encuentran los costos relativos asignados a las transformaciones. En sistemática molecular se presentan a menudo en términos de costos de indels y tasas transición/transversión. En los últimos tiempos varios resultados filogenéticos (Morrison and Ellis, 1997) mostraron la dependencia de estos análisis, de acuerdo a los costos relativos asignados a los diferentes parámetros evaluados. Wheeler (1995) propuso un método de análisis de sensibilidad para explorar los efectos de la variación de estos y otros parámetros, tales como costos de extensión y apertura del gap, aunque él solo utilizó costos indels y tasa transición/transversión. El análisis anterior va acompañado por el cálculo del índice de incongruencia ILD (Farris et al., 1995); en esta estructura, el set de parámetros que minimice la incongruencia entre las particiones es considerado como el óptimo. Hasta ahora, en la mayoría de análisis filogenéticos se han utilizado costos iguales para cada una de las particiones. El objetivo de este estudio fue determinar el efecto de la utilización de costos diferenciales lo que llamaremos “interacciones entre costos” para cada una de las particiones y así determinar su posible utilización en los análisis de sensibilidad posteriores para la reconstrucción de relaciones filogenéticas. METODOLOGÍA Para evaluar la conducta del análisis de sensibilidad utilizando las interacciones de los costos en los diferentes genes; se dispuso de la utilización de seis sets de datos que comprendían tres genes y una matriz morfológica provenientes de diferentes estudios (Fritsch et al., 2001; Petersen et al., 2004; Boyer and Giribert, 2006; Espinasa et al., 2007 Peruzi et al., 2008; Schuh et al., 2009) y cuatro set de costos (g1ts1tv1; g1ts1tv2; g1ts2tv2; g1ts2tv4). En este estudio en particular, se realizó el análisis de sensibilidad para el estudio filogenético de Cubacubaninae (Espinosa et al., 2007), usando el programa POY 4.0. (Varón et al., 2008). Los resultados aquí obtenidos fueron confrontados con los resultados del estudio inicial. Con el ánimo de dilucidar aún mejor el efecto de las interacciones entre costos en análisis de sensibilidad para la reconstrucción de relaciones filogenéticas; se hizo la respectiva comparación entre los estudios iniciales llevados a cabo por los autores citados y, los estudios secundarios, realizados en el curso de sistemática 2009. En el análisis diferentes costos de alineamiento son explorados. Los costos óptimos son identificados por medio de medidas de congruencia y se selecciona como óptimo el set de costos que produce la más alta congruencia entre las particiones. Esta técnica es originalmente implementada en el programa POY (Varón et al., 2008). RESULTADOS Después de realizado el análisis de sensibilidad para el estudio filogenético de Cubacubaninae (Espinosa et al., 2007), el mejor costo de acuerdo al Índice de Incongruencia de Farris fue la interacción g1ts1tv1 para el gen 1, con un valor ILD de 0.019 (Tabla 2 vs. Tabla 1), lo que indica que esta interacción de costos es la que minimiza la incongruencia de las particiones de los datos moleculares y morfológicos. DISCUSIONES Es imperativo señalar que los análisis filogenéticos presentados hasta la fecha, evaluaban una gran cantidad de set de costos, pero en estos análisis una sola matriz de Sankoff era utilizada para evaluar la congruencia entre ellos. Aunque las características específicas de cada set de datos pueden variar; la forma de analizar los datos para un análisis de evidencia total en una estructura de optimización directa presentada aquí, permite examinar la influencia de variar el set de costos para cada gen utilizado, en un mismo análisis, lo que se podría llamar interacción de costos. Los resultados presentados en este estudio, muestran que los ILDs más bajos y por ende los set de costos más óptimos para las posteriores reconstrucciones filogenéticas, fueron presentados cuando en los análisis se realizaron las interacciones entre costos en cada uno de los estudios analizados (Tabla 3). Cabe señalar que el cambio se presenta exclusivamente en la longitud o el menor número de pasos en las topologías generadas para cada interacción y para costos iguales, lo que señalaría el posible error en el que han caído los estudios donde se realiza un análisis de sensibilidad pero sin interacción de costos. Esta variación en el tipo de análisis para encontrar el set de costos óptimo, es análoga lógicamente guardando las distancias, a los análisis de reconstrucción filogenética basado en modelos como Máxima Likelihood y Bayes, donde se asume que cada gen evoluciona de una manera diferente, aunque podría darse que los tres genes tengan el mismo modelo y se recuperara todavía una interacción, una posibilidad que se tendría que analizar posteriormente. Por último se recomienda a los posteriores estudios filogenéticos, implementar este tipo de metodología ya que es congruente con la lógica misma del análisis de sensibilidad. BIBLIOGRAFÍA Boyer, S. and Giribert, G. 2006. A new model Gondwanan taxon: systematics and biogeography of the harvestman family Pettalidae (Arachnida, Opiliones, Cyphophthalmi), with a taxonomic revision of genera from Australia and New Zealand, Cladistics. 23:337–36. Espinasa, L., Flick, C. and Giribet, G. 2007. Phylogeny of the American silverfish Cubacubaninae (Hexapoda: Zygentoma: Nicoletiide): a combined approach using morphology and five molecular loci. Cladistics. 23: 22-40. Farris, J. S., Källersjö, M., Kluge, A. G. and Bult, C. 1995. Constructing a significance test for incongruence. Syst. Biol. 44:570-572. Fritsch, Peter W., Morton, Cynthia M., Chen, Tao and Meldrum, Candice. 2001. Phylogeny and Biogeography of the Styracaceae. International Journal of Plant Sciences. 162: 95-116 Morrison, D.A. and Ellis, J.T. 1997. Effects of nucleotide sequence alignment on phylogeny estimation: a case study of 18S rDNAs of apicomplexa. Mol Biol Evol. 14: 428-441. Peruzi, L., Peterson, A., Tison, J. and Peterson J. 2008. Phylogeny relationships of Gagea Salisb. (Liliaceae) in Italy, inferred from molecular and morphological data matrices. Plant Syst. Evol. 276: 219-234. Petersen G., Seberg O. and Baden C. 2004. A phylogenetic analysis of the genus Psathyrostachys (Poaceae) based on one nuclear gene, three gene, three plastid genes, and morphology Plant Systematics and Evolution. 249:99-110. Schuh, R. T., Weirauch, Christiane and Wheeler, Ward C. 2009. Phylogenetic relationships within the Cimicomorpha (Hemiptera: Heteroptera): a total-evidence analysis. Systematic Entomology. 34:15–48. Varón, A., L. S. Vinh., I. Bomash and Wheeler W. C. 2008. POY 4.0.2911. American Museum of Natural History. http://research.amnh.org/scicomp/projects/poy.php. Wheeler, W.C. 1995. Sequence alignment, parameter sensitvity, and the phylogenetic analysis of molecular data. Systematic biology 44: 321-331. ANEXOS Tabla 1. Set de costos iguales para el Test de Incongruencia de Farris ILD, tomados de Espinasa et al., 2007. Costos Gen1 Gen2 Gen3 Morfología Molecular Evidencia ILD Iguales Total g1ts1tv1 1345 350 517 54 2212 2500 0,093562446 g1ts1tv2 1766 353 554 110 2673 4135 0,326964933 g1ts2tv2 2255 900 729 216 3884 4234 0,316485593 g1ts2tv4 2868 608 802 432 4272 5559 0,15272531 Tabla 2. Valor óptimo del Test de Incongruencia de Farris ILD por interacción entre costos para el estudio realizado por Espinasa et al., 2007. Interacción Gen1 Gen2 Gen3 Morfología Molecular Evidencia ILD Total g1ts1tv1 (gen1) 1340 344 779 54 2463 2512 0.019 Tabla 3. Valores óptimos del Test de Incongruencia de Farris ILD por interacción entre costos para los estudios realizados por a). Fritsch et al., 2001; b). Petersen et al., 2004; c). Boyer y Giribert, 2006; d). Peruzi et al., 2008 y e). Schuh et al., 2009. Interacción Gen1 Gen2 Gen3 Morfología Molecular Evidencia ILD Total 1331 942 619 429 123 1990 2214 0.045619 [a] 4128 4128 2390 274 130 6792 3100 0.05096774 [b] 1414 157 17686 2032 380 19875 20561 0.014882545[c] 1414 792 8191 3712 252 12695 15252 0.15112772 [d] 1148 3177 2809 1477 269 7463 3456 0.07783565 [e]