EFECTO DE LAS SECUENCIAS CODIFICANTES Y NO CODIFICANTES EN LAS RECONSTRUCCIONES FILOGENÉTICAS DENTRO DE LA FAMILIA ARISTOLOCHIACEAE Y ALGUNOS GRUPOS RELACIONADOS Laura Melisa Ayala Trabajo Final Sistemática-Universidad Industrial de Santander INTRODUCCIÓN Los genes codificantes se trabajan especialmente para estudios a bajo nivel taxonómico, y con frecuencia las homologías entre los diferentes nucleótidos se pueden establecer de forma inambigua, a diferencia de lo que ocurre con las secuencias no codificantes las cuales no siguen un patrón de tripletes y por lo tanto la identificación de las homologías es mas complicada (Pleguezuelos, et al., 2002). Adicionalmente éstas secuencias no codificantes pueden haber sufrido eventos mutacionales de inserción y deleción (fenómeno indel) entre las secuencias, lo cual en el momento del alineamiento debe ser tenido en cuenta puesto que estos espacios son sustituidos por guiones (gaps) con el fin de conservar la homología posicional. El orden Piperales es uno de los mas grandes dentro de las angiospermas basales con una amplia distribución (Wanke, et al., 2007). Datos moleculares han aportado la suficiente evidencia como para encontrar relaciones entre Piperales y Canellales (Qiu et al., 1999, en Wanke, et al., 2007). La relación entre los ordenes Piperales, Canellales, Magnoliales, y Laureles, los cuales forman el clado magnolioideo está también bien soportado. Dentro de los Piperales, el intrón trnK (que incluye el ORF de matK) tiene en promedio 2533 bp. La región codificante matK tiene una longitud de entre 1509-1557 bp (en promedio 1534bp) en la mayoría de angiospermas y se encuentra localizado dentro de el dominio V del grupo de los intrones tipo II del trnKUUU (Ems et al., 1995). Se piensa que este ORF codifica para la maturasa, de hecho es la única maturasa de los plastidios de las plantas superiores (Vogel et al., 1997 en Wanke et al, 2006). Mientras que el gen matK se ha convertido en uno de los genes cloroplásticos mas usados como marcadores en los análisis filogenéticos de Angiospermas, el intrón completo últimamente ha empezado a usarse, de ésta manera la utilidad de esta región puede ser extendida a niveles inter e intraespecíficos (Wanke et al., 2006). Particularmente el gen matK posee una tasa de sustitución en la primera y segunda posición similares a las de la tercera, lo cual contribuye a su alta tasa evolutiva en contraste con otros genes cloroplásticos ((Wanke et al., 2007). Éste trabajo busca construir las filogenias derivadas de regiones codificantes y no codificantes de la región trnK/matK del ADN de trasferencia de la ------, que se encuentra en el cloroplasto, con el fin de observar los efectos de la utilización de estos fragmentos en las reconstrucciones filogenéticas, particularmente de la familia Aristolochiaceae. MATERIALES Y MÉTODOS Análisis filogenético Las reconstrucciones filogenéticas se realizaron a partir de 19 especies de plantas, pertenecientes a de los órdenes Chlorantales (Hedyosmus mexicanum) y Piperales. Dentro del orden Piperales se trabajó con las familias Saururaceae (Saururus cernuus y Gymnotheca chilensis) y Aristolochiaceae. En esta última se tuvieron representantes de los cuatro géneros que la conforman. Género Saruma (Saruma henryi), Asarum (Asarum nipponicum, Asarum caudatum), Thottea (Thottea corymbosa) y Aristolochia (Aristolochia serpentaria, A. californica, A. triactinia, A. promissa, A. rojasiana, A. holostylis, A. rotunda, A. clematitis, A. bracteolata, A. albida) Se trabajó con las secuencias codificantes y no codificantes de la región trnk/matK ubicada en el cloroplasto. Para el análisis de los datos moleculares se realizo un alineamiento múltiple utilizando el programa MUSCLE 3.6 (Edgar 2005) y los resultados generados del alineamiento se utilizaron para determinar los modelos de evolución de cada gen con los programas R 2.0.8 (Venables & Smith 2008), ape 2.2-2 (Paradis et al., 2007) y PhyML 3.0 (Guindon & Gascuel 2008). Las reconstrucciones filogenéticas usando búsquedas heurísticas bajo máxima parsimonia fue llevado a cabo el programa winclada. A los árboles obtenidos se les realizó un consenso estricto y soporte (limite de confianza) de Bootstrap Se realizo un análisis de sensibilidad con 5 costos (ts2tv1g2, ts2tv5g1, ts2tv4g5, ts2tv6g2, y ts3tv5g2) en el programa POY 4.0 (Varón et al., 2007) y se escogió el menor costo con lo cual se generaron la topologías para cada uno de los genes. A los árboles obtenidos se les realizo consenso estricto y soporte (limite de confianza) de Bootstrap. Se llevó a cabo un análisis de Máxima verosimilitud para las secuencias moleculares con el programa PhyMl 3.0 (Guindon & Gascuel 2008) y por ultimo se realizo un análisis de inferencia Bayesiana con el programa MrBayes 3.1.2 (Huelsenbeck & Ronquist 2001). RESULTADOS Y DISCUSIÓN Se observaron diferencias en cuanto a los modelos de evolución para cada una de las secuencias, el modelo de sustitución que mejor se ajustó para las secuencias codificantes fue GTR con una distribución gamma y HKY85 también con una distribución gamma de las tasas evolutivas por sitio, fue el mejor modelo de sustitución para la secuencia no codificante, lo cual fue usado para inferencia filogenética de máxima likelihood. Es decir, que de manera general esta región se acomoda mejor a los modelos con muchos parámetros. A excepción de la topología arrojada por el análisis de máxima verosimilitud, la región no codificante del trnK recupera el clado de la subfamilia Aristolochioidae, sin embargo las relaciones dentro del género Aristolochia se destruyen casi en su totalidad, permaneciendo únicamente la relación entre Aristolochia albida y A. bracteolata para todos los casos (figura 1-6). Si bien, las relaciones de la subfamilia Asaroideae varían mucho dentro de las topologías, al igual que el caso anterior, el clado y las relaciones de sus géneros permanecen contantes a través de los diferentes análisis, lo cual es soportado por altos valores de Bootstrap (figura 1 y 4); ésta subfamilia presenta relaciones recurrentes con representantes del orden Canellales, cuando lo que se debería esperar es una relación más próxima con la familia Saruraceae (figura 1 y 3). De manera particular, la reconstrucción bajo el criterio de parsimonia, se puede evidenciar la conservación de las relaciones subgenéricas, a pesar de ser un clado con muchas politomías (figura 1). La topología bajo el análisis de sensibilidad guarda la mayor cantidad de relaciones, con respecto a la configuración generada mediante la secuencia codificante de la región trnK/matK a nivel de grandes grupos, ya que dentro de la subfamilia Aristolochioidae, las relación genéricas e infragenéricas son casi inexistentes. El análisis bayesiano es el único que reconstruye las relaciones dentro del género Aristolochia. Las relaciones que se obtienen mediante el análisis de máxima verosimilitud son bastante confusas y rompen completamente con las relaciones existentes dentro de las series que conforman los subgéneros. Particularmente Asarum caudatum (Subfamilia Asaroideae) se relaciona con A. serpentaria (Subfamilia Aristolochioideae) en un clado terminal, de la misma manera, A. holostitis y A. promisa, se encuentran dentro de un mismo clado junto con representantes de la subfamilia Asaroideae y Saruraceae (incluidas dentro del orden Piperales), y del orden Canellales. La poca resolución obtenida mediante las secuencias no codificantes pueden deberse a que éstas no han acumulado la suficiente variabilidad como para distinguir las relaciones entre las especies, lo cual si ocurre con la región codificante matK, cuyas tasas de sustitución en la primera y segunda posición son similares a las de la tercera (Wanke et al., 2007), y dado que esto contribuye a su alta tasa evolutiva, podría ser la razón de la diferencia con respecto a las topologías generadas; pese a esto pudo haber ocurrido lo contrario, las tasas de evolución se disminuyeron en la región intrónica trnK.. BIBLIOGRAFÍA Edgar, R.C. 2005. MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32; 1792-97. Ems, S.C., Morden, C.W., Dixon, K.W. 1995. Transcription, splicing, and editing of plastid RNAs in the nonphotosynthetic plant Epifagus virginiana. Plant Mol. Biol. 29, 621-733. Goloboff, P.A. (1993a). NONA, Version 2.0. Published by the Author, Instituto Miguel Lillo, Miguel Lillo 205, 400 Sierra Madre de Tucuman, Argentina. Goloboff, P.A., Farris, J.S., Nixon, K.C. 2007. T.N.T. Tree analysis using new technology. Programa y documentación disponible en: http://www.zmuc.dk/public/phylogeny/TNT/. Guindon, S & Gascuel, O. 2008. A simple, fast and accurate algorithm to estímate large phylogenies by maximun likelihood. Systematic Biology 52; 696-704. Huelsenbeck, J.P and Ronquist, F. 2001. MrBayes v3.1.2: Bayesian inference of phylogeny. Bioinformatics 17; 754-755. Nixon, K.C. (2002). WINCLADA (BETA), Versión 1.00.08. Published by the author, Cornell University, Ithaca, New York. Nixon, K.C & Carpenter, J.M. (1993) On Outgroups. Cladistics 9; 413–426. Paradis, E. 2008. The ape Package. Analyses of Phylogenetics and Evolution. Pleguezuelos J. M., R. Márquez Y M. Lizana, (eds.) 2002. Atlas y Libro Rojo de los Anfibios y Reptiles de España. Dirección General de Conservación de la Naturaleza-Asociación Herpetologica Española (2ª impresión), Madrid, 587 pp. Pag 17. Venables, W.N., Smith, D.M and the R Development Core Team. 2008. A programming environment for data analysis and graphics. Varón, A., Vinh, L.S., Bomash, I & Wheeler, W.C. 2007. POY 4.0 Beta 2398. American Museum of Natural History. http://research.amnh.org/scicomp/projects/poy/php. Wanke, S., González, F., Neinhuis, C. 2006. Systematics of pipevines –Combining morphological and fast-evolving molecular characters to resolve therelationships within Aristolochioideae (Aristolochiaceae). Int. J. Plant Sci. 167(6):1215–1227. Wanke, S., Jaramillo, M.A., Borsch, T., Samain, M., Quandt, D., Neinhuis, C. 2007. Evolution of Piperales—matK gene and trnK intron sequence data reveal lineage specific resolution contrast. Molecular Phylogenetics and Evolution 42: 477–497 Wheeler, W.C. 1995. Sequence alignment, parameter sensitvity, and the phylogenetic analysis of molecular data. Systematic biology 44; 321-331. Figura 1. Reconstrucción a partir de las secuencias codificantes (A) y no codificantes (B). A. Longitud=1067, Ci=73 y Ri=77. B. Longitud=1269, Ci=71, Ri=65 Figura 2.Análisis de Sensibilidad. Reconstrucción usando las secuencias codificantes bajo la matriz de menor costo. ts2tv6gap2 con un valor de 1522. Figura 3. Análisis de Sensibilidad. Reconstrucción usando las secuencias No codificantes bajo la matriz de menor costo. ts2tv5gap1 y ts2tv6gap2 con un valor de 5061. Figura 5. Topología obtenida a partir de la secuencia No codificante en Mr Bayes. Figura 6. Topología obtenida a partir de la secuencia codificante en Mr Bayes. Figura 7. Topología generada por las secuencias codificantes bajo máxima verosimilitud usando PhyML Figura 8. Topología generada por las secuencias no codificantes bajo máxima verosimilitud usando PhyML