1 UNIVERSIDAD NACIONAL DE MOQUEGUA ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL “INFORME DE PRÁCTICA - ÁRBOL FILOGENÉTICO EN EL SOFTWARE MEGA" DOCENTE: SOTO GONZALES, HEBERT HERNAN PRESENTADO POR: CHUNGA CORMILLUNI, DAYANA YOSSELYN OBANDO OVIEDO, FLAVIA LISSETH CURSO: BIOTECNOLOGÍA CICLO: VII OCTUBRE, 18 del 2022 2 ÍNDICE ÍNDICE 2 1. INTRODUCCIÓN 3 2. OBJETIVOS 4 3. MARCO TEÓRICO 4 4. MATERIALES Y EQUIPOS 8 5. PROCEDIMIENTO 9 6. DISCUSIÓN DE RESULTADOS 16 7. CONCLUSIONES 18 8. CUESTIONARIO 19 9. RECOMENDACIONES 21 10. BIBLIOGRAFÍA 21 3 1. INTRODUCCIÓN Los sistemas de clasificación de los seres vivos se basan en las relaciones evolutivas entre organismos, es decir, en su filogenia. Estos sistemas de clasificación organizan las especies de manera que reflejan cierta comprensión de su proceso evolutivo a partir de los ancestros comunes que comparten las diversas especies, dentro de esta clasificación se suele hacer uso de los árboles filogenéticos, los cuales son diagramas que representan las relaciones evolutivas entre organismos. Para construir una filogenia, es necesario primero determinar las especies a estudiar, describir sus caracteres y codificarlos para luego establecer sus relaciones y representarlas gráficamente en un árbol filogenético, a través de métodos de reconstrucción filogenética, las secuencias de genes o proteínas se pueden comparar entre especies y se utilizan para la construcción de árboles filogenéticos, las especies próximas generalmente suelen tener bastante pocas diferencias entre sus secuencias, mientras que las que tienen menos parentesco tienden a tener más diferencias. La metodología aplicada para la presente práctica incluye para empezar un artículo científico, de esta manera es posible obtener el código de cada especie, para luego agregarlo al NCBI y obtener parte de su secuencia genética, lo cual será usado en el programa BLAST, para realizar una alineación de una matriz de datos, lo cual incluye las secuencias de cierta región de ADN, de esta manera el software construirá el árbol genético, en base a las similitudes de las secuencias estudiadas, pertenecientes a diversas especies. El patrón de ramificación en un árbol filogenético refleja cómo las especies u otros grupos evolucionaron a partir de una serie de ancestros comunes, de esta forma es posible identificar la similitud entre una especie y otra consideradas en el artículo “ Caracterización molecular de bacterias cultivables y no cultivables procedentes de pozas de lixiviación con cianuro” de (Sernaque Aguilar et al., 2019), metodología considerada puede ser aplicada en la biotecnología ambiental, ya que ello permitirá identificar los ancestros de algunas especies, y similitudes entre una y otra, ya sea en bacteria degradadoras de metales pesados, entre otros, por lo tanto el uso de estos software que actúan como herramientas, hacen que el trabajo realizado sea más óptimo y efectivo. 4 2. OBJETIVOS ● Conocer el software y sus aplicaciones en biotecnología ambiental ● Elaborar un árbol filogenético ● Elaborar un mapa conceptual según el artículo designado 3. MARCO TEÓRICO 3.1. ÁRBOL FILOGENÉTICO En los términos más generales, un árbol filogenético es una representación esquemática de entidades biológicas que están conectadas por descendencia común, pueden ser especies o grupos taxonómicos mayores. Hoy en día, la mayoría de árboles filogenéticos se crean a partir de datos moleculares ya sea ADN, ARN o proteínas. Se tiende a usar ADN cuando se analizan especies cercanamente emparentadas, porque proveen mayor información (las cadenas de ADN son más largas que las cadenas de aminoácidos); mientras que las secuencias de aminoácidos son usados para análisis filogenéticos de especies más lejanamente emparentadas. Es importante resaltar que la filogenia tiene orígenes más antiguos. El famoso naturalista Ernst Häckel – un ferviente evolucionista - describía las relaciones entre diferentes organismos en forma de árboles filogenéticos, únicamente a partir de datos morfológicos, inclusive dibujaba estos diagramas como verdaderos árboles y es a partir de sus esquemas, probablemente se acuñó el término árbol filo. Aunque para el caso de las investigaciones médicas, los árboles filogenéticos son generados principalmente a partir de datos moleculares, el análisis e interpretación de un árbol es independiente del tipo de datos utilizado para su construcción genética. (Mendoza, 2012) En un árbol filogenético, la relación entre dos especies tiene un significado muy específico. Dos especies están más relacionadas si tienen un ancestro común más reciente y menos relacionadas si tienen un ancestro común menos reciente. 5 Figura 01: Árbol filogenético de distintas cepas de virus de inmunodeficiencia en simios y del virus de inmunodeficiencia humana (VIH), Fuente: (Mendoza, 2012) 3.2. ANATOMÍA DE UN ÁRBOL FILOGENÉTICO Un árbol filogenético contiene varios componentes. En la parte de la derecha de la figura 2 se encuentran los nodos terminales o puntas, que representan las Unidades Taxonómicas Operativas (OTUS) o taxones. Estas pueden ser individuos de una especie o grupos taxonómicos mayores. Cada uno de estos nodos terminales se encuentran unidos mediante ramas a un nodo interno, el cual representa al ancestro común entre los nodos terminales. De tal manera que los nodos terminales representan el presente, mientras que los nodos internos representan el pasado. La importancia de un árbol filogenético yace en la topología, es decir, cómo están unidas las ramas o el patrón de ramificación, lo que representa la relación evolutiva entre los distintos taxones. En el caso de la figura 2, a los taxones A y B, se les denomina taxones hermanos, ya que comparten un reciente ancestro común, y que no lo comparten con otro. Al taxón F, se le denomina "outgroup", que se encuentra emparentado más lejanamente a los otros taxones, llamados "ingroup". Los outgroups sirven para enraizar el árbol, es decir para indicar el comienzo del proceso de ramificación, señalando así el nodo más interno compartido por todos, la raíz. (Mendoza, 2012) 6 Figura 02: Anatomía de un árbol filogenético, Fuente: (Mendoza, 2012) 3.3. ALINEAMIENTO DE SECUENCIAS Un alineamiento de secuencias en bioinformática es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados. Las secuencias alineadas se escriben con las letras (representando aminoácidos o nucleótidos) en filas de una matriz en las que, si es necesario, se insertan espacios para que las zonas con idéntica o similar estructura se alineen. Figura 03: Alineamiento de secuencias, Fuente: (Moreira, n.d.) 7 3.4. SOFTWARE MEGA DNA MEGA es una herramienta integrada para realizar alineaciones de secuencias automáticas y manuales, inferir árboles filogenéticos, extraer bases de datos basadas en la web, estimar tasas de evolución molecular y probar hipótesis evolutivas. (MEGA, n.d.) Alineación de secuencias (usando GUI) ● MEGA admite la alineación de secuencias utilizando los programas ClustalW y MUSCLE. ● La alineación (o refinamiento) se realiza en el Explorador de análisis ( Alineación -> Abrir Explorador de alineación desde el menú principal). ● Podemos comenzar con una alineación en blanco (si estamos importando secuencias desde NCBI o no tenemos un archivo de secuencia compatible) o desde un archivo de secuencia compatible. ● Con nuestras secuencias en Alignment Explorer (AE), seleccionamos Alignment en el menú, luego ClustalW o Muscle. ● Establezca los parámetros de alineación en los valores que desee o deje las opciones como están para usar los valores predeterminados. Haga clic en Calcular/Aceptar. ● Según la duración y el número de secuencias, es posible que vea una barra de progreso mientras se ejecuta la alineación. ● Las secuencias alineadas reemplazarán las secuencias previamente no alineadas en el Explorador de alineación. Ahora puede exportarlos a formato MEGA o Fasta para su análisis. Figura 04: Software MEGA, Fuente: (MEGA, n.d.) 8 4. MATERIALES Y EQUIPOS 4.1. MATERIALES Artículo científico 4.2. EQUIPOS Laptop Proyector 9 Software MEGA DNA Sitio web del NCBI 5. PROCEDIMIENTO Para la construcción del árbol filogenético en clase se repartieron artículos que contenían un conjunto de datos los cuales contienen relaciones evolutivas. A continuación los pasos a seguir para la construcción del árbol filogenético: 1. Asignación del artículo científico con la lista de especies bacterianas identificadas a nivel molecular. Figura 05. Artículo Científico asignado. Fuente: Revista peruana de biología 275 - 282 (2019) 10 2. Identificación de “Códigos de acceso a genbank” en el artículo científico asignado. Figura 06. Códigos de acceso a genbank Fuente: Revista peruana de biología 275 - 282 (2019) 3. Ingreso al programa MEGA ADN. Figura 07. Software MEGA ADN Fuente: Elaboración propia 4. Seleccionar la opción de ALIGN > Show Web Browser. Figura 08. Procedimiento de ingreso a la Web NCBI 11 Fuente: Elaboración propia 5. A continuación, se dirigirá automáticamente a la página de El Centro Nacional de Información Biotecnológica (NCBI). Figura 09. Página NCBI. Fuente: Elaboración propia 6. Seguidamente se configura al buscador con la selección de nucleótidos > Se introducen los “Código de acceso a genbank” > Search. Figura 10. Búsqueda de especies según el código de acceso a genbank. Fuente: Elaboración propia 12 7. Una vez identificada la especie se procede a la opción de Add To Alignment > First Word > Se selecciona la primera opción > OK. Figura 11. Ventana para añadir la especie al árbol filogenético . Fuente: Elaboración propia 8. Se repite el mismo procedimiento con 15 Códigos de interés para la construcción del árbol filogenético. Figura 12. Identificación de especies según su código en el software MEGA ADN Fuente: Elaboración propia Figura 13. Identificación de 16 especies según su código en el software MEGA ADN Fuente: Elaboración propia 13 9. Ya con los datos insertados, se procede a alinearlos seleccionando Align using the MUSCLE algorithm. Figura 14. Alineación de ADN en las especies insertadas. Fuente: Elaboración propia 10. Se prosigue con la eliminación de espacios en blanco para un mejor orden de datos. Figura 15. Identificación y eliminación de espacios en blanco.. Fuente: Elaboración propia 14 11. Ya con los datos ordenados, se procede a guardar seleccionando Data > Export Alignment > MEGA Format. Figura 16. Procedimiento de guardar el archivo con la base de datos recolectada. Fuente: Elaboración propia 12. Una vez guardados los datos, se procede a la elaboración del árbol filogenético digiriendo a el Software MEGA ADN > PHYLOGENY > Construct /Test UPGMA Tree… Figura 17. Procedimiento para la elaboración del árbol filogenético en el software MEGA ADN. Fuente: Elaboración propia 13. Se procede a buscar el archivo anteriormente guardado con la base de datos a trabajar > Abrir. 15 Figura 18. Búsqueda de archivo con base de datos a trabajar. Fuente: Elaboración propia 14. Automáticamente se dirige a un aventana > OK. Figura 19. Ventana de preferencias de análisis. Fuente: Elaboración propia 15. Seguidamente, se muestra el árbol filogenético construido con la base de datos guardada. Figura 20. Árbol filogenético construido. Fuente: Elaboración propia 16 16. Finalmente se procede a guardar el archivo como imagen dirigiéndose a Image > Save as PNG file. Figura 21. Procedimiento de guardado de árbol filogenético. Fuente: Elaboración propia 17. Se inserta el nombre conveniente al Archivo > OK. Figura 22. Elección del nombre conveniente al Archivo. Fuente: Elaboración propia 6. DISCUSIÓN DE RESULTADOS Para la construcción del árbol filogenético se necesito del programa MEGA ADN basado en el gen ADNr S16 el cuál de uso para la alineación de 31 secuencias de ADN por separado. ➔ En el primer grupo formado se puede dar a conocer que estos se relacionan por la especie pseudomonas con la única variación en sus números de acuerdo a su identificación. 17 Figura 23. Primer grupo del árbol filogenético Fuente: Elaboración propia ➔ Por otro lado, se tiene un segundo grupo conformado por la 3 especies que comparten filogenéticamente un porcentaje de la especie acinetobacter, diferenciándose por características mínimas. Figura 24. Segundo grupo del árbol filogenético Fuente: Elaboración propia ➔ Cómo tercer grupo identificado, se tiene a las especies serratia y enterobacter que presentan una ligera cercanía entre ellas, sin embargo no se encuentran en un mismo lado del árbol filogenético, sino por el contrario presentan una relación directa pero sin ser identificadas de manera conjunta. Figura 25. Tercer grupo del árbol filogenético Fuente: Elaboración propia ➔ El único elemento que se encuentra relacionado al árbol filogenético es la especie identificada como Arthrobacter según el gen ADN S16 la cual tiene una dirección más directa con el árbol filogenético en discusión. Figura 26. Cuarto grupo del árbol filogenético Fuente: Elaboración propia 18 ➔ Cómo penúltimo grupo se encuentra a las especies identificadas cómo Chryseomicrobium y Bacillus las cuales tienen un porcentaje de parecido entre ellas, ya que se encuentran muy próximas entre sí, singularidad que se encuentra mostrada en la estructura. Figura 27. Quinto grupo del árbol filogenético Fuente: Elaboración propia ➔ Finalmente, se tiene sola a la especie identificada como Sphingobacterium según di código como próxima al grupo anterior mencionado. Sin embargo, se puede decir que es la especie más próxima a la especie originaria del árbol filogenético elaborado en el presente informe. Figura 28. Primer grupo del árbol filogenético Fuente: Elaboración propia 7. CONCLUSIONES ● Gracias al presente informe se puede reconocer la metodología para la obtención del árbol filogenético a partir del programa MEGA ADN únicamente con insertar el código de acceso a genbank de cada especie a la página web NCBI para su reconocimiento y recopilación de información para la construcción del árbol filogenético. ● Por otro lado, se concluyó que el uso del software MEGA ADN y el manejo de páginas web como fuentes oficiales de información pueden contribuir con el mejoramiento de estrategias biotecnológicas ambientales. 19 ● Finalmente, para la conceptualización de la información según el artículo designado, se optó por la elaboración del mapa conceptual a fin de tener una mejor base para un entendimiento más efectivo. 8. CUESTIONARIO 8.1.¿Pará qué se utiliza el programa muscle? La Comparación de Secuencias Múltiples por Log-Expectativa ( MUSCLE ) es un software de computadora para el alineamiento de secuencias múltiples de secuencias de proteínas y nucleótidos . El algoritmo MUSCLE avanza en tres etapas: el borrador progresivo , el progresivo mejorado y las etapas de refinamiento . En la etapa de borrador progresivo , el algoritmo produce un borrador de alineación múltiple, enfatizando la velocidad sobre la precisión. En la etapa progresiva mejorada , la distancia de Kimura se utiliza para volver a estimar el árbol binario para crear la alineación de borrador, lo que a su vez produce una alineación múltiple más precisa. La etapa de refinamiento final refina la alineación mejorada realizada en el paso dos.Hay varias alineaciones disponibles al final de cada etapa. En las dos primeras etapas del algoritmo, la complejidad temporal es O ( N 2 L + NL 2 ) , la complejidad espacial es O ( N 2 + NL + L 2 ). La etapa de refinamiento agrega a la complejidad del tiempo otro término, MUSCLE se usa a menudo como un reemplazo de Clustal , ya que generalmente (pero no siempre) da mejores alineaciones de secuencia, dependiendo de las opciones elegidas. Además, MUSCLE es significativamente más rápido que Clustal, más aún para alineaciones más grandes. 8.2.¿Qué es una alineación de secuencias múltiples? Un alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un alineamiento de tres o más secuencias biológicas, generalmente proteínas, ADN o ARN. En general, se asume que el conjunto de secuencias de consulta que se ingresa como entrada (conjunto problema) tienen una relación evolutiva por la cual comparten un linaje y descienden de un ancestro común. Del MSA resultante, se puede inferir la homología, y puede llevarse a cabo el análisis filogenético para evaluar los orígenes evolutivos compartidos por las secuencias. 20 Los alineamientos múltiples de secuencias también se refieren al proceso de alinearlas como un conjunto de secuencias. Como puede ser difícil alinear a mano tres o más secuencias de longitud biológicamente relevante, y casi siempre consume mucho tiempo, se utilizan algoritmos computacionales para producir y analizar los alineamientos. 8.3.¿Qué le pareció el programa MEGA DNA, de su opinión? El programa MEGA DNA nos pareció interesante y sencillo de usar, reduce el tiempo de trabajo para alinear secuencias y la construcción del árbol filogenético, su interfaz es amigable con el usuario, y tiene incorporado el sitio web BLAST, lo cual permite identificar los microorganismos según un código de acceso. En otras palabras, hace que el trabajo sea efectivo y en un tiempo menor, aparte de que brinda licencia para ser usado, lo cual favorece a su uso y aplicación. 8.4.¿Qué es el genoma? Cual es el tamaño: bacteria, hongo y hombre. El genoma es el conjunto completo de instrucciones del ADN que se hallan en una célula, un genoma contiene toda la información que un organismo necesita para desarrollarse y funcionar. El genoma es el conjunto del material hereditario de un organismo, la secuencia de nucleótidos que especifican las instrucciones genéticas para el desarrollo y funcionamiento del mismo y que son transmitidas de generación en generación, de padres a hijos. Tamaño: 1 megabase (Mb) es un millón de pares de bases (pb ● Bacteria: 4,6 Mb Escherichia coli ● Hongo: 12Mb Mb Saccharomyces cerevisiae ● Hombre: 3.400 Mb Figura 23. Rango de tamaño del genoma en organismos. 21 Fuente: (Latorre & Silva, 2013) 9. RECOMENDACIONES ● Es importante usar correctamente los códigos de acceso de los microorganismos al momento de insertarlos en el programa, de esta manera se identificará adecuadamente al microorganismo con el que se trabajará. ● Se debe tener conocimientos sobre el uso del programa MEGA DNA, de esta forma el trabajo será más eficiente. 10. BIBLIOGRAFÍA MEGA. (n.d.). Home. Retrieved October 14, 2022, from https://www.megasoftware.net/ Mendoza, J. (2012). Aportes de la filogenética a la investigación médica. SciELO Perú. Retrieved October 14, 2022, from http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1018-130X201 2000200008 Moreira, A. (n.d.). IV Alineamiento múltiple de secuencias - ppt descargar. SlidePlayer. Retrieved October 14, 2022, from https://slideplayer.es/slide/3775227/ Sernaque Aguilar, Y., Cornejo La Torre, M., Pierre Regard, J., & Mialhe Matonnier, E. (2019). Caracterización molecular de bacterias cultivables y no cultivables 22 procedentes de pozas de lixiviación con cianuro. Revista Peruana de Biologia. Retrieved October 14, http://www.scielo.org.pe/pdf/rpb/v26n2/a14v26n2.pdf 2022, from