Subido por Flavia Obando

ARBOL FILOGENETICO- INFORME

Anuncio
1
UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERÍA AMBIENTAL
“INFORME DE PRÁCTICA - ÁRBOL FILOGENÉTICO EN EL
SOFTWARE MEGA"
DOCENTE:
SOTO GONZALES, HEBERT HERNAN
PRESENTADO POR:
CHUNGA CORMILLUNI, DAYANA YOSSELYN
OBANDO OVIEDO, FLAVIA LISSETH
CURSO:
BIOTECNOLOGÍA
CICLO:
VII
OCTUBRE, 18 del 2022
2
ÍNDICE
ÍNDICE
2
1. INTRODUCCIÓN
3
2. OBJETIVOS
4
3. MARCO TEÓRICO
4
4. MATERIALES Y EQUIPOS
8
5. PROCEDIMIENTO
9
6. DISCUSIÓN DE RESULTADOS
16
7. CONCLUSIONES
18
8. CUESTIONARIO
19
9. RECOMENDACIONES
21
10. BIBLIOGRAFÍA
21
3
1. INTRODUCCIÓN
Los sistemas de clasificación de los seres vivos se basan en las relaciones evolutivas entre
organismos, es decir, en su filogenia. Estos sistemas de clasificación organizan las
especies de manera que reflejan cierta comprensión de su proceso evolutivo a partir de los
ancestros comunes que comparten las diversas especies, dentro de esta clasificación se
suele hacer uso de los árboles filogenéticos, los cuales son diagramas que representan las
relaciones evolutivas entre organismos.
Para construir una filogenia, es necesario primero determinar las especies a estudiar,
describir sus caracteres y codificarlos para luego establecer sus relaciones y representarlas
gráficamente en un árbol filogenético, a través de métodos de reconstrucción filogenética,
las secuencias de genes o proteínas se pueden comparar entre especies y se utilizan para la
construcción de árboles filogenéticos, las especies próximas generalmente suelen tener
bastante pocas diferencias entre sus secuencias, mientras que las que tienen menos
parentesco tienden a tener más diferencias.
La metodología aplicada para la presente práctica incluye para empezar un artículo
científico, de esta manera es posible obtener el código de cada especie, para luego
agregarlo al NCBI y obtener parte de su secuencia genética, lo cual será usado en el
programa BLAST, para realizar una alineación de una matriz de datos, lo cual incluye las
secuencias de cierta región de ADN, de esta manera el software construirá el árbol
genético, en base a las similitudes de las secuencias estudiadas, pertenecientes a diversas
especies.
El patrón de ramificación en un árbol filogenético refleja cómo las especies u otros grupos
evolucionaron a partir de una serie de ancestros comunes, de esta forma es posible
identificar la similitud entre una especie y otra consideradas en el artículo “
Caracterización molecular de bacterias cultivables y no cultivables procedentes de pozas
de lixiviación con cianuro” de (Sernaque Aguilar et al., 2019), metodología considerada
puede ser aplicada en la biotecnología ambiental, ya que ello permitirá identificar los
ancestros de algunas especies, y similitudes entre una y otra, ya sea en bacteria
degradadoras de metales pesados, entre otros, por lo tanto el uso de estos software que
actúan como herramientas, hacen que el trabajo realizado sea más óptimo y efectivo.
4
2. OBJETIVOS
●
Conocer el software y sus aplicaciones en biotecnología ambiental
●
Elaborar un árbol filogenético
●
Elaborar un mapa conceptual según el artículo designado
3. MARCO TEÓRICO
3.1. ÁRBOL FILOGENÉTICO
En los términos más generales, un árbol filogenético es una representación
esquemática de entidades biológicas que están conectadas por descendencia común,
pueden ser especies o grupos taxonómicos mayores. Hoy en día, la mayoría de
árboles filogenéticos se crean a partir de datos moleculares ya sea ADN, ARN o
proteínas. Se tiende a usar ADN cuando se analizan especies cercanamente
emparentadas, porque proveen mayor información (las cadenas de ADN son más
largas que las cadenas de aminoácidos); mientras que las secuencias de aminoácidos
son usados para análisis filogenéticos de especies más lejanamente emparentadas.
Es importante resaltar que la filogenia tiene orígenes más antiguos. El famoso
naturalista Ernst Häckel – un ferviente evolucionista - describía las relaciones entre
diferentes organismos en forma de árboles filogenéticos, únicamente a partir de
datos morfológicos, inclusive dibujaba estos diagramas como verdaderos árboles y
es a partir de sus esquemas, probablemente se acuñó el término árbol filo.
Aunque para el caso de las investigaciones médicas, los árboles filogenéticos son
generados principalmente a partir de datos moleculares, el análisis e interpretación
de un árbol es independiente del tipo de datos utilizado para su construcción
genética. (Mendoza, 2012)
En un árbol filogenético, la relación entre dos especies tiene un significado muy
específico. Dos especies están más relacionadas si tienen un ancestro común más
reciente y menos relacionadas si tienen un ancestro común menos reciente.
5
Figura 01: Árbol filogenético de distintas cepas de virus de inmunodeficiencia en simios y
del virus de inmunodeficiencia humana (VIH), Fuente: (Mendoza, 2012)
3.2. ANATOMÍA DE UN ÁRBOL FILOGENÉTICO
Un árbol filogenético contiene varios componentes. En la parte de la derecha de la
figura 2 se encuentran los nodos terminales o puntas, que representan las Unidades
Taxonómicas Operativas (OTUS) o taxones. Estas pueden ser individuos de una
especie o grupos taxonómicos mayores. Cada uno de estos nodos terminales se
encuentran unidos mediante ramas a un nodo interno, el cual representa al ancestro
común entre los nodos terminales. De tal manera que los nodos terminales
representan el presente, mientras que los nodos internos representan el pasado.
La importancia de un árbol filogenético yace en la topología, es decir, cómo están
unidas las ramas o el patrón de ramificación, lo que representa la relación evolutiva
entre los distintos taxones. En el caso de la figura 2, a los taxones A y B, se les
denomina taxones hermanos, ya que comparten un reciente ancestro común, y que
no lo comparten con otro. Al taxón F, se le denomina "outgroup", que se encuentra
emparentado más lejanamente a los otros taxones, llamados "ingroup". Los
outgroups sirven para enraizar el árbol, es decir para indicar el comienzo del proceso
de ramificación, señalando así el nodo más interno compartido por todos, la raíz.
(Mendoza, 2012)
6
Figura 02: Anatomía de un árbol filogenético, Fuente: (Mendoza, 2012)
3.3. ALINEAMIENTO DE SECUENCIAS
Un alineamiento de secuencias en bioinformática es una forma de representar y
comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias
proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones
funcionales o evolutivas entre los genes o proteínas consultados. Las secuencias
alineadas se escriben con las letras (representando aminoácidos o nucleótidos) en
filas de una matriz en las que, si es necesario, se insertan espacios para que las zonas
con idéntica o similar estructura se alineen.
Figura 03: Alineamiento de secuencias, Fuente: (Moreira, n.d.)
7
3.4. SOFTWARE MEGA DNA
MEGA es una herramienta integrada para realizar alineaciones de secuencias
automáticas y manuales, inferir árboles filogenéticos, extraer bases de datos basadas
en la web, estimar tasas de evolución molecular y probar hipótesis evolutivas.
(MEGA, n.d.)
Alineación de secuencias (usando GUI)
●
MEGA admite la alineación de secuencias utilizando los programas ClustalW
y MUSCLE.
●
La alineación (o refinamiento) se realiza en el Explorador de análisis (
Alineación -> Abrir Explorador de alineación desde el menú principal).
●
Podemos comenzar con una alineación en blanco (si estamos importando
secuencias desde NCBI o no tenemos un archivo de secuencia compatible) o
desde un archivo de secuencia compatible.
●
Con nuestras secuencias en Alignment Explorer (AE), seleccionamos
Alignment en el menú, luego ClustalW o Muscle.
●
Establezca los parámetros de alineación en los valores que desee o deje las
opciones como están para usar los valores predeterminados. Haga clic en
Calcular/Aceptar.
●
Según la duración y el número de secuencias, es posible que vea una barra de
progreso mientras se ejecuta la alineación.
●
Las secuencias alineadas reemplazarán las secuencias previamente no
alineadas en el Explorador de alineación. Ahora puede exportarlos a formato
MEGA o Fasta para su análisis.
Figura 04: Software MEGA, Fuente: (MEGA, n.d.)
8
4. MATERIALES Y EQUIPOS
4.1. MATERIALES
Artículo científico
4.2. EQUIPOS
Laptop
Proyector
9
Software MEGA DNA
Sitio web del NCBI
5. PROCEDIMIENTO
Para la construcción del árbol filogenético en clase se repartieron artículos que
contenían un conjunto de datos los cuales contienen relaciones evolutivas.
A continuación los pasos a seguir para la construcción del árbol filogenético:
1.
Asignación del artículo científico con la lista de especies bacterianas identificadas
a nivel molecular.
Figura 05. Artículo Científico asignado.
Fuente: Revista peruana de biología 275 - 282 (2019)
10
2.
Identificación de “Códigos de acceso a genbank” en el artículo científico
asignado.
Figura 06. Códigos
de acceso a genbank
Fuente: Revista peruana de biología 275 - 282 (2019)
3.
Ingreso al programa MEGA ADN.
Figura 07. Software MEGA ADN
Fuente: Elaboración propia
4.
Seleccionar la opción de ALIGN > Show Web Browser.
Figura 08. Procedimiento de ingreso a la Web NCBI
11
Fuente: Elaboración propia
5.
A continuación, se dirigirá automáticamente a la página de El Centro Nacional de
Información Biotecnológica (NCBI).
Figura 09. Página NCBI.
Fuente: Elaboración propia
6.
Seguidamente se configura al buscador con la selección de nucleótidos > Se
introducen los “Código de acceso a genbank” > Search.
Figura 10. Búsqueda de especies según el código de acceso a genbank.
Fuente: Elaboración propia
12
7.
Una vez identificada la especie se procede a la opción de Add To Alignment >
First Word > Se selecciona la primera opción > OK.
Figura 11. Ventana para añadir la especie al árbol filogenético .
Fuente: Elaboración propia
8.
Se repite el mismo procedimiento con 15 Códigos de interés para la construcción
del árbol filogenético.
Figura 12. Identificación de especies según su código en el software MEGA ADN
Fuente: Elaboración propia
Figura 13. Identificación de 16 especies según su código en el software MEGA ADN
Fuente: Elaboración propia
13
9.
Ya con los datos insertados, se procede a alinearlos seleccionando Align using the
MUSCLE algorithm.
Figura 14. Alineación de ADN en las especies insertadas.
Fuente: Elaboración propia
10. Se prosigue con la eliminación de espacios en blanco para un mejor orden de
datos.
Figura 15. Identificación y eliminación de espacios en blanco..
Fuente: Elaboración propia
14
11. Ya con los datos ordenados, se procede a guardar seleccionando Data > Export
Alignment > MEGA Format.
Figura 16. Procedimiento de guardar el archivo con la base de datos recolectada.
Fuente: Elaboración propia
12. Una vez guardados los datos, se procede a la elaboración del árbol filogenético
digiriendo a el Software MEGA ADN > PHYLOGENY > Construct /Test
UPGMA Tree…
Figura 17. Procedimiento para la elaboración del árbol filogenético en el software MEGA ADN.
Fuente: Elaboración propia
13. Se procede a buscar el archivo anteriormente guardado con la base de datos a
trabajar > Abrir.
15
Figura 18. Búsqueda de archivo con base de datos a trabajar.
Fuente: Elaboración propia
14. Automáticamente se dirige a un aventana > OK.
Figura 19. Ventana de preferencias de análisis.
Fuente: Elaboración propia
15. Seguidamente, se muestra el árbol filogenético construido con la base de datos
guardada.
Figura 20. Árbol filogenético construido.
Fuente: Elaboración propia
16
16. Finalmente se procede a guardar el archivo como imagen dirigiéndose a Image >
Save as PNG file.
Figura 21. Procedimiento de guardado de árbol filogenético.
Fuente: Elaboración propia
17. Se inserta el nombre conveniente al Archivo > OK.
Figura 22. Elección del nombre conveniente al Archivo.
Fuente: Elaboración propia
6. DISCUSIÓN DE RESULTADOS
Para la construcción del árbol filogenético se necesito del programa MEGA ADN basado en
el gen ADNr S16 el cuál de uso para la alineación de 31 secuencias de ADN por separado.
➔ En el primer grupo formado se puede dar a conocer que estos se relacionan por la
especie pseudomonas con la única variación en sus números de acuerdo a su
identificación.
17
Figura 23. Primer grupo del árbol filogenético
Fuente: Elaboración propia
➔ Por otro lado, se tiene un segundo grupo conformado por la 3 especies que comparten
filogenéticamente un porcentaje de la especie acinetobacter, diferenciándose por
características mínimas.
Figura 24. Segundo grupo del árbol filogenético
Fuente: Elaboración propia
➔ Cómo tercer grupo identificado, se tiene a las especies serratia y enterobacter que
presentan una ligera cercanía entre ellas, sin embargo no se encuentran en un mismo
lado del árbol filogenético, sino por el contrario presentan una relación directa pero
sin ser identificadas de manera conjunta.
Figura 25. Tercer grupo del árbol filogenético
Fuente: Elaboración propia
➔ El único elemento que se encuentra relacionado al árbol filogenético es la especie
identificada como Arthrobacter según el gen ADN S16 la cual tiene una dirección
más directa con el árbol filogenético en discusión.
Figura 26. Cuarto grupo del árbol filogenético
Fuente: Elaboración propia
18
➔ Cómo penúltimo grupo se encuentra a las especies identificadas cómo
Chryseomicrobium y Bacillus las cuales tienen un porcentaje de parecido entre ellas,
ya que se encuentran muy próximas entre sí, singularidad que se encuentra mostrada
en la estructura.
Figura 27. Quinto grupo del árbol filogenético
Fuente: Elaboración propia
➔ Finalmente, se tiene sola a la especie identificada como Sphingobacterium según di
código como próxima al grupo anterior mencionado. Sin embargo, se puede decir que
es la especie más próxima a la especie originaria del árbol filogenético elaborado en el
presente informe.
Figura 28. Primer grupo del árbol filogenético
Fuente: Elaboración propia
7. CONCLUSIONES
● Gracias al presente informe se puede reconocer la metodología para la obtención del
árbol filogenético a partir del programa MEGA ADN únicamente con insertar el
código de acceso a genbank de cada especie a la página web NCBI para su
reconocimiento y recopilación de información para la construcción del árbol
filogenético.
● Por otro lado, se concluyó que el uso del software MEGA ADN y el manejo de
páginas web como fuentes oficiales de información pueden contribuir con el
mejoramiento de estrategias biotecnológicas ambientales.
19
● Finalmente, para la conceptualización de la información según el artículo designado,
se optó por la elaboración del mapa conceptual a fin de tener una mejor base para un
entendimiento más efectivo.
8. CUESTIONARIO
8.1.¿Pará qué se utiliza el programa muscle?
La Comparación de Secuencias Múltiples por Log-Expectativa ( MUSCLE ) es un
software de computadora para el alineamiento de secuencias múltiples de secuencias
de proteínas y nucleótidos .
El algoritmo MUSCLE avanza en tres etapas: el borrador progresivo , el progresivo
mejorado y las etapas de refinamiento . En la etapa de borrador progresivo , el
algoritmo produce un borrador de alineación múltiple, enfatizando la velocidad sobre
la precisión. En la etapa progresiva mejorada , la distancia de Kimura se utiliza para
volver a estimar el árbol binario para crear la alineación de borrador, lo que a su vez
produce una alineación múltiple más precisa. La etapa de refinamiento final refina la
alineación mejorada realizada en el paso dos.Hay varias alineaciones disponibles al
final de cada etapa. En las dos primeras etapas del algoritmo, la complejidad temporal
es O ( N 2 L + NL 2 ) , la complejidad espacial es O ( N 2 + NL + L 2 ).
La etapa de refinamiento agrega a la complejidad del tiempo otro término, MUSCLE
se usa a menudo como un reemplazo de Clustal , ya que generalmente (pero no
siempre) da mejores alineaciones de secuencia, dependiendo de las opciones elegidas.
Además, MUSCLE es significativamente más rápido que Clustal, más aún para
alineaciones más grandes.
8.2.¿Qué es una alineación de secuencias múltiples?
Un alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un
alineamiento de tres o más secuencias biológicas, generalmente proteínas, ADN o
ARN. En general, se asume que el conjunto de secuencias de consulta que se ingresa
como entrada (conjunto problema) tienen una relación evolutiva por la cual
comparten un linaje y descienden de un ancestro común. Del MSA resultante, se
puede inferir la homología, y puede llevarse a cabo el análisis filogenético para
evaluar los orígenes evolutivos compartidos por las secuencias.
20
Los alineamientos múltiples de secuencias también se refieren al proceso de alinearlas
como un conjunto de secuencias. Como puede ser difícil alinear a mano tres o más
secuencias de longitud biológicamente relevante, y casi siempre consume mucho
tiempo, se utilizan algoritmos computacionales para producir y analizar los
alineamientos.
8.3.¿Qué le pareció el programa MEGA DNA, de su opinión?
El programa MEGA DNA nos pareció interesante y sencillo de usar, reduce el tiempo
de trabajo para alinear secuencias y la construcción del árbol filogenético, su interfaz
es amigable con el usuario, y tiene incorporado el sitio web BLAST, lo cual permite
identificar los microorganismos según un código de acceso.
En otras palabras, hace que el trabajo sea efectivo y en un tiempo menor, aparte de
que brinda licencia para ser usado, lo cual favorece a su uso y aplicación.
8.4.¿Qué es el genoma? Cual es el tamaño: bacteria, hongo y hombre.
El genoma es el conjunto completo de instrucciones del ADN que se hallan en una
célula, un genoma contiene toda la información que un organismo necesita para
desarrollarse y funcionar.
El genoma es el conjunto del material hereditario de un organismo, la secuencia de
nucleótidos que especifican las instrucciones genéticas para el desarrollo y
funcionamiento del mismo y que son transmitidas de generación en generación, de
padres a hijos.
Tamaño: 1 megabase (Mb) es un millón de pares de bases (pb
● Bacteria: 4,6 Mb Escherichia coli
● Hongo: 12Mb Mb Saccharomyces cerevisiae
● Hombre: 3.400 Mb
Figura 23. Rango de tamaño del genoma en organismos.
21
Fuente: (Latorre & Silva, 2013)
9. RECOMENDACIONES
● Es importante usar correctamente los
códigos
de acceso de los
microorganismos al momento de insertarlos en el programa, de esta manera se
identificará adecuadamente al microorganismo con el que se trabajará.
● Se debe tener conocimientos sobre el uso del programa MEGA DNA, de esta
forma el trabajo será más eficiente.
10. BIBLIOGRAFÍA
MEGA.
(n.d.).
Home.
Retrieved
October
14,
2022,
from
https://www.megasoftware.net/
Mendoza, J. (2012). Aportes de la filogenética a la investigación médica. SciELO Perú.
Retrieved
October
14,
2022,
from
http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1018-130X201
2000200008
Moreira, A. (n.d.). IV Alineamiento múltiple de secuencias - ppt descargar. SlidePlayer.
Retrieved October 14, 2022, from https://slideplayer.es/slide/3775227/
Sernaque Aguilar, Y., Cornejo La Torre, M., Pierre Regard, J., & Mialhe Matonnier, E.
(2019). Caracterización molecular de bacterias cultivables y no cultivables
22
procedentes de pozas de lixiviación con cianuro. Revista Peruana de
Biologia.
Retrieved
October
14,
http://www.scielo.org.pe/pdf/rpb/v26n2/a14v26n2.pdf
2022,
from
Descargar