Practicos

Anuncio
Trabajo Práctico N°1
Procesos que generan cambios epigenéticos
Ejercicio 1. Análisis de electroferogramas.
A. Análisis con GeneMapper.
Iniciar el programa GeneMapper.
File / Add Samples to Project… Seleccionar los archivos .fsa de la carpeta Curso
Epigenetica / Genemapper. Cliclear Add To List >> y Add.
En la columna Analysis Method seleccionar AFLP Default en la primera muestra. Marcar
la columna completa e ir a Edit / Fill Down (o Ctrl+D) para rellenar hacia abajo.
Hacer doble-click en AFLP Default. Se abrirá una ventana. Ir a la pestaña Allele. Elegir
los parámetros adecuados en las subcategorías Analyze Dyes, Analysis Range, Panel y
Allele Calling, y aceptar los cambios.
En la columna Size Standard seleccionar GS500 (-250) en la primera muestra. Marcar
la columna completa e ir a Edit / Fill Down (o Ctrl+D) para rellenar hacia abajo.
Comenzar el análisis haciendo clic en el botón verde de Analyze. Guardar el proyecto.
B. Observación de las corridas
En la tabla “Genotypes” seleccionar todas las muestras (Ctrl+A) y hacer click en el botón
Display Plots.
Explorar las distintas herramientas de visualización que ofrece el programa:
acercamientos en ordenadas y en abscisas, mostrar/ocultar etiquetas, etc.
Volver a la ventana principal e ir a la tabla “Samples”. Seleccionar todo (Ctrl+A) y hacer
clic en el botón Display Plots.
Explorar las opciones que ofrece esta representación gráfica ¿Cómo son ahora los
acercamientos y desplazamientos respecto a la visualización anterior? Seleccione el
color rojo para ver el marcador ROX. Añada a la visualización la tabla de genotipos y
compárela con los electroferogramas.
C. Obtención de la matriz
Volver a la ventana principal y, ubicado en la tabla de genotipos, ir a File / Export
Table… Elegir como tipo de archivo Tab-delimited Text (.txt) y guardar en la carpeta
Genemapper.
Abrir la tabla de genotipos (archivo .txt) en Bloc de notas. Edit / Seleccionar todo
(Ctrl+E) y copiar.
Iniciar el programa Excel y pegar en una hoja nueva. Guardar la tabla como “Matriz
Genemapper”.
Ejercicio 2. Porcentaje de metilación.
A. Matriz de patrones de metilación.
Abrir la matriz de Excel obtenida en el Ejercicio 1.
Primero se procederá a “limpiar” la matriz de toda información que no sea necesaria.
Eliminar todas las columnas excepto las de “Allele” (ceros y unos) y la de “Sample
Name”. Luego, eliminar las columnas que sólo contengan ceros. Para una fácil
visualización se puede hacer la sumatoria debajo de cada columna y eliminar aquellas
columnas cuya suma sea igual a cero. Rotular nuevamente las columnas del
“Locus001” al “Locus n”.
Para generar la matriz de patrones de metilación se seguirá el siguiente esquema:
H (HpaII)
M (MspI)
Patrón
Metilación del
sitio CCGG
Estado de
metilación
1
0
2
Hemimetilado
0
1
3
Metilación
interna
1
1
1
Desmetilado
0
Metilación
externa
o
total
0
0
Situarse en la columna B (Locus001) y colocar el cursor dos celdas por debajo de la
última fila. Ingresar la siguiente fórmula:
=SI(B2+B3=0;0;SI(B2+B3=2;1;SI(B2=1;2;3)))
Esta fórmula lógica representa el siguiente árbol de decisiones:
SI: H+M = 0
Verdadero
Falso
0
SI: H+M = 2
Verdadero
Falso
1
SI: H = 1
Verdadero
2
Falso
3
Mediante esta fórmula se transforman los valores de presencia (1) y ausencia (0) en H y
en M por un único valor que representa al patrón.
Utilizar la misma fórmula en la siguiente celda hacia abajo, pero reemplazando “B2” y
“B3” por “B4” y “B5”, respectivamente. Continuar con los 5 genotipos restantes de la
misma manera.
Una vez terminado el Locus001 de la tabla de patrones, copiar hacia la derecha para el
resto de los loci. (Nota: Esta vez Excel cambiará automáticamente los valores en la
fórmula para referirla a los siguientes loci, por ej: B2 y B3 por C2 y C3)
Copiar la nueva tabla y pegarla en un documento nuevo de Excel. Agregar rótulos a
genotipos y loci, y guardar como “Matriz de patrones”.
B. Cálculo de porcentajes de metilación.
A partir de la matriz de patrones se obtendrán los porcentajes de loci metilados,
desmetilados y hemimetilados para cada individuo, utilizando la función lógica
CONTAR.SI al final de cada fila.
Primero, contar el número de loci totales para cada individuo. La fórmula quedaría:
CONTAR.SI(rango de datos; “>0”)
Con la misma función contar los patrones 1, 2 y 3 para cada individuo y expresarlos
como porcentaje para cada individuo.
Calcular el valor promedio de los padres para cada estado de metilación (Valor Parental
Medio, VPM).
Representar gráficamente los valores obtenidos.
Ejemplo:
Porcentajes de loci
Genotipo
Total loci
Desmetilados
Metilados
Hemimetilados
Hibrido 1
84
32,1
53,6
14,3
Hibrido 2
81
29,6
49,4
21,0
Hibrido 3
92
29,3
55,4
15,2
Hibrido 4
46
37,0
54,3
8,7
Hibrido 5
89
39,3
53,9
6,7
Padre
60
26,7
56,7
16,7
Madre
107
33,6
47,7
18,7
-
30,2
52,2
17,7
VPM
Ejercicio 3. Herencia de patrones de metilación.
A. Matriz binaria.
A partir de la matriz de patrones se obtendrá una matriz binaria (de ceros y unos). Un
locus que en la matriz de patrones posee 2 o 3 patrones, en esta nueva matriz se
transformará en 2 o 3 loci distintos.
Abrir la matriz de Excel obtenida en el Ejercicio 2. Agregar una fila de ceros abajo de la
matriz. (Esto sirve para que los loci que no tienen ceros sean correctamente
transformados).
Seleccionar la matriz de patrones completa, incluyendo la fila de ceros, y copiarla.
Iniciar el programa InfoStat. En una tabla nueva, Edición / Pegar con nombres de
columnas. Ir a Datos / Crear variables auxiliares (dummy). Se abrirá una ventana,
seleccionar todos los loci y hacer clic en la flecha () para moverlos al cuadro de
“Variables a transformar”. Se crearán variables nuevas al final de la tabla. Copiarlas
incluyendo el nombre de las columnas y pegarlas en un nuevo documento de Excel.
Agregar los rótulos de los genotipos y guardar como “Matriz binaria”.
B. Construcción de un Diagrama de Venn.
Para computar cuántos alelos son únicos de los híbridos, del padre o de la madre, y
cuántos se comparten, se construirá un diagrama de Venn de tres conjuntos: padre,
madre e híbridos.
Abrir la matriz binaria. Agregar debajo de la matriz una fila que sea la suma de los
híbridos para cada locus. (Función SUMA o CONTAR). Rotular la fila como “Híbridos”.
Debajo de la matriz armar una tabla con 7 filas: Híbridos-Padre-Madre, Híbridos-Padre,
Híbridos-Madre, Padre-Madre, Padre, Madre e Híbridos. Utilizar la función =Y() como se
muestra en el Ejemplo. La función utilizada dará como resultado “VERDADERO” o
“FALSO”, según se cumplan o no los requisitos. Al final de la tabla contar la cantidad de
verdaderos (función CONTAR.SI).
Expresar los valores en porcentajes y construir un diagrama de Venn.
Ejemplo:
Locus001
…
Locus002
Locus n
Híbrido 1
1
0
0
1
Híbrido 2
0
1
0
1
…
1
0
1
1
Híbrido n
1
1
0
0
Padre
1
0
0
1
Madre
0
1
0
1
Híbridos
3
2
1
4
N° loci
% loci
H-P-M
=Y(Padre=1;Madre=1;Híbridos>0)
VERDADERO
37
22,3
H-P
=Y(Padre=1;Madre=0;Híbridos>0)
FALSO
38
23,0
H-M
=Y(Padre=0;Madre=1;Híbridos>0)
FALSO
57
34,3
P-M
=Y(Padre=1;Madre=1;Híbridos=0)
FALSO
12
7,2
P
=Y(Padre=1;Madre=0;Híbridos=0)
FALSO
8
4,8
M
=Y(Padre=0;Madre=1;Híbridos=0)
FALSO
10
6,0
H
=Y(Padre=0;Madre=0;Híbridos>0)
FALSO
4
2,4
Total
Padre
166
Madre
4,8
7,2
6,0
22,3
23,0
34,3
2,4
Híbridos
C. Análisis de cambios en patrones de metilación.
Abrir el archivo “Ejercicio3.xls”.
En él encontrará en la primera hoja una matriz de patrones compuesta por 40 loci y 5
genotipos (2 parentales y 3 híbridos). Debajo de ésta hay un recuadro en donde deberá
anotar cambios en los patrones de metilación (patrón 0, 1, 2 ó 3) de los híbridos
respecto a los padres. Para eso en la segunda hoja encontrará la codificación utilizada
para cada tipo de cambio.
En la tabla inferior se registrará automáticamente el número de cambios para cada
híbrido y el porcentaje de cambios respecto al total de loci.
Trabajo Práctico N°2
Variabilidad epigenética en poblaciones naturales
Ejercicio 1. Cálculo de la variabilidad epigenética.
A. Matriz de similitud.
Iniciar el programa NTSYS-pc.
Ir a Similarity / Qualitative data. En Input file seleccionar el archivo
“PoblacionesNaturales.nts”. Marcar la casilla By rows y elegir DICE como coeficiente
de similitud. En Output file escribir “PoblacionesNaturalesSIM.nts” y hacer clic en
Compute.
Esta función compara a todos los individuos entre sí y para cada comparación
calcula un coeficiente de similitud basado en las coincidencias (1-1) y discrepancias
(1-0). El coeficiente de similitud DICE puede tomar valores de 0 (genotipos distintos
para todos los loci) a 1 (genotipos iguales para todos los loci). La matriz resultante es
triangular y en la diagonal se ubican las comparaciones de cada genotipo consigo
mismo, por lo que los coeficientes son igual a 1.
B. Construcción de dendrograma.
Ir a Clustering / SAHN. En Input file seleccionar el archivo
“PoblacionesNaturalesSIM.nts” y en Output tree file escribir
“PoblacionesNaturalesTREE.nts”. Elegir UPGMA como Clustering method y hacer
clic en Compute.
Para graficar el dendrograma ir a Graphics / Tree plot.
C. Variabilidad genética y epigenética.
(Opcional) Abrir el archivo MSAPmcd en NTSYS. Esta es una matriz de similitud
(coef. DICE) entre individuos de la especie Solanum microdontum. Abrir el mismo
archivo en Bloc de Notas. La matriz no se visualizará correctamente, pero permitirá
extraer los datos. Copiar y pegar los datos en un documento nuevo de Excel. Para
que se peguen correctamente es posible que necesite usar la opción Usar el
Asistente para importar texto… que aparece al pegar, y allí seleccionar “.” como
separador de decimales. Eliminar las celdas que contengan el valor “1” (la diagonal)
y apilar todos los datos en una sola columna.
Abrir el archivo “Variabilidad Genetica y Epigenetica” en InfoStat. Es una tabla de 2
columnas elaborada a partir de matrices de similitud como la hecha en este ejercicio.
Ejecutar un ANOVA yendo a Estadísticas / Análisis de la varianza y graficar los datos
en un Gráfico de Barras.
Ejercicio 2. Análisis Bayesiano con STRUCTURE.
A. Creación de un proyecto.
Iniciar el programa STRUCTURE e ir a File / New Project…
Elegir un nombre para el proyecto y como directorio seleccionar la carpeta del curso.
En Choose data file buscar el archivo “Datos Structure.txt”.
En la próxima ventana ingresar los siguientes parámetros:
- Number of individuals:
78
- Ploidy of data:
2
- Number of loci:
345
- Missing data value:
999
En la tercera ventana marcar solamente la casilla
- Row of recessive alleles
En la cuarta ventana marcar las casillas:
- Individual ID for each individual
- Putative population origin for each individual
Cliquear en Finish y luego Proceed.
B. Elección de parámetros y simulación
Ir a Parameter Set / New… Ingresar:
- Length of Burnin Period:
5000
- Number of MCMC Reps after Burnin:
20000
El resto de los parámetros se utilizarán como aparecen por defecto.
Guardar los parámetros como “5x20”.
Ahora en el panel de la izquierda en la carpeta “Parameter Sets” aparecerá la
carpeta “5x20” (Active).
Ir a Parameter Sets / Run o hacer clic en el botón Run (¡). Ingresar 3 en “Set number
of populations assumed” (K=3) y dar “OK”.
Comenzarán las simulaciones, primero 5000 ciclos de Burn-in y luego 20000 ciclos
más en donde se computan los parámetros alfa, FST’s y Ln(likelihood).
Al terminar la corrida se creará un archivo en la carpeta “Results” del panel izquierdo.
Seleccionarla e ir a Bar plot / Show en el panel de la derecha.
Para una mejor visualización marcar la opción Plot in multiple lines.
C. Elección de K usando STRUCTURE-SUM.
Abrir el programa R.
Ir a Archivo / Cambiar dir… y seleccionar la carpeta STRUCTURE-SUM dentro de la
carpeta del curso.
Ir a Archivo / Interpretar código fuente R… y seleccionar el archivo “Structure-sum2011.r”.
En la consola de R escribir:
> Structure.deltaK(“resultsMSAP.txt”, 25)
Se generarán cuatro gráficos y un archivo .txt con los valores K en la carpeta del
curso ¿Según los resultados cuál sería el valor de K más adecuado?
Descargar