Trabajo Práctico N°1 Procesos que generan cambios epigenéticos Ejercicio 1. Análisis de electroferogramas. A. Análisis con GeneMapper. Iniciar el programa GeneMapper. File / Add Samples to Project… Seleccionar los archivos .fsa de la carpeta Curso Epigenetica / Genemapper. Cliclear Add To List >> y Add. En la columna Analysis Method seleccionar AFLP Default en la primera muestra. Marcar la columna completa e ir a Edit / Fill Down (o Ctrl+D) para rellenar hacia abajo. Hacer doble-click en AFLP Default. Se abrirá una ventana. Ir a la pestaña Allele. Elegir los parámetros adecuados en las subcategorías Analyze Dyes, Analysis Range, Panel y Allele Calling, y aceptar los cambios. En la columna Size Standard seleccionar GS500 (-250) en la primera muestra. Marcar la columna completa e ir a Edit / Fill Down (o Ctrl+D) para rellenar hacia abajo. Comenzar el análisis haciendo clic en el botón verde de Analyze. Guardar el proyecto. B. Observación de las corridas En la tabla “Genotypes” seleccionar todas las muestras (Ctrl+A) y hacer click en el botón Display Plots. Explorar las distintas herramientas de visualización que ofrece el programa: acercamientos en ordenadas y en abscisas, mostrar/ocultar etiquetas, etc. Volver a la ventana principal e ir a la tabla “Samples”. Seleccionar todo (Ctrl+A) y hacer clic en el botón Display Plots. Explorar las opciones que ofrece esta representación gráfica ¿Cómo son ahora los acercamientos y desplazamientos respecto a la visualización anterior? Seleccione el color rojo para ver el marcador ROX. Añada a la visualización la tabla de genotipos y compárela con los electroferogramas. C. Obtención de la matriz Volver a la ventana principal y, ubicado en la tabla de genotipos, ir a File / Export Table… Elegir como tipo de archivo Tab-delimited Text (.txt) y guardar en la carpeta Genemapper. Abrir la tabla de genotipos (archivo .txt) en Bloc de notas. Edit / Seleccionar todo (Ctrl+E) y copiar. Iniciar el programa Excel y pegar en una hoja nueva. Guardar la tabla como “Matriz Genemapper”. Ejercicio 2. Porcentaje de metilación. A. Matriz de patrones de metilación. Abrir la matriz de Excel obtenida en el Ejercicio 1. Primero se procederá a “limpiar” la matriz de toda información que no sea necesaria. Eliminar todas las columnas excepto las de “Allele” (ceros y unos) y la de “Sample Name”. Luego, eliminar las columnas que sólo contengan ceros. Para una fácil visualización se puede hacer la sumatoria debajo de cada columna y eliminar aquellas columnas cuya suma sea igual a cero. Rotular nuevamente las columnas del “Locus001” al “Locus n”. Para generar la matriz de patrones de metilación se seguirá el siguiente esquema: H (HpaII) M (MspI) Patrón Metilación del sitio CCGG Estado de metilación 1 0 2 Hemimetilado 0 1 3 Metilación interna 1 1 1 Desmetilado 0 Metilación externa o total 0 0 Situarse en la columna B (Locus001) y colocar el cursor dos celdas por debajo de la última fila. Ingresar la siguiente fórmula: =SI(B2+B3=0;0;SI(B2+B3=2;1;SI(B2=1;2;3))) Esta fórmula lógica representa el siguiente árbol de decisiones: SI: H+M = 0 Verdadero Falso 0 SI: H+M = 2 Verdadero Falso 1 SI: H = 1 Verdadero 2 Falso 3 Mediante esta fórmula se transforman los valores de presencia (1) y ausencia (0) en H y en M por un único valor que representa al patrón. Utilizar la misma fórmula en la siguiente celda hacia abajo, pero reemplazando “B2” y “B3” por “B4” y “B5”, respectivamente. Continuar con los 5 genotipos restantes de la misma manera. Una vez terminado el Locus001 de la tabla de patrones, copiar hacia la derecha para el resto de los loci. (Nota: Esta vez Excel cambiará automáticamente los valores en la fórmula para referirla a los siguientes loci, por ej: B2 y B3 por C2 y C3) Copiar la nueva tabla y pegarla en un documento nuevo de Excel. Agregar rótulos a genotipos y loci, y guardar como “Matriz de patrones”. B. Cálculo de porcentajes de metilación. A partir de la matriz de patrones se obtendrán los porcentajes de loci metilados, desmetilados y hemimetilados para cada individuo, utilizando la función lógica CONTAR.SI al final de cada fila. Primero, contar el número de loci totales para cada individuo. La fórmula quedaría: CONTAR.SI(rango de datos; “>0”) Con la misma función contar los patrones 1, 2 y 3 para cada individuo y expresarlos como porcentaje para cada individuo. Calcular el valor promedio de los padres para cada estado de metilación (Valor Parental Medio, VPM). Representar gráficamente los valores obtenidos. Ejemplo: Porcentajes de loci Genotipo Total loci Desmetilados Metilados Hemimetilados Hibrido 1 84 32,1 53,6 14,3 Hibrido 2 81 29,6 49,4 21,0 Hibrido 3 92 29,3 55,4 15,2 Hibrido 4 46 37,0 54,3 8,7 Hibrido 5 89 39,3 53,9 6,7 Padre 60 26,7 56,7 16,7 Madre 107 33,6 47,7 18,7 - 30,2 52,2 17,7 VPM Ejercicio 3. Herencia de patrones de metilación. A. Matriz binaria. A partir de la matriz de patrones se obtendrá una matriz binaria (de ceros y unos). Un locus que en la matriz de patrones posee 2 o 3 patrones, en esta nueva matriz se transformará en 2 o 3 loci distintos. Abrir la matriz de Excel obtenida en el Ejercicio 2. Agregar una fila de ceros abajo de la matriz. (Esto sirve para que los loci que no tienen ceros sean correctamente transformados). Seleccionar la matriz de patrones completa, incluyendo la fila de ceros, y copiarla. Iniciar el programa InfoStat. En una tabla nueva, Edición / Pegar con nombres de columnas. Ir a Datos / Crear variables auxiliares (dummy). Se abrirá una ventana, seleccionar todos los loci y hacer clic en la flecha () para moverlos al cuadro de “Variables a transformar”. Se crearán variables nuevas al final de la tabla. Copiarlas incluyendo el nombre de las columnas y pegarlas en un nuevo documento de Excel. Agregar los rótulos de los genotipos y guardar como “Matriz binaria”. B. Construcción de un Diagrama de Venn. Para computar cuántos alelos son únicos de los híbridos, del padre o de la madre, y cuántos se comparten, se construirá un diagrama de Venn de tres conjuntos: padre, madre e híbridos. Abrir la matriz binaria. Agregar debajo de la matriz una fila que sea la suma de los híbridos para cada locus. (Función SUMA o CONTAR). Rotular la fila como “Híbridos”. Debajo de la matriz armar una tabla con 7 filas: Híbridos-Padre-Madre, Híbridos-Padre, Híbridos-Madre, Padre-Madre, Padre, Madre e Híbridos. Utilizar la función =Y() como se muestra en el Ejemplo. La función utilizada dará como resultado “VERDADERO” o “FALSO”, según se cumplan o no los requisitos. Al final de la tabla contar la cantidad de verdaderos (función CONTAR.SI). Expresar los valores en porcentajes y construir un diagrama de Venn. Ejemplo: Locus001 … Locus002 Locus n Híbrido 1 1 0 0 1 Híbrido 2 0 1 0 1 … 1 0 1 1 Híbrido n 1 1 0 0 Padre 1 0 0 1 Madre 0 1 0 1 Híbridos 3 2 1 4 N° loci % loci H-P-M =Y(Padre=1;Madre=1;Híbridos>0) VERDADERO 37 22,3 H-P =Y(Padre=1;Madre=0;Híbridos>0) FALSO 38 23,0 H-M =Y(Padre=0;Madre=1;Híbridos>0) FALSO 57 34,3 P-M =Y(Padre=1;Madre=1;Híbridos=0) FALSO 12 7,2 P =Y(Padre=1;Madre=0;Híbridos=0) FALSO 8 4,8 M =Y(Padre=0;Madre=1;Híbridos=0) FALSO 10 6,0 H =Y(Padre=0;Madre=0;Híbridos>0) FALSO 4 2,4 Total Padre 166 Madre 4,8 7,2 6,0 22,3 23,0 34,3 2,4 Híbridos C. Análisis de cambios en patrones de metilación. Abrir el archivo “Ejercicio3.xls”. En él encontrará en la primera hoja una matriz de patrones compuesta por 40 loci y 5 genotipos (2 parentales y 3 híbridos). Debajo de ésta hay un recuadro en donde deberá anotar cambios en los patrones de metilación (patrón 0, 1, 2 ó 3) de los híbridos respecto a los padres. Para eso en la segunda hoja encontrará la codificación utilizada para cada tipo de cambio. En la tabla inferior se registrará automáticamente el número de cambios para cada híbrido y el porcentaje de cambios respecto al total de loci. Trabajo Práctico N°2 Variabilidad epigenética en poblaciones naturales Ejercicio 1. Cálculo de la variabilidad epigenética. A. Matriz de similitud. Iniciar el programa NTSYS-pc. Ir a Similarity / Qualitative data. En Input file seleccionar el archivo “PoblacionesNaturales.nts”. Marcar la casilla By rows y elegir DICE como coeficiente de similitud. En Output file escribir “PoblacionesNaturalesSIM.nts” y hacer clic en Compute. Esta función compara a todos los individuos entre sí y para cada comparación calcula un coeficiente de similitud basado en las coincidencias (1-1) y discrepancias (1-0). El coeficiente de similitud DICE puede tomar valores de 0 (genotipos distintos para todos los loci) a 1 (genotipos iguales para todos los loci). La matriz resultante es triangular y en la diagonal se ubican las comparaciones de cada genotipo consigo mismo, por lo que los coeficientes son igual a 1. B. Construcción de dendrograma. Ir a Clustering / SAHN. En Input file seleccionar el archivo “PoblacionesNaturalesSIM.nts” y en Output tree file escribir “PoblacionesNaturalesTREE.nts”. Elegir UPGMA como Clustering method y hacer clic en Compute. Para graficar el dendrograma ir a Graphics / Tree plot. C. Variabilidad genética y epigenética. (Opcional) Abrir el archivo MSAPmcd en NTSYS. Esta es una matriz de similitud (coef. DICE) entre individuos de la especie Solanum microdontum. Abrir el mismo archivo en Bloc de Notas. La matriz no se visualizará correctamente, pero permitirá extraer los datos. Copiar y pegar los datos en un documento nuevo de Excel. Para que se peguen correctamente es posible que necesite usar la opción Usar el Asistente para importar texto… que aparece al pegar, y allí seleccionar “.” como separador de decimales. Eliminar las celdas que contengan el valor “1” (la diagonal) y apilar todos los datos en una sola columna. Abrir el archivo “Variabilidad Genetica y Epigenetica” en InfoStat. Es una tabla de 2 columnas elaborada a partir de matrices de similitud como la hecha en este ejercicio. Ejecutar un ANOVA yendo a Estadísticas / Análisis de la varianza y graficar los datos en un Gráfico de Barras. Ejercicio 2. Análisis Bayesiano con STRUCTURE. A. Creación de un proyecto. Iniciar el programa STRUCTURE e ir a File / New Project… Elegir un nombre para el proyecto y como directorio seleccionar la carpeta del curso. En Choose data file buscar el archivo “Datos Structure.txt”. En la próxima ventana ingresar los siguientes parámetros: - Number of individuals: 78 - Ploidy of data: 2 - Number of loci: 345 - Missing data value: 999 En la tercera ventana marcar solamente la casilla - Row of recessive alleles En la cuarta ventana marcar las casillas: - Individual ID for each individual - Putative population origin for each individual Cliquear en Finish y luego Proceed. B. Elección de parámetros y simulación Ir a Parameter Set / New… Ingresar: - Length of Burnin Period: 5000 - Number of MCMC Reps after Burnin: 20000 El resto de los parámetros se utilizarán como aparecen por defecto. Guardar los parámetros como “5x20”. Ahora en el panel de la izquierda en la carpeta “Parameter Sets” aparecerá la carpeta “5x20” (Active). Ir a Parameter Sets / Run o hacer clic en el botón Run (¡). Ingresar 3 en “Set number of populations assumed” (K=3) y dar “OK”. Comenzarán las simulaciones, primero 5000 ciclos de Burn-in y luego 20000 ciclos más en donde se computan los parámetros alfa, FST’s y Ln(likelihood). Al terminar la corrida se creará un archivo en la carpeta “Results” del panel izquierdo. Seleccionarla e ir a Bar plot / Show en el panel de la derecha. Para una mejor visualización marcar la opción Plot in multiple lines. C. Elección de K usando STRUCTURE-SUM. Abrir el programa R. Ir a Archivo / Cambiar dir… y seleccionar la carpeta STRUCTURE-SUM dentro de la carpeta del curso. Ir a Archivo / Interpretar código fuente R… y seleccionar el archivo “Structure-sum2011.r”. En la consola de R escribir: > Structure.deltaK(“resultsMSAP.txt”, 25) Se generarán cuatro gráficos y un archivo .txt con los valores K en la carpeta del curso ¿Según los resultados cuál sería el valor de K más adecuado?