Curso de Biología Molecular y Bioquímica Maestría en Bioinformática ACTIVIDAD PRÁCTICA OBJETIVO: Clonar la proteína TcPop2 de Trypanosoma cruzi. Búsqueda de la secuencia del gen que codifica para la proteína Pop2 identificada en levadura. La búsqueda de la secuencia codificante de Pop2, se realizó en la base de datos GenBank (http://www.ncbi.nlm.nih.gov/genbank/). Si ingresamos “Pop2” en el menú de búsqueda y seleccionando en la base de datos de proteínas, tenemos como resultado todos los genes anotados como Pop2 (Caf1) en distintos organismos. Al seleccionar la primer entrada, correspondiente a la secuencia de levadura, nos dirige a una entrada de la base de datos que nos provee de información diversa acerca de la proteína en este organismo. Esta información está ordenada en campos específicos de anotación de acuerdo al formato de archivo por defecto en este sitio que es el de tipo genbank. A partir de aquí podemos obtener la secuencia proteica en formato FASTA, el cual nos da menos información que el anterior, pero que es más adecuado al momento de trabajar únicamente con la secuencia aminoacídica. Una vez que contamos con esta secuencia podemos realizar la búsqueda de proteínas homológas mediante el uso del algoritmo BLAST. Esta herramienta se encuentra disponible online en el enlace: Curso de Biología Molecular y Bioquímica Maestría en Bioinformática http://blast.ncbi.nlm.nih.gov/Blast.cgi Desde el cual se puede comparar la secuencia de interés con todas las existentes en el genbank. Dado que el algoritmo es de tipo heurístico no nos asegura el mejor alineamiento, sino que nos reporta una lista de alineamientos locales entre nuestra secuencia (“querry”) y las similares en la base (“hits”). Esto es compensado con la velocidad de búsqueda la cual es muy superior a la de los algoritmos de tipo programación dinámica que tendrían tiempos de ejecución incompatibles con el tamaño de las bases de datos actuales. Debido a que bajamos la secuencia aminoacídica, lo que se emplea frecuentemente en la búsqueda de homólogos (ya que ésta se encuentra más conservada que la nucleotidica), se realizará un blastp seleccionando “protein blast”. Este algoritmo tiene varios parámetros que se pueden modificar que van a afectar el resultado de la búsqueda. Al reducir los parámetros de la búsqueda, de manera que: En nuestro caso debido a que queremos obtener la secuencia homóloga específicamente de Trypanosoma cruzi podemos acotar la búsqueda a este organismo. Por otra parte, buscaremos en la base nonredundant (nr) que contiene la totalidad de las secuencias subidas a esta base de datos. Como resultado obtenemos una lista de alineamientos entre nuestra proteína y el hit en particular en donde cada uno posee asociado un “expected-value” relacionado con la probabilidad de obtener ese resultado por azar. Cuanto menor sea este valor, el resultado es más significativo. De esta forma tendremos como resultado a la proteína Tc00.1047053511827.60 en el genoma de la cepa no CL Brener non Esmeraldo-like con un e-value muy significativo. Ya que el genoma de T. cruzi se encuentra completamente secuenciado podemos asegurar que esta secuencia es la que tiene la mayor homología con la secuencia de Pop2 de levadura y por lo tanto correspondería al gen ortólogo en este organismo. Curso de Biología Molecular y Bioquímica Maestría en Bioinformática Diseño de primers para amplificar la región codificante del gen que codifica para Pop2 Para amplificar el gen correspondiente al homologo de Pop2 en T. cruzi recién identificado en la base de datos es necesario diseñar cebadores específicos. Para esto necesitamos contar con la secuencia nucleotidica del gen. La misma la podemos obtener haciendo click sobre el link “CDS” que nos llevará a la entrada correspondiente a la secuencia codificante de la proteína que estamos analizando. En esta nueva vista podemos acceder a la secuencia en formato FASTA de la misma manera que en la parte anterior, para ser utilizada posteriormente. A partir de la secuencia codificante del gen TcPop2 se diseñan los siguientes primers utilizando el algoritmo primer3plus. Conisderando como requisito obligatorio que los mismos abarquen toda la región codificante de dicho gen incluyendo el codón de inicio de la traducción y el codón stop: atgtcaaacacatgggattttatggacggtctttttgtggcaaatttgtcgtttccattctctctctctctctctttttttttttt tgtttctgcctgcctgttggctggtccgaggggggcccacgaagaagaagacgagacacagacacacaagacggagagagagacat acgtggaaggagggagtgaaataggaaaaaaaaagacaaaaaacaataataataaaaaaggggacatgatgcagtacggtaacgct ttagcgcagtacgggacgtaccagcagcgttatccggttgctgttagccaaggcgggattgctgccattccttcccttagtaaatc cccaatgattcgcgacgtgtgggaggagaatttagaggaagagttcaacatcatacgatccctgatcaaagactacccttatgtgt caatggacaccgagtttcccggagttgtagcgaagcctgtgggcaattttaaggcaacacacgagttttattaccagacacttcgt tgtaatgtcaatttgctcaaaatgattcagctagggattacactactcaatgaaaagggggaggtaccggaaaactgctgcacctg gcagtttaacttccgtttttgcctcacagaggatgtgtacgcacaggatagtattcagttactccgccatggcggcattgactttg actactttgcgcagtatggggttgaggtgacgcactttgcggagctcctcatctcgagcgggctcgtgctgaacagcgacattcgc tggcttgccttccatgcaggctacgactttggttatttgatgaaggtggtctgcggcaaggacctgccggagaaggaggatgactt cctgcagatcttccactccctgttcccgtgcgtgtacgacatcaagtacctcctgcgcgccaccgacctctcgcactcgttgggtt tagaccacctctcggagagccttcgggtgcgccggttcggcatggcgcaccaggccggcagcgactccctcctcaccggccactgc tacttcaaactgctccgcgactgcttcggcagcaacccgcccgtggcaagcaacggcgtgctctacggcctgtgcgaagacgcgtc ctcagccgccacgcccagcagcacgacgataccgggcggcagcgcacacgcgttcgcttcgtttaccgccagcaaaaacaccacat tcccgtccacgccgctcaacaactcggtgaagggccacaac De esta manera, se mandaron a sintetizar los siguientes primers: Pop2F: 5´ ATGTCAAACACATGGGATTTTATG 3´ Tm 59.9ºC Met Pop2R: 5´ TTAGTTGTGGCCCTTCACC 3´ Tm 58.2ºC Stop Curso de Biología Molecular y Bioquímica Maestría en Bioinformática Si bien es recomendable que el Tm no sea inferior a 50ºC, muchas veces nos vemos obligados a seleccionar primers con propiedades que no son las óptimas (formación de dímeros, horquillas, Tm bajas) de manera de tener amplificado el gen completo, y son el resto de las condiciones experimentales del PCR las que tenemos que modificar (concentración de primers, concentración de MgCl2, concentración de ADN) para lograr obtener el producto amplificado de interés. A dichos primers se le adicionaron, secuencias específicas en los extremos 5’, de manera de permitir el clonado en los vectores de expresión. Debido que T. cruzi a pesar de ser un organismo eucariota no presenta intrones, la obtención del inserto a clonar se realiza simplemente mediante la amplificación por PCR a partir de ADN génomico. Amplificación del gen de TcPop2 por PCR Se realizara un PCR para clonar TcPop2 a partir de ADN genómico de la cepa Dm28 Buffer STR 10 X 2µL DNA Polymerase (Stratagene) 2µL Primers Forward/Reverse 0.5µL (c/u) ADN genómico 3 µL Agua 12 µL STR 10x: Buffer Tris-HCl 100mM pH 9 KCl 500mM 15mM de MgCl 1% Tritonx-100 2mM de cada dNTP ADN pol: Unidades/ uL Concentración de los primers: 10uM Concentración de ADN genómico: 34ng/uL Las reacciones se deben armar en frío, para aumentar la especificidad de la reacción, luego se pasan rápidamente al temociclador en donde se realiza el siguiente programa de temperaturas: 56 ºC Por 30 ciclos Curso de Biología Molecular y Bioquímica Maestría en Bioinformática Digestión del producto de PCR clonado en Topo y análisis por electroforesis Los resultados de las digestiones con enzimas de restricción, nos permiten verificar que nuestro inserto fue clonado en el vector. Según el mapa de restricción del vector Topo 2.1, podemos liberar el inserto mediante una digestión con EcoRI. EcoRI Buffer EcoRI H2O Topo 2.1 TcPop2 Topo 2.1 TcPop2 2µL 4µL c.s.p. 40µL 15µL Topo 2.1 TcPop2 ---------------------4µL c.s.p. 40µL 6µL Para analizar los productos obtenidos a partir de las digestiones, al igual que para verificar si mediante el PCR tuvimos el producto del tamaño esperado, realizaremos una electroforesis de agarosa 1% (1 g de agarosa cada 100 mL de Buffer). Dicha electroforesis, se realizará en presencia de Bromuro de Etidio que permite visualizar las moléculas de ADN bajo la luz UV, al intercalarse entre bases del ADN. Mediante esta técnica los fragmentos de ADN migran de forma paralela a un campo eléctrico a través de una malla de un polímero de agarosa, que opone cierta resistencia en relación al tamaño de las moléculas. Esto hace que fragmentos de un tamaño mayor, tengan una movilidad electroforética menor que fragmentos de menor tamaño. Curso de Biología Molecular y Bioquímica Maestría en Bioinformática Para poder atribuir los tamaños de los productos, además de nuestras muestras debemos incluir un marcador de peso molecular, que consiste en una serie de fragmentos de tamaño conocido (por ejemplo 1 Kb Ladder).