Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias Marcadores Moleculares de ADN 1 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias REACCIÓN EN CADENA DE LA POLIMERASA O PCR E INTRODUCCIÓN AL MEJORAMIENTO VEGETAL ASISTIDO La base teórica de la reacción en cadenas de la polimerasa o PCR fue expuesta en 1971 (Kleppl et al.), pero esta técnica no produjo demasiado interés hasta mediados de los años 80 La tecnología denominada Reacción en Cadena de la Polimerasa o PCR (Polymerase Chain Reaction) fue desarrollada por Mullis y colaboradores a mediados de la década del ochenta (Saiki et al., 1985; Mullis y Falcona, 1987). El impacto causado en la ciencia por esta tecnología fue tan grande que le valió el premio Novel de medicina a Kary Mullis en 1993. La técnica esta basada en la replicación in vitro del ADN, e imita el proceso natural que ocurre en todas las células vivas. Una célula para poder replicar su ADN requiere, entre otras cosas, de enzimas que desenrollen la estructura de hélice y separen las cadenas del ADN, una secuencia molde de ADN o templado de simple cadena a copiar, y enzimas que catalicen la unión de los nucleótidos a este último. Para poder imitar este proceso, la técnica de PCR aprovecha las propiedades de desnaturalización y renaturalización del ADN y provoca, en forma artificial, un aumento y descenso alternado de la temperatura (ciclos) del cóctel de reacción (premix), por medio de un ciclador térmico o termociclador. En el cóctel de reacción o premix, se encuentran todos los elementos necesarios para la replicación: ADN, oligonucleótidos cebadores o "primers", una ADN polimerasa y nucleótidos (dNTPs). En la primer parte del ciclo, el aumento de la temperatura hasta 95 °C, produce la desnaturalización del ADN, es decir la separación de las dos hebras de la doble hélice. En la segunda parte del ciclo comienza a descender la temperatura, lo que permite la unión de las cadenas de simple hebra a los oligonucléotidos (10 a 30 bases) denominadas primers, que actúan como cebadores para el inicio de la replicación. La temperatura en la que se produce la unión del primer a la cadena molde de ADN se conoce 2 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias como temperatura de annealing, y depende del largo, de la composición de bases del primer y oscila entre los 50 y 60 °C. Esta temperatura es mayor que la que permite la unión de las hebras de ADN separadas (45°C), por lo que el primer se hibrida antes con la cadena molde durante el descenso de temperatura. A diferencia de la replicación de ADN celular, en la que los cebadores reconocidos por la ADN polimerasa son secuencias de ARN, los cebadores utilizados en la reacción de PCR son secuencias de ADN. En la reacción de PCR, los primers (sintéticos) tienen una secuencia que les permite hibridar, en forma específica, y amplificar la secuencia compredida entre dos primers con la secuencia blanco que el usuario quiere amplificar. Una vez que se produce la hibridación de los primers, la enzima ADN polimerasa cataliza la síntesis de una nueva hebra de ADN, incorporando a la cadena en formación, a través de uniones fosfodiester, los nucleótidos con las bases complementarias a la cadena molde. La enzima responsable de la replicación en las células es la ADN polimerasa. Esta cataliza la unión del grupo OH-3' del extremo del cebador, con el grupo fosfato del deoxiribonucíeósido trifosfato que se incorpora a la cadena en síntesis a través de una unión fosfodiester. En la célula la replicación ocurren a temperatura constante e intervienen distintas enzimas que catalizan todas las reacciones y que son sensibles al aumento de la temperatura ya que, como son proteínas, se desnaturalizan y pierden sus propiedades a los 45°C. En al reacción de PCR estos procesos ocurren en un tubo de ensayo sometido a variaciones de temperatura con un máximo de 95 °C, y la polimerización es conducida por una ADN polimerasa llamada Taq polimerasa obtenida de bacterias termófilas (Thermus aquaticus). Esta enzima tiene su temperatura óptima de catalización a 72 °C. En la utilización de esta enzima se basó el gran descubrimiento de Kan Mullis. Las enzimas utilizadas para la unión de nucleótidos en la reacción de PCR son obtenidas de bacterias que habitan en aguas termales, y son capaces de resistir temperaturas tan altas como la necesaria para separar las cadenas de ADN, es decir 95°C. Gracias a esto, el termociclador puede realizar muchos ciclos de variación de la temperatura, llegando hasta 3 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias los 95 °C sin que se desnaturalice la enzima Taq polimerasa, lo que permite obtener millones de réplicas (amplificación) de un fragmento de ADN. Antes del descubrimiento de la Taq polimerasa, se utilizaba ADN polimerasa de E. coli, la que se agregaba en cada ciclo a la mezcla de reacción, ya que durante el calentamiento a 950C, la enzima se degradaba. Este procedimiento resultaba muy complicado y de difícil ejecución. Otra de las ventajas que tiene la Taq polimerasa respecto de la ADN polimerasa de E. Coli es que su temperatura óptima de polimerización es de 72 °C. Esto permite utilizar temperaturas de annealing de los primers más elevadas, eliminando amplificaciones no deseadas que se producen por hibridaciones no específicas de los primers (por ej. autohibridación) y que se favorecen con la baja temperatura de polimerización (370C) de la enzima de E. Coli. En la actualidad existen varias empresas que comercializan Taq polimerasa bajo licencia, y distintas variedades de polimerasas termoestables de acuerdo a su utilización. Algunas son naturales y otras son proteínas recombinantes, modificadas o no. Resumiendo, el ciclado al que se somete el cóctel de reacción consiste en elevar la temperatura hasta 95 °C, manteniendo algunos segundos para que se separen las cadenas del ADN molde. Luego, la temperatura desciende y se mantiene aproximadamente un minuto a la temperatura de hibridación del primer (50-60°C) para que este encuentre a su región complementaria e hibride. Comienza entonces un nuevo ascenso de la temperatura, manteniéndose 1 a 2 minutos, (dependiendo del largo de cadena a polimerizar), a 72 °C para que la enzima Taq. polimerasa sintetice, en sentido 5'- 3', la nueva cadena, utilizando como molde las cadenas de ADN separadas. Continúa luego el ascenso de temperatura, proceso en que se detiene la replicación y, al llegar a los 95°C se produce nuevamente la separación de las cadenas de ADN. En los sucesivos ciclos, cada hebra doble cadena generara dos nuevas cadenas sintetizadas sobre las viejas, originando nuevos sitios de unión o annealing para los primers. Esto implica que por cada ciclo se duplica la cantidad de ADN blanco para la hibridación de los primers. 4 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias El resultado final es que luego de un determinado "n" número de ciclos en el tubo de reacción existirán 2n copias de la cadena de ADN por cada cadena de ADN blanco existente al comienzo de la reacción. Es decir, en el ciclo 1, habrá 2 copias nuevas de la cadena de ADN, complementarias a las cadenas molde; en el ciclo 2 habrá 4 copias, en el ciclo 10 existirán 1.024 copias, y en el ciclo 20 se tendrán 1.048.576 copias del ADN blanco. La técnica de PCR es relativamente simple, versátil, muy rápida y económica en comparación con otras técnicas de marcadores de ADN, utilizadas en biología molecular. Las cantidades de ADN blanco necesario para producir la amplificación dependen de la frecuencia con que se encuentra dicha secuencia en el ADN en estudio. Si queremos amplificar una región genómica multicopia (varias copias del gen en el genoma), bastarán 5 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias unos pocos nanogramos de ADN total, en cambio si pretendemos amplificar una región genómica correspondiente a un gen de copia única, la cantidad de ADN total a utilizar puede variar desde los 100 nanogramos a 1 gr. La reacción se lleva a cabo en un tubo de microcentrífuga de 500 o de 200 l, según el diseño del bloque del ciclador térmico. En este tubo se encuentra la mezcla o premix de ADN, los dos tipos de primers que se unirán al ADN, señalando el punto de comienzo de la polimerización, una mezcla de los cuatro dexoxiribonucleósidos trifosfatos (dNTPs), buffer, C12 Mg (el Mg es cofactor de la enzima Taq polimerasa),y una pequeña cantidad de Taq Polimerasa. Una vez que la premix está preparada se lo coloca en el ciclador, vulgarmente llamado PCR, y se programa con el número de ciclos a realizar (entre 20 y 35), las temperaturas entre las que variará la reacción y el tiempo en que se mantendrá cada temperatura. Una vez terminado el programa, la corrida se realiza en un gel de agarosa (1,5-2%), con bromuro de etidio. Optimización de las condiciones de reacción de PCR La técnica de PCR tiene múltiples aplicaciones, su utilización no tiene restricciones en cuanto a especies animales o vegetales. Por su versatilidad, no existe un protocolo que pueda ser aplicado a todas las situaciones que se presenten en un laboratorio. Cada caso particular necesitará de una puesta a punto de las metodologías y protocolos, aunque se pueden considerar una serie de reglas generales acerca de los parámetros a optimizar para llevar adelante con éxito una reacción de amplificación. La hibridación depende del diseño de los primers (secuencia y largo) y de las condiciones de reacción (especialmente la concentración del Mg+2 y la temperatura). El control de estos factores disminuirá las hibridaciones de los primers en sitios no deseados y la autohibridación o autoannealing. La especificidad y la pureza del producto final van a depender de la frecuencia relativa con que ocurra la extensión de la cadena a partir del primer en el sitio deseado, versus la que ocurra en una posición no deseada del ADN templado. Esencialmente, toda interacción del primer con el templado lleva a la obtención de productos de extensión cuya especificidad es muy difícil de controlar durante los 6 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias primeros ciclos, debido al exceso en molaridad de los posibles sitios de annealing no deseados del ADN respecto de los sitios deseados. Por ello es deseable que al menos en los primeros ciclos, las condiciones de reacción sean lo más estrictas posible. Una vez transcurridos estos primeros ciclos en el cóctel de reacción, aumenta la molaridad de la secuencia blanco en forma exponencial, lo que permite que las condiciones de reacción se alejen un poco de las ideales sin afectar los siguientes ciclos. La concentración de magnesio en la premix es uno de los factores más importantes que pueden afectar el comportamiento de la Taq polimerasa durante la reacción. Algunos componentes de la reacción pueden actuar como agentes quelantes del magnesio, como por ejemplo el EDTA del buffer TE en que se suele diluir el ADN, los dNTPs y otras proteínas, Esto disminuye la concentración de magnesio libre en el tubo de reacción lo que puede llegar a inactivar a la polimerasa. El uso de una concentración excesiva de magnesio reduce la fidelidad de polimerización de la enzima. Es importante determinar en forma empírica la cantidad de magnesio total en el tubo de reacción con los reactivos que se usaran y tratar de no variar la forma de preparación de los componentes. Es conveniente hacer, además de la cuantificación y caracterización del ADN extraído, una serie de reacciones en la que se varíe la concentración de Mg-2. Fig. 1: Gel de corrida para optimizar la concentración de Mg de la reacción Los primers deben tener, en lo posible, una longitud mayor a los 18 nucleótidos con un contenido de G+C entre 40 y 60 % para otorgarles especificidad restringiendo el número de los posibles sitios de hibridación. Además deben tener secuencias que no 7 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias produzcan estructuras secundarias a la temperatura de reacción, como por ejemplo la autohibridación por complementariedad de las bases (los extremos 3' no deben tener complementaridad entre ellos). Es conveniente que la temperatura de annealing de ambos primers sea la misma pero si no es así, se debe elegir la menor temperatura de annealing . En el proceso de ajuste de la técnica también se deberá considerar la elección de una temperatura de annealing apropiada para cada primer. La cantidad de ADN molde o templado necesaria para la reacción depende de la complejidad y del tipo de secuencia a amplificar. Normalmente en plantas se utiliza desde 10 ng hasta 200 ng dependiendo del rendimiento de ADN propio de la técnica de extracción y de la especie. La concentración de Taq pol. influye en gran medida en los productos obtenidos en la reacción. Una alta concentración no implica una mayor cantidad de producto amplificado, es decir un mayor número de copias de secuencia blanco. El exceso de Taq pol. y el aumento del tiempo de polimerización (tiempo en que se mantienen los 720C) puede provocar "artefactos" asociados con la actividad exonucleasa 5'--3' intrínseca que posee la Taq pol. Esto provoca que en el gel de corrida aparezca un chorreado continuo en lugar de bandas discretas. Insignificantes cantidades de un plásmido, restos de ADN de otras reacciones o de nuestras propias células pueden ser amplificados. Es importante entonces evitar las contaminaciones, por ejemplo, utilizando juegos de micropipetas para uso general del laboratorio y otro para pipetear las reacciones de PCR, o usando tips con filtro, que previenen los aerosoles que se producen en la superficie interior del líquido dentro del tips. El uso de guantes descartables de la contaminación con células epiteliales que se desprenden a diario de la piel, evitando que las nucleasas de nuestras células contaminen la premix. 8 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias RAPD - Random Amplified Polymorphic DNA (Amplificación al Azar de ADN Polimórfico) La reacción en cadena de la polimerasa (PCR) resulta en la amplificación de porciones específicas del ADN templado, mediada por el agregado de oligonucleótidos iniciadores. Este proceso cíclico tiene tres pasos básicos: Desnaturalización térmica del ADN, Annealing de los iniciadores al ADN templado Extensión de los iniciadores por la enzima ADN polimerasa en presencia de 4 dNTPs y CI2Mg. Los fragmentos de ADN son amplificados exponencialmente durante 25-45 ciclos, separados por electroforesis y visualizados por el teñido con bromuro de etidio. En un comienzo la reacción de PCR se lograba con el agregado a la mezcla de reacción del fragmento termosensible Klenow (Escherichia coli), en cada nuevo ciclo. Posteriormente, con el aislamiento de una enzima termoestable de la bacteria Thermus aquaticus se pudo automatizar la amplificación in vítro del ADN en equipos termocicladores. El desarrollo de esta tecnología permitió contar con un nuevo set de marcadores moleculares para comparar organismos a nivel de ADN. Los marcadores moleculares RAPDs son obtenidos tras la amplificación por PCR de segmentos al azar del ADN, utilizando secuencias arbitrarias de oligonucleótidos iniciadores. Williams et al. (1990) fueron los primeros en utilizar este procedimiento en el mapeo del genoma en organismos vegetales, acuñando el nombre de RAPDs a los productos obtenidos. Welsh y McClelland (1990) al mismo tiempo desarrollaron esta metodología para aplicaciones de fingerprinting denominándolos AP-PCR (arbitrarily primed PCR), finalmente Caetano-Anolles et al. (1991) los nombraron DAF (DNA amplification fingerprinting). Las diferencias en la denominación de estos marcadores dependen de las condiciones específicas de la reacción de amplificación o de la separación y detección de los productos amplificados. Los iniciadores arbitrarios usados en RAPDs son usualmente de 9-10 pares de bases, con un contenido de GC de 50-80% sin secuencias palindrómicas. El número de fragmentos de ADN amplificados es dependiente del 9 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias iniciador y del ADN genómico empleados. Las condiciones de la reacción de PCR limitan el tamaño de los fragmentos obtenidos entre 100-3000pb. Las diferencias a nivel de ADN entre individuos pueden deberse a: 1- Cambios de nucleótidos que impiden la amplificación por la introducción de un mismatch en el sitio de unión del iniciador, 2- Deleción del sitio de unión del iniciador, 3- Inserciones que aumentan demasiado la distancia entre los sitios de unión de los iniciadores para permitir la amplificación y 4- Inserciones o deleciones que cambian el tamaño del fragmento amplificado. Estos tipos de polimorfismo hacen que los marcadores RAPDs sean empleados para estudios de diversidad genética, construcción de mapas genéticos, mapeo de caracteres en poblaciones segregantes, líneas isotónicas y usando análisis segregante en bulks, ADN fingerprinting, saturación de marcadores en regiones determinadas del genoma, análisis de germoplasma. Entre las ventajas de utilizar estos marcadores se encuentran: 1- un set universal de iniciadores puede ser empleado para todas las especies. 2- no se necesitan sondas de librerías, radioactividad, transferencia de southern o información de la secuencia del iniciador (solamente se requiere la secuencia del iniciador para transferir la información). 3- se requiere muy poca cantidad de ADN templado (usualmente 5-25ng). 4- detección de polimorfismos múltiples 5- simplicidad experimental y el proceso puede ser automatizado. Entre las limitaciones de estos marcadores se detallan: la mayoría son de herencia dominante en muchos casos es discutible la reproducibilidad de los patrones de bandas en experimentos independientes generalmente no son apropiados para detectar diferencias entre genomas dadas por mutaciones simples o deleciones muy pequeñas, (0,001% del genoma o menos) En los experimentos de RAPDs, para asegurar la reproducibilidad de los patrones de bandas, se deben optimizar todos los parámetros, en particular las 10 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias concentraciones de ADN, CI2Mg e iniciadores, las condiciones del ciclado (especialmente la temperatura de annealing), el tipo y cantidad de ADN polimerasa termoestable y la precisión de las pipetas. AFLPs La técnica denominada AFLP (Amplified Fragment Length Polimorfisms) desarrollada hace poco tiempo (Vos et al., 1995), se basa en la amplificación de fragmentos de restricción específicos por PCR. Esta técnica combina la confiabilidad de los RFLP con la potencia de la PCR y cabe destacar que la misma ha sido masivamente adoptada por los investigadores que trabajan en el área de los marcadores moleculares en plantas para realizar fingerprinting, mapeo genético y clonado de genes. Etapas de la técnica: 1- Digestión del ADN con EcoRI y Msel y ligación de los adaptadores El ADN a utilizar debe ser de buena calidad, tanto en pureza como en tamaño, y debe estar cuantificado con la mayor precisión posible. El ADN debe ser digerido en forma simultánea con las enzimas EcoRI y Msel en un buffer en el cual la actividad de ambos enzimas sea alta y no provoque falsos sitios de corte que influencien en la repetitibilidad de la técnica. Los extremos cohesivos dejados por el corte con las enzimas de restricción se ligan a pequeños oligonucleótidos (de doble cadena y de secuencia conocida) que poseen los extremos complementarios a estos, teniendo como resultado todo nuestro ADN flanqueado por oligonucleótidos conocidos en tres combinaciones posibles: a)AdapEco-ADN-AdapEco. b)AdapEco-ADN-AdapMse. c)AdapMse-ADN-AdapMse. Estadísticamente se ha calculado (de acuerdo a la frecuencia de sitios de corte que pueden existir para las dos enzimas) que la frecuencia de los distintos fragmentos en tomate es de: a)1 .000.000 b)200. 000 11 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias c)200 2) Preamplificación selectiva o PCR +1 En esta reacción de PCR ocurre la amplificación selectiva de los fragmentos del ADN ligado a los adaptadores. Para ello se utilizan primers complementarios a los adaptadores y que poseen en el extremo 3' una base nucleotídica más elegida al azar de modo de amplificar sólo un subset de los fragmentos ligados a los adaptadores. 3) Amplificación selectiva o PCR +3 En esta reacción de PCR ocurre la amplificación selectiva de los fragmentos del ADN ligado a los adaptadores y luego amplificados en la preamplificación (PCR+1). Para ello se utilizan primers cuya secuencia posee en el extremo 3' dos bases nucleotídicas más (elegidas al azar) que el primer utilizado en la preamplificación, o sea, tres en total. 4) Visualización de los productos de amplificación Los productos de amplificación se resuelven en geles de poliacrilamida desnaturalizantes (similares a los geles de secuenciación). Una forma de visualizarlos es marcando uno de los primers, ya sea con radioactivo o con fluorescencia. Otra alternativa es la tinción del ADN con nitrato de plata y el revelado con carbonato de sodio. En este último caso, las bandas de ADN aparecen de color gris acero sobre el fondo transparente del gel, lo cual permite observarlas a simple vista con un transiluminador de luz blanca y obtener fotografías por contacto. Microsatélites Los microsatélites son pequeños segmentos de ADN cuyas secuencias consisten en repeticiones en tandem de di, tri o tetra nucleótidos. Los arreglos más frecuentes en plantas son: Dinucleótidos Trinucleótidos AT 74% TAT 27% AG/TC 24% TCT 25% AC/TG 1% CG 0% 12 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias El largo del microsatélite depende del número de repeticiones del motivo y existe gran variabilidad en él, lo que permite la existencia de un elevado número de alelos por locus, llegando a encontrarse hasta 11 alelos. Se especula que dicha variabilidad es generada por entrecruzamientos desiguales. Para amplificarlos se diseñan primers a ambos lados del tandem de repeticiones y los productos de amplificación se separar comúnmente por electroforesis en geles de poliacrilamida (PAGE). Los microsatélites se visualizan por teñido con nitrato de plata o por exposición en placa radiográfica si se utilizan primers con marcado radioactivo. Interpretación del perfil de bandas de los marcadores RAPDs y AFLPs para la caracterización de genotipos vegetales. Toda nueva variedad a ser incorporada al mercado debe cumplir con los requisitos de diferenciación, uniformidad y estabilidad. Para ello al testearlas se intenta una identificación clara de los cultivares vegetales, como también poder establecer las relaciones genéticas existentes entre ellos y de los nuevos cultivares derivados. En estos tests se incluyen caracteres morfológicos y marcadores moleculares como proteínas o a nivel de ADN. Particularmente el análisis estadístico de los perfiles de marcadores a nivel de ADN, pertenecientes a distintos genotipos, usualmente consiste en tres pasos: el primero de ellos corresponde a la clasificación del perfil de datos o caracteres a analizar, el segundo al cálculo de las distancias genéticas entre pares de genotipos y el tercero a la suma de las relaciones genéticas en el total de genotipos, las que pueden ser esbozadas en un fenograma (Piepho y Laidig, 1997). Los RAPDs y AFLPs corresponden a un tipo de marcador molecular utilizado por el perfil de patrón específico de bandas observadas en un gel. Con estos marcadores se pueden establecer sólo dos fenotipos presencia y ausencia del producto de amplificación (banda). Consecuentemente, cada banda o producto de amplificación corresponde a un dato binario o también llamado de doble estado (Crisci y Lopez Armengol, 1983). Para facilitar el tratamiento cuantitativo de estos datos binarios se determinó identificar la presencia de una banda en un genotipo con el número 1 y la ausencia de la misma en otro genotipo como 0. Determinándose para cada amplificación individual, que 13 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias la banda ubicada más cerca del cátodo fuera designada como carácter 1 y los productos subsecuentes hacia el ánodo 2, 3..., a continuación. Esta designación debe ser realizada para todas las bandas obtenidas por cada iniciador y en todos los genotipos analizados. A continuación se muestra una matriz de 2x2 con las combinaciones posibles que pueden obtenerse al comparar dos genotipos para un mismo carácter del tipo doble estado. genotipo A 1 genotipo B 0 1 1,1 a 1,0 b 0 0,1 c 0,0 d Una vez interpretados los perfiles de bandas obtenidos, como caracteres cuantitativos, se emplearán los productos de amplificación polimórficos únicos y compartidos por los genotipos, para la elaboración de una matriz básica binaria, de forma rectangular, que contenga a todas las OTU ("Unidades Taxonómicas Operativas") en este caso a los genotipos y a los caracteres. Ejemplo de una matriz básica binaria de 7 genotipos y 5 caracteres: A B C D E F G 1 1 1 0 1 0 1 1 2 0 1 1 0 0 0 0 3 0 0 0 0 1 1 0 4 1 1 1 1 0 1 1 5 0 0 1 0 1 0 1 Para expresar de manera cuantitativa el parecido entre distintos genotipos existen varios coeficientes de similitud. Estos coeficientes son operaciones matemáticas que permiten calcular las similitudes o las diferencias entre taxa. A todos ellos se los puede dividir en cuatro grupos: de distancia1 de correlación, de asociación y de similitud probabilística. El tipo de estadístico aplicable a un grupo de datos, para el análisis de las 14 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias relaciones genéticas entre OTU, depende del tipo de datos evaluados. Específicamente, los coeficientes de asociación miden las coincidencias y diferencias en los estados de los caracteres entre dos OTU. Esta medición exige caracteres de tipo doble estado. Al comparar dos OTU para un carácter doble estado pueden presentarse cuatro posibilidades (ver matriz 2x2): que las dos OTU presenten el carácter comparado (caso a), que sólo una u otra lo presente (casos b y c), o bien que el carácter esté ausente en ambas (caso d). En la mayoría de los análisis genéticos, con datos doble estado, se utilizan medidas que ignoran, al comparar dos OTU, la doble ausencia del carácter evaluado (caso d), como componente a favor de similitud. Los dos coeficientes de asociación que, reuniendo éstas características, son más ampliamente usados como medidas de similitud en análisis genéticos son: el índice de Nei (Nei y Li, 1979) y el índice de Jaccard (Jaccard, 1908). En la extensa bibliografía de estudio para la caracterización de cultivares vegetales se utilizan indistintamente ambos índices con datos provenientes de RAPDs, AFLPs, RFLPs e isoenzimas. Los índices de Nei y de Jaccard, se diferencian porque el primero le otorga un peso doble a la posibilidad de que ambas OTU presenten al carácter comparado. Por ello, ha sido sugerido (Link et al., 1995; Piepho y Laidig, 1997) que es más apropiado utilizar para datos de RFLPs e isoenzimas el índice de Nei, mientras que para caracteres de RAPDs y AFLPs el índice de Jaccard. La razón descripta por Piepho y Laidig (1997), es que los marcadores RAPDs y AFLPs al ser dominantes determinan la presencia o ausencia de una banda en cierta posición, correspondiendo usualmente cada posición de banda a un locus. En cambio, los marcadores RFLPs e isoenzimas por ser codominantes producen fragmentos de tamaños variables dados por diferentes alelos de un gen. Por lo tanto, en cultivares idénticos, con marcadores codominantes, el locus se manifestará con sólo una posición de banda en el gel, siendo conveniente darle un peso doble como lo expresa el índice de Nei. Es así como la estimación del parecido taxonómico, con caracteres RAPDs y AFLPs se realizará comparando los genotipos de a pares mediante el coeficiente de asociación de Jaccard (J), los valores de similitud obtenidos con este estadístico varían entre 0 (mínima similitud) y 1 (máxima similitud): 15 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias JXY= n11/(n-n00) = n11 / (n0l+nl0+n11) Siendo: n1 1= número de bandas de igual peso molecular compartidas por los individuos xey n= número de bandas totales. n00= número de bandas presentes en el total y ausentes en los individuos x e y, n0l =número de bandas ausentes en el individuo x y presentes en el individuo y n10= número de bandas presentes en el individuo x y ausentes en el individuo y Se generará así, a partir de la aplicación del coeficiente de Jaccard a la matriz básica binaria, una nueva matriz llamada de similitud, de forma triangular, con los coeficientes de similitud obtenidos tras la comparación entre pares de genotipos. Ejemplo de una matriz de similitud, obtenida tras aplicar el coeficiente de Jaccard a la matriz básica de datos: A B C D E F A 1,00 B 0,67 1,00 C 0,25 0,50 1,00 D 0,67 1,00 0,25 1,00 E 0 0 0,25 0 1,00 F 0,67 0,50 0,20 0,67 0,25 1,00 G 0,67 0,50 0,50 0,67 0,25 0,50 G 1,00 Para expresar las relaciones taxonómicas entre la totalidad de las OTU, con la matriz de similitud se practicará una técnica de agrupamiento llamada del Ligamiento promedio, utilizándose la media aritmética no ponderada (UPGMA, "Unweighted pairgroup method using arithmetic averages") (Crisci y Lopez Armengol, 1983). La estructura taxonómica obtenida a partir del análisis de agrupamiento practicado a la matriz de similitud se representará gráficamente en una estructura arborescente o fenograma. Ejemplo del fenograma obtenido aplicando la técnica UPGMA a la matriz de similitud: 16 Cátedra de Genética y Mejoramiento Vegetal y Animal Facultad de Ciencias Agropecuarias Apunte preparado por la Ing. Martha Lucrecia Bonell (Profesional Adscripta a la Cátedra de Genética y Mejoramiento Vegetal y Animal) Año 2000 17