Marcadores Moleculares de ADN

Anuncio
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
Marcadores Moleculares de ADN
1
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
REACCIÓN EN CADENA DE LA POLIMERASA O PCR E INTRODUCCIÓN
AL MEJORAMIENTO VEGETAL ASISTIDO
La base teórica de la reacción en cadenas de la polimerasa o PCR fue expuesta en
1971 (Kleppl et al.), pero esta técnica no produjo demasiado interés hasta mediados de los
años 80
La tecnología denominada Reacción en Cadena de la Polimerasa o PCR (Polymerase
Chain Reaction) fue desarrollada por Mullis y colaboradores a mediados de la década del
ochenta (Saiki et al., 1985; Mullis y Falcona, 1987). El impacto causado en la ciencia por
esta tecnología fue tan grande que le valió el premio Novel de medicina a Kary Mullis en
1993.
La técnica esta basada en la replicación in vitro del ADN, e imita el proceso natural
que ocurre en todas las células vivas.
Una célula para poder replicar su ADN requiere, entre otras cosas, de enzimas que
desenrollen la estructura de hélice y separen las cadenas del ADN, una secuencia molde
de ADN o templado de simple cadena a copiar, y enzimas que catalicen la unión de los
nucleótidos a este último.
Para poder imitar este proceso, la técnica de PCR aprovecha las propiedades de
desnaturalización y renaturalización del ADN y provoca, en forma artificial, un aumento
y descenso alternado de la temperatura (ciclos) del cóctel de reacción (premix), por medio
de un ciclador térmico o termociclador.
En el cóctel de reacción o premix, se encuentran todos los elementos necesarios para
la replicación: ADN, oligonucleótidos cebadores o "primers", una ADN polimerasa y
nucleótidos (dNTPs).
En la primer parte del ciclo, el aumento de la temperatura hasta 95 °C, produce la
desnaturalización del ADN, es decir la separación de las dos hebras de la doble hélice.
En la segunda parte del ciclo comienza a descender la temperatura, lo que permite
la unión de las cadenas de simple hebra a los oligonucléotidos (10 a 30 bases)
denominadas primers, que actúan como cebadores para el inicio de la replicación. La
temperatura en la que se produce la unión del primer a la cadena molde de ADN se conoce
2
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
como temperatura de annealing, y depende del largo, de la composición de bases del
primer y oscila entre los 50 y 60 °C. Esta temperatura es mayor que la que permite la unión
de las hebras de ADN separadas (45°C), por lo que el primer se hibrida antes con la cadena
molde durante el descenso de temperatura.
A diferencia de la replicación de ADN celular, en la que los cebadores reconocidos
por la ADN polimerasa son secuencias de ARN, los cebadores utilizados en la reacción de
PCR son secuencias de ADN.
En la reacción de PCR, los primers (sintéticos) tienen una secuencia que les permite
hibridar, en forma específica, y amplificar la secuencia compredida entre dos primers con
la secuencia blanco que el usuario quiere amplificar.
Una vez que se produce la hibridación de los primers, la enzima ADN polimerasa
cataliza la síntesis de una nueva hebra de ADN, incorporando a la cadena en formación, a
través de uniones fosfodiester, los nucleótidos con las bases complementarias a la cadena
molde.
La enzima responsable de la replicación en las células es la ADN polimerasa. Esta
cataliza la unión del grupo OH-3' del extremo del cebador, con el grupo fosfato del
deoxiribonucíeósido trifosfato que se incorpora a la cadena en síntesis a través de una
unión fosfodiester.
En la célula la replicación ocurren a temperatura constante e intervienen distintas
enzimas que catalizan todas las reacciones y que son sensibles al aumento de la
temperatura ya que, como son proteínas, se desnaturalizan y pierden sus propiedades a
los 45°C.
En al reacción de PCR estos procesos ocurren en un tubo de ensayo sometido a
variaciones de temperatura con un máximo de 95 °C, y la polimerización es conducida por
una ADN polimerasa llamada Taq polimerasa obtenida de bacterias termófilas (Thermus
aquaticus). Esta enzima tiene su temperatura óptima de catalización a 72 °C.
En la utilización de esta enzima se basó el gran descubrimiento de Kan Mullis. Las
enzimas utilizadas para la unión de nucleótidos en la reacción de PCR son obtenidas de
bacterias que habitan en aguas termales, y son capaces de resistir temperaturas tan altas
como la necesaria para separar las cadenas de ADN, es decir 95°C. Gracias a esto, el
termociclador puede realizar muchos ciclos de variación de la temperatura, llegando hasta
3
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
los 95 °C sin que se desnaturalice la enzima Taq polimerasa, lo que permite obtener
millones de réplicas (amplificación) de un fragmento de ADN.
Antes del descubrimiento de la Taq polimerasa, se utilizaba ADN polimerasa de E.
coli, la que se agregaba en cada ciclo a la mezcla de reacción, ya que durante el
calentamiento a 950C, la enzima se degradaba. Este procedimiento resultaba muy
complicado y de difícil ejecución. Otra de las ventajas que tiene la Taq polimerasa respecto
de la ADN polimerasa de E. Coli es que su temperatura óptima de polimerización es de 72
°C. Esto permite utilizar temperaturas de annealing de los primers más elevadas,
eliminando amplificaciones no deseadas que se producen por hibridaciones no específicas
de los primers (por ej. autohibridación) y que se favorecen con la baja temperatura de
polimerización (370C) de la enzima de E. Coli.
En la actualidad existen varias empresas que comercializan Taq polimerasa bajo
licencia, y distintas variedades de polimerasas termoestables de acuerdo a su utilización.
Algunas son naturales y otras son proteínas recombinantes, modificadas o no.
Resumiendo, el ciclado al que se somete el cóctel de reacción consiste en elevar la
temperatura hasta 95 °C, manteniendo algunos segundos para que se separen las cadenas
del ADN molde. Luego, la temperatura desciende y se mantiene aproximadamente un
minuto a la temperatura de hibridación del primer (50-60°C) para que este encuentre a su
región complementaria e hibride. Comienza entonces un nuevo ascenso de la
temperatura, manteniéndose 1 a 2 minutos, (dependiendo del largo de cadena a
polimerizar), a 72 °C para que la enzima Taq. polimerasa sintetice, en sentido 5'- 3', la nueva
cadena, utilizando como molde las cadenas de ADN separadas. Continúa luego el ascenso
de temperatura, proceso en que se detiene la replicación y, al llegar a los 95°C se produce
nuevamente la separación de las cadenas de ADN.
En los sucesivos ciclos, cada hebra doble cadena generara dos nuevas cadenas
sintetizadas sobre las viejas, originando nuevos sitios de unión o annealing para los
primers. Esto implica que por cada ciclo se duplica la cantidad de ADN blanco para la
hibridación de los primers.
4
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
El resultado final es que luego de un determinado "n" número de ciclos en el tubo
de reacción existirán 2n copias de la cadena de ADN por cada cadena de ADN blanco
existente al comienzo de la reacción. Es decir, en el ciclo 1, habrá 2 copias nuevas de la
cadena de ADN, complementarias a las cadenas molde; en el ciclo 2 habrá 4 copias, en el
ciclo 10 existirán 1.024 copias, y en el ciclo 20 se tendrán 1.048.576 copias del ADN blanco.
La técnica de PCR es relativamente simple, versátil, muy rápida y económica en
comparación con otras técnicas de marcadores de ADN, utilizadas en biología molecular.
Las cantidades de ADN blanco necesario para producir la amplificación dependen
de la frecuencia con que se encuentra dicha secuencia en el ADN en estudio. Si queremos
amplificar una región genómica multicopia (varias copias del gen en el genoma), bastarán
5
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
unos pocos nanogramos de ADN total, en cambio si pretendemos amplificar una región
genómica correspondiente a un gen de copia única, la cantidad de ADN total a utilizar
puede variar desde los 100 nanogramos a 1 gr.
La reacción se lleva a cabo en un tubo de microcentrífuga de 500 o de 200 l, según
el diseño del bloque del ciclador térmico. En este tubo se encuentra la mezcla o premix de
ADN, los dos tipos de primers que se unirán al ADN, señalando el punto de comienzo de
la polimerización, una mezcla de los cuatro dexoxiribonucleósidos trifosfatos (dNTPs),
buffer, C12 Mg (el Mg es cofactor de la enzima Taq polimerasa),y una pequeña cantidad de
Taq Polimerasa. Una vez que la premix está preparada se lo coloca en el ciclador,
vulgarmente llamado PCR, y se programa con el número de ciclos a realizar (entre 20 y
35), las temperaturas entre las que variará la reacción y el tiempo en que se mantendrá
cada temperatura.
Una vez terminado el programa, la corrida se realiza en un gel de agarosa (1,5-2%),
con bromuro de etidio.
Optimización de las condiciones de reacción de PCR
La técnica de PCR tiene múltiples aplicaciones, su utilización no tiene restricciones
en cuanto a especies animales o vegetales.
Por su versatilidad, no existe un protocolo que pueda ser aplicado a todas las
situaciones que se presenten en un laboratorio. Cada caso particular necesitará de una
puesta a punto de las metodologías y protocolos, aunque se pueden considerar una serie
de reglas generales acerca de los parámetros a optimizar para llevar adelante con éxito
una reacción de amplificación.
La hibridación depende del diseño de los primers (secuencia y largo) y de las
condiciones de reacción (especialmente la concentración del Mg+2 y la temperatura). El
control de estos factores disminuirá las hibridaciones de los primers en sitios no deseados
y la autohibridación o autoannealing.
La especificidad y la pureza del producto final van a depender de la frecuencia
relativa con que ocurra la extensión de la cadena a partir del primer en el sitio deseado,
versus la que ocurra en una posición no deseada del ADN templado.
Esencialmente, toda interacción del primer con el templado lleva a la obtención de
productos de extensión cuya especificidad es muy difícil de controlar durante los
6
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
primeros ciclos, debido al exceso en molaridad de los posibles sitios de annealing no
deseados del ADN respecto de los sitios deseados. Por ello es deseable que al menos en
los primeros ciclos, las condiciones de reacción sean lo más estrictas posible.
Una vez transcurridos estos primeros ciclos en el cóctel de reacción, aumenta la
molaridad de la secuencia blanco en forma exponencial, lo que permite que las
condiciones de reacción se alejen un poco de las ideales sin afectar los siguientes ciclos.
La concentración de magnesio en la premix es uno de los factores más importantes
que pueden afectar el comportamiento de la Taq polimerasa durante la reacción. Algunos
componentes de la reacción pueden actuar como agentes quelantes del magnesio, como
por ejemplo el EDTA del buffer TE en que se suele diluir el ADN, los dNTPs y otras
proteínas, Esto disminuye la concentración de magnesio libre en el tubo de reacción lo que
puede llegar a inactivar a la
polimerasa. El uso de una concentración excesiva de
magnesio reduce la fidelidad de polimerización de la enzima. Es importante determinar
en forma empírica la cantidad de magnesio total en el tubo de reacción con los reactivos
que se usaran y tratar de no variar la forma de preparación de los componentes.
Es conveniente hacer, además de la cuantificación y caracterización del ADN
extraído, una serie de reacciones en la que se varíe la concentración de Mg-2.
Fig. 1: Gel de corrida para optimizar la concentración de Mg de la reacción
Los primers deben tener, en lo posible, una longitud mayor a los 18 nucleótidos con
un contenido de G+C entre 40 y 60 % para otorgarles especificidad restringiendo el
número de los posibles sitios de hibridación. Además deben tener secuencias que no
7
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
produzcan estructuras secundarias a la temperatura de reacción, como por ejemplo la
autohibridación por complementariedad de las bases (los extremos 3' no deben tener
complementaridad entre ellos). Es conveniente que la temperatura de annealing de ambos
primers sea la misma pero si no es así, se debe elegir la menor temperatura de annealing .
En el proceso de ajuste de la técnica también se deberá considerar la elección de
una temperatura de annealing apropiada para cada primer.
La cantidad de ADN molde o templado necesaria para la reacción depende de la
complejidad y del tipo de secuencia a amplificar. Normalmente en plantas se utiliza desde
10 ng hasta 200 ng dependiendo del rendimiento de ADN propio de la técnica de
extracción y de la especie.
La concentración de Taq pol. influye en gran medida en los productos obtenidos en
la reacción. Una alta concentración no implica una mayor cantidad de producto
amplificado, es decir un mayor número de copias de secuencia blanco. El exceso de Taq
pol. y el aumento del tiempo de polimerización (tiempo en que se mantienen los 720C)
puede provocar "artefactos" asociados con la actividad exonucleasa 5'--3' intrínseca que
posee la Taq pol. Esto provoca que en el gel de corrida aparezca un chorreado continuo en
lugar de bandas discretas.
Insignificantes cantidades de un plásmido, restos de ADN de otras reacciones o de
nuestras propias células pueden ser amplificados. Es importante entonces evitar las
contaminaciones, por ejemplo, utilizando juegos de micropipetas para uso general del
laboratorio y otro para pipetear las reacciones de PCR, o usando tips con filtro, que
previenen los aerosoles que se producen en la superficie interior del líquido dentro del
tips. El uso de guantes descartables de la contaminación con células epiteliales que se
desprenden a diario de la piel, evitando que las nucleasas de nuestras células contaminen
la premix.
8
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
RAPD - Random Amplified Polymorphic DNA (Amplificación al Azar de ADN
Polimórfico)
La reacción en cadena de la polimerasa (PCR) resulta en la amplificación de
porciones específicas del ADN templado, mediada por el agregado de oligonucleótidos
iniciadores. Este proceso cíclico tiene tres pasos básicos:
 Desnaturalización térmica del ADN,
 Annealing de los iniciadores al ADN templado
 Extensión de los iniciadores por la enzima ADN polimerasa en presencia de 4 dNTPs y
CI2Mg.
Los fragmentos de ADN son amplificados exponencialmente durante 25-45 ciclos,
separados por electroforesis y visualizados por el teñido con bromuro de etidio. En un
comienzo la reacción de PCR se lograba con el agregado a la mezcla de reacción del
fragmento termosensible Klenow (Escherichia coli), en cada nuevo ciclo.
Posteriormente, con el aislamiento de una enzima termoestable de la bacteria
Thermus aquaticus se pudo automatizar la amplificación in vítro del ADN en equipos
termocicladores. El desarrollo de esta tecnología permitió contar con un nuevo set de
marcadores moleculares para comparar organismos a nivel de ADN.
Los marcadores moleculares RAPDs son obtenidos tras la amplificación por
PCR de segmentos al azar del ADN, utilizando secuencias arbitrarias de oligonucleótidos
iniciadores. Williams et al. (1990) fueron los primeros en utilizar este procedimiento en el
mapeo del genoma en organismos vegetales, acuñando el nombre de RAPDs a los
productos obtenidos. Welsh y McClelland (1990) al mismo tiempo desarrollaron esta
metodología para aplicaciones de fingerprinting denominándolos AP-PCR (arbitrarily
primed PCR), finalmente Caetano-Anolles et al. (1991) los nombraron DAF (DNA
amplification fingerprinting). Las diferencias en la denominación de estos marcadores
dependen de las condiciones específicas de la reacción de amplificación o de la separación
y detección de los productos amplificados. Los iniciadores arbitrarios usados en RAPDs
son usualmente de 9-10 pares de bases, con un contenido de GC de 50-80% sin secuencias
palindrómicas.
El número de fragmentos de ADN amplificados es dependiente del
9
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
iniciador y del ADN genómico empleados. Las condiciones de la reacción de PCR limitan
el tamaño de los fragmentos obtenidos entre 100-3000pb.
Las diferencias a nivel de ADN entre individuos pueden deberse a:
1- Cambios de nucleótidos que impiden la amplificación por la introducción de un
mismatch en el sitio de unión del iniciador,
2- Deleción del sitio de unión del iniciador,
3- Inserciones que aumentan demasiado la distancia entre los sitios de unión de los
iniciadores para permitir la amplificación y
4- Inserciones o deleciones que cambian el tamaño del fragmento amplificado.
Estos tipos de polimorfismo hacen que los marcadores RAPDs sean empleados
para estudios de diversidad genética, construcción de mapas genéticos, mapeo de
caracteres en poblaciones segregantes, líneas isotónicas y usando análisis segregante en
bulks, ADN fingerprinting, saturación de marcadores en regiones determinadas del
genoma, análisis de germoplasma.
Entre las ventajas de utilizar estos marcadores se encuentran:
1- un set universal de iniciadores puede ser empleado para todas las especies.
2- no se necesitan sondas de librerías, radioactividad, transferencia de southern o
información de la secuencia del iniciador (solamente se requiere la secuencia del iniciador
para transferir la información).
3- se requiere muy poca cantidad de ADN templado (usualmente 5-25ng).
4- detección de polimorfismos múltiples
5- simplicidad experimental y el proceso puede ser automatizado.
Entre las limitaciones de estos marcadores se detallan:
 la mayoría son de herencia dominante
 en muchos casos es discutible la reproducibilidad de los patrones de bandas en
experimentos independientes
 generalmente no son apropiados para detectar diferencias entre genomas dadas
por mutaciones simples o deleciones muy pequeñas, (0,001% del genoma o
menos)
En los experimentos de RAPDs, para asegurar la reproducibilidad de los
patrones de bandas, se deben optimizar todos los parámetros, en particular las
10
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
concentraciones de ADN, CI2Mg e iniciadores, las condiciones del ciclado (especialmente
la temperatura de annealing), el tipo y cantidad de ADN polimerasa termoestable y la
precisión de las pipetas.
AFLPs
La técnica denominada AFLP (Amplified Fragment Length Polimorfisms) desarrollada
hace poco tiempo (Vos et al., 1995), se basa en la amplificación de fragmentos de
restricción específicos por PCR.
Esta técnica combina la confiabilidad de los RFLP con la potencia de la PCR y cabe
destacar que la misma ha sido masivamente adoptada por los investigadores que trabajan
en el área de los marcadores moleculares en plantas para realizar fingerprinting, mapeo
genético y clonado de genes.
Etapas de la técnica:
1- Digestión del ADN con EcoRI y Msel y ligación de los adaptadores
El ADN a utilizar debe ser de buena calidad, tanto en pureza como en
tamaño, y debe estar cuantificado con la mayor precisión posible. El ADN debe ser
digerido en forma simultánea con las enzimas EcoRI y Msel en un buffer en el cual la
actividad de ambos enzimas sea alta y no provoque falsos sitios de corte que influencien
en la repetitibilidad de la técnica. Los extremos cohesivos dejados por el corte con las
enzimas de restricción se ligan a pequeños oligonucleótidos (de doble cadena y de
secuencia conocida) que poseen los extremos complementarios a estos, teniendo como
resultado todo nuestro ADN flanqueado por oligonucleótidos conocidos en tres
combinaciones posibles:
a)AdapEco-ADN-AdapEco.
b)AdapEco-ADN-AdapMse.
c)AdapMse-ADN-AdapMse.
Estadísticamente se ha calculado (de acuerdo a la frecuencia de sitios de corte que
pueden existir para las dos enzimas) que la frecuencia de los distintos fragmentos en
tomate es de:
a)1 .000.000
b)200. 000
11
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
c)200
2)
Preamplificación selectiva o PCR +1
En esta reacción de PCR ocurre la amplificación selectiva de los fragmentos
del ADN ligado a los adaptadores. Para ello se utilizan primers complementarios a los
adaptadores y que poseen en el extremo 3' una base nucleotídica más elegida al azar de
modo de amplificar sólo un subset de los fragmentos ligados a los adaptadores.
3) Amplificación selectiva o PCR +3
En esta reacción de PCR ocurre la amplificación selectiva de los fragmentos del
ADN ligado a los adaptadores y luego amplificados en la preamplificación (PCR+1). Para
ello se utilizan primers cuya secuencia posee en el extremo 3' dos bases nucleotídicas más
(elegidas al azar) que el primer utilizado en la preamplificación, o sea, tres en total.
4) Visualización de los productos de amplificación
Los productos de amplificación se resuelven en geles de poliacrilamida
desnaturalizantes (similares a los geles de secuenciación). Una forma de visualizarlos es
marcando uno de los primers, ya sea con radioactivo o con fluorescencia. Otra alternativa
es la tinción del ADN con nitrato de plata y el revelado con carbonato de sodio. En este
último caso, las bandas de ADN aparecen de color gris acero sobre el fondo transparente
del gel, lo cual permite observarlas a simple vista con un transiluminador de luz blanca y
obtener fotografías por contacto.
Microsatélites
Los microsatélites son pequeños segmentos de ADN cuyas secuencias
consisten en repeticiones en tandem de di, tri o tetra nucleótidos. Los arreglos más
frecuentes en plantas son:
Dinucleótidos
Trinucleótidos
AT
74%
TAT
27%
AG/TC
24%
TCT
25%
AC/TG
1%
CG
0%
12
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
El largo del microsatélite depende del número de repeticiones del motivo y existe
gran variabilidad en él, lo que permite la existencia de un elevado número de alelos por
locus, llegando a encontrarse hasta 11 alelos. Se especula que dicha variabilidad es
generada por entrecruzamientos desiguales.
Para amplificarlos se diseñan primers a ambos lados del tandem de repeticiones y
los productos de amplificación se separar comúnmente por electroforesis en geles de
poliacrilamida (PAGE). Los microsatélites se visualizan por teñido con nitrato de plata o
por exposición en placa radiográfica si se utilizan primers con marcado radioactivo.
Interpretación del perfil de bandas de los marcadores RAPDs y AFLPs para la
caracterización de genotipos vegetales.
Toda nueva variedad a ser incorporada al mercado debe cumplir con los
requisitos de diferenciación, uniformidad y estabilidad. Para ello al testearlas se intenta
una identificación clara de los cultivares vegetales, como también poder establecer las
relaciones genéticas existentes entre ellos y de los nuevos cultivares derivados.
En estos tests se incluyen caracteres morfológicos y marcadores moleculares como
proteínas o a nivel de ADN. Particularmente el análisis estadístico de los perfiles de
marcadores a nivel de ADN, pertenecientes a distintos genotipos, usualmente consiste en
tres pasos: el primero de ellos corresponde a la clasificación del perfil de datos o caracteres
a analizar, el segundo al cálculo de las distancias genéticas entre pares de genotipos y el
tercero a la suma de las relaciones genéticas en el total de genotipos, las que pueden ser
esbozadas en un fenograma (Piepho y Laidig, 1997).
Los RAPDs y AFLPs corresponden a un tipo de marcador molecular
utilizado por el perfil de patrón específico de bandas observadas en un gel. Con estos
marcadores se pueden establecer sólo dos fenotipos presencia y ausencia del producto de
amplificación (banda). Consecuentemente, cada banda o producto de amplificación
corresponde a un dato binario o también llamado de doble estado (Crisci y Lopez
Armengol, 1983).
Para facilitar el tratamiento cuantitativo de estos datos binarios se determinó
identificar la presencia de una banda en un genotipo con el número 1 y la ausencia de la
misma en otro genotipo como 0. Determinándose para cada amplificación individual, que
13
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
la banda ubicada más cerca del cátodo fuera designada como carácter 1 y los productos
subsecuentes hacia el ánodo 2, 3..., a continuación. Esta designación debe ser realizada
para todas las bandas obtenidas por cada iniciador y en todos los genotipos analizados.
A continuación se muestra una matriz de 2x2 con las
combinaciones
posibles que pueden obtenerse al comparar dos genotipos para un mismo carácter del tipo
doble estado.
genotipo A
1
genotipo B
0
1
1,1 a 1,0 b
0
0,1 c
0,0 d
Una vez interpretados los perfiles de bandas obtenidos, como caracteres
cuantitativos, se emplearán los productos de amplificación polimórficos únicos y
compartidos por los genotipos, para la elaboración de una matriz básica binaria, de forma
rectangular, que contenga a todas las OTU ("Unidades Taxonómicas Operativas") en este
caso a los genotipos y a los caracteres.
Ejemplo de una matriz básica binaria de 7 genotipos y 5 caracteres:
A
B
C
D
E
F
G
1
1
1
0
1
0
1
1
2
0
1
1
0
0
0
0
3
0
0
0
0
1
1
0
4
1
1
1
1
0
1
1
5
0
0
1
0
1
0
1
Para expresar de manera cuantitativa el parecido entre distintos genotipos
existen varios coeficientes de similitud. Estos coeficientes son operaciones matemáticas
que permiten calcular las similitudes o las diferencias entre taxa. A todos ellos se los
puede dividir en cuatro grupos: de distancia1 de correlación, de asociación y de similitud
probabilística. El tipo de estadístico aplicable a un grupo de datos, para el análisis de las
14
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
relaciones genéticas entre OTU, depende del tipo de datos evaluados. Específicamente, los
coeficientes de asociación miden las coincidencias y diferencias en los estados de los
caracteres entre dos OTU. Esta medición exige caracteres de tipo doble estado.
Al comparar dos OTU para un carácter doble estado pueden presentarse
cuatro posibilidades (ver matriz 2x2): que las dos OTU presenten el carácter comparado
(caso a), que sólo una u otra lo presente (casos b y c), o bien que el carácter esté ausente en
ambas (caso d). En la mayoría de los análisis genéticos, con datos doble estado, se utilizan
medidas que ignoran, al comparar dos OTU, la doble ausencia del carácter evaluado (caso
d), como componente a favor de similitud. Los dos coeficientes de asociación que,
reuniendo éstas características, son más ampliamente usados como medidas de similitud
en análisis genéticos son: el índice de Nei (Nei y Li, 1979) y el índice de Jaccard (Jaccard,
1908). En la extensa bibliografía de estudio para la caracterización de cultivares vegetales
se utilizan indistintamente ambos índices con datos provenientes de RAPDs, AFLPs,
RFLPs e isoenzimas.
Los índices de Nei y de Jaccard, se diferencian porque el primero le otorga un peso
doble a la posibilidad de que ambas OTU presenten al carácter comparado. Por ello, ha
sido sugerido (Link et al., 1995; Piepho y Laidig, 1997) que es más apropiado utilizar para
datos de RFLPs e isoenzimas el índice de Nei, mientras que para caracteres de RAPDs y
AFLPs el índice de Jaccard. La razón descripta por Piepho y Laidig (1997), es que los
marcadores RAPDs y AFLPs al ser dominantes determinan la presencia o ausencia de una
banda en cierta posición, correspondiendo usualmente cada posición de banda a un
locus.
En cambio, los marcadores RFLPs e isoenzimas por ser codominantes producen
fragmentos de tamaños variables dados por diferentes alelos de un gen. Por lo tanto, en
cultivares idénticos, con marcadores codominantes, el locus se manifestará con sólo una
posición de banda en el gel, siendo conveniente darle un peso doble como lo expresa el
índice de Nei.
Es así como la estimación del parecido taxonómico, con caracteres RAPDs y
AFLPs se realizará comparando los genotipos de a pares mediante el coeficiente de
asociación de Jaccard (J), los valores de similitud obtenidos con este estadístico varían
entre 0 (mínima similitud) y 1 (máxima similitud):
15
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
JXY= n11/(n-n00) = n11 / (n0l+nl0+n11)
Siendo:
n1 1= número de bandas de igual peso molecular compartidas por los individuos
xey
n= número de bandas totales.
n00= número de bandas presentes en el total y ausentes en los individuos x e y,
n0l =número de bandas ausentes en el individuo x y presentes en el individuo y
n10= número de bandas presentes en el individuo x y ausentes en el individuo y
Se generará así, a partir de la aplicación del coeficiente de Jaccard a la matriz
básica binaria, una nueva matriz llamada de similitud, de forma triangular, con los
coeficientes de similitud obtenidos tras la comparación entre pares de genotipos.
Ejemplo de una matriz de similitud, obtenida tras aplicar el coeficiente de
Jaccard a la matriz básica de datos:
A
B
C
D
E
F
A
1,00
B
0,67
1,00
C
0,25
0,50
1,00
D
0,67
1,00
0,25
1,00
E
0
0
0,25
0
1,00
F
0,67
0,50
0,20
0,67
0,25
1,00
G
0,67
0,50 0,50
0,67
0,25
0,50
G
1,00
Para expresar las relaciones taxonómicas entre la totalidad de las OTU, con
la matriz de similitud se practicará una técnica de agrupamiento llamada del Ligamiento
promedio, utilizándose la media aritmética no ponderada (UPGMA, "Unweighted
pairgroup method using arithmetic averages") (Crisci y Lopez Armengol, 1983).
La estructura taxonómica obtenida a partir del análisis de agrupamiento
practicado a la matriz de similitud se representará gráficamente en una estructura
arborescente o fenograma.
Ejemplo del fenograma obtenido aplicando la técnica UPGMA a la matriz de
similitud:
16
Cátedra de Genética y Mejoramiento Vegetal y Animal
Facultad de Ciencias Agropecuarias
Apunte preparado por la Ing. Martha Lucrecia Bonell (Profesional Adscripta a la
Cátedra de Genética y Mejoramiento Vegetal y Animal) Año 2000
17
Descargar