Análisis de Variación El valor observado cuando se mide un

Anuncio
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Análisis de Variación
El valor observado cuando se mide un determinado carácter en un individuo es
el valor fenotípico de dicho individuo; todas las observaciones, ya sean medias,
varianzas o covarianzas deben estar basadas claramente en medidas de los
valores fenotípicos. Para analizar las propiedades genéticas de las poblaciones
es necesario dividir el valor fenotípico en componentes atribuibles a diferentes
causas (Falconer y Mackay, 1996).
La primera división del valor fenotípico es en componentes atribuibles a la
influencia del genotipo y el ambiente. El genotipo es el conjunto particular de
genes que posee el individuo, y el ambiente son todas las circunstancias no
genéticas que influyen en el valor fenotípico; la inclusión de todas estas
circunstancias no genéticas bajo el término “ambiente” quiere decir que el
genotipo y el ambiente son, por definición, los únicos determinantes del valor
fenotípico de un individuo. Simbólicamente se puede expresar lo anterior de la
siguiente manera (Falconer y Mackay, 1996):
P=G+E
Donde,
P = valor fenotípico
G= valor genotípico
E= desviación ambiental
En términos de varianza, se puede plantear ésta expresión de la siguiente
manera:
VP= VG + VE
Donde,
VP= varianza fenotípica
VG= varianza genética
VE= varianza ambiental
La variación genética puede a su vez subdividirse en tres componentes:
VG= VA + VD + VI
1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
El primer componente es el llamado variación genética aditiva (VA), y es
considerado el más importante puesto que es la causa principal del parecido
entre parientes y, por lo tanto, el principal determinante de las propiedades
genéticas observables en una población y de la respuesta a la selección. Más
aún, es el único componente que puede estimarse directamente a partir de las
observaciones realizadas en la población (Falconer y Mackay, 1996).
Además de los genes que tienen un efecto aditivo sobre un carácter
cuantitativo, existen otros que pueden poseer una acción dominante que
enmascara la contribución de los alelos recesivos en ese locus; esta fuente de
variabilidad se atribuye a la Varianza genética por dominancia (VD). El otro tipo
de varianza genética está asociada a las interacciones entre los genes; la base
genética de esta varianza es la epistasis y se denomina Variación genética por
interacción (VI) (Legates y Warwick, 1992).
Sin embargo, en la práctica la subdivisión importante es la de la varianza
genética aditiva frente al resto, por lo cual la varianza por dominancia y la
varianza por interacción pueden agruparse en un solo componente: Varianza
No Aditiva (VNA). En estos términos, se puede expresar la variación fenotípica
total de una característica de la siguiente manera:
VP= VA + VNA + VE
VG
El análisis de varianza es una técnica estadística que permite particionar la
variación de una característica en diferentes fuentes de variación, algunas de
ellas medidas o controladas dentro del sistema productivo, y otras que no
pueden ser controladas o medidas, propias de cualquier material biológico
(Ruales y col., 2007).
En el Análisis de Varianza se deben tener en cuenta los siguientes supuestos:
A) Los datos a analizar deben ser aleatorios e independientes
B) Los datos deben provenir de una población que tenga distribución
normal
C) Los datos deben presentar variación homogénea de acuerdo a las
fuentes de variación.
2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Modelo lineal
El modelo lineal es un modelo estadístico que describe la variación de la
característica bajo análisis en un conjunto de factores o efectos. Por ejemplo, si
se tienen los pesajes de los animales en una empresa ganadera, se conoce el
sexo de cada uno, su edad y el manejo (nutricional, sanitario, etc.) que tuvo, se
puede conocer cuánto de la variación en los pesajes se atribuye a cada uno de
éstos factores, y a la posible interacción entre estos factores (Ruales y col.,
2007).
Como se había mencionado anteriormente, desde el punto de vista de genética
cuantitativa, los factores que afectan la expresión de cualquier característica se
pueden clasificar en dos categorías: factores genéticos y no genéticos. Los
factores genéticos son aquellos referentes a la constitución genética de los
individuos, es decir, si los individuos provienen de padres comunes (hermanos
completos), de un mismo padre (medios hermanos), si provienen de una misma
composición genética (misma raza, línea, estirpe o especie). Los no genéticos
son aquellos factores de entorno en donde se desempeñan los animales, que
pueden afectar la expresión de la característica bajo estudio; algunos de estos
factores son por ejemplo el sexo de los animales, la edad, la zona o región en
donde se encuentren, la época de nacimiento, entre otros (Ruales y col., 2007).
Es de vital importancia cuando se va a realizar el análisis de los datos, conocer
cuáles de estos factores genéticos y no genéticos deben tenerse en cuenta en
el modelo, ya que aquellos factores que no se cuantifiquen o se tengan en
cuenta, pueden incrementar el error de estimación o predicción, o su efecto
puede confundirse con los descritos (Ruales y col., 2007).
El modelo lineal puede definirse de la siguiente manera:
Donde,
yijk… = valor de la característica en cada uno de los valores (i,j,k…) de cada uno
de los factores (A,B,C,…).
µ = promedio general de la característica (efecto común en todos los
individuos).
Ai= efecto del valor i en el factor A
Bj= efecto del valor j en el factor B
3
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Ck= efecto del valor k en el factor C
εijk…= desviación aleatoria asociada a un individuo con respecto a los factores
definidos en el modelo.
Desde el punto de vista genético, el Análisis de Varianza se utiliza para separar
la variación total entre observaciones, en sus componentes genéticos y no
genéticos.
Los animales pueden agruparse de acuerdo con sus progenitores, de forma tal
que la variación entre individuos se puede particionar en la variación entre
diferentes grupos de reproductores (uno de ellos o ambos) y la variación dentro
de los grupos. Esa partición de la variación entre grupos y dentro de grupos es
la base para la estimación de la heredabilidad de la característica bajo estudio,
la cual se describirá posteriormente en el capítulo 2. Aquí se tiene en cuenta un
supuesto adicional: la variación no genética es homogénea y se incluye en la
variación dentro de grupos (Ruales y col., 2007).
Desde el punto de vista estadístico, el modelo de análisis se puede expresar de
la siguiente manera (Ruales y col., 2007):
Donde,
yij= valor de la característica en el individuo j (j=1,2,…,n i) del grupo genético Gi
(i= 1,2,…,g), siendo ni el número de individuos por grupo.
µ = promedio general de la característica
Gi= efecto del grupo genético i
εij= desviación aleatoria asociada con el individuo j dentro del grupo i
El análisis de varianza tendría entonces el siguiente esquema:
Fuente de Variación
Entre Grupos (EG)
Dentro de Grupos (DG)
TOTAL
Grados de Libertad
(GL)
g–1
∑i (ni – 1)
∑i GLEG + GLDG
Ejemplo:
4
Suma de
Cuadrados (SC)
S.C. EG
S.C. DG
S.C. TOTAL
Cuadrado
Medio (CM)
C.M.EG
C.M.DG
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
En la siguiente tabla se presentan los pesos al destete de terneros Brahman
provenientes de 5 padres:
TORO A
281
318
288
286
306
TORO B
271
285
288
295
317
253
291
252
TORO C
285
266
240
290
∑ = 1479
∑ = 2252
∑ = 1081
TORO D
286
259
294
248
286
272
269
289
272
284
∑ = 2579
Para el análisis de estos datos, los pasos son los siguientes:
1. Estimar los Grados de Libertad:
 Grados de Libertad Entre Padres:
(
)
 Grados de Libertad Totales:
 Grados de Libertad Dentro de Padres (Dentro de Grupos):
2. Estimar las sumas de cuadrados:
 Suma de Cuadrados Total:
5
TORO E
300
243
294
276
282
324
287
252
254
∑ = 2512
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
(∑
∑
(
)
(
)
)
(
(
)
(
(
)
)
(
)
)
(
)
 Suma de Cuadrados Entre Padres (Entre Grupos):
(∑
∑
)
Donde,
yi. = total de cada grupo
(
)
(
)
(
)
(
)
(
1821.41
 Suma de Cuadrados Dentro de Padres (Dentro de Grupos):
3. Estimar los Cuadrados Medios:
 Cuadrado Medio Entre Padres (Entre grupos):
 Cuadrado Medio Dentro de Padres (Dentro de Grupos):
6
)
(
)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Con estas estimaciones, la tabla de Análisis de Varianza sería:
Fuente de Variación
Entre padres
Dentro de padres
TOTAL
Grados de
Libertad
4
31
35
Suma de
Cuadrados
1821.41
13227.34
15048.75
Cuadrado
Medio
455.35
426.69
COMPONENTES DE VARIANZA
Cuando se realiza el análisis de varianza de una característica, se busca
obtener los componentes de varianza correspondientes a las diferentes fuentes
de variación, con base en los cuales se pueden obtener parámetros genéticos
(Ruales y col., 2007).
De acuerdo con el análisis de varianza descrito en el párrafo anterior, los
cuadrados medios que se calculan pueden igualarse a unos Cuadrados Medios
Esperados, que comprenden diferentes componentes de varianza, de tal
manera que al igualar los Cuadrados Medios Calculados en el análisis de
varianza con los Cuadrados Medios Esperados, se pueden obtener los
diferentes componentes de varianza. Es importante aclarar que a cada fuente
de variación se le asocia un Cuadrado Medio Esperado, y para que el sistema
de ecuaciones tenga solución única, se esperan tantos componentes de
varianza como fuentes de variación hay en el análisis (Ruales y col., 2007).
Los componentes de varianza tienen el siguiente esquema:
Fuente de
Variación
Entre grupos (EG)
Dentro
grupos
(DG)
TOTAL
Grados de
Libertad
g–1
∑i (ni – 1)
Suma de
Cuadrados
S.C. EG
S.C. DG
∑i GLEG + GLDG
S.C. TOTAL
7
Cuadrado
Medio
C.M.EG
C.M.DG
Cuadrado Medio
Esperado
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Donde,
δ2 EG = componente de varianza genético (entre grupos)
δ2 DG = componente de varianza de entorno (dentro de grupos)
np = número ponderado de observaciones por agrupamiento, el cual se obtiene
con la siguiente fórmula:
(∑
∑
∑
)
Para el caso del ejemplo, este número ponderado sería:
(
)
La tabla de análisis de varianza sería:
Fuente de
Variación
Entre padres
Dentro de padres
TOTAL
Grados de
Libertad
4
31
35
Suma de
Cuadrados
1821.41
13227.34
15048.75
Cuadrado
Medio
455.35
426.69
Cuadrado Medio
Esperado
Con los Cuadrados Medios (calculados y esperados) se pueden estimar los
componentes de varianza, así:
Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los
componentes de varianza genético y de entorno:
8
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Modelo Anidado
En ciertos sistemas de producción, en la planeación de los apareamientos, a
cada macho (factor A) se le asignan varias hembras (factor B) las cuales, una
vez asignadas a un macho, no se asignan a otro. Este tipo de agrupamiento se
denomina anidado (Ruales y col., 2007).
Desde el punto de vista estadístico, el modelo de análisis es:
Donde,
yijk = valor de la característica en el individuo k (k = 1,2,…,nij) proveniente del
factor Bj anidado en el factor Ai, nij siendo el número de individuos por
combinación de A y B.
µ = promedio general de la característica
Ai= efecto del valor i en el factor A (i = 1,2,…,a)
Bj= efecto del valor j en el factor B (j = 1,2,…bi) anidado en el valor i del factor
A, bi siendo el número de valores de B en cada valor de A
εijk= desviación aleatoria asociada con el individuo k en el valor i del factor A y
del valor j del factor B.
De acuerdo con este modelo, se tienen tres fuentes de variación, como se
expresa en la siguiente tabla:
Fuente de
Variación
A
B (A)
Residual
TOTAL
Grados de Libertad
a–1
∑i (bi – 1)
(
∑ij (nij – 1)
( )
Suma de
Cuadrados
S.C.A
S.C.B (A)
S.C.R
S.C.T
)
Cuadrad
o Medio
C.M.A
C.M.B (A)
C.M.R
Cuadrado Medio
Esperado
( )
Donde,
δ2 A = componente de varianza del factor A
δ2 B (A) = componente de varianza del factor B (A)
δ2 R = componente de varianza residual
k1, k2, k3 = números ponderados de observaciones por cada agrupamiento, los
cuales se obtienen con las siguientes fórmulas:
( )
(∑
9
∑
∑
)
( )
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
∑
(
∑
∑
∑
)
(∑
∑
∑
)
Donde,
ni = número de observaciones por cada valor de A
nij= número de observaciones por cada combinación de A y B
Ejemplo:
En la siguiente tabla se presentan los pesos al destete de gazapos
provenientes de diferentes camadas:
Macho Hembra
A
1
A
2
B
3
B
4
B
5
C
6
C
7
711
735
687
562
556
729
605
772
776
934
750
637
1132
978
788
791
960
819
709
1383
781
Peso al destete (g)
993 903
904
822 843
766
994 1027
859 771
862 645
658
943
949
914
802
857
876
733
1012
Para el análisis de estos datos, los pasos son los siguientes:
1. Estimar los Grados de Libertad:
 Grados de Libertad Machos:
 Grados de Libertad Hembras (Machos):
(
)
∑(
)
10
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
(
)
∑(
(
)
∑(
)
)
(
)
(
)
 Grados de Libertad Totales:
∑
-1
 Grados de Libertad Residual:
(
(
(
)
)
)
2. Estimar las sumas de cuadrados:
 Suma de Cuadrados Total:
(∑
∑
(
)
∑
)
(
)
(
)
(
 Suma de Cuadrados Machos:
(∑
∑
)
∑
Donde,
yi.. = total de cada macho
(
)
(
)
(
)
11
)
(
)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
173329
 Suma de Cuadrados Hembras (Machos):
(
(∑
∑
)
)
∑
Donde,
yIj. = total de cada hembra con cada macho
(
(
)
(
)
)
(
)
(
)
(
)
 Suma de Cuadrados Residual:
(
)
3. Estimar los Cuadrados Medios:
 Cuadrado Medio Machos:
 Cuadrado Medio Hembras (Machos):
(
)
(
)
(
)
 Cuadrado Medio Residual:
12
(
)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
4. Estimar los números ponderados de observaciones por cada agrupamiento:
(
)
(
)
(
)
La tabla de análisis de varianza sería:
Fuente de
Variación
Machos
Hembras (machos)
Residual
TOTAL
Grados de
Libertad
2
4
35
41
Suma de
Cuadrados
173329
255653
595990
1024972
Cuadrado
Medio
86665
63913
17028
Cuadrado Medio Esperado
( )
( )
Con los Cuadrados Medios (calculados y esperados) se estiman los
componentes de varianza, así:
( )
( )
Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los
componentes de varianza de machos, hembras (machos) y residual:
( )
(
)
13
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
Modelos Mixtos
Cuando se tienen modelos más complejos, es decir, cuando no solo la genética
afecta la expresión de la característica analizada, sino que también hay una
influencia de los factores del entorno, la estimación de los componentes de
varianza se hace más compleja; es entonces cuando se deben emplear los
Modelos Mixtos (Ruales y col., 2007).
El modelo mixto se puede representar de la siguiente manera:
Registro = factores genéticos + factores no genéticos + residual
El registro representa aquellos caracteres de importancia en el sistema
productivo y que son el objetivo del programa de mejora genética (peso al
nacer, al destete, a selección, ganancia de peso, producción de leche, intervalo
entre parto, etc.). Los factores genéticos se diferencian entre factores de
grupos raciales (tanto de machos como de hembras, e interacciones de estos
grupos) y factores individuales. Los primeros se consideran fijos y los últimos
aleatorios, ya que representan una muestra aleatoria de la expresión de los
“genes” de los individuos (Manrique, C).
Entre los efectos genéticos se tienen: efecto del animal, efecto del padre,
efecto de la madre, efecto del abuelo materno, etc., los cuales se consideran
efectos genéticos aditivos. Como efectos genéticos no aditivos se tienen las
interacciones de padres o interacciones de padres con grupos raciales.
Dependiendo del efecto presente, el modelo se denomina modelo animal,
modelo de padre, modelo de padre y abuelo materno, etc. (Manrique, C).
Los efectos no genéticos tienen en cuenta todos aquellos factores que afectan
la expresión de esos registros. Pueden ser efectos de año, sexo del animal,
manejo de los animales (nutricional, reproductivo, sanitario, etc.); estos efectos
se consideran fijos en el modelo. Dependiendo de la reglamentación
establecida en cada país, la definición de los efectos a incluir en manejo varían.
En las evaluaciones realizadas en los Estados Unidos, estos factores se
combinan para crear “grupos contemporáneos” (Manrique, C).
Todos aquellos factores cuyos efectos no pueden ser controlados o medidos se
tienen como efecto residual dentro de la evaluación. Esto afectará la
14
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD
ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE
confiabilidad con que se obtienen las predicciones genéticas; de aquí la
importancia de tener información confiable y válida para llevar a cabo estas
evaluaciones (Manrique, C).
REFERENCIAS BIBLIOGRÁFICAS
Falconer DS, FC Mackay. 1996. Introduction to quantitative genetics. 4ª Ed.
Addison Wesley Longman Limited, England.
Legates JE, Warwick EJ. 1992. Cría y mejora del ganado. 8ª Ed.
Interamericana Mc Graw-Hill, México.
Manrique C. Programa de mejoramiento genético en bovinos. Disponible:
http://www.cundinamarca.gov.co/cundinamarca/archivos/FILE_EVENTOSENTI
/FILE_EVENTOSENTI11132.pdf (Acceso: Enero 30, 2013).
Ruales F, C Manrique, MF Cerón. 2007. Fundamentos en mejoramiento
animal. 1ª Ed. L. Vieco e Hijas Ltda, Colombia.
15
Descargar