UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Análisis de Variación El valor observado cuando se mide un determinado carácter en un individuo es el valor fenotípico de dicho individuo; todas las observaciones, ya sean medias, varianzas o covarianzas deben estar basadas claramente en medidas de los valores fenotípicos. Para analizar las propiedades genéticas de las poblaciones es necesario dividir el valor fenotípico en componentes atribuibles a diferentes causas (Falconer y Mackay, 1996). La primera división del valor fenotípico es en componentes atribuibles a la influencia del genotipo y el ambiente. El genotipo es el conjunto particular de genes que posee el individuo, y el ambiente son todas las circunstancias no genéticas que influyen en el valor fenotípico; la inclusión de todas estas circunstancias no genéticas bajo el término “ambiente” quiere decir que el genotipo y el ambiente son, por definición, los únicos determinantes del valor fenotípico de un individuo. Simbólicamente se puede expresar lo anterior de la siguiente manera (Falconer y Mackay, 1996): P=G+E Donde, P = valor fenotípico G= valor genotípico E= desviación ambiental En términos de varianza, se puede plantear ésta expresión de la siguiente manera: VP= VG + VE Donde, VP= varianza fenotípica VG= varianza genética VE= varianza ambiental La variación genética puede a su vez subdividirse en tres componentes: VG= VA + VD + VI 1 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE El primer componente es el llamado variación genética aditiva (VA), y es considerado el más importante puesto que es la causa principal del parecido entre parientes y, por lo tanto, el principal determinante de las propiedades genéticas observables en una población y de la respuesta a la selección. Más aún, es el único componente que puede estimarse directamente a partir de las observaciones realizadas en la población (Falconer y Mackay, 1996). Además de los genes que tienen un efecto aditivo sobre un carácter cuantitativo, existen otros que pueden poseer una acción dominante que enmascara la contribución de los alelos recesivos en ese locus; esta fuente de variabilidad se atribuye a la Varianza genética por dominancia (VD). El otro tipo de varianza genética está asociada a las interacciones entre los genes; la base genética de esta varianza es la epistasis y se denomina Variación genética por interacción (VI) (Legates y Warwick, 1992). Sin embargo, en la práctica la subdivisión importante es la de la varianza genética aditiva frente al resto, por lo cual la varianza por dominancia y la varianza por interacción pueden agruparse en un solo componente: Varianza No Aditiva (VNA). En estos términos, se puede expresar la variación fenotípica total de una característica de la siguiente manera: VP= VA + VNA + VE VG El análisis de varianza es una técnica estadística que permite particionar la variación de una característica en diferentes fuentes de variación, algunas de ellas medidas o controladas dentro del sistema productivo, y otras que no pueden ser controladas o medidas, propias de cualquier material biológico (Ruales y col., 2007). En el Análisis de Varianza se deben tener en cuenta los siguientes supuestos: A) Los datos a analizar deben ser aleatorios e independientes B) Los datos deben provenir de una población que tenga distribución normal C) Los datos deben presentar variación homogénea de acuerdo a las fuentes de variación. 2 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Modelo lineal El modelo lineal es un modelo estadístico que describe la variación de la característica bajo análisis en un conjunto de factores o efectos. Por ejemplo, si se tienen los pesajes de los animales en una empresa ganadera, se conoce el sexo de cada uno, su edad y el manejo (nutricional, sanitario, etc.) que tuvo, se puede conocer cuánto de la variación en los pesajes se atribuye a cada uno de éstos factores, y a la posible interacción entre estos factores (Ruales y col., 2007). Como se había mencionado anteriormente, desde el punto de vista de genética cuantitativa, los factores que afectan la expresión de cualquier característica se pueden clasificar en dos categorías: factores genéticos y no genéticos. Los factores genéticos son aquellos referentes a la constitución genética de los individuos, es decir, si los individuos provienen de padres comunes (hermanos completos), de un mismo padre (medios hermanos), si provienen de una misma composición genética (misma raza, línea, estirpe o especie). Los no genéticos son aquellos factores de entorno en donde se desempeñan los animales, que pueden afectar la expresión de la característica bajo estudio; algunos de estos factores son por ejemplo el sexo de los animales, la edad, la zona o región en donde se encuentren, la época de nacimiento, entre otros (Ruales y col., 2007). Es de vital importancia cuando se va a realizar el análisis de los datos, conocer cuáles de estos factores genéticos y no genéticos deben tenerse en cuenta en el modelo, ya que aquellos factores que no se cuantifiquen o se tengan en cuenta, pueden incrementar el error de estimación o predicción, o su efecto puede confundirse con los descritos (Ruales y col., 2007). El modelo lineal puede definirse de la siguiente manera: Donde, yijk… = valor de la característica en cada uno de los valores (i,j,k…) de cada uno de los factores (A,B,C,…). µ = promedio general de la característica (efecto común en todos los individuos). Ai= efecto del valor i en el factor A Bj= efecto del valor j en el factor B 3 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Ck= efecto del valor k en el factor C εijk…= desviación aleatoria asociada a un individuo con respecto a los factores definidos en el modelo. Desde el punto de vista genético, el Análisis de Varianza se utiliza para separar la variación total entre observaciones, en sus componentes genéticos y no genéticos. Los animales pueden agruparse de acuerdo con sus progenitores, de forma tal que la variación entre individuos se puede particionar en la variación entre diferentes grupos de reproductores (uno de ellos o ambos) y la variación dentro de los grupos. Esa partición de la variación entre grupos y dentro de grupos es la base para la estimación de la heredabilidad de la característica bajo estudio, la cual se describirá posteriormente en el capítulo 2. Aquí se tiene en cuenta un supuesto adicional: la variación no genética es homogénea y se incluye en la variación dentro de grupos (Ruales y col., 2007). Desde el punto de vista estadístico, el modelo de análisis se puede expresar de la siguiente manera (Ruales y col., 2007): Donde, yij= valor de la característica en el individuo j (j=1,2,…,n i) del grupo genético Gi (i= 1,2,…,g), siendo ni el número de individuos por grupo. µ = promedio general de la característica Gi= efecto del grupo genético i εij= desviación aleatoria asociada con el individuo j dentro del grupo i El análisis de varianza tendría entonces el siguiente esquema: Fuente de Variación Entre Grupos (EG) Dentro de Grupos (DG) TOTAL Grados de Libertad (GL) g–1 ∑i (ni – 1) ∑i GLEG + GLDG Ejemplo: 4 Suma de Cuadrados (SC) S.C. EG S.C. DG S.C. TOTAL Cuadrado Medio (CM) C.M.EG C.M.DG UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE En la siguiente tabla se presentan los pesos al destete de terneros Brahman provenientes de 5 padres: TORO A 281 318 288 286 306 TORO B 271 285 288 295 317 253 291 252 TORO C 285 266 240 290 ∑ = 1479 ∑ = 2252 ∑ = 1081 TORO D 286 259 294 248 286 272 269 289 272 284 ∑ = 2579 Para el análisis de estos datos, los pasos son los siguientes: 1. Estimar los Grados de Libertad: Grados de Libertad Entre Padres: ( ) Grados de Libertad Totales: Grados de Libertad Dentro de Padres (Dentro de Grupos): 2. Estimar las sumas de cuadrados: Suma de Cuadrados Total: 5 TORO E 300 243 294 276 282 324 287 252 254 ∑ = 2512 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE (∑ ∑ ( ) ( ) ) ( ( ) ( ( ) ) ( ) ) ( ) Suma de Cuadrados Entre Padres (Entre Grupos): (∑ ∑ ) Donde, yi. = total de cada grupo ( ) ( ) ( ) ( ) ( 1821.41 Suma de Cuadrados Dentro de Padres (Dentro de Grupos): 3. Estimar los Cuadrados Medios: Cuadrado Medio Entre Padres (Entre grupos): Cuadrado Medio Dentro de Padres (Dentro de Grupos): 6 ) ( ) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Con estas estimaciones, la tabla de Análisis de Varianza sería: Fuente de Variación Entre padres Dentro de padres TOTAL Grados de Libertad 4 31 35 Suma de Cuadrados 1821.41 13227.34 15048.75 Cuadrado Medio 455.35 426.69 COMPONENTES DE VARIANZA Cuando se realiza el análisis de varianza de una característica, se busca obtener los componentes de varianza correspondientes a las diferentes fuentes de variación, con base en los cuales se pueden obtener parámetros genéticos (Ruales y col., 2007). De acuerdo con el análisis de varianza descrito en el párrafo anterior, los cuadrados medios que se calculan pueden igualarse a unos Cuadrados Medios Esperados, que comprenden diferentes componentes de varianza, de tal manera que al igualar los Cuadrados Medios Calculados en el análisis de varianza con los Cuadrados Medios Esperados, se pueden obtener los diferentes componentes de varianza. Es importante aclarar que a cada fuente de variación se le asocia un Cuadrado Medio Esperado, y para que el sistema de ecuaciones tenga solución única, se esperan tantos componentes de varianza como fuentes de variación hay en el análisis (Ruales y col., 2007). Los componentes de varianza tienen el siguiente esquema: Fuente de Variación Entre grupos (EG) Dentro grupos (DG) TOTAL Grados de Libertad g–1 ∑i (ni – 1) Suma de Cuadrados S.C. EG S.C. DG ∑i GLEG + GLDG S.C. TOTAL 7 Cuadrado Medio C.M.EG C.M.DG Cuadrado Medio Esperado UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Donde, δ2 EG = componente de varianza genético (entre grupos) δ2 DG = componente de varianza de entorno (dentro de grupos) np = número ponderado de observaciones por agrupamiento, el cual se obtiene con la siguiente fórmula: (∑ ∑ ∑ ) Para el caso del ejemplo, este número ponderado sería: ( ) La tabla de análisis de varianza sería: Fuente de Variación Entre padres Dentro de padres TOTAL Grados de Libertad 4 31 35 Suma de Cuadrados 1821.41 13227.34 15048.75 Cuadrado Medio 455.35 426.69 Cuadrado Medio Esperado Con los Cuadrados Medios (calculados y esperados) se pueden estimar los componentes de varianza, así: Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los componentes de varianza genético y de entorno: 8 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Modelo Anidado En ciertos sistemas de producción, en la planeación de los apareamientos, a cada macho (factor A) se le asignan varias hembras (factor B) las cuales, una vez asignadas a un macho, no se asignan a otro. Este tipo de agrupamiento se denomina anidado (Ruales y col., 2007). Desde el punto de vista estadístico, el modelo de análisis es: Donde, yijk = valor de la característica en el individuo k (k = 1,2,…,nij) proveniente del factor Bj anidado en el factor Ai, nij siendo el número de individuos por combinación de A y B. µ = promedio general de la característica Ai= efecto del valor i en el factor A (i = 1,2,…,a) Bj= efecto del valor j en el factor B (j = 1,2,…bi) anidado en el valor i del factor A, bi siendo el número de valores de B en cada valor de A εijk= desviación aleatoria asociada con el individuo k en el valor i del factor A y del valor j del factor B. De acuerdo con este modelo, se tienen tres fuentes de variación, como se expresa en la siguiente tabla: Fuente de Variación A B (A) Residual TOTAL Grados de Libertad a–1 ∑i (bi – 1) ( ∑ij (nij – 1) ( ) Suma de Cuadrados S.C.A S.C.B (A) S.C.R S.C.T ) Cuadrad o Medio C.M.A C.M.B (A) C.M.R Cuadrado Medio Esperado ( ) Donde, δ2 A = componente de varianza del factor A δ2 B (A) = componente de varianza del factor B (A) δ2 R = componente de varianza residual k1, k2, k3 = números ponderados de observaciones por cada agrupamiento, los cuales se obtienen con las siguientes fórmulas: ( ) (∑ 9 ∑ ∑ ) ( ) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE ∑ ( ∑ ∑ ∑ ) (∑ ∑ ∑ ) Donde, ni = número de observaciones por cada valor de A nij= número de observaciones por cada combinación de A y B Ejemplo: En la siguiente tabla se presentan los pesos al destete de gazapos provenientes de diferentes camadas: Macho Hembra A 1 A 2 B 3 B 4 B 5 C 6 C 7 711 735 687 562 556 729 605 772 776 934 750 637 1132 978 788 791 960 819 709 1383 781 Peso al destete (g) 993 903 904 822 843 766 994 1027 859 771 862 645 658 943 949 914 802 857 876 733 1012 Para el análisis de estos datos, los pasos son los siguientes: 1. Estimar los Grados de Libertad: Grados de Libertad Machos: Grados de Libertad Hembras (Machos): ( ) ∑( ) 10 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE ( ) ∑( ( ) ∑( ) ) ( ) ( ) Grados de Libertad Totales: ∑ -1 Grados de Libertad Residual: ( ( ( ) ) ) 2. Estimar las sumas de cuadrados: Suma de Cuadrados Total: (∑ ∑ ( ) ∑ ) ( ) ( ) ( Suma de Cuadrados Machos: (∑ ∑ ) ∑ Donde, yi.. = total de cada macho ( ) ( ) ( ) 11 ) ( ) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE 173329 Suma de Cuadrados Hembras (Machos): ( (∑ ∑ ) ) ∑ Donde, yIj. = total de cada hembra con cada macho ( ( ) ( ) ) ( ) ( ) ( ) Suma de Cuadrados Residual: ( ) 3. Estimar los Cuadrados Medios: Cuadrado Medio Machos: Cuadrado Medio Hembras (Machos): ( ) ( ) ( ) Cuadrado Medio Residual: 12 ( ) UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE 4. Estimar los números ponderados de observaciones por cada agrupamiento: ( ) ( ) ( ) La tabla de análisis de varianza sería: Fuente de Variación Machos Hembras (machos) Residual TOTAL Grados de Libertad 2 4 35 41 Suma de Cuadrados 173329 255653 595990 1024972 Cuadrado Medio 86665 63913 17028 Cuadrado Medio Esperado ( ) ( ) Con los Cuadrados Medios (calculados y esperados) se estiman los componentes de varianza, así: ( ) ( ) Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los componentes de varianza de machos, hembras (machos) y residual: ( ) ( ) 13 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE Modelos Mixtos Cuando se tienen modelos más complejos, es decir, cuando no solo la genética afecta la expresión de la característica analizada, sino que también hay una influencia de los factores del entorno, la estimación de los componentes de varianza se hace más compleja; es entonces cuando se deben emplear los Modelos Mixtos (Ruales y col., 2007). El modelo mixto se puede representar de la siguiente manera: Registro = factores genéticos + factores no genéticos + residual El registro representa aquellos caracteres de importancia en el sistema productivo y que son el objetivo del programa de mejora genética (peso al nacer, al destete, a selección, ganancia de peso, producción de leche, intervalo entre parto, etc.). Los factores genéticos se diferencian entre factores de grupos raciales (tanto de machos como de hembras, e interacciones de estos grupos) y factores individuales. Los primeros se consideran fijos y los últimos aleatorios, ya que representan una muestra aleatoria de la expresión de los “genes” de los individuos (Manrique, C). Entre los efectos genéticos se tienen: efecto del animal, efecto del padre, efecto de la madre, efecto del abuelo materno, etc., los cuales se consideran efectos genéticos aditivos. Como efectos genéticos no aditivos se tienen las interacciones de padres o interacciones de padres con grupos raciales. Dependiendo del efecto presente, el modelo se denomina modelo animal, modelo de padre, modelo de padre y abuelo materno, etc. (Manrique, C). Los efectos no genéticos tienen en cuenta todos aquellos factores que afectan la expresión de esos registros. Pueden ser efectos de año, sexo del animal, manejo de los animales (nutricional, reproductivo, sanitario, etc.); estos efectos se consideran fijos en el modelo. Dependiendo de la reglamentación establecida en cada país, la definición de los efectos a incluir en manejo varían. En las evaluaciones realizadas en los Estados Unidos, estos factores se combinan para crear “grupos contemporáneos” (Manrique, C). Todos aquellos factores cuyos efectos no pueden ser controlados o medidos se tienen como efecto residual dentro de la evaluación. Esto afectará la 14 UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS AGRARIAS, PECUARIAS Y DEL MEDIO AMBIENTE confiabilidad con que se obtienen las predicciones genéticas; de aquí la importancia de tener información confiable y válida para llevar a cabo estas evaluaciones (Manrique, C). REFERENCIAS BIBLIOGRÁFICAS Falconer DS, FC Mackay. 1996. Introduction to quantitative genetics. 4ª Ed. Addison Wesley Longman Limited, England. Legates JE, Warwick EJ. 1992. Cría y mejora del ganado. 8ª Ed. Interamericana Mc Graw-Hill, México. Manrique C. Programa de mejoramiento genético en bovinos. Disponible: http://www.cundinamarca.gov.co/cundinamarca/archivos/FILE_EVENTOSENTI /FILE_EVENTOSENTI11132.pdf (Acceso: Enero 30, 2013). Ruales F, C Manrique, MF Cerón. 2007. Fundamentos en mejoramiento animal. 1ª Ed. L. Vieco e Hijas Ltda, Colombia. 15