Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Notas de Actualización de Estadística Mejora Genética Javier Cañón 1 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Esperanza matemática y principales teoremas: Definición de Esperanza Matemática: Variables discretas: Supongamos una variable x que toma los valores x1, x2,.....xn con probabilidades p1, p2, ....pn ( ∑ pi = 1 ) i E[x] = μx = x1p1 + x2p2 +........+ xnpn = ∑x p i i i Variables continuas: E[x] = ∞ ∫ xf ( x)dx = μx −∞ Teoremas fundamentales de la Esperanza Matemática: 1) La Esperanza de una constante (k) es ella misma E[k] = k 2) Dadas dos variables X e Y, la esperanza matemática de la suma es igual a la suma de las esperanzas matemáticas E[X + Y] = E[X] + E[Y] 3) La esperanza matemática del producto de dos variables aleatorias independientes X e Y es igual al producto de las esperanzas Z = X⋅Y E[Z] = E[X⋅Y] = E[X] ⋅ E[Y] 2 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Varianza y principales teoremas: Definición de varianza: σ2 = E[X - μ]2 = E[X2] - μ2 = E[X2] - E[X]2 un resultado de interés es: E[X2] = σ2 + μ2 a la raíz cuadrada de la varianza se la conoce con el nombre desviación típica Teoremas: 1) La varianza de la suma o diferencia de dos variables aleatorias: a) independientes es igual a la suma de las varianzas σ2(X+Y) = σ2(X) + σ2(Y) σ2(X - Y) = σ2(X) + σ2(Y) b) relacionadas σ2(X+Y) = σ2(X) + σ2(Y) + 2cov(X,Y) σ2(X - Y) = σ2(X) + σ2(Y) -2cov(X,Y) 2) Si existe la varianza para la variable aleatoria X, σ2(X), también existirá para kX y X + k: σ2(kX) = k2σ2(X) σ2(X+k) = σ2(X) Covarianza de dos variables: Definición de convarianza entre dos variables X e Y: σxy = Cov(X,Y) = E[(X - μx)(Y - μy)] = E[XY] - μxμy 3 − Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ un resultado de interés es: E[XY] = Cov(X,Y) + μxμy Cov (X,kY) = kCov(X,Y) Cov(kX,Y) = kCov(X,Y) Cov(X,Y+Z) = Cov(X,Y) + Cov(X,Z) Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z) Cov(X,X) = σ2(X) Cálculo de la varianza y convarianza: σ X2 = ∑(X i − X )2 i n ∑(X − X ) σ x2 = X 2 2 - =∑X − 2 X 2 (∑ X ) 2 n = Sx 2 Suma de cuadrados (numerador de la varianza) La varianza es, por lo tanto, la diferencia entre la media de los cuadrados y el cuadrado de la media σ XY ∑ ( X − X )(Y − Y ) = n ∑ ( X − X )(Y − Y ) = ∑ XY − ∑ X ∑Y n Suma de productos cruzados (numerador de la co‐ = Sxy varianza) σ xy = XY - XY Varianza de la media muestral: σ X2 = σ X2 n 4 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ FUNDAMENTOS DEL ANALISIS DE VARIANZA Análisis jerárquico simple X ij = μ + Ti + ε ij i=1....I j=1....J I J J ∑∑ ∑ X ij = X i. i =1 j =1 j =1 X ij = X .. X .. = X .. IJ ( X ij − X .. ) = ( X ij − X i. ) + ( X i. − X .. ) Total Interna Error Residuo X i. = X .. X i. J X ij X i. Externa Tratamientos Grupos X i. − X .. X ij − X i. X ij − X .. SCTotal ∑ ij SCInterna SCExterna { } ( X ij − X .. ) 2 = ∑ij ( X ij − X i. ) + ( X i. − X .. ) 2 Suma de Cuadrados Total = ∑ij X ij2 − X ..2 IJ Suma de Cuadrados del residuo = ∑ij X ij2 − ∑i X i2. J Suma de Cuadrados debido al tratamiento = ∑ i X i2. X ..2 − J IJ 5 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Tabla de Análisis de Varianza para el modelo jerárquico simple y equilibrado Fuentes de Variación Grados de Libertad Suma de Cuadrados Cuadrados Medios E(CM) Grupos I-1 SCG = ∑i X2i. /J - X2.. /IJ CMG = SCG / (I-1) σ2 + Jσ2G Residuo I(J - 1) SCR = ∑ij X2ij - ∑i X2i. /J CMR = SCR / I(J-1) σ2 Total IJ - 1 SCT = ∑ij X2ij - X2.. /IJ SCT / (IJ-1) Prueba de hipótesis: H0 ≡ σ2G = 0 CMG FII(−J1−1) ∼ CMR Análisis jerárquico doble X ijk = μ + Ti + G j ( i ) + ε k ( ij ) i=1....I j=1....J K ∑ X ijk = X ij. k =1 X ij . = X ij . K J K ∑∑ j =1 k =1 X i.. = X i.. JK k=1....K X ijk = X i.. X ... = I J K ∑ ∑∑ i =1 j =1 k =1 X ijk = X ... X ... IJK ( X ijk − X ... ) = ( X ijk − X ij . ) + ( X ij . − X i.. ) + ( X i.. − X ... ) Total ∑ ijk Error Subgrupos Grupos { } ( X ijk − X ... ) 2 = ∑ijk ( X ijk − X ij . ) + ( X ij . − X i.. ) + ( X i.. − X ... ) SCTotal SCInterna SCSubgrupos 2 SCgrupos 6 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Suma de Cuadrados Total = ∑ ijk X 2 ijk X ...2 − IJK Suma de Cuadrados del residuo = ∑ijk X ijk2 − ∑ij X ij2. X ij2. X i2.. JK K Suma de Cuadrados debido a subgrupos = ∑ ij K − ∑i Suma de Cuadrados debido a grupos = ∑ i X i2.. X ...2 − JK IJK Tabla de Análisis de Varianza para el modelo jerárquico doble y equilibrado Fuentes de Variación g.l. Suma de Cuadrados Grupos Subgrupos Residuo I-1 SCG = ∑i X2i.. /JK - X2... /IJK I(J - 1) SCSg = ∑ij X2ij. /K - ∑i X2i.. /JK IJ(K - 1) SCR = ∑ijk X2ijk - ∑ij X2ij. /K Total IJK - 1 SCT = ∑ijk X2ijk - X2... /IJK Cuadrados Medios CMG = SCG / (I-1) CMSg = SCSg / I(J-1) CMR = SCR / IJ(K-1) E(CM) σ2 + Kσ2Sg +JKσ2G σ2 + Kσ2Sg σ2 CMT = SCT / (IJK-1) 7 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Pruebas de hipótesis: H0 ≡ σ2Sg = 0 CMSg I ( J −1) ∼ FIJ ( K −1) CMR H0 ≡ σ2G = 0 CMG ∼ FII(−J1−1) CMSg Análisis factorial X ijk = μ + Fi + C j + I ij + ε k ( ij ) i=1....I J K ∑X k =1 j=1....J ijk X ij . = k=1....K K ∑∑ = X ij . j =1 k =1 X ij . X ijk = X i.. X i.. = K I K ∑∑ i =1 k =1 X i.. JK I X ijk = X . j . X . j. = X . j. IK J K ∑ ∑∑ i =1 j =1 k =1 X ... = X ijk = X ... X ... IJK ( X ijk − X ... ) = ( X ijk − X ij . ) + ( X ij . − X i.. − X . j . + X ... ) + ( X i.. − X ... ) + ( X . j . − X ... ) Total Error Interacción Filas Columnas 8 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ ∑ ijk { } ( X ijk − X ... ) 2 = ∑ijk ( X ijk − X ij . ) + ( X ij . − X i.. − X . j . + X ... ) + ( X i.. − X ... ) + ( X . j . − X ... ) SCTotal SCInterna SCInteracción SCfilas 2 SCcolumnas Suma de Cuadrados Total = ∑ ijk X 2 ijk X ...2 − IJK Suma de Cuadrados del residuo = X ij2. ∑ijk X ijk2 − ∑ij K Suma de Cuadrados debido a filas = ∑ X i2.. X ...2 − JK IJK ∑ X .2j . i Suma de Cuadrados debido a columnas = j X ...2 − IK IJK Suma de Cuadrados debido a interacción = ∑ ij X ij2. K − ∑i X .2j . X ...2 X i2.. − ∑j + JK IK IJK 9 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ Tabla de Análisis de Varianza para el modelo factorial y equilibrado Fuentes de Variación Filas Columnas Interacción Residuo g.l. I-1 J-1 (I-1)(J-1) IJ(K - 1) Total IJK - 1 Suma de Cuadrados Cuadrados Medios E(CM) SCF = ∑i X2i.. /JK - X2... /IJK SCC = ∑j X2.j. /IK - X2... /IJK SCI = ∑ijk X2ijk - ∑j X2.j. /IK - ∑i X2i.. /JK + X2... /IJK SCR = ∑ijk X2ijk - ∑ij X2ij. /K CMF = SCF / (I-1) CMC = SCC / (J-1) CMI = SCI / (I-1)(J-1) CMR = SCR / IJ(K-1) σ2 + Kσ2I +JKσ2F σ2 + Kσ2I +IKσ2C σ2 + Kσ2I σ2 SCT = ∑ijk X2ijk - X2... /IJK CMT = SCT / (IJK-1) Pruebas de hipótesis: 1) H0 ≡ σ2I = 0 CMI ∼ CMR 2) H0 ≡ σ2C = 0 CMC ∼ CMI 3) FIJ( I(−K1−)(1J) −1) F( JI −−11)( J −1) H0 ≡ σ2F = 0 CMF CMI ∼ F( II −−11)( J −1) 10 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ MODELO DE REGRESIÓN LINEAL yi = β 0 + β1 X i + ε i yi : es el valor de la variable dependiente en la prueba i β0 y β1 : son los parámetros del modelo Xi : es una constante conocida, el valor de la variable independiente en la prueba i εi : representa el error aleatorio E(yi) =β0 + β1 E(εi) = 0 σ2(εi) = σ2 y σ(εi, εj) = 0 Los estimadores de mínimos cuadrados de β0 y β1, b0 y b1 se obtendrían a partir de las expresiones siguientes: b1 = ∑X i Xj − ∑ X i2 − ∑X ∑X i n (∑ X i ) 2 j = ∑ ( X − X )(Y − Y ) ∑(X − X ) i i 2 i n b0 = Y − b1 X Partición de la desviación total: ^ ^ ( yi − y ) = ( yi − yi ) + ( yi − y ) S.C.T Desv. de la regresión Resíduo Desv. debido a regresión 11 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ yi Y y^ i * * y= y * X Tabla del análisis de varianza Fuentes de Variación g.l. Debido a Regresión 1 Desviación de la regresión n-2 Total n-1 Suma de Cuadrados Cuadrados Medios b1Sxy CMR= b1Sxy Sy2 - b1Sxy CMI = (Sy2 - b1 Sxy)/(n-2) E(CM) σ12+ β12 Sx2 σ2 Sy2 El cociente: (n-2) b1Sxy (Sy2 - b1 Sxy) se distribuye como una F con 1 y n-2 grados de libertad y nos permite probar la hipótesis de si el coeficiente de regresión es o no diferente de cero. El error típico de b puede ser estimado como: E.T .(b) = CM I Sx 2 12 Mejora Genética de los Animales de Interés Veterinario www.ucm.es/info/genetvet/ y yi y i − y^ i y^i y yi − y ^ α y b0 x 13