Document

Anuncio
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Notas de Actualización de Estadística
Mejora Genética
Javier Cañón
1
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Esperanza matemática y principales teoremas:
Definición de Esperanza Matemática:
Variables discretas:
Supongamos una variable x que toma los valores x1, x2,.....xn con probabilidades p1, p2,
....pn ( ∑ pi = 1 )
i
E[x] = μx = x1p1 + x2p2 +........+ xnpn =
∑x p
i
i
i
Variables continuas:
E[x] =
∞
∫ xf ( x)dx = μx
−∞
Teoremas fundamentales de la Esperanza Matemática:
1) La Esperanza de una constante (k) es ella misma
E[k] = k
2) Dadas dos variables X e Y, la esperanza matemática de la suma es igual a la suma
de las esperanzas matemáticas
E[X + Y] = E[X] + E[Y]
3) La esperanza matemática del producto de dos variables aleatorias independientes X
e Y es igual al producto de las esperanzas
Z = X⋅Y
E[Z] = E[X⋅Y] = E[X] ⋅ E[Y]
2
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Varianza y principales teoremas:
Definición de varianza:
σ2 = E[X - μ]2 = E[X2] - μ2 = E[X2] - E[X]2
un resultado de interés es:
E[X2] = σ2 + μ2
a la raíz cuadrada de la varianza se la conoce con el nombre desviación típica
Teoremas:
1) La varianza de la suma o diferencia de dos variables aleatorias:
a) independientes es igual a la suma de las varianzas
σ2(X+Y) = σ2(X) + σ2(Y)
σ2(X - Y) = σ2(X) + σ2(Y)
b) relacionadas
σ2(X+Y) = σ2(X) + σ2(Y) + 2cov(X,Y)
σ2(X - Y) = σ2(X) + σ2(Y) -2cov(X,Y)
2) Si existe la varianza para la variable aleatoria X, σ2(X), también existirá para
kX y X + k:
σ2(kX) = k2σ2(X)
σ2(X+k) = σ2(X)
Covarianza de dos variables:
Definición de convarianza entre dos variables X e Y:
σxy = Cov(X,Y) = E[(X - μx)(Y - μy)] = E[XY] - μxμy
3
−
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
un resultado de interés es:
E[XY] = Cov(X,Y) + μxμy
Cov (X,kY) = kCov(X,Y)
Cov(kX,Y) = kCov(X,Y)
Cov(X,Y+Z) = Cov(X,Y) + Cov(X,Z)
Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z)
Cov(X,X) = σ2(X)
Cálculo de la varianza y convarianza:
σ X2 =
∑(X
i
− X )2
i
n
∑(X − X )
σ x2 = X 2
2
-
=∑X −
2
X
2
(∑ X ) 2
n
= Sx 2
Suma de cuadrados (numerador de la varianza)
La varianza es, por lo tanto, la diferencia entre la media de los cuadrados y el cuadrado de la media σ XY
∑ ( X − X )(Y − Y )
=
n
∑ ( X − X )(Y − Y ) = ∑ XY −
∑ X ∑Y
n
Suma de productos cruzados (numerador de la co‐
= Sxy varianza)
σ xy = XY - XY
Varianza de la media muestral:
σ X2 =
σ X2
n
4
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
FUNDAMENTOS DEL ANALISIS DE VARIANZA
Análisis jerárquico simple
X ij = μ + Ti + ε ij
i=1....I
j=1....J
I
J
J
∑∑
∑ X ij = X i.
i =1 j =1
j =1
X ij = X ..
X .. =
X ..
IJ
( X ij − X .. ) = ( X ij − X i. ) + ( X i. − X .. )
Total
Interna
Error
Residuo
X i. =
X ..
X i.
J
X ij
X i.
Externa
Tratamientos
Grupos
X i. − X ..
X ij − X i.
X ij − X ..
SCTotal
∑
ij
SCInterna
SCExterna
{
}
( X ij − X .. ) 2 = ∑ij ( X ij − X i. ) + ( X i. − X .. )
2
Suma de Cuadrados Total =
∑ij X ij2 −
X ..2
IJ
Suma de Cuadrados del residuo =
∑ij X ij2 − ∑i
X i2.
J
Suma de Cuadrados debido al tratamiento =
∑
i
X i2. X ..2
−
J
IJ
5
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Tabla de Análisis de Varianza para el modelo jerárquico simple y equilibrado
Fuentes de Variación
Grados de Libertad
Suma de Cuadrados
Cuadrados Medios
E(CM)
Grupos
I-1
SCG = ∑i X2i. /J - X2.. /IJ
CMG = SCG / (I-1)
σ2 + Jσ2G
Residuo
I(J - 1)
SCR = ∑ij X2ij - ∑i X2i. /J
CMR = SCR / I(J-1)
σ2
Total
IJ - 1
SCT = ∑ij X2ij - X2.. /IJ
SCT / (IJ-1)
Prueba de hipótesis:
H0 ≡ σ2G = 0
CMG
FII(−J1−1)
∼
CMR
Análisis jerárquico doble
X ijk = μ + Ti + G j ( i ) + ε k ( ij )
i=1....I
j=1....J
K
∑ X ijk = X ij.
k =1
X ij . =
X ij .
K
J
K
∑∑
j =1 k =1
X i.. =
X i..
JK
k=1....K
X ijk = X i..
X ... =
I
J
K
∑ ∑∑
i =1
j =1 k =1
X ijk = X ...
X ...
IJK
( X ijk − X ... ) = ( X ijk − X ij . ) + ( X ij . − X i.. ) + ( X i.. − X ... )
Total
∑
ijk
Error
Subgrupos
Grupos
{
}
( X ijk − X ... ) 2 = ∑ijk ( X ijk − X ij . ) + ( X ij . − X i.. ) + ( X i.. − X ... )
SCTotal
SCInterna
SCSubgrupos
2
SCgrupos
6
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Suma de Cuadrados Total =
∑
ijk
X
2
ijk
X ...2
−
IJK
Suma de Cuadrados del residuo =
∑ijk X ijk2 − ∑ij
X ij2.
X ij2.
X i2..
JK
K
Suma de Cuadrados debido a subgrupos =
∑
ij
K
− ∑i
Suma de Cuadrados debido a grupos =
∑
i
X i2.. X ...2
−
JK IJK
Tabla de Análisis de Varianza para el modelo jerárquico doble y equilibrado
Fuentes de Variación
g.l.
Suma de Cuadrados
Grupos
Subgrupos
Residuo
I-1
SCG = ∑i X2i.. /JK - X2... /IJK
I(J - 1) SCSg = ∑ij X2ij. /K - ∑i X2i.. /JK
IJ(K - 1) SCR = ∑ijk X2ijk - ∑ij X2ij. /K
Total
IJK - 1
SCT = ∑ijk X2ijk - X2... /IJK
Cuadrados Medios
CMG = SCG / (I-1)
CMSg = SCSg / I(J-1)
CMR = SCR / IJ(K-1)
E(CM)
σ2 + Kσ2Sg +JKσ2G
σ2 + Kσ2Sg
σ2
CMT = SCT / (IJK-1)
7
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Pruebas de hipótesis:
H0 ≡ σ2Sg = 0
CMSg
I ( J −1)
∼ FIJ ( K −1)
CMR
H0 ≡ σ2G = 0
CMG
∼ FII(−J1−1)
CMSg
Análisis factorial
X ijk = μ + Fi + C j + I ij + ε k ( ij )
i=1....I
J
K
∑X
k =1
j=1....J
ijk
X ij . =
k=1....K
K
∑∑
= X ij .
j =1 k =1
X ij .
X ijk = X i..
X i.. =
K
I
K
∑∑
i =1 k =1
X i..
JK
I
X ijk = X . j .
X . j. =
X . j.
IK
J
K
∑ ∑∑
i =1
j =1 k =1
X ... =
X ijk = X ...
X ...
IJK
( X ijk − X ... ) = ( X ijk − X ij . ) + ( X ij . − X i.. − X . j . + X ... ) + ( X i.. − X ... ) + ( X . j . − X ... )
Total
Error
Interacción
Filas
Columnas
8
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
∑
ijk
{
}
( X ijk − X ... ) 2 = ∑ijk ( X ijk − X ij . ) + ( X ij . − X i.. − X . j . + X ... ) + ( X i.. − X ... ) + ( X . j . − X ... )
SCTotal
SCInterna
SCInteracción
SCfilas
2
SCcolumnas
Suma de Cuadrados Total =
∑
ijk
X
2
ijk
X ...2
−
IJK
Suma de Cuadrados del residuo =
X ij2.
∑ijk X ijk2 − ∑ij
K
Suma de Cuadrados debido a filas =
∑
X i2.. X ...2
−
JK IJK
∑
X .2j .
i
Suma de Cuadrados debido a columnas =
j
X ...2
−
IK IJK
Suma de Cuadrados debido a interacción =
∑
ij
X ij2.
K
− ∑i
X .2j . X ...2
X i2..
− ∑j
+
JK
IK IJK
9
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
Tabla de Análisis de Varianza para el modelo factorial y equilibrado
Fuentes de Variación
Filas
Columnas
Interacción
Residuo
g.l.
I-1
J-1
(I-1)(J-1)
IJ(K - 1)
Total
IJK - 1
Suma de Cuadrados
Cuadrados Medios
E(CM)
SCF = ∑i X2i.. /JK - X2... /IJK
SCC = ∑j X2.j. /IK - X2... /IJK
SCI = ∑ijk X2ijk - ∑j X2.j. /IK - ∑i X2i.. /JK + X2... /IJK
SCR = ∑ijk X2ijk - ∑ij X2ij. /K
CMF = SCF / (I-1)
CMC = SCC / (J-1)
CMI = SCI / (I-1)(J-1)
CMR = SCR / IJ(K-1)
σ2 + Kσ2I +JKσ2F
σ2 + Kσ2I +IKσ2C
σ2 + Kσ2I
σ2
SCT = ∑ijk X2ijk - X2... /IJK
CMT = SCT / (IJK-1)
Pruebas de hipótesis:
1)
H0 ≡ σ2I = 0
CMI
∼
CMR
2)
H0 ≡ σ2C = 0
CMC
∼
CMI
3)
FIJ( I(−K1−)(1J) −1)
F( JI −−11)( J −1)
H0 ≡ σ2F = 0
CMF
CMI
∼
F( II −−11)( J −1)
10
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
MODELO DE REGRESIÓN LINEAL
yi = β 0 + β1 X i + ε i
yi : es el valor de la variable dependiente en la prueba i
β0 y β1 : son los parámetros del modelo
Xi : es una constante conocida, el valor de la variable independiente en la
prueba i
εi : representa el error aleatorio
E(yi) =β0 + β1
E(εi) = 0
σ2(εi) = σ2 y
σ(εi, εj) = 0
Los estimadores de mínimos cuadrados de β0 y β1, b0 y b1 se obtendrían a
partir de las expresiones siguientes:
b1 =
∑X
i
Xj −
∑ X i2 −
∑X ∑X
i
n
(∑ X i ) 2
j
=
∑ ( X − X )(Y − Y )
∑(X − X )
i
i
2
i
n
b0 = Y − b1 X
Partición de la desviación total:
^
^
( yi − y ) = ( yi − yi ) + ( yi − y )
S.C.T
Desv. de la
regresión
Resíduo
Desv. debido a
regresión
11
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
yi
Y
y^ i
*
*
y= y
*
X
Tabla del análisis de varianza
Fuentes de Variación
g.l.
Debido a Regresión
1
Desviación de la regresión
n-2
Total
n-1
Suma de Cuadrados
Cuadrados Medios
b1Sxy
CMR= b1Sxy
Sy2 - b1Sxy
CMI = (Sy2 - b1 Sxy)/(n-2)
E(CM)
σ12+ β12 Sx2
σ2
Sy2
El cociente:
(n-2) b1Sxy
(Sy2 - b1 Sxy)
se distribuye como una F con 1 y n-2 grados de libertad y nos permite probar la
hipótesis de si el coeficiente de regresión es o no diferente de cero.
El error típico de b puede ser estimado como:
E.T .(b) =
CM I
Sx 2
12
Mejora Genética de los Animales de Interés Veterinario
www.ucm.es/info/genetvet/
y
yi
y i − y^ i
y^i
y
yi − y
^
α
y
b0
x
13
Descargar