TEMA 7. ESTIMACIÓN 7.1. Introducción y definiciones 7.2. Estimación puntual. Propiedades deseables de los estimadores 7.2.1. Introducción y definiciones 7.2.2. Estimadores Insegados 7.3. Estimación por intervalos de confianza 7.3.1. Introducción 7.3.2. Intervalos de confianza para una población normal 7.3.2.1. Intervalos de confianza para la media 7.3.2.2. Intervalos de confianza para la varianza 7.3.3. Intervalos de confianza para dos poblaciones Normales independientes 7.3.3.1. Intervalos de confianza para la diferencia de medias 7.3.3.2. Intervalos de confianza para el cociente de varianzas 7.3.4. Intervalo de confianza para una proporción 7.3.5. Intervalo de confianza para la diferencia de proporciones 199 7.1. Introducción y definiciones Supongamos que conocemos la distribución de la característica de interés de una población La función de densidad o masa de probabilidad depende del vector de parámetros θ : f(x ; θ) Se desean estimar los parámetros a partir de una muestra ¿Cómo hacer esta estimación? Estimación puntual: Se busca un estimador, que con base a los datos muestrales dé origen a un valor puntual que utilizamos como estimación del parámetro Estimación por intervalos: Se determina un intervalo aleatorio que, de forma probable, contiene el verdadero valor del parámetro. Este intervalo recibe el nombre de intervalo de confianza 200 Ejemplo Sea X una v.a. que estudia el grosor del tronco de un arbusto. Se conoce que dicha variable es normal con desviación típica 1 pero no se conoce la media. X N (µ, 1) ; µ ∈ R El parámetro a estimar es µ 201 7.2. Estimación puntual. Propiedades deseables de los estimadores 7.2.1. Introducción y definiciones Sea X1, …, X n una muestra aleatoria simple con función de densidad f ( x ; θ ) Sea un estadístico T = u ( X 1, …, X n ) El problema es encontrar una función u que proporcione el mejor estimador de θ El estimador, T, del parámetro θ debe tener una distribución concentrada alrededor de θ y la varianza debe ser lo menor posible P[θ −h ≤ T ≤ θ+h] debería ser grande θ−h θ θ+h 202 Error cuadrático medio P[θ −h ≤ T ≤ θ+h] debería ser grande θ−h θ θ+h Para estudiar la variabilidad de los valores del estimador alrededor del parámetro se hace uso de una cantidad llamada error cuadrático medio Definición. Error cuadrático medio T estimador de θ ECM ( T ) = E [( T − θ ) 2 ] = Var [ T ] + [ θ − E [ T ]] 2 203 Ejemplo Sea X1, … , Xn una muestra aleatoria simple (m.a.s.) de una población X de la que se sabe que E[X] = µ y Var[X] = σ2. Sea T = X un estimador de µ. Hallar el error cuadrático medio que se comete. Solución.- ( ECM ( X ) = Var [ X ] + µ − E [ X ] ) 2 Calculamos en primer lugar la esperanza del estimador ∑ Xi E [ X i ] nµ i E[X ] = E =∑ = =µ n n n i Por lo tanto el ECM es 1 ECM ( X ) = Var[ X ] = Var ∑ X i = n i = 1 n 2 ∑ Var[ X i ] = i nσ 2 n 2 = σ2 n 204 7.2.2. Estimadores Insesgados Definición. Sesgo de un Estimador Sea T el estimador del parámetro θ. Se define el sesgo del estimador como θ − E[T] Definición. Estimador Insesgado T es un estimador insesgado de θ si y sólo si E[T] = θ para todo θ NOTA: En este caso ECM ( T ) = Var [ T ] 205 Ejemplo Sea X1, … , Xn una muestra aleatoria simple (m.a.s.) de una población X de la que se sabe que E [ X ] = µ y Var [ X ] = σ2. 1.- Demostrar que X es un estimador insesgado de µ 2.- Demostrar que la cuasivarianza S2 es un estimador insesgado de σ2 Solución 1.- Demostrado en el ejemplo anterior 206 2. 1 1 2 2 2 E S = E ∑ X i − X = E n −1 ∑ ( X i − µ ) − X − µ n 1 − i i ( ( ) 2 1 2 E ∑ ( X i − µ ) + ∑ X − µ − 2∑ ( X i − µ ) X − µ = n −1 i i i ( ) )) ( ( ) 1 2 2 E ( X − µ ) + E ∑ ( X − µ ) − 2 E ( X − µ ) ∑ ( X i − µ ) = n − 1 ∑ i i i i 1 2 2 2 E ( X − µ ) + nE ( X − µ ) − 2nE ( X − µ ) = n − 1 ∑ i i 1 σ2 σ2 2 = − 2n σ +n = n − 1 ∑ n n i ( n − 1)σ 1 2 = nσ + σ 2 − 2σ 2 = n −1 n −1 2 =σ2 207 7.3. Estimación por intervalos de confianza 7.3.1. Introducción Se desea calcular un intervalo aleatorio que contenga al verdadero valor del parámetro, θ, con una cierta probabilidad h1(T) ≤ θ ≤ h2(T) Las funciones h1 y h2 son funciones de un estadístico T relacionado con el parámetro a estimar en cada caso Definición: Nivel de confianza (1−α) El nivel de confianza, 1−α, es la probabilidad de que un intervalo de confianza contenga al verdadero valor del parámetro. P [ h1 ( T ) ≤ θ ≤ h 2 ( T ) ] = 1−α 208 Definición: Intervalos de confianza bilaterales P [ h1(T) ≤ θ ≤ h2(T) ] = 1−α Definición: Intervalos de confianza unilaterales P [θ ≥ h1(T) ] = 1−α P [θ ≤ h2(T) ] = 1−α NOTA: De cada 100 intervalos construidos a partir de 100 muestras, 100 ( 1−α ) % deberían contener al verdadero valor del parámetro. ( θ ) ( ) . . . . . . . . .θ. . . . . . . . ( ( θ Intervalo aleatorio θ fijo ) ) θ 209 7.3.2. Intervalos de confianza para una población normal Se muestrea una población normal para estimar los parámetros de esta población X1, … , X n m.a.s. de una población X X 1, X 2 ,... X n N ( µ, σ ) Independientes entre sí Xi N ( µ, σ ) Se desea estimar alguno de los parámetros, o ambos, según sea o no conocido el otro 210 7.3.2.1. Intervalos de confianza para la media Se desea estimar la media poblacional mediante un intervalo de confianza 2 Varianza poblacional conocida σ 0 Estadístico asociado al parámetro a estudiar µ : T = X (media muestral). Distribución de la media muestral: σ2 X → N µ; 0 n ⇔ Z= (X − µ) → N σ0 ( 0; 1) n P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α α/2 α/2 1−α z1−α / 2 = − zα / 2 zα / 2 211 X − µ) ( P [ − zα / 2 ≤ Z ≤ zα / 2 ] = P − zα / 2 ≤ ≤ zα / 2 = 1 − α σ0 n σ0 σ0 ≤ X − µ ≤ zα / 2 P − zα / 2 = 1−α n n σ0 σ0 ≤ − µ ≤ − X + zα / 2 P − X − zα / 2 = 1−α n n σ0 σ0 ≥ µ ≥ X − zα / 2 P X + zα / 2 = 1−α n n σ0 σ0 ≤ µ ≤ X + zα / 2 P X − zα / 2 = 1−α n n I.C. para µ, con varianza conocida, al nivel de confianza 1−α. σ0 σ0 X − zα / 2 , X + zα / 2 n n 212 I.C. para µ, con varianza conocida, al nivel de confianza 1−α σ0 σ0 X − zα / 2 , X + zα / 2 n n NOTA: • A medida que aumenta el tamaño de la muestra disminuye la amplitud del intervalo • A medida que el nivel de confianza es mayor aumenta la amplitud del intervalo 213 Ejemplo. Se desea estudiar el peso en gramos del fruto producido por una planta. Para ello se tomó una muestra de 16 plantas observando los siguientes pesos: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. El peso del fruto de cada planta es una v.a. Normal con desviación típica 5 gr. Obtener un intervalo de confianza al nivel de confianza 0.9 para el peso medio del fruto de esta planta. Solución.I.C. para µ con varianza conocida al nivel de confianza 1−α σ0 σ0 , X + zα / 2 X − zα / 2 n n x = 503.75; n = 16; σ 02 = 25 ; σ 0 = 5 214 σ0 σ0 , X + zα / 2 X − zα / 2 n n x = 503.75; n = 16; σ 02 = 25 ; σ 0 = 5 1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒ zα / 2 = z0.05 = 1.645 0.05 0.05 0.90 − z 0.05 = −1.645 z 0.05 = 1.645 5 5 503.75 − 1.645 4 , 503.75 + 1.645 4 = = [501.69, 505.81] 215 Varianza poblacional desconocida Estimador: X Distribución muestral: Cuasidesviación típica X − µ) ( T= S S= → t n-1 n 1 2 X − X ( ) n −1 ∑ i i α/2 α/2 1−α t1−α / 2 = −tα / 2 tα / 2 P −tα / 2; n−1 ≤ T ≤ tα / 2; n−1 = 1 − α − X µ ( ) ≤ tα / 2; n−1 = 1 − α P −tα / 2; n−1 ≤ S n 216 X − µ) ( ≤ tα / 2 ; n−1 = 1 − α P −tα / 2; n−1 ≤ S n S S ≤ X − µ ≤ tα / 2; n−1 = 1−α P −tα / 2; n−1 n n S S P − X − tα / 2; n−1 ≤ − µ ≤ − X + tα / 2; n−1 = 1−α n n S S P X + tα / 2; n−1 ≥ + µ ≥ X − tα / 2; n−1 = 1−α n n S S ≤ µ ≤ X + tα / 2; n−1 = 1−α P X − tα / 2; n−1 n n I.C. para µ con varianza desconocida al nivel de confianza 1−α S S X t X t − + , α / 2;n−1 α / 2;n−1 n n 217 Ejemplo. Se desea estudiar el peso en gramos del fruto producido por una planta. Para ello se tomó una muestra de 16 plantas observando los siguientes pesos: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. Del peso del fruto sólo se conoce que es una v.a. Normal. Obtener un intervalo de confianza al nivel de confianza 0.9 para el peso medio del fruto de esta planta. Solución S S , X + tα / 2; n−1 X − tα / 2; n−1 n n I.C. para µ con varianza desconocida al nivel de confianza 1−α x = 503.75 ; s = 6.2022 ; n = 16 s s − + = , x t x t α / 2; n−1 α / 2; n−1 n n 6.2022 6.2022 = 503.75 − 1.75 × = , 503.75 + 1.75 × 4 4 = [501.0319, 506.4681] 218 S S , X + tα / 2; n−1 X − tα / 2; n−1 n n x = 503.75 ; s = 6.2022 ; n = 16 1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒ tα / 2; n−1 = t 0.05;15 = 1.75 0.05 0.90 −t 0.05 = −1.75 0.05 t 0.05 = 1.75 6.2022 6.2022 − + = 503 . 75 1.75 , 503 . 75 1.75 × × 4 4 = [501.0319, 506.4681] 219 7.3.2.2. Intervalos de confianza para la varianza Media poblacional desconocida Estimador: Cuasivarianza S2 = 2 1 Xi − X ∑ n −1 i ( ) Distribución muestral n ∑( Xi − X ) i =1 2 σ2 = ( n − 1) S 2 σ2 → χ n2−1 P χ12−α / 2;n−1 ≤ χ n2−1 ≤ χα2 / 2;n−1 = 1 − α 2 n 1 S − ( ) 2 2 ≤ χα / 2; n−1 = 1 − α P χ1−α / 2; n−1 ≤ σ2 α/2 χ12−α / 2;n −1 1−α α/2 χ α2 / 2;n −1 220 2 n 1 S − ( ) ≤ χα2 / 2; n−1 = 1 − α P χ12−α / 2; n−1 ≤ σ2 2 χ2 χ 1 1−α / 2; n −1 α / 2; n−1 ≤ ≤ = 1−α P n −1 S 2 2 2 − σ 1 n S ( ) ( ) 2 2 ( n − 1) S ( n − 1) S 2 ≥σ ≥ = 1−α P χ2 2 χα / 2; n−1 1−α / 2; n−1 2 2 ( n − 1) S ( n − 1) S P ≤σ2 ≤ = 1−α χ2 2 χ 1−α / 2;n −1 α / 2;n−1 I.C. para σ 2, con media poblacional desconocida, al nivel de confianza 1−α 2 2 ( n 1) S ( n 1) S − − , χ2 2 χ 1−α / 2 ; n −1 α / 2; n−1 221 Ejemplo Se desea estimar la varianza del nivel de nistamina en un ungüento. Se conoce por larga experiencia que su distribución sigue una ley Normal. Se toma una muestra de 9 ungüentos, dando el nivel siguiente (en millones de unidades/gr): 1, 0.9, 1.5, 2.8, 3.1, 3.2, 2.5, 1.9, 2. Estimar la varianza mediante dos intervalos de confianza al nivel de confianza del 99% y del 95%. Solución 1 2 2 s = x − x = 0.74 Cuasivarianza: ( ) ∑ i n −1 i Nivel de confianza: 1 − α = 0.99; α = 0.01; α / 2 = 0.005 2 2 χα2 / 2;n−1 = χ 0.005;8 = 22.0; χ12−α / 2;n−1 = χ 0.995;8 = 1.34 0.005 0.005 0.99 2 χ 0.995;8 = 1.34 χ 20.005;8 = 22.0 2 2 ( n − 1) s , ( n − 1) s = χ2 2 χ 1−α / 2; n−1 α / 2; n−1 = [ 0.2691, 4.4179] 222 Nivel de confianza: 1 − α = 0.95 1 − α = 0.95; α = 0.05; α / 2 = 0.025 s2 = Cuasi-varianza: 1 2 x − x = 0.74 ( ) n −1∑ i i 2 χ α2 / 2 ; n−1 = χ 0.025 ; 8 = 17.5 2 χ 12−α / 2; n−1 = χ 0.975;8 = 2.18 0.025 0.025 0.95 2 χ 0.975;8 = 2.18 χ 20.025;8 = 17.5 2 2 ( n 1) s ( n 1) s − − = , χ2 2 χ α / 2; n−1 1−α / 2; n−1 = [ 0.3383, 2.7156] 223 7.3.3. Intervalos de confianza para dos poblaciones Normales independientes Se muestrean dos poblaciones normales para estimar los parámetros “comparativamente” Sean las variables aleatorias X e Y tales que N ( µX ; σ X ) X N ( µ Y ; σY ) Y Independientes Consideramos: m.a.s. de tamaño nX de X X1, X 2 ,..., X n X , S X2 m.a.s. de tamaño n Y de Y Y , S Y2 x Y1, Y2 ,..., Yn Y Se desean estimar comparativamente los parámetros de ambas poblaciones 224 7.3.3.1. Intervalos de confianza para la diferencia de medias Varianzas poblacionales conocidas Estimador: T = X − Y Distribución muestral: Z= ( X − Y ) − ( µ X − µY ) σ X2 nX + σ Y2 → N (0; 1) nY P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α α/2 α/2 1−α z1−α / 2 = − zα / 2 zα / 2 225 P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α X − Y ) − µ X − µY ( P − zα / 2 ≤ ≤ zα / 2 = 1 − α 2 2 σ σ X Y + n X nY ( ) 2 2 σ σ X Y + ≤ µ X − µY ≤ P X − Y − zα / 2 nX nY 2 2 σ X σY ≤ X − Y + zα / 2 + = 1−α nX nY ( ) ( ) I.C. para µ X − µ Y con varianzas poblacionales conocidas, al nivel de confianza 1−α 2 2 σ σ X Y X −Y ± z + ) α /2 n n ( X Y 226 Ejemplo Se están utilizando normalmente en una granja avícola dos tipos de piensos compuestos A y B. Queriendo comparar la media de engorde con ambos piensos, para un nivel de confianza 0.9, se alimentan a 20 aves durante cierto tiempo con el pienso A obteniéndose una ganancia media de peso de 0.4 Kgr por ave. Simultáneamente a otras 19 aves se les alimenta con el pienso B y se obtiene un engorde medio de 0.5 Kgr. Se conoce por experiencias previas que las variables objeto de estudio, engorde con cada uno de los piensos, son normales con varianzas de 0.05 para el pienso A y 0.1 para pienso B. Estimar la diferencia de engorde medio. Solución n A = 20 ; x A = 0.4 ; 2 = 0.05 σA nB = 19 ; xB = 0.5 ; σ B2 = 0.1 2 σ2 2 σ2 σ σ A + B, x −x +z A+ B x A − xB − zα / 2 A B α /2 n A nB n A nB 227 n A = 20 ; x A = 0.4 ; 2 = 0.05 σA nB = 19 ; xB = 0.5 ; σ B2 = 0.1 2 σ2 2 σ2 σ σ A + B, x −x +z A+ B x A − xB − zα / 2 α /2 A B n A nB n A nB 1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒ zα / 2 = z0.05 = 1.645 0.05 0.90 − z 0.05 = −1.645 0.05 z 0.05 = 1.645 0.05 0.1 0.05 0.1 + , 0.4 − 0.5 + 1.645 + 0.4 − 0.5 − 1.645 = 20 19 20 19 = [ −0.2449, 0.0449] 228 Varianzas poblacionales desconocidas pero iguales σ X2 = σ Y2 Estimador: T = X − Y Distribución muestral T= ( X − Y ) − ( µx − µ y ) Sp Sp = 1 1 + n X nY → tn + n − 2 x y (nx − 1) S x2 + (n y − 1) S y2 nx + n y − 2 P −tα / 2;n X −nY −2 ≤ tn X −nY −2 ≤ tα / 2;n X −nY −2 = 1 − α t nX + nY −2 α/2 1−α t1−α / 2 = −tα / 2 α/2 tα / 2 229 P −tα / 2;n X −nY −2 ≤ tn X −nY −2 ≤ tα / 2;n X −nY −2 = 1 − α X − Y ) − µ X − µY ( ≤ tα / 2; n + n − 2 = P −tα / 2; n + n − 2 ≤ X Y X Y 1 1 + Sp n n X Y ( ) 1 1 P X − Y − tα / 2; n X + nY −2 × S p + ≤ µ X − µY ≤ n X nY 1 1 ≤ X − Y + tα / 2; n X + nY − 2 × S p + = 1−α n X nY I.C. para µx−µy, al nivel de confianza 1−α, con varianzas poblacionales desconocidas pero iguales y muestra pequeñas 1 1 + X − Y ± tα / 2; n X + nY − 2 × S p n X nY 230 Ejemplo Se están utilizando normalmente en una granja avícola dos tipos de piensos compuestos A y B. Queriendo comparar la media de engorde con ambos piensos, para un nivel de confianza 0.9, se alimentan a 22 aves durante cierto tiempo con el pienso A obteniéndose una ganancia media de peso de 0.4 Kgr por ave con una varianza de 0.03. Simultáneamente a otras 20 aves se les alimenta con el pienso B y se obtiene un engorde medio de 0.5 Kgr con una varianza de 0.09. Se conoce por experiencias previas que las variables objeto de estudio, engorde con cada uno de los piensos, son normales con varianzas poblacionales iguales. Estimar la diferencia de engorde medio. Solución 1 1 + x A − xB ± tα / 2;n A + nB − 2 × s p n n A B n A = 22 ; x A = 0.4 ; σˆ A2 = 0.03 nB = 20 ; xB = 0.5 ; σˆ B2 = 0.09 231 n A = 22 ; x A = 0.4 ; σˆ A2 = 0.03 nB = 20 ; xB = 0.5 ; σˆ B2 = 0.09 nA ˆ 2 2 sA = σ A = 0.0316 ; nA − 1 nB ˆ 2 2 sB = σ B = 0.095 nB − 1 1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒ tα / 2; n A + nB − 2 = t 0.05;40 = 1.684 sp = 2 2 (n A − 1) s A + (nB − 1) sB n A + nB − 2 = 0.2484 t nX + nY −2 = t40 0.05 0.90 −t 0.05 = −1.684 0.05 t0.05 = 1.684 1 1 + x A − xB ± tα / 2;n A + nB − 2×s p n A nB = = [ −0.2292, 0.0292] 232 Varianzas poblacionales desconocidas 2 2 pero iguales, σ X = σ Y Tamaños muestrales grandes Estimador: T = X − Y Distribución muestral: Z= ( X − Y ) − ( µ X − µY ) S X2 nX + S Y2 n X , nY → ∞ → N (0; 1) nY P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α α/2 α/2 1−α z1−α / 2 = − zα / 2 zα / 2 NOTA: La aproximación se considera correcta para n X y n Y > 30 233 P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α X − Y ) − µ X − µY ( ≤ zα / 2 = 1 − α P − zα / 2 ≤ 2 2 S X SY + n n X Y ( ) 2 2 S S X Y + ≤ µ X − µY ≤ P X − Y − zα / 2 n X nY 2 2 S X SY ≤ X − Y + zα / 2 + = 1−α n X nY ( ) ( I.C. para ) µX − µY, al nivel de confianza 1−α, con varianzas poblacionales desconocidas y muestras grandes X −Y ± z ) α /2 ( S Y2 + n X nY 2 SX 234 Ejemplo Se están utilizando normalmente en una granja avícola dos tipos de piensos compuestos A y B. Queriendo comparar la media de engorde con ambos piensos, para un nivel de confianza 0.9, se alimentan a 100 aves durante cierto tiempo con el pienso A obteniéndose una ganancia media de peso de 0.5 Kgr por ave con una cuasivarianza de 0.08. Simultáneamente a otras 120 aves se les alimenta con el pienso B y se obtiene un engorde medio de 0.2 Kgr con una cuasivarianza de 0.09. Estimar la diferencia de engorde medio. Solución s 2A s B2 ( x − x ) ± z + B α /2 A n A nB nA = 100 ; x A = 0.5 ; s 2A = 0.08 nB = 120 ; xB = 0.2 ; sB2 = 0.09 235 nA = 100 ; x A = 0.5 ; s 2A = 0.08 nB = 120 ; xB = 0.2 ; sB2 = 0.09 1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒ zα / 2 = z0.05 = 1.645 0.05 0.90 − z 0.05 = −1.645 0.05 z 0.05 = 1.645 S A2 S B2 ( x − x ) ± z = + A B /2 α n A nB 0.08 0.09 0.08 0.09 = 0.5 − 0.2 − 1.645 + , 0.5 − 0.2 + 1.645 + = 100 120 100 120 = [ 0.2352, 0.3648] 236 7.3.3.2. Intervalos de confianza para el cociente de varianzas: σ X2 / σ Y2 nX T= Estimador: S X2 S Y2 ( ) 2 1 Xi − X ∑ n X − 1 i =1 = nY 2 1 Yi − Y ∑ nY − 1 i =1 ( ) Distribución muestral S X2 F= S Y2 σ X2 = σ Y2 S X2 σ Y2 S Y2 σ X2 → Fn X −1, nY −1 P F1−α / 2; nX −1, nY −1 ≤ F nX −1, nY −1 ≤ Fα / 2; nX −1, nY −1 = 1 − α α/2 1−α F1−α / 2; n X −1, nY −1 α/2 Fα / 2; n X −1, nY −1 237 P F1−α / 2; nX −1, nY −1 ≤ F nX −1, nY −1 ≤ Fα / 2; nX −1, nY −1 = 1 − α σ Y2 S X2 ≤ Fα / 2; nX −1, nY −1 = 1 − α P F1−α / 2; nX −1, nY −1 ≤ σ X2 S Y2 2 S Y2 σ Y2 S ≤ ≤ Fα / 2; nX −1, nY −1 Y P F1−α / 2; nX −1, nY −1 2 2 SX SX σ 2X 1 P F1−α / 2; n −1, n −1 X Y S X2 1 P Fα / 2; n −1, n −1 X Y 2 σ X2 S X2 = 1−α = 1−α ≥ ≥ S Y2 σ Y2 S Y2 Fα / 2; nX −1, nY −1 σ 2X 2 1 = 1−α ≤ ≤ 2 2 2 SY σ Y S Y F1−α / 2; nX −1, nY −1 SX SX 1 238 1 P Fα / 2; n −1, n −1 X Y 2 σ 2X 2 1 = 1−α ≤ ≤ 2 2 2 SY σ Y S Y F1−α / 2; nX −1, nY −1 SX 1 F1−α / 2; nX −1, nY −1 1 P F1−α / 2; n −1, n −1 X Y S X2 SX = Fα / 2; nY −1, n X −1 σ 2X S X2 ≤ ≤ Fα / 2; nY −1, n X −1 = 1−α 2 2 2 SY SY σY 2 2 I.C. para σ X / σ Y con medias poblacionales desconocidas, al nivel de confianza 1−α 1 Fα / 2; nX −1, nY −1 2 SX , Fα / 2 ; nY −1 , n X −1 SY2 SY2 2 SX 239 Ejemplo Una central lechera recibe diariamente leche de dos granjas A y B. Deseando estudiar la calidad de los productos se eligen dos muestras al azar de la leche suministrada por cada una de las granjas analizando el contenido en grasa. Para la granja A se han tomado 11 muestras obteniéndose una cuasivarianza de 0.034, mientras que para la granja B ha sido de 0.027 en un total de 16 muestras. Es conocido por experiencias previas que los contenidos medios en grasa de la granjas son normales e independientes. Estimar el cociente de varianzas al nivel de confianza de 0.98. Solución 1 Fα / 2; nA −1, n B −1 s 2A s 2A , F / 2; 1, 1 α n − n − B A s B2 s B2 n A = 11 ; s A2 = 0.034 ; nB = 16 ; sB2 = 0.027 240 n A = 11 ; s A2 = 0.034 ; nB = 16 ; sB2 = 0.027 1 − α = 0.98; α = 0.02; α 2 = 0.01 ⇒ Fα / 2; n A −1, nB −1 = F 0.01;10, 15 = 3.80 Fα / 2; nB −1, n A −1 = F 0.01;15, 10 = 4.56 1 Fα / 2; nA −1, n B −1 s 2A s 2A = , F / 2; 1, 1 α n − n − B A s B2 s B2 0.034 1 0.034 × = = [ 0.3314, 5.7422] , 4.56 × 0.027 3.80 0.027 241 7.3.4. Intervalo de confianza para una proporción Se muestrea una población para estimar el parámetro proporción p : proporción de éxitos en la población X : “número de éxitos en n realizaciones independientes” n conocido X B (n; p) Parámetro a estimar: p Estimador puntual de p: p̂ = X / n Distribución asintótica ( n → ∞ ): n → ∞ X → N ( np ; npˆ (1 − pˆ ) ) pˆ (1 − pˆ ) X n→∞ pˆ = → N p; n n Z= pˆ − p pˆ ( 1 − pˆ ) n n → ∞ → N ( 0; 1) 242 pˆ − p Z= pˆ (1 − pˆ ) n α/2 n→∞ → N (0;1) α/2 1−α z1−α / 2 = − zα / 2 zα / 2 P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α P [ − zα / 2 ≤ pˆ − p ≤ zα / 2 ] = 1 − α pˆ (1 − pˆ ) n pˆ (1 − pˆ ) pˆ (1 − pˆ ) P pˆ − zα / 2 ≤ p ≤ pˆ + zα / 2 = 1−α n n I.C. para el parámetro proporción, al nivel 1−α pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + zα / 2 pˆ − zα / 2 n n 243 Ejemplo Se ignora la proporción de ranas tigre que se encuentran en una región de México. Para dar una estimación se ha tomado una muestra de 100 ranas observando que 15 de ellas son de este tipo. Hallar un intervalo de confianza al nivel de confianza del 0.95 para la proporción de ranas tigre. Solución 15 pˆ = = 0.15 100 ; zα / 2 = z0.025 = 1.96 pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + zα / 2 pˆ − zα / 2 = n n 0.15 × 0.85 0.15 × 0.85 , 0.15 + 1.96 = 0.15 − 1.96 = 100 100 = [ 0.081, 0.219] 244 7.3.5. Intervalo de confianza para la diferencia de proporciones Se muestrean dos poblaciones independientes para estimar la diferencia de proporciones p1 − p2 : diferencia de proporciones de éxitos en la población X : “número de éxitos en n realizaciones independientes” Y : “número de éxitos en m realizaciones independientes” nX y nY conocidos Parámetro a estimar : p1 − p 2 p1 − p 2 = X n X − Y nY Estimador puntual de p1 − p 2 : Distribución asintótica X Y p1 − p 2 = − n X nY ( ( n X , nY ) → ∞ : ∞ → n X , nY → ) ( p1 1 − p1 p2 1− p2 + N p1 − p2 ; nX nY ) 245 Z= p 2 ) − ( p1 − p 2 ) ( p1 − n ,n → ∞ → N (0; 1) p1 (1 − p1 ) p 2 (1 − p2 ) + X nX Y nY α/2 α/2 1−α z1−α / 2 = − zα / 2 zα / 2 P [ − zα / 2 ≤ Z ≤ zα / 2 ] = P − zα 2 ≤ − p1 − p 2 ≤ zα 2 = 1 − α p2 1 − p2 + nY p2 ) ( ) ( p1 − p1 (1 − p1 ) ( ) nX 246 P − zα 2 ≤ − p1 − p 2 ≤ = 1 − α p2 1 − p2 + nY p2 ) ( ) ( p1 − p1 (1 − p1 ) ( ) nX ( ) ( ) ( p 1 p p 1 p2 − − 1 1 2 P p1 − p 2 − zα 2 + ≤ p1 − p 2 ≤ nX nY ( ) ( ) p1 − p 2 + zα 2 ≤ ( p1 1 − p1 nX ) ( ) ) p2 1 − p2 + = 1−α nY I.C. para la diferencia de proporciones, al nivel de confianza 1−α ( ) ( p 1 p p 1 p2 − − 1 1 2 + p1 − p 2 ± zα 2 nX nY ( ) ) 247 Ejemplo Se desean comparar las proporciones de ranas pipiens que se encuentran en dos regiones independientes de México. Para dar una estimación se ha tomado una muestra de 80 ranas observando que 5 de ellas son de este tipo en la zona A, habiendo 8 de 100 en la zona B. Hallar un intervalo de confianza al nivel de confianza del 0.95 para la diferencia de proporciones de ranas pipiens. Solución 5 p1 = = 0.0625 ; 80 8 p2 = = 0.08 ; 100 zα / 2 = z 0.025 = 1.96 n X = 80 ; ( ) nY = 100 ( p 1 p p 1 p2 − − 1 1 2 − + p p 2 ± zα / 2 1 nX nY ) = 0.0625 − 0.08 ± 1.96 0.0625(1 − 0.0625) + 0.08(1 − 0.08) 80 100 = = [ −0.0926, 0.0576] 248