Capı́tulo 5 Intervalos de confianza Como su nombre indica, el objetivo de un estadı́stico puntual para un parámetro desconocido de una población, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Difı́cilmente esta estimación acertará con el valor exacto del parámetro. No obstante, la pretensión de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximación razonable” del mismo. En esta lı́nea surgen los intervalos de confianza, para un nivel de confianza dado. 1. Definiciones Definición 1.1. Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con función de masa Pθ (o función de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Un estimador por intervalos de confianza de θi (al nivel de confianza 1 − α), es una función que a cada posible muestra x1 � . . . � xN le hace corresponder un intervalo (T1 � T2 ) = (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )), tal que, para todo θ ∈ Θ: � � � � Pθ θi ∈ (T1 � T2 ) = Pθ (x1 � . . . � xN ) : θi ∈ (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )) = 1 − α . Para la construcción de intervalos de confianza, usaremos cantidades pivotales. Definición 1.2. Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con función de masa Pθ (o función de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Una cantidad pivotal para θi es una función C(X1 � . . . � XN ; θi ) tal que su distribución no depende de θ. Una vez obtenida una cantidad pivotal C(X1 � . . . � XN ; θi ), la construcción de un intervalo para estimar es el siguiente: - se eligen dos valores� c1 y c2 tales que: � � Pθ (x1 � . . . � xN ) : c1 < C(X1 � . . . � XN ; θi ) < c2 = 1 − α . Obsérvese que c1 y c2 no dependen de θ, al ser C(X1 � . . . � XN ; θi ) una cantidad pivotal. - Despejamos θi de las desigualdades c1 < C(X1 � . . . � XN ; θi ) < c2 . Obtenemos ası́ un estimador por intervalos de confianza para θi . Obsérvese que la cantidad pivotal debe ser continua y monótona en θi . Necesitaremos, pues, obtener cantidades pivotales, y en este capı́tulo describiremos la construcción para los modelos más importantes. 83 84 2. CAPÍTULO 5. INTERVALOS DE CONFIANZA Poblaciones normales Sea X ∼ N (µ ; σ), y (X1 � . . . � XN ) una muestra aleatoria de dicha población. El estimador media muestral, X̄, tiene las siguientes propiedades: E[X̄] = E[X] = µ � V [X̄] = V [X] σ = . N N Por otra parte, X1 � . . . � XN son variables aleatorias independientes, todas con la misma distribución, N (µ ; σ), y ası́ √ X̄ ∼ N (µ ; σ/ N ) . Por otra parte, el estimador cuasi–varianza muestral N S2 = 1 � (Xi − E[X̄])2 N − 1 i=1 tiene esperanza E[S 2 ] = σ 2 . Necesitaremos conocer la distribución seguida por este estadı́stico. Se tiene la siguiente definición: Definición 2.1. �Distribución χ2 ) Sean Z1 � . . . � ZN variables aleatorias independientes, todas con distribución N (0 ; 1). La distribución χ2 de Pearson con N grados de libertad (abreviadamente χ2N ) es la distribución de la variable aleatoria N � Zi2 . i=1 Esta distribución está asociada a la distribución normal, y sus valores vienen dados por una tabla. Es claro que si (X1 � . . . � XN ) es una muestra aleatoria de una población X ∼ N (µ ; σ), entonces: N −1 2 S = σ2 = N � (Xi − µ)2 i=1 N � i=1 σ2 de manera que: N (Xi − X̄)2 � (Xi − µ + µ − X̄)2 = σ2 σ2 i=1 N � (Xi − µ)2 i=1 N � ∼ χ2N σ2 N � � (X̄ − µ)2 X̄ − µ � � −2 − µ) + (X i σ2 σ2 i=1 (X̄ − µ)2 (X̄ − µ)2 (Xi − µ)2 − 2N + N σ2 σ2 σ2 i=1 � �2 N � (X̄ − µ)2 (Xi − µ)2 X̄ − µ 2 √ = −N = χN − ∼ χ2N −1 . 2 2 σ σ σ/ N i=1 = Para evitar confusiones, denotaremos por S 2 a la variable aleatoria cuasi–varianza muestral, y por VX la varianza muestral. Se tiene la siguiente propiedad: 2. POBLACIONES NORMALES 85 Propiedad: [Lema de Fisher] Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con distribución N (µ ; σ). Entonces: √ X̄ ∼ N (µ ; σ/ N ) ; N −1 2 S ∼ χ2N −1 ; 2 σ y, además, X̄ y S 2 son independientes. Igual que para la distribución de la cuasi–varianza de N variables aleatorias independientes con igual distribución N (µ � σ), hemos introducido una nueva distribución, necesitaremos las siguientes nuevas definiciones. Definición 2.2. �Distribución t de Student) Sean Y , X1 � . . . � XN variables aleatorias independientes, todas con distribución N (0 ; 1). La distribución t de Student con N grados de libertad (abreviadamente tN ) es la distribución de la variable aleatoria � 1 N Y �N 2 i=1 Xi =� Y 1 N . χ2N Definición 2.3. �Distribución F de Fisher–Snedecor) Sean X1 � . . . � Xm , Y1 � . . . � Yn variables aleatorias independientes, todas con distribución N (0 ; 1). La distribución F de Fisher–Snedecor con m y n grados de libertad (abreviadamente Fm;n ) es la distribución de la variable aleatoria 1 m 1 n 2.1. �m X2 �ni=1 2i = i=1 Yi 1 m 1 n χ2m . χ2n Cantidades pivotales en poblaciones normales Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la construcción de estimadores por intervalos de confianza, para el caso de una población X ∼ N (µ ; σ). Distinguiremos el caso de un muestra y el de dos muestras. Cantidades pivotales para el caso de una muestra a) Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ), con σ conocido. Entonces: X̄ − µ √ ∼ N (0 ; 1) y es una cantidad pivotal para µ. σ/ N b) Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ). Entonces: X̄ − µ √ ∼ tN −1 es una cantidad pivotal para µ S/ N N −1 2 S ∼ χ2N −1 es una cantidad pivotal para σ 2 . σ2 86 CAPÍTULO 5. INTERVALOS DE CONFIANZA Obsérvese que si (X1 � . . . � XN ) es una muestra aleatoria de una población N (µ ; σ), entonces: X̄ − µ √ X̄ − µ σ/ N � = √ ∼ tN −1 1 N −1 2 S/ N S 2 N −1 σ por definición de la distribución t de Student con N − 1 grados de libertad. Cantidades pivotales para el caso de dos muestras a) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ), respectivamente. Entonces: donde X̄ − Ȳ − (µ1 − µ2 ) � ∼ tm+n−2 y es una cantidad pivotal para µ1 − µ2 Sp m1 + n1 2 (m − 1)SX + (n − 1)SY2 m+n−2 2 y SY2 , puede interpretarse como una ponderación de las cuasi–varianzas muestrales SX correspondientes a cada una de las muestras. Sp2 = b) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ), respectivamente. Entonces: 2 SX /σ12 ∼ Fm−1;n−1 y es una cantidad pivotal para σ12 /σ22 . SY2 /σ22 Obsérvese que, en la situación descrita para dos muestras: 1 m−1 2 SX S 2 /σ 2 m − 1 σ12 = X2 12 ∼ Fm−1;n−1 1 n−1 2 SY /σ2 SY n − 1 σ22 de ahı́ la afirmación del apartado b). La comprobación del primer apartado excede el nivel de este curso, y no se abordará. 2.2. Intervalos de confianza en poblaciones normales Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de confianza para los parámetros de una población normal. Distinguiremos diferentes casos: Primer caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ), con σ conocido. Entonces: � σ σ � X̄ − zα/2 √ � X̄ + zα/2 √ N N es un intervalo de confianza para µ �al nivel 1−α), siendo zα el valor que verifica P (Z > zα ) = α, para Z ∼ N (0 ; 1). 2. POBLACIONES NORMALES 87 Segundo caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ). Entonces: S S � es un intervalo de confianza para µ �al nivel 1−α), X̄ −tN −1 ; α/2 √ � X̄ +tN −1 ; α/2 √ N N siendo tN ; α el valor que verifica que P (tN > tN ; α ) = α. � (N − 1)S 2 (N − 1)S 2 � es un intervalo de confianza para σ 2 �al nivel 1 − α), siendo b) � χ2N −1 ; α/2 χ2N −1 ; 1−α/2 χ2N ; α el valor que verifica: P (χ2N > χ2N ; α ) = α. a) � Tercer caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales con igual desviación tı́pica: X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ) , respectivamente. Entonces: � � � � 1 1 1 1 + � X̄ − Ȳ + tm+n−2 ; α/2 Sp + X̄ − Ȳ − tm+n−2 ; α/2 Sp m n m n es un intervalo de confianza para la diferencia de medias, µ1 − µ2 �al nivel 1 − α). Cuarto caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales: X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ) , respectivamente. Entonces: � � 2 2 SX /SY2 /SY2 SX � Fm−1 ; n−1 ; α/2 Fm−1 ; n−1 ; 1−α/2 es un intervalo de confianza para la razón de varianzas, σ12 /σ22 �al nivel 1 − α), siendo Fm ; n ; α el valor que verifica: P (Fm ; n > Fm ; n ; α ) = α. Observación: En el manejo de las tablas correspondientes a la distribución Fm ; n , conviene tener en cuenta la siguiente relación (obsérvese el cambio de orden en los grados de libertad): Fm ; n ; 1−α = Fn ;1m ; α . 2.3. Ejemplos Ejemplo 36 Una empresa fabrica bombillas cuya duración en horas sigue una distribución N (µ ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constrúyase un intervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa fábrica. Solución: Tenemos una muestra de tamaño N = 36 de una población, X ∼ N (µ ; 200), de varianza conocida. Usaremos la cantidad pivotal: X̄ − µ ∼ N (0 ; 1) ; 200/6 y, para α = 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral x̄ = 7000. En otras palabras, consideramos la igualdad: � � 7000 − µ P −c< < c = 1 − α = 0.99 . 200/6 88 CAPÍTULO 5. INTERVALOS DE CONFIANZA De la tabla para una N (0 ; 1) se tiene c = zα/2 ≈ 2.58 (pues α/2 = 0.005). Construimos el intervalo de confianza para µ, al nivel del 99 %, despejando µ en las desigualdades: −2.58 < 7000 − µ < 2.58 200/6 de manera que: 21000 + 258 21258 200 2.58 = = = 7086 6 3 3 21000 − 258 20742 200 2.58 = = = 6914 µ > 7000 − 6 3 3 µ < 7000 + (de la desigualdad izquierda) (de la desigualdad derecha) Resumiendo, el intervalo de confianza para µ al nivel del 99 % para la muestra dada es: � � 200 200 2.58� 7000 + 2.58 = (6914 � 7086) . I = 7000 − 6 6 Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviación tı́pica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribución N (µ ; σ), obténgase un intervalo de confianza al 99 � del contenido medio de nicotina por cigarrillo en esa marca. Solución: En este caso se quiere estimar µ en una población N (µ ; σ), con ambos parámetros desconocidos. Partimos de una muestra de tamaño N = 16, con x̄ = 1.6 y cuasi–desviación tı́pica muestral � 16 s = 0.72 ≈ 0.723 . 15 Sabemos que en este caso hemos de usar la cantidad pivotal: 1.6 − µ x̄ − µ √ = 0.723/4 s/ N que sigue una distribución t de Student con N − 1 = 15 grados de libertad. Para la muestra dada, el intervalo de confianza para µ al nivel de confianza 1 − α queda � s s � � 0.723 0.723 � = 1.6 − t15 ; α/2 � x̄ − tN −1 ; α/2 √ � x̄ + tN −1 ; α/2 √ � 1.6 + t15 ; α/2 4 4 N N siendo t15 ; α/2 el valor tal que P (t15 > t15 ; α/2 ) = α/2. Como en nuestro caso 1 − α = 0.99 entonces α = 0.01 y ası́, de la correspondiente tabla para la distribución t de Student, obtenemos: t15 ; α/2 = t15 ; 0.005 = 2.947 . El intervalo que nos piden es pues: � � 0.723 0.723 0.723 � 0.723 � = 1.6 − 2.947 1.6 − t15 ; α/2 � 1.6 + t15 ; α/2 � 1.6 + 2.947 4 4 4 4 ≈ (1.6 − 0.5327� 1.6 + 0.5327) = (1.0673� 2.1327) . 2. POBLACIONES NORMALES 89 Observación: En este ejemplo hemos tenido que calcular la cuasi–desviación tı́pica muestral a √ partir de la desviación tı́pica muestral. Si seguimos el uso dado, denotando por v la desviación � tı́pica muestral, vemos que: √ √ √ v NN−1 s v N v √ = √ =√ √ =√ N −1 N N N N −1 Podrı́amos haber expresado el intervalo de confianza utilizando la desviación tı́pica muestral: √ √ � � v v x̄ − tN −1 ; α/2 √ � x̄ + tN −1 ; α/2 √ � N −1 N −1 pero no usaremos esta expresión, para no liar la notación. Tan sólo hemos de tener cuidado al tomar los datos del problema. Ejemplo 38 Una muestra aleatoria de una población N (µ ; σ) ha dado los diez valores siguientes 6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6 . Constrúyase un intervalo de confianza de σ 2 al 95 � . Solución: Estamos ante una población N (µ ; σ) de la que desconocemos ambos parámetros. Para estimar por intervalos de confianza σ 2 usaremos la cantidad pivotal N −1 2 S σ2 que sabemos sigue una distribución χ2 con N − 1 grados de libertad. Ası́, de la muestra dada, tan sólo usaremos la cuasi–varianza muestral: N 1 � S2 = (Xi − X̄)2 . N − 1 i=1 Los siguientes cálculos dan con ella: 76.6 x̄ = = 7.66 10 1 (6.92 +5.72 +8.42 +9.32 +7.22 +8.52 +7.42 +9.12 +6.52 +7.62 ) − 7.662 varianza muestral: v = 10 598.82 = − 58.6756 = 59.882 − 58.6756 = 1.2064 10 10 12.064 ≈ 1.34 . s2 = v = 9 9 Para construir el intervalo pedido � (N − 1)s2 (N − 1)s2 � � χ2N −1 ; α/2 χ2N −1 ; 1−α/2 hemos de calcular χ2N −1 ; α/2 y χ2N −1 ; 1−α/2 , con N − 1 = 9, α/2 = (1 − 0.95)/2 = 0.025. Estos valores son, respectivamente: χ29 ; 0.025 = 19.023 ; χ29 ; 1−0.025 = χ29 ; 0.975 = 2.7 . Sustituyendo en la expresión del intervalo de confianza para estimar σ 2 al nivel pedido, se obtiene: � � 9 · 1.34 9 · 1.34 � ≈ (0.634� 4.467) � 19.023 2.7 como intervalo de confianza para estimar σ 2 al nivel del 95 %. 90 CAPÍTULO 5. INTERVALOS DE CONFIANZA Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuación media de 76 con desviación tı́pica 6, y 28 del curso con hora complementaria una puntuación media de 84 con desviación tı́pica 5. Obténgase un intervalo de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales. Solución: En las condiciones dadas es aplicable el intervalo � � � � 1 1 1 1 X̄ − Ȳ − tm+n−2 ; α/2 Sp + � X̄ − Ȳ + tm+n−2 ; α/2 Sp + m n m n con 15 540 = 14 14 700 2 2 28 n = 28 ; ȳ = 84 ; sY = 5 = 27 27 m = 15 ; x̄ = 76 ; s2X = 62 y (m − 1)s2X + (n − 1)s2Y m+n−2 540 14 14 + 27 700 1240 27 = = 15 + 28 − 2 41 s2p = Sustituyendo α = 1 − 0.9 = 0.1, obtenemos, de la tabla para una distribución t de Student con 15 + 28 − 2 = 41 grados de libertad1 : t41 ; α/2 = t41 ; 0.05 ≈ 1.684 En definitiva, el intervalo de confianza para σ 2 al 90 %, dadas las dos muestras, es: � � � � � � 1240 28 + 15 1240 28 + 15 � 76 − 84 + 1.684 76 − 84−1.684 41 28 · 15 41 28 · 15 � � � � 1240 · 43 1240 · 43 � −6 + 1.684 = − 6 − 1.684 41 · 28 · 15 41 · 28 · 15 � � � � 62 · 43 62 · 43 � −6 + 1.684 ≈ (−8.9633� −3.0367) . = − 6 − 1.684 41 · 21 41 · 21 Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 N2 = 11 x̄1 = 4 x̄2 = 5 s1 = 3 s2 = 2.2 . Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N (µi ; σi ), para i = 1� 2, obtener un intervalo de confianza para el cociente de varianzas al nivel 0.80 . 1 En la tabla entregada en clase este dato está mal escrito: deberı́a poner 1.684 en lugar de 1.648. 3. OTRAS POBLACIONES 91 Solución: Un intervalo de confianza para el cociente σ12 /σ22 , al nivel 0.80 = 1 − α con α = 0.2, será: � � S12 /S22 S12 /S22 � FN1 −1 ; N2 −1 ; 0.1 FN1 −1 ; N2 −1 ; 0.9 De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1): F12 ; 10 ; 0.1 = 2.2841 ; El intervalo queda: 3. � y: F12 ; 10 ; 0.9 = 32 /2.22 32 /2.22 � 2.2841 1/2.1878 � 1 1 = ≈ 0.4571 . F10 ; 12 ; 0.1 2.1878 ≈ (0.8141� 4.0682) . Otras poblaciones Cuando la muestra se obtiene de poblaciones con distribución Bernoulli, o de Poisson, usaremos intervalos de confianza asintóticos, para ponernos en la situación anterior. Para ello las cantidades pivotales utilizadas tendrán una distribución lı́mite (cuando N → ∞) independiente de parámetros desconocidos. Intervalos de confianza para una distribución de Bernoulli Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ B(1 ; p). Entonces: � � � � p� (1 − p�) p� (1 − p�) X̄ − zα/2 � X̄ + zα/2 N N es un intervalo de confianza para p �al nivel 1 − α), siendo p� = X̄ =“frecuencia relativa de éxitos”. Estamos utilizando la siguiente cantidad pivotal asintótica: � X̄ − p p�(q − p�)/N ∼ N (0 ; 1) (aproximadamente, para N grande) . Intervalos de confianza para una distribución de Poisson Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ Poisson (λ). Entonces: � � � � � � X̄ − zα/2 λ/N � X̄ + zα/2 λ/N � = X̄. es un intervalo de confianza para λ �al nivel 1 − α), siendo λ En este caso, la cantidad pivotal asintótica es: X̄ − λ � ∼ N (0 ; 1) (aproximadamente, para N grande) . � λ/N 92 4. CAPÍTULO 5. INTERVALOS DE CONFIANZA Mı́nimo tamaño muestral Un problema muy relacionado con la construcción de intervalos de confianza es el de determinar el mı́nimo tamaño muestral necesario para obtener una determinada precisión en nuestra estimación. Es decir, cuántos elementos tenemos que observar, al menos, para que el error cometido con la estimación no supere cierta cantidad. Definición 4.1. El error de una estimación por intervalos de confianza (al nivel 1 − α) es la semi– amplitud del intervalo obtenido. Ejemplo 41 Determinar el mı́nimo tamaño muestral de una población N (µ ; σ = 5), para que el error de la estimación por intervalos de confianza para µ al 95 �, no sea superior a 0.5. Solución: Estimaremos µ mediante un intervalo de confianza de la forma: � � σ σ X̄ − zα/2 √ � X̄ + zα/2 √ N N con lo cual el error cometido será σ Error = zα/2 √ . N Siendo α = 1 − 0.95 = 0.05, α/2 = 0.025y σ = 5, se quiere obtener el mı́nimo valor de N para que: 5 5 z0.025 √ = 1.96 √ ≤ 0.5 N N de donde: N≥ � 5 · 1.96 �2 0.5 = 19.62 = 384.16 . Es decir, necesitaremos observar 385 elementos para conseguir la precisión deseada (error ≤ 0.5) para esa estimación. Para otros intervalos, un cálculo similar nos llevarı́a a determinar, en cada caso, el mı́nimo tamaño muestral. Téngase en cuenta que este mı́nimo tamaño muestral ha de tomarse como un valor orientativo. Ası́, si obtenemos, para determinada precisión, un mı́nimo tamaño muestral de 196, entenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el mı́nimo tamaño muestral depende de la muestra concreta obtenida. 5. Intervalos de confianza más frecuentes Recogemos por último, los intervalos de confianza antes obtenidos, y algún otro, en una lista esquemática. Se utiliza la siguiente notación (X1 � . . . � Xn ) muestra aleatoria (m.a.) de X. n 1� x̄ = xi � n i=1 n 1 � s = (xi − x̄)2 � n − 1 i=1 2 I = (a ± �) = (a − �� a + �) 5. INTERVALOS DE CONFIANZA MÁS FRECUENTES 93 1. X ∼ N (µ� σ) � � σ √ I = x̄ ± z α/2 n Intervalo de confianza 1 − α para µ: � � s I = x̄ ± tn−1;α/2 √ n � Intervalo de confianza 1 − α para σ 2 : I = 2. X ∼ B(1� p) (muestras grandes). Intervalo de confianza 1 − α para p: I = 3. X ∼ P (λ) (muestras grandes). Intervalo de confianza 1 − α para λ: I = � σ desconocida (n − 1)s2 (n − 1)s2 � χ2n−1;α/2 χ2n−1;1−α/2 x̄ ± zα/2 � σ conocida � x̄(1 − x̄) n � � � � x̄ x̄ ± zα/2 n 4. Dos poblaciones Normales independientes X ∼ N (µ1 � σ1 ), Y ∼ N (µ2 � σ2 ) independientes (X1 � . . . � Xn1 ) m.a. de X; se calcula x̄ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula ȳ y s22 . s2p = (n1 − 1) s21 + (n2 − 1) s22 n1 + n2 − 2 Intervalo de confianza 1 − α para µ1 − µ2 : � � 2 2 σ1 σ2 I = x̄ − ȳ ± zα/2 + n 1 n2 I= � x̄ − ȳ ± tn1 +n2 −2;α/2 sp � I = x̄ − ȳ ± tf ;α/2 � � 1 1 + n1 n2 s2 s21 + 2 n1 n2 donde f = entero más próximo a Intervalo de confianza 1 − α para σ1 , σ2 conocidas � σ1 � σ2 desconocidas, σ1 = σ2 σ1 � σ2 desconocidas, σ1 �= σ2 (s21 /n1 + s22 /n2 )2 �s21 /n1 )2 n1 +1 σ12 /σ22 : + �s22 /n2 )2 n2 +1 I= � −2 s21 /s22 Fn1 −1;n2 −1;α/2 � (s21 /s22 ) Fn2 −1;n1 −1;α/2 � 94 CAPÍTULO 5. INTERVALOS DE CONFIANZA 5. Comparación de proporciones (muestras grandes e independientes) X ∼ B(1� p1 ), Y ∼ B(1� p2 ), independientes. (X1 � . . . � Xn1 ) m.a. de X; se calcula x̄ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula ȳ y s22 . � Intervalo de confianza 1 − α para p1 − p2 : I = x̄ − ȳ ± zα/2 � x̄ (1 − x̄) ȳ (1 − ȳ) + n1 n2 6. Datos emparejados (X� Y ) ∼ Normal bivariante (µ1 � µ2 � σ1 � σ2 � ρ). (X1 � Y1 )� . . . � (Xn � Yn ) m.a. de (X� Y ).� � � D = X − Y ∼ N µ = µ1 − µ2 � σ = σ12 + σ22 − 2 ρ σ1 σ2 (D1 � . . . � Dn ) m.a. de D, donde Di = Xi − Yi . Intervalos de confianza 1 − α para µ ó σ: aplicar Apartado 1 a la variable aleatoria D 5. INTERVALOS DE CONFIANZA MÁS FRECUENTES 95 Problemas 1. En una población se desea conocer la probabilidad de que un individuo sea alérgico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 alérgicos. Hallar el intervalo de confianza al 95 % para la probabilidad pedida. ¿Cuántos individuos se deberı́an observar para que, con el mismo nivel de confianza, el error máximo en la estimación de la proporción de alérgicos sea del 0.01? 2. Se supone que el número de erratas por página en un libro sigue una distribución de Poisson. Elegidas al azar 95 páginas, se obtuvieron los siguientes resultados: Número de erratas Número de páginas 0 40 1 30 2 15 3 7 4 2 5 1 Hallar el intervalo de confianza al 90 % para el número medio de erratas por página en todo el libro. 3. Se mide el tiempo de duración (en segundos) de un proceso quı́mico realizado 20 veces en condiciones similares, obteniéndose los siguientes resultados: 28 � 25 � 32 � 25 � 28 � 26 � 31 � 29 � 26 � 26 � 23 � 18 � 20 � 16 � 24 � 17 � 22 � 23 � 25 � 21 . 4. 5. 6. 7. 8. Suponiendo que la duración sigue una distribución Normal, hallar los intervalos de confianza al 90 % para ambos parámetros. La vida activa (en dı́as) de cierto fármaco sigue una distribución N (1200 ; 40). Se desea enviar un lote de este fármaco de manera que la vida media del lote no sea inferior a 1180 dı́as, con probabilidad 0.95. Hallar el tamaño del lote. Una noticia en el periódico dice que, de 1000 personas encuestadas sobre una cuestión, 556 se muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la población se muestra a favor, con un margen de error de ±3 %. ¿Cuál es el nivel de confianza de esta afirmación? Se quiere estudiar la proporción p de declaraciones de la renta con algún defecto. En una muestra preliminar pequeña (muestra piloto) de tamaño 50 se han observado 22 declaraciones defectuosas. ¿Cuál es el tamaño muestral necesario para estimar p cometiendo un error máximo de 0.01 con una probabilidad 0.99? En una gran zona ganadera se desea estimar la proporción de ovejas que sufren cierta enfermedad degenerativa. Calcular el tamaño muestral necesario para estimar esta proporción con un error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una pequeña muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 x̄1 = 4 s1 = 3 N2 = 11 x̄2 = 5 s2 = 2.2 . Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N (µi ; σi ), para i = 1� 2, se pide: a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80 . b) Obtener un intervalo de confianza para µ1 − µ2 , con nivel de confianza 0.95 . c) ¿Cuántos individuos habrı́a que observar para estimar µ1 con un error máximo de ±0.2 y un nivel de confianza de 0.95? 96 CAPÍTULO 5. INTERVALOS DE CONFIANZA 9. Para construir un intervalo de confianza de la media poblacional de una N (µ ; σ) con σ conocida, se ha utilizado una muestra de tamaño n y se ha obtenido el intervalo del 95 %. ¿Cómo ha de ser modificado el tamaño de la muestra para obtener el mismo intervalo con una confianza del 99 %? 10. Una fábrica elabora dos artı́culos A y B, cuya demanda aleatoria sigue una distribución normal de medias µA y µB desconocidas, y desviaciones tı́picas σA = 100 y σB = 50. Observados 100 puntos de venta, la demanda media de dichos artı́culos ha resultado de 200 y 150 unidades, respectivamente. Constrúyase un intervalo de confianza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se comprobó que 280 se habı́an suscrito a cierto canal de televisión. Obténgase un intervalo de confianza del 95 % de la proporción real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una máquina produce engranajes cuyo diámetro, debido a imperfecciones inherentes al funcionamiento de la máquina, es una variable aleatoria con distribución N (µ ; σ = 0.03), de forma que µ puede ser fijada a voluntad mediante un reglaje de la máquina. Para que un engranaje sea utilizable, su diámetro debe estar comprendido entre 15.50 y 15.60 mm. Calcúlese: a) el valor de µ que hace máxima la proporción de engranajes utilizables y dicha proporción máxima. b) el tamaño n de la muestra de engranajes necesario para poder construir, a partir de la media muestral x̄, un intervalo de confianza de µ al 95 % de amplitud menor que 0.02 mm. 13. De una población normal de media µ desconocida se selecciona una muestra de tamaño n = 10, resultando: 40, 45, 39, 46, 58, 52, 50, 45, 57, 49 . Constrúyase un intervalo de confianza al 95 % para el parámetro µ, suponiendo que: a) la varianza poblacional es σ 2 = 49; b) la varianza poblacional es desconocida. 14. Sabiendo que X sigue una distribución N (µ ; σ = 4), calcúlese el tamaño muestral mı́nimo para que, con una confianza del 99 %, el intervalo (x̄ − 1.5� x̄ + 1.5) contenga al parámetro µ. 15. El diámetro (en centı́metros) de diez piezas metálicas de forma esférica, seleccionadas al azar de la producción de una máquina, resultó 2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 . a) Suponiendo que el diámetro sigue una distribución normal, constrúyase un intervalo de confianza al 95 % del diámetro medio de las piezas producidas por esta máquina. b) ¿Cuál deberá ser el tamaño muestral mı́nimo si, a este nivel de confianza, se pretende dar un intervalo de estimación cuya amplitud no supere los 0.02 cm? 16. Con objeto de decidir si un nuevo proceso de fabricación da mejores resultados que el antiguo, en cuanto a la proporción de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente. a) Obténgase un intervalo de confianza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos. b) ¿Se puede afirmar que el número de elementos defectuosos es significativamente menor en el nuevo proceso? 5. INTERVALOS DE CONFIANZA MÁS FRECUENTES 97 17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros años de funcionamiento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza de nivel 0.95 para la probabilidad pedida. ¿Cuántas piezas se deberı́an observar para que, con el mismo nivel de confianza, el margen de error en la estimación de la proporción de fallos sea de ±0.01? 18. En una población, la altura de los individuos varones sigue una distribución N (µ; σ = 7.5). Halla el tamaño de la muestra para estimar µ con un margen de error inferior a ±2 cm. para un nivel de confianza 0.90. 19. En una explotación minera, las rocas excavadas se someten a un análisis quı́mico para determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribución normal de media µ y varianza σ 2 . Después de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con una cuasidesviación tı́pica de 3.164. La explotación comercial de este mineral es económicamente rentable si el contenido medio en la mina es superior al 8 %. a) Construye un intervalo de confianza de nivel 95 % para el contenido porcentual medio de cadmio en la mina. b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a través de la varianza σ, que debe ser menor al 3 %. Construye un intervalo de confianza de nivel 95 % para σ 2 . 20. Como parte de un estudio para la reducción de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. Sea X el número de kilómetros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el número de kilómetros recorridos con un litro de gasolina con el aditivo. Se observan los kilómetros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son: 4 � i=1 xi = 25.4 4 � i=1 yi = 31.2 4 � i=1 x2i = 173.53 4 � yi2 = 261.22 i=1 a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las hipótesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias. b) A la vista del intervalo obtenido en a), ¿hay alguna indicación de que el aditivo tiene algún efecto en el número de kilómetros recorridos por litro de gasolina? 21. Se admite que el número de microorganismos en una muestra de 1 mm cúbico de agua de un rı́o sigue una distribución de Poisson de parámetro λ. En 40 muestras se han detectado, en total, 833 microorganismos. Calcula un estimador puntual y un intervalo de confianza al 90 % para λ.