Cap´ıtulo 5 Intervalos de confianza

Anuncio
Capı́tulo 5
Intervalos de confianza
Como su nombre indica, el objetivo de un estadı́stico puntual para un parámetro desconocido
de una población, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de
una muestra. Difı́cilmente esta estimación acertará con el valor exacto del parámetro. No obstante,
la pretensión de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente
una “aproximación razonable” del mismo. En esta lı́nea surgen los intervalos de confianza, para un
nivel de confianza dado.
1.
Definiciones
Definición 1.1. Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con función de masa
Pθ (o función de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Un estimador por intervalos de confianza
de θi (al nivel de confianza 1 − α), es una función que a cada posible muestra x1 � . . . � xN le hace
corresponder un intervalo (T1 � T2 ) = (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )), tal que, para todo θ ∈ Θ:
�
�
�
�
Pθ θi ∈ (T1 � T2 ) = Pθ (x1 � . . . � xN ) : θi ∈ (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )) = 1 − α .
Para la construcción de intervalos de confianza, usaremos cantidades pivotales.
Definición 1.2. Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con función de masa
Pθ (o función de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Una cantidad pivotal para θi es una
función C(X1 � . . . � XN ; θi ) tal que su distribución no depende de θ.
Una vez obtenida una cantidad pivotal C(X1 � . . . � XN ; θi ), la construcción de un intervalo para
estimar es el siguiente:
- se eligen dos valores� c1 y c2 tales que:
�
�
Pθ (x1 � . . . � xN ) : c1 < C(X1 � . . . � XN ; θi ) < c2 = 1 − α .
Obsérvese que c1 y c2 no dependen de θ, al ser C(X1 � . . . � XN ; θi ) una cantidad pivotal.
- Despejamos θi de las desigualdades c1 < C(X1 � . . . � XN ; θi ) < c2 .
Obtenemos ası́ un estimador por intervalos de confianza para θi . Obsérvese que la cantidad pivotal
debe ser continua y monótona en θi .
Necesitaremos, pues, obtener cantidades pivotales, y en este capı́tulo describiremos la construcción
para los modelos más importantes.
83
84
2.
CAPÍTULO 5. INTERVALOS DE CONFIANZA
Poblaciones normales
Sea X ∼ N (µ ; σ), y (X1 � . . . � XN ) una muestra aleatoria de dicha población. El estimador media
muestral, X̄, tiene las siguientes propiedades:
E[X̄] = E[X] = µ �
V [X̄] =
V [X]
σ
=
.
N
N
Por otra parte, X1 � . . . � XN son variables aleatorias independientes, todas con la misma distribución,
N (µ ; σ), y ası́
√
X̄ ∼ N (µ ; σ/ N ) .
Por otra parte, el estimador cuasi–varianza muestral
N
S2 =
1 �
(Xi − E[X̄])2
N − 1 i=1
tiene esperanza
E[S 2 ] = σ 2 .
Necesitaremos conocer la distribución seguida por este estadı́stico. Se tiene la siguiente definición:
Definición 2.1. �Distribución χ2 ) Sean Z1 � . . . � ZN variables aleatorias independientes, todas con
distribución N (0 ; 1). La distribución χ2 de Pearson con N grados de libertad (abreviadamente
χ2N ) es la distribución de la variable aleatoria
N
�
Zi2 .
i=1
Esta distribución está asociada a la distribución normal, y sus valores vienen dados por una tabla.
Es claro que si (X1 � . . . � XN ) es una muestra aleatoria de una población X ∼ N (µ ; σ), entonces:
N −1 2
S =
σ2
=
N
�
(Xi − µ)2
i=1
N
�
i=1
σ2
de manera que:
N
(Xi − X̄)2 � (Xi − µ + µ − X̄)2
=
σ2
σ2
i=1
N
�
(Xi − µ)2
i=1
N
�
∼ χ2N
σ2
N
� � (X̄ − µ)2
X̄ − µ � �
−2
−
µ)
+
(X
i
σ2
σ2
i=1
(X̄ − µ)2
(X̄ − µ)2
(Xi − µ)2
−
2N
+
N
σ2
σ2
σ2
i=1
�
�2
N
�
(X̄ − µ)2
(Xi − µ)2
X̄ − µ
2
√
=
−N
= χN −
∼ χ2N −1 .
2
2
σ
σ
σ/
N
i=1
=
Para evitar confusiones, denotaremos por S 2 a la variable aleatoria cuasi–varianza muestral, y
por VX la varianza muestral. Se tiene la siguiente propiedad:
2. POBLACIONES NORMALES
85
Propiedad: [Lema de Fisher] Sea (X1 � . . . � XN ) una muestra aleatoria de una población X con
distribución N (µ ; σ). Entonces:
√
X̄ ∼ N (µ ; σ/ N ) ;
N −1 2
S ∼ χ2N −1 ;
2
σ
y, además, X̄ y S 2 son independientes.
Igual que para la distribución de la cuasi–varianza de N variables aleatorias independientes con
igual distribución N (µ � σ), hemos introducido una nueva distribución, necesitaremos las siguientes
nuevas definiciones.
Definición 2.2. �Distribución t de Student) Sean Y , X1 � . . . � XN variables aleatorias independientes, todas con distribución N (0 ; 1). La distribución t de Student con N grados de libertad
(abreviadamente tN ) es la distribución de la variable aleatoria
�
1
N
Y
�N
2
i=1 Xi
=�
Y
1
N
.
χ2N
Definición 2.3. �Distribución F de Fisher–Snedecor) Sean X1 � . . . � Xm , Y1 � . . . � Yn variables
aleatorias independientes, todas con distribución N (0 ; 1). La distribución F de Fisher–Snedecor
con m y n grados de libertad (abreviadamente Fm;n ) es la distribución de la variable aleatoria
1
m
1
n
2.1.
�m
X2
�ni=1 2i =
i=1 Yi
1
m
1
n
χ2m
.
χ2n
Cantidades pivotales en poblaciones normales
Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la construcción de estimadores por intervalos de confianza, para el caso de una población X ∼ N (µ ; σ).
Distinguiremos el caso de un muestra y el de dos muestras.
Cantidades pivotales para el caso de una muestra
a) Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ), con σ conocido.
Entonces:
X̄ − µ
√ ∼ N (0 ; 1) y es una cantidad pivotal para µ.
σ/ N
b) Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ). Entonces:
X̄ − µ
√ ∼ tN −1 es una cantidad pivotal para µ
S/ N
N −1 2
S ∼ χ2N −1 es una cantidad pivotal para σ 2 .
σ2
86
CAPÍTULO 5. INTERVALOS DE CONFIANZA
Obsérvese que si (X1 � . . . � XN ) es una muestra aleatoria de una población N (µ ; σ), entonces:
X̄ − µ
√
X̄ − µ
σ/ N
�
= √ ∼ tN −1
1 N −1 2
S/ N
S
2
N −1 σ
por definición de la distribución t de Student con N − 1 grados de libertad.
Cantidades pivotales para el caso de dos muestras
a) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones
X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ), respectivamente. Entonces:
donde
X̄ − Ȳ − (µ1 − µ2 )
�
∼ tm+n−2 y es una cantidad pivotal para µ1 − µ2
Sp m1 + n1
2
(m − 1)SX
+ (n − 1)SY2
m+n−2
2
y SY2 ,
puede interpretarse como una ponderación de las cuasi–varianzas muestrales SX
correspondientes a cada una de las muestras.
Sp2 =
b) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones
X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ), respectivamente. Entonces:
2
SX
/σ12
∼ Fm−1;n−1 y es una cantidad pivotal para σ12 /σ22 .
SY2 /σ22
Obsérvese que, en la situación descrita para dos muestras:
1 m−1 2
SX
S 2 /σ 2
m − 1 σ12
= X2 12 ∼ Fm−1;n−1
1 n−1 2
SY /σ2
SY
n − 1 σ22
de ahı́ la afirmación del apartado b). La comprobación del primer apartado excede el nivel de
este curso, y no se abordará.
2.2.
Intervalos de confianza en poblaciones normales
Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de confianza para los parámetros de una población normal. Distinguiremos diferentes casos:
Primer caso:
Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ), con σ conocido. Entonces:
�
σ
σ �
X̄ − zα/2 √ � X̄ + zα/2 √
N
N
es un intervalo de confianza para µ �al nivel 1−α), siendo zα el valor que verifica P (Z > zα ) = α,
para Z ∼ N (0 ; 1).
2. POBLACIONES NORMALES
87
Segundo caso:
Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ N (µ ; σ). Entonces:
S
S �
es un intervalo de confianza para µ �al nivel 1−α),
X̄ −tN −1 ; α/2 √ � X̄ +tN −1 ; α/2 √
N
N
siendo tN ; α el valor que verifica que P (tN > tN ; α ) = α.
� (N − 1)S 2 (N − 1)S 2 �
es un intervalo de confianza para σ 2 �al nivel 1 − α), siendo
b)
�
χ2N −1 ; α/2 χ2N −1 ; 1−α/2
χ2N ; α el valor que verifica: P (χ2N > χ2N ; α ) = α.
a)
�
Tercer caso:
Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales
con igual desviación tı́pica: X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ) , respectivamente. Entonces:
�
�
�
�
1
1
1
1
+ � X̄ − Ȳ + tm+n−2 ; α/2 Sp
+
X̄ − Ȳ − tm+n−2 ; α/2 Sp
m n
m n
es un intervalo de confianza para la diferencia de medias, µ1 − µ2 �al nivel 1 − α).
Cuarto caso:
Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales:
X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ) , respectivamente. Entonces:
�
�
2
2
SX
/SY2
/SY2
SX
�
Fm−1 ; n−1 ; α/2 Fm−1 ; n−1 ; 1−α/2
es un intervalo de confianza para la razón de varianzas, σ12 /σ22 �al nivel 1 − α), siendo Fm ; n ; α
el valor que verifica: P (Fm ; n > Fm ; n ; α ) = α.
Observación: En el manejo de las tablas correspondientes a la distribución Fm ; n , conviene tener en
cuenta la siguiente relación (obsérvese el cambio de orden en los grados de libertad):
Fm ; n ; 1−α = Fn ;1m ; α .
2.3.
Ejemplos
Ejemplo 36 Una empresa fabrica bombillas cuya duración en horas sigue una distribución N (µ ; 200).
Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constrúyase un intervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa fábrica.
Solución: Tenemos una muestra de tamaño N = 36 de una población, X ∼ N (µ ; 200), de varianza
conocida. Usaremos la cantidad pivotal:
X̄ − µ
∼ N (0 ; 1) ;
200/6
y, para α = 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media
muestral x̄ = 7000. En otras palabras, consideramos la igualdad:
�
�
7000 − µ
P −c<
< c = 1 − α = 0.99 .
200/6
88
CAPÍTULO 5. INTERVALOS DE CONFIANZA
De la tabla para una N (0 ; 1) se tiene c = zα/2 ≈ 2.58 (pues α/2 = 0.005). Construimos el intervalo
de confianza para µ, al nivel del 99 %, despejando µ en las desigualdades:
−2.58 <
7000 − µ
< 2.58
200/6
de manera que:
21000 + 258
21258
200
2.58 =
=
= 7086
6
3
3
21000 − 258
20742
200
2.58 =
=
= 6914
µ > 7000 −
6
3
3
µ < 7000 +
(de la desigualdad izquierda)
(de la desigualdad derecha)
Resumiendo, el intervalo de confianza para µ al nivel del 99 % para la muestra dada es:
�
�
200
200
2.58� 7000 +
2.58 = (6914 � 7086) .
I = 7000 −
6
6
Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio
de nicotina de 1.6mg. y una desviación tı́pica de 0.7mg. Suponiendo que la variable X =“contenido
de nicotina en un cigarrillo”, sigue una distribución N (µ ; σ), obténgase un intervalo de confianza
al 99 � del contenido medio de nicotina por cigarrillo en esa marca.
Solución: En este caso se quiere estimar µ en una población N (µ ; σ), con ambos parámetros
desconocidos. Partimos de una muestra de tamaño N = 16, con x̄ = 1.6 y cuasi–desviación tı́pica
muestral
�
16
s = 0.72 ≈ 0.723 .
15
Sabemos que en este caso hemos de usar la cantidad pivotal:
1.6 − µ
x̄ − µ
√ =
0.723/4
s/ N
que sigue una distribución t de Student con N − 1 = 15 grados de libertad. Para la muestra dada, el
intervalo de confianza para µ al nivel de confianza 1 − α queda
�
s
s � �
0.723
0.723 �
= 1.6 − t15 ; α/2
�
x̄ − tN −1 ; α/2 √ � x̄ + tN −1 ; α/2 √
� 1.6 + t15 ; α/2
4
4
N
N
siendo t15 ; α/2 el valor tal que P (t15 > t15 ; α/2 ) = α/2. Como en nuestro caso 1 − α = 0.99 entonces
α = 0.01 y ası́, de la correspondiente tabla para la distribución t de Student, obtenemos:
t15 ; α/2 = t15 ; 0.005 = 2.947 .
El intervalo que nos piden es pues:
�
�
0.723
0.723
0.723 �
0.723 �
= 1.6 − 2.947
1.6 − t15 ; α/2
� 1.6 + t15 ; α/2
� 1.6 + 2.947
4
4
4
4
≈ (1.6 − 0.5327� 1.6 + 0.5327)
= (1.0673� 2.1327) .
2. POBLACIONES NORMALES
89
Observación: En este ejemplo hemos tenido que calcular la cuasi–desviación tı́pica
muestral a
√
partir de la desviación tı́pica muestral. Si seguimos el uso dado, denotando por v la desviación
�
tı́pica muestral, vemos que:
√ √
√
v NN−1
s
v N
v
√ = √
=√ √
=√
N −1
N
N
N N −1
Podrı́amos haber expresado el intervalo de confianza utilizando la desviación tı́pica muestral:
√
√
�
�
v
v
x̄ − tN −1 ; α/2 √
� x̄ + tN −1 ; α/2 √
�
N −1
N −1
pero no usaremos esta expresión, para no liar la notación. Tan sólo hemos de tener cuidado al tomar
los datos del problema.
Ejemplo 38 Una muestra aleatoria de una población N (µ ; σ) ha dado los diez valores siguientes
6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6 .
Constrúyase un intervalo de confianza de σ 2 al 95 � .
Solución: Estamos ante una población N (µ ; σ) de la que desconocemos ambos parámetros. Para
estimar por intervalos de confianza σ 2 usaremos la cantidad pivotal
N −1 2
S
σ2
que sabemos sigue una distribución χ2 con N − 1 grados de libertad. Ası́, de la muestra dada, tan
sólo usaremos la cuasi–varianza muestral:
N
1 �
S2 =
(Xi − X̄)2 .
N − 1 i=1
Los siguientes cálculos dan con ella:
76.6
x̄ =
= 7.66
10
1
(6.92 +5.72 +8.42 +9.32 +7.22 +8.52 +7.42 +9.12 +6.52 +7.62 ) − 7.662
varianza muestral: v =
10
598.82
=
− 58.6756 = 59.882 − 58.6756 = 1.2064
10
10
12.064
≈ 1.34 .
s2 = v =
9
9
Para construir el intervalo pedido
� (N − 1)s2 (N − 1)s2 �
�
χ2N −1 ; α/2 χ2N −1 ; 1−α/2
hemos de calcular χ2N −1 ; α/2 y χ2N −1 ; 1−α/2 , con N − 1 = 9, α/2 = (1 − 0.95)/2 = 0.025. Estos valores
son, respectivamente:
χ29 ; 0.025 = 19.023 ; χ29 ; 1−0.025 = χ29 ; 0.975 = 2.7 .
Sustituyendo en la expresión del intervalo de confianza para estimar σ 2 al nivel pedido, se obtiene:
�
�
9 · 1.34 9 · 1.34
�
≈ (0.634� 4.467) �
19.023
2.7
como intervalo de confianza para estimar σ 2 al nivel del 95 %.
90
CAPÍTULO 5. INTERVALOS DE CONFIANZA
Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria
de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase
extra), 15 alumnos obtuvieron una puntuación media de 76 con desviación tı́pica 6, y 28 del curso con
hora complementaria una puntuación media de 84 con desviación tı́pica 5. Obténgase un intervalo
de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son
normales de varianzas iguales.
Solución: En las condiciones dadas es aplicable el intervalo
�
�
�
�
1
1
1
1
X̄ − Ȳ − tm+n−2 ; α/2 Sp
+ � X̄ − Ȳ + tm+n−2 ; α/2 Sp
+
m n
m n
con
15
540
=
14
14
700
2
2 28
n = 28 ; ȳ = 84 ; sY = 5
=
27
27
m = 15 ; x̄ = 76 ; s2X = 62
y
(m − 1)s2X + (n − 1)s2Y
m+n−2
540
14 14 + 27 700
1240
27
=
=
15 + 28 − 2
41
s2p =
Sustituyendo α = 1 − 0.9 = 0.1, obtenemos, de la tabla para una distribución t de Student con
15 + 28 − 2 = 41 grados de libertad1 :
t41 ; α/2 = t41 ; 0.05 ≈ 1.684
En definitiva, el intervalo de confianza para σ 2 al 90 %, dadas las dos muestras, es:
�
�
�
�
�
�
1240 28 + 15
1240 28 + 15
� 76 − 84 + 1.684
76 − 84−1.684
41
28 · 15
41
28 · 15
�
�
�
�
1240 · 43
1240 · 43
� −6 + 1.684
= − 6 − 1.684
41 · 28 · 15
41 · 28 · 15
�
�
�
�
62 · 43
62 · 43
� −6 + 1.684
≈ (−8.9633� −3.0367) .
= − 6 − 1.684
41 · 21
41 · 21
Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos:
N1 = 13
N2 = 11
x̄1 = 4
x̄2 = 5
s1 = 3
s2 = 2.2 .
Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N (µi ; σi ), para
i = 1� 2, obtener un intervalo de confianza para el cociente de varianzas al nivel 0.80 .
1
En la tabla entregada en clase este dato está mal escrito: deberı́a poner 1.684 en lugar de 1.648.
3. OTRAS POBLACIONES
91
Solución: Un intervalo de confianza para el cociente σ12 /σ22 , al nivel 0.80 = 1 − α con α = 0.2, será:
�
�
S12 /S22
S12 /S22
�
FN1 −1 ; N2 −1 ; 0.1 FN1 −1 ; N2 −1 ; 0.9
De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1):
F12 ; 10 ; 0.1 = 2.2841 ;
El intervalo queda:
3.
�
y:
F12 ; 10 ; 0.9 =
32 /2.22 32 /2.22
�
2.2841 1/2.1878
�
1
1
=
≈ 0.4571 .
F10 ; 12 ; 0.1
2.1878
≈ (0.8141� 4.0682) .
Otras poblaciones
Cuando la muestra se obtiene de poblaciones con distribución Bernoulli, o de Poisson, usaremos
intervalos de confianza asintóticos, para ponernos en la situación anterior. Para ello las cantidades
pivotales utilizadas tendrán una distribución lı́mite (cuando N → ∞) independiente de parámetros
desconocidos.
Intervalos de confianza para una distribución de Bernoulli
Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ B(1 ; p). Entonces:
�
�
�
�
p� (1 − p�)
p� (1 − p�)
X̄ − zα/2
� X̄ + zα/2
N
N
es un intervalo de confianza para p �al nivel 1 − α), siendo p� = X̄ =“frecuencia relativa de
éxitos”.
Estamos utilizando la siguiente cantidad pivotal asintótica:
�
X̄ − p
p�(q − p�)/N
∼ N (0 ; 1) (aproximadamente, para N grande) .
Intervalos de confianza para una distribución de Poisson
Sea (X1 � . . . � XN ) una muestra aleatoria de una población X ∼ Poisson (λ). Entonces:
�
�
�
�
�
�
X̄ − zα/2 λ/N � X̄ + zα/2 λ/N
� = X̄.
es un intervalo de confianza para λ �al nivel 1 − α), siendo λ
En este caso, la cantidad pivotal asintótica es:
X̄ − λ
�
∼ N (0 ; 1) (aproximadamente, para N grande) .
�
λ/N
92
4.
CAPÍTULO 5. INTERVALOS DE CONFIANZA
Mı́nimo tamaño muestral
Un problema muy relacionado con la construcción de intervalos de confianza es el de determinar
el mı́nimo tamaño muestral necesario para obtener una determinada precisión en nuestra estimación.
Es decir, cuántos elementos tenemos que observar, al menos, para que el error cometido con la
estimación no supere cierta cantidad.
Definición 4.1. El error de una estimación por intervalos de confianza (al nivel 1 − α) es la semi–
amplitud del intervalo obtenido.
Ejemplo 41 Determinar el mı́nimo tamaño muestral de una población N (µ ; σ = 5), para que el
error de la estimación por intervalos de confianza para µ al 95 �, no sea superior a 0.5.
Solución: Estimaremos µ mediante un intervalo de confianza de la forma:
�
�
σ
σ
X̄ − zα/2 √ � X̄ + zα/2 √
N
N
con lo cual el error cometido será
σ
Error = zα/2 √ .
N
Siendo α = 1 − 0.95 = 0.05, α/2 = 0.025y σ = 5, se quiere obtener el mı́nimo valor de N para que:
5
5
z0.025 √ = 1.96 √ ≤ 0.5
N
N
de donde:
N≥
� 5 · 1.96 �2
0.5
= 19.62 = 384.16 .
Es decir, necesitaremos observar 385 elementos para conseguir la precisión deseada (error ≤ 0.5) para
esa estimación.
Para otros intervalos, un cálculo similar nos llevarı́a a determinar, en cada caso, el mı́nimo tamaño muestral. Téngase en cuenta que este mı́nimo tamaño muestral ha de tomarse como un valor
orientativo. Ası́, si obtenemos, para determinada precisión, un mı́nimo tamaño muestral de 196, entenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los
casos en que el mı́nimo tamaño muestral depende de la muestra concreta obtenida.
5.
Intervalos de confianza más frecuentes
Recogemos por último, los intervalos de confianza antes obtenidos, y algún otro, en una lista
esquemática. Se utiliza la siguiente notación
(X1 � . . . � Xn ) muestra aleatoria (m.a.) de X.
n
1�
x̄ =
xi �
n i=1
n
1 �
s =
(xi − x̄)2 �
n − 1 i=1
2
I = (a ± �) = (a − �� a + �)
5. INTERVALOS DE CONFIANZA MÁS FRECUENTES
93
1. X ∼ N (µ� σ)

�
�
σ


√
I
=
x̄
±
z

α/2

n
Intervalo de confianza 1 − α para µ:
�
�

s


 I = x̄ ± tn−1;α/2 √
n
�
Intervalo de confianza 1 − α para σ 2 : I =
2. X ∼ B(1� p) (muestras grandes).
Intervalo de confianza 1 − α para p: I =
3. X ∼ P (λ) (muestras grandes).
Intervalo de confianza 1 − α para λ: I =
�
σ desconocida
(n − 1)s2
(n − 1)s2
�
χ2n−1;α/2
χ2n−1;1−α/2
x̄ ± zα/2
�
σ conocida
�
x̄(1 − x̄)
n
�
�
� �
x̄
x̄ ± zα/2
n
4. Dos poblaciones Normales independientes
X ∼ N (µ1 � σ1 ), Y ∼ N (µ2 � σ2 ) independientes
(X1 � . . . � Xn1 ) m.a. de X; se calcula x̄ y s21 .
(Y1 � . . . � Yn2 ) m.a. de Y ; se calcula ȳ y s22 .
s2p =
(n1 − 1) s21 + (n2 − 1) s22
n1 + n2 − 2
Intervalo de confianza 1 − α para µ1 − µ2 :
�

�
2
2
σ1 σ2 
I = x̄ − ȳ ± zα/2
+
n 1 n2
I=
�
x̄ − ȳ ± tn1 +n2 −2;α/2 sp
�
I = x̄ − ȳ ± tf ;α/2
�
�
1
1
+
n1 n2

s2
s21
+ 2
n1 n2
donde f = entero más próximo a
Intervalo de confianza 1 − α para
σ1 , σ2 conocidas
�
σ1 � σ2 desconocidas, σ1 = σ2
σ1 � σ2 desconocidas, σ1 �= σ2
(s21 /n1 + s22 /n2 )2
�s21 /n1 )2
n1 +1
σ12 /σ22 :
+
�s22 /n2 )2
n2 +1
I=
�
−2
s21 /s22
Fn1 −1;n2 −1;α/2
�
(s21 /s22 ) Fn2 −1;n1 −1;α/2
�
94
CAPÍTULO 5. INTERVALOS DE CONFIANZA
5. Comparación de proporciones (muestras grandes e independientes)
X ∼ B(1� p1 ), Y ∼ B(1� p2 ), independientes.
(X1 � . . . � Xn1 ) m.a. de X; se calcula x̄ y s21 .
(Y1 � . . . � Yn2 ) m.a. de Y ; se calcula ȳ y s22 .
�
Intervalo de confianza 1 − α para p1 − p2 : I = x̄ − ȳ ± zα/2
�

x̄ (1 − x̄) ȳ (1 − ȳ) 
+
n1
n2
6. Datos emparejados
(X� Y ) ∼ Normal bivariante (µ1 � µ2 � σ1 � σ2 � ρ).
(X1 � Y1 )� . . . � (Xn � Yn ) m.a. de (X� Y ).�
�
�
D = X − Y ∼ N µ = µ1 − µ2 � σ = σ12 + σ22 − 2 ρ σ1 σ2
(D1 � . . . � Dn ) m.a. de D, donde Di = Xi − Yi .
Intervalos de confianza 1 − α para µ ó σ: aplicar Apartado 1 a la variable aleatoria D
5. INTERVALOS DE CONFIANZA MÁS FRECUENTES
95
Problemas
1. En una población se desea conocer la probabilidad de que un individuo sea alérgico al polen de
las acacias. En 100 individuos tomados al azar se observaron 10 alérgicos. Hallar el intervalo de
confianza al 95 % para la probabilidad pedida. ¿Cuántos individuos se deberı́an observar para
que, con el mismo nivel de confianza, el error máximo en la estimación de la proporción de
alérgicos sea del 0.01?
2. Se supone que el número de erratas por página en un libro sigue una distribución de Poisson.
Elegidas al azar 95 páginas, se obtuvieron los siguientes resultados:
Número de erratas
Número de páginas
0
40
1
30
2
15
3
7
4
2
5
1
Hallar el intervalo de confianza al 90 % para el número medio de erratas por página en todo el
libro.
3. Se mide el tiempo de duración (en segundos) de un proceso quı́mico realizado 20 veces en condiciones similares, obteniéndose los siguientes resultados:
28 � 25 � 32 � 25 � 28 � 26 � 31 � 29 � 26 � 26 � 23 � 18 � 20 � 16 � 24 � 17 � 22 � 23 � 25 � 21 .
4.
5.
6.
7.
8.
Suponiendo que la duración sigue una distribución Normal, hallar los intervalos de confianza
al 90 % para ambos parámetros.
La vida activa (en dı́as) de cierto fármaco sigue una distribución N (1200 ; 40). Se desea enviar
un lote de este fármaco de manera que la vida media del lote no sea inferior a 1180 dı́as, con
probabilidad 0.95. Hallar el tamaño del lote.
Una noticia en el periódico dice que, de 1000 personas encuestadas sobre una cuestión, 556 se
muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la población se muestra
a favor, con un margen de error de ±3 %. ¿Cuál es el nivel de confianza de esta afirmación?
Se quiere estudiar la proporción p de declaraciones de la renta con algún defecto. En una
muestra preliminar pequeña (muestra piloto) de tamaño 50 se han observado 22 declaraciones
defectuosas. ¿Cuál es el tamaño muestral necesario para estimar p cometiendo un error máximo
de 0.01 con una probabilidad 0.99?
En una gran zona ganadera se desea estimar la proporción de ovejas que sufren cierta enfermedad degenerativa. Calcular el tamaño muestral necesario para estimar esta proporción con un
error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una pequeña muestra
preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad.
En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones
aisladas, A1 y A2 , se obtuvieron los siguientes datos:
N1 = 13 x̄1 = 4 s1 = 3
N2 = 11 x̄2 = 5 s2 = 2.2 .
Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N (µi ; σi ),
para i = 1� 2, se pide:
a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80 .
b) Obtener un intervalo de confianza para µ1 − µ2 , con nivel de confianza 0.95 .
c) ¿Cuántos individuos habrı́a que observar para estimar µ1 con un error máximo de ±0.2 y
un nivel de confianza de 0.95?
96
CAPÍTULO 5. INTERVALOS DE CONFIANZA
9. Para construir un intervalo de confianza de la media poblacional de una N (µ ; σ) con σ conocida,
se ha utilizado una muestra de tamaño n y se ha obtenido el intervalo del 95 %. ¿Cómo ha de
ser modificado el tamaño de la muestra para obtener el mismo intervalo con una confianza
del 99 %?
10. Una fábrica elabora dos artı́culos A y B, cuya demanda aleatoria sigue una distribución normal
de medias µA y µB desconocidas, y desviaciones tı́picas σA = 100 y σB = 50. Observados 100
puntos de venta, la demanda media de dichos artı́culos ha resultado de 200 y 150 unidades,
respectivamente. Constrúyase un intervalo de confianza al 95 % para la diferencia de medias.
11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se comprobó que 280 se habı́an suscrito a cierto canal de televisión. Obténgase un intervalo de confianza
del 95 % de la proporción real de familias con televisor suscritas a dicho canal en esa ciudad.
12. Una máquina produce engranajes cuyo diámetro, debido a imperfecciones inherentes al funcionamiento de la máquina, es una variable aleatoria con distribución N (µ ; σ = 0.03), de forma
que µ puede ser fijada a voluntad mediante un reglaje de la máquina. Para que un engranaje
sea utilizable, su diámetro debe estar comprendido entre 15.50 y 15.60 mm. Calcúlese:
a) el valor de µ que hace máxima la proporción de engranajes utilizables y dicha proporción
máxima.
b) el tamaño n de la muestra de engranajes necesario para poder construir, a partir de la
media muestral x̄, un intervalo de confianza de µ al 95 % de amplitud menor que 0.02 mm.
13. De una población normal de media µ desconocida se selecciona una muestra de tamaño n = 10,
resultando:
40, 45, 39, 46, 58, 52, 50, 45, 57, 49 .
Constrúyase un intervalo de confianza al 95 % para el parámetro µ, suponiendo que:
a) la varianza poblacional es σ 2 = 49;
b) la varianza poblacional es desconocida.
14. Sabiendo que X sigue una distribución N (µ ; σ = 4), calcúlese el tamaño muestral mı́nimo
para que, con una confianza del 99 %, el intervalo (x̄ − 1.5� x̄ + 1.5) contenga al parámetro µ.
15. El diámetro (en centı́metros) de diez piezas metálicas de forma esférica, seleccionadas al azar
de la producción de una máquina, resultó
2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 .
a) Suponiendo que el diámetro sigue una distribución normal, constrúyase un intervalo de
confianza al 95 % del diámetro medio de las piezas producidas por esta máquina.
b) ¿Cuál deberá ser el tamaño muestral mı́nimo si, a este nivel de confianza, se pretende dar
un intervalo de estimación cuya amplitud no supere los 0.02 cm?
16. Con objeto de decidir si un nuevo proceso de fabricación da mejores resultados que el antiguo, en
cuanto a la proporción de elementos defectuosos, se selecciona una muestra de 1000 elementos
del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos,
respectivamente.
a) Obténgase un intervalo de confianza al 95 % para la diferencia de proporciones de elementos
defectuosos de ambos procesos.
b) ¿Se puede afirmar que el número de elementos defectuosos es significativamente menor en
el nuevo proceso?
5. INTERVALOS DE CONFIANZA MÁS FRECUENTES
97
17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros años de funcionamiento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza
de nivel 0.95 para la probabilidad pedida. ¿Cuántas piezas se deberı́an observar para que, con
el mismo nivel de confianza, el margen de error en la estimación de la proporción de fallos sea
de ±0.01?
18. En una población, la altura de los individuos varones sigue una distribución N (µ; σ = 7.5).
Halla el tamaño de la muestra para estimar µ con un margen de error inferior a ±2 cm. para
un nivel de confianza 0.90.
19. En una explotación minera, las rocas excavadas se someten a un análisis quı́mico para determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable
con distribución normal de media µ y varianza σ 2 . Después de analizar 25 rocas se obtiene
un contenido porcentual medio de 9.77 con una cuasidesviación tı́pica de 3.164. La explotación comercial de este mineral es económicamente rentable si el contenido medio en la mina es
superior al 8 %.
a) Construye un intervalo de confianza de nivel 95 % para el contenido porcentual medio de
cadmio en la mina.
b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida
a través de la varianza σ, que debe ser menor al 3 %. Construye un intervalo de confianza
de nivel 95 % para σ 2 .
20. Como parte de un estudio para la reducción de los gases de efecto invernadero que emiten
los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. Sea X
el número de kilómetros recorridos por un coche con un litro de gasolina sin el aditivo. Sea
Y el número de kilómetros recorridos con un litro de gasolina con el aditivo. Se observan los
kilómetros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos
que se obtienen son:
4
�
i=1
xi = 25.4
4
�
i=1
yi = 31.2
4
�
i=1
x2i
= 173.53
4
�
yi2 = 261.22
i=1
a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las
hipótesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias.
b) A la vista del intervalo obtenido en a), ¿hay alguna indicación de que el aditivo tiene algún
efecto en el número de kilómetros recorridos por litro de gasolina?
21. Se admite que el número de microorganismos en una muestra de 1 mm cúbico de agua de un
rı́o sigue una distribución de Poisson de parámetro λ. En 40 muestras se han detectado, en
total, 833 microorganismos. Calcula un estimador puntual y un intervalo de confianza al 90 %
para λ.
Descargar