TEMA 7. ESTIMACIÓN

Anuncio
TEMA 7. ESTIMACIÓN
7.1. Introducción y definiciones
7.2. Estimación puntual. Propiedades deseables de los
estimadores
7.2.1. Introducción y definiciones
7.2.2. Estimadores Insegados
7.3. Estimación por intervalos de confianza
7.3.1. Introducción
7.3.2. Intervalos de confianza para una población
normal
7.3.2.1. Intervalos de confianza para la media
7.3.2.2. Intervalos de confianza para la
varianza
7.3.3. Intervalos de confianza para dos
poblaciones Normales independientes
7.3.3.1. Intervalos de confianza para la
diferencia de medias
7.3.3.2. Intervalos de confianza para el
cociente de varianzas
7.3.4. Intervalo
de confianza
para
una
proporción
7.3.5. Intervalo de confianza para la diferencia de
proporciones
199
7.1. Introducción y definiciones
Supongamos que conocemos la distribución de la
característica de interés de una población
La
función de densidad o masa de probabilidad depende
del vector de parámetros θ : f(x ; θ)
Se desean estimar los parámetros a partir de una
muestra
¿Cómo hacer esta estimación?
Estimación puntual: Se busca un estimador, que con
base a los datos muestrales dé origen a un valor puntual
que utilizamos como estimación del parámetro
Estimación
por intervalos: Se determina un intervalo
aleatorio que, de forma probable, contiene el verdadero
valor del parámetro. Este intervalo recibe el nombre de
intervalo de confianza
200
Ejemplo
Sea X una v.a. que estudia el grosor del tronco de un
arbusto. Se conoce que dicha variable es normal con
desviación típica 1 pero no se conoce la media.
X
N (µ, 1) ; µ ∈ R
El parámetro a estimar es µ
201
7.2. Estimación puntual. Propiedades
deseables de los estimadores
7.2.1.
Introducción y definiciones
Sea X1, …, X n una muestra aleatoria simple con función
de densidad f ( x ; θ )
Sea un estadístico T = u ( X 1, …, X n )
El problema es encontrar una función u que proporcione
el mejor estimador de θ
El estimador, T, del parámetro θ debe tener una
distribución concentrada alrededor de θ y la varianza
debe ser lo menor posible
P[θ −h ≤ T ≤ θ+h]
debería ser grande
θ−h θ
θ+h
202
Error cuadrático medio
P[θ −h ≤ T ≤ θ+h]
debería ser grande
θ−h θ
θ+h
Para estudiar la variabilidad de los valores del estimador
alrededor del parámetro se hace uso de una cantidad
llamada error cuadrático medio
Definición. Error cuadrático medio
T estimador de θ
ECM ( T ) = E [( T − θ ) 2 ] = Var [ T ] + [ θ − E [ T ]] 2
203
Ejemplo
Sea X1, … , Xn una muestra aleatoria simple (m.a.s.) de
una población X de la que se sabe que E[X] = µ y
Var[X] = σ2.
Sea T = X un estimador de µ.
Hallar el error cuadrático medio que se comete.
Solución.-
(
ECM ( X ) = Var [ X ] + µ − E [ X ]
)
2
Calculamos en primer lugar la esperanza del estimador
 ∑ Xi 
E [ X i ] nµ
 i

E[X ] = E 
=∑
=
=µ

n
n
 n  i


Por lo tanto el ECM es
1

ECM ( X ) = Var[ X ] = Var  ∑ X i  =
 n i

=
1
n
2
∑ Var[ X i ] =
i
nσ 2
n
2
=
σ2
n
204
7.2.2.
Estimadores Insesgados
Definición. Sesgo de un Estimador
Sea T el estimador del parámetro θ. Se define el sesgo
del estimador como
θ − E[T]
Definición. Estimador Insesgado
T es un estimador insesgado de θ si y sólo si
E[T] = θ
para todo θ
NOTA: En este caso ECM ( T ) = Var [ T ]
205
Ejemplo
Sea X1, … , Xn una muestra aleatoria simple (m.a.s.) de
una población X de la que se sabe que E [ X ] = µ y
Var [ X ] = σ2.
1.- Demostrar que X es un estimador insesgado de µ
2.- Demostrar que la cuasivarianza S2 es un estimador
insesgado de σ2
Solución
1.- Demostrado en el ejemplo anterior
206
2. 1
 1
2
2
2

E S = E
∑ X i − X  = E  n −1 ∑ ( X i − µ ) − X − µ 
 
n
1
−




i
i
(
(
)

2
1
2
E  ∑ ( X i − µ ) + ∑ X − µ − 2∑ ( X i − µ ) X − µ
=
n −1 
i
i
 i
(
)
))
(
(
)






1  
2
2
 E  ( X − µ )  + E  ∑ ( X − µ )  − 2 E ( X − µ ) ∑ ( X i − µ )  
=
n − 1  ∑ i

 i


 
i
  i
1  
2
2 
2


 E  ( X − µ )  + nE ( X − µ ) − 2nE ( X − µ ) 
=



 
n − 1  ∑ i

i

 

1 
σ2
σ2
2
=
− 2n
 σ +n
=
n − 1 ∑
n
n 
 i

( n − 1)σ
1  2
=
nσ + σ 2 − 2σ 2  =

n −1 
n −1
2
=σ2
207
7.3. Estimación por intervalos de confianza
7.3.1.
Introducción
Se desea calcular un intervalo aleatorio que contenga al
verdadero valor del parámetro, θ, con una cierta
probabilidad
h1(T) ≤ θ ≤ h2(T)
Las funciones h1 y h2 son funciones de un estadístico T
relacionado con el parámetro a estimar en cada caso
Definición: Nivel de confianza (1−α)
El nivel de confianza, 1−α, es la probabilidad de que un
intervalo de confianza contenga al verdadero valor del
parámetro.
P [ h1 ( T ) ≤ θ ≤ h 2 ( T ) ] = 1−α
208
Definición: Intervalos de confianza bilaterales
P [ h1(T) ≤ θ ≤ h2(T) ] = 1−α
Definición: Intervalos de confianza unilaterales
P [θ ≥ h1(T) ] = 1−α
P [θ ≤ h2(T) ] = 1−α
NOTA: De cada 100 intervalos construidos a partir
de 100 muestras, 100 ( 1−α ) % deberían contener al
verdadero valor del parámetro.
(
θ
)
(
)
. . . . . . . . .θ. . . . . . . .
(
(
θ
Intervalo aleatorio
θ fijo
)
)
θ
209
7.3.2.
Intervalos de confianza para una
población normal
Se muestrea una población normal para estimar los
parámetros de esta población
X1, … , X n m.a.s. de una población X
X 1, X 2 ,... X n
N ( µ, σ )
Independientes entre sí
Xi
N ( µ, σ )
Se desea estimar alguno de los parámetros, o ambos,
según sea o no conocido el otro
210
7.3.2.1. Intervalos de confianza para la media
Se desea estimar la media poblacional mediante un
intervalo de confianza
2
Varianza poblacional conocida σ 0
Estadístico asociado al parámetro a estudiar µ : T = X
(media muestral).
Distribución de la media muestral:
 σ2
X → N µ; 0 
n 



⇔ Z=
(X − µ) → N
σ0
( 0; 1)
n
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α
α/2
α/2
1−α
z1−α / 2 = − zα / 2
zα / 2
211


X − µ)
(
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = P  − zα / 2 ≤
≤ zα / 2  = 1 − α
σ0




n



σ0
σ0 
≤ X − µ ≤ zα / 2
P  − zα / 2
 = 1−α
n
n 


σ0
σ0 
≤ − µ ≤ − X + zα / 2
P  − X − zα / 2
 = 1−α
n
n 


σ0
σ0 
≥ µ ≥ X − zα / 2
P  X + zα / 2
 = 1−α
n
n 


σ0
σ0 
≤ µ ≤ X + zα / 2
P  X − zα / 2
 = 1−α
n
n 

I.C. para µ, con varianza conocida, al nivel de
confianza 1−α.

σ0
σ0 
 X − zα / 2

, X + zα / 2

n
n


212
I.C. para µ, con varianza conocida, al nivel de
confianza 1−α

σ0
σ0 
 X − zα / 2

, X + zα / 2

n
n


NOTA:
• A medida que aumenta el tamaño de la muestra
disminuye la amplitud del intervalo
• A medida que el nivel de confianza es mayor aumenta
la amplitud del intervalo
213
Ejemplo. Se desea estudiar el peso en gramos del fruto
producido por una planta. Para ello se tomó una muestra
de 16 plantas observando los siguientes pesos: 506, 508,
499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,
502, 509, 496. El peso del fruto de cada planta es una v.a.
Normal con desviación típica 5 gr. Obtener un intervalo
de confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.
Solución.I.C. para µ con varianza conocida
al nivel de confianza 1−α

σ0
σ0 
, X + zα / 2
 X − zα / 2

n
n


x = 503.75; n = 16;
σ 02 = 25 ; σ 0 = 5
214

σ0
σ0 
, X + zα / 2
 X − zα / 2

n
n 

x = 503.75; n = 16;
σ 02 = 25 ; σ 0 = 5
1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒
zα / 2 = z0.05 = 1.645
0.05
0.05
0.90
− z 0.05 = −1.645
z 0.05 = 1.645
5
5

503.75 − 1.645 4 , 503.75 + 1.645 4  =
= [501.69, 505.81]
215
Varianza poblacional desconocida
Estimador: X
Distribución muestral:
Cuasidesviación típica
X − µ)
(
T=
S
S=
→ t n-1
n
1
2
X
−
X
(
)
n −1 ∑ i
i
α/2
α/2
1−α
t1−α / 2 = −tα / 2
tα / 2


P  −tα / 2; n−1 ≤ T ≤ tα / 2; n−1  = 1 − α




−
X
µ
(
)
≤ tα / 2; n−1  = 1 − α
P  −tα / 2; n−1 ≤
S


n


216


X − µ)
(
≤ tα / 2 ; n−1  = 1 − α
P  −tα / 2; n−1 ≤
S


n


S
S 

≤ X − µ ≤ tα / 2; n−1
= 1−α
P  −tα / 2; n−1

n
n

S
S 

P  − X − tα / 2; n−1
≤ − µ ≤ − X + tα / 2; n−1
= 1−α

n
n

S
S 

P  X + tα / 2; n−1
≥ + µ ≥ X − tα / 2; n−1
= 1−α

n
n

S
S 

≤ µ ≤ X + tα / 2; n−1
= 1−α
P  X − tα / 2; n−1

n
n

I.C. para µ con varianza desconocida
al nivel de confianza 1−α
S
S 

X
t
X
t
−
+
,
α / 2;n−1
α / 2;n−1

n
n 

217
Ejemplo. Se desea estudiar el peso en gramos del
fruto producido por una planta. Para ello se tomó una
muestra de 16 plantas observando los siguientes pesos:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493,
496, 506, 502, 509, 496. Del peso del fruto sólo se
conoce que es una v.a. Normal. Obtener un intervalo de
confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.
Solución
S
S 

, X + tα / 2; n−1
 X − tα / 2; n−1

n
n

I.C. para µ con varianza desconocida
al nivel de confianza 1−α
x = 503.75 ;
s = 6.2022 ;
n = 16
s
s 

−
+
=
,
x
t
x
t
α / 2; n−1
α / 2; n−1


n
n

6.2022
6.2022 

= 503.75 − 1.75 ×
=
, 503.75 + 1.75 ×

4
4 

= [501.0319, 506.4681]
218
S
S 

, X + tα / 2; n−1
 X − tα / 2; n−1

n
n

x = 503.75 ;
s = 6.2022 ;
n = 16
1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒
tα / 2; n−1 = t 0.05;15 = 1.75
0.05
0.90
−t 0.05 = −1.75
0.05
t 0.05 = 1.75
6.2022
6.2022 

−
+
=
503
.
75
1.75
,
503
.
75
1.75
×
×


4
4 
= [501.0319, 506.4681]
219
7.3.2.2. Intervalos de confianza para la varianza
Media poblacional desconocida
Estimador: Cuasivarianza
S2 =
2
1
Xi − X
∑
n −1
i
(
)
Distribución muestral
n
∑( Xi − X )
i =1
2
σ2
=
( n − 1) S 2
σ2
→ χ n2−1
P  χ12−α / 2;n−1 ≤ χ n2−1 ≤ χα2 / 2;n−1  = 1 − α


2


n
1
S
−
(
)
2
2
≤ χα / 2; n−1  = 1 − α
P  χ1−α / 2; n−1 ≤


σ2
α/2
χ12−α / 2;n −1
1−α
α/2
χ α2 / 2;n −1
220
2


n
1
S
−
(
)
≤ χα2 / 2; n−1  = 1 − α
P  χ12−α / 2; n−1 ≤


σ2
2
χ2

χ
1
1−α / 2; n −1
α / 2; n−1 
≤
≤
= 1−α
P
 n −1 S 2

2
2
−
σ
1
n
S
(
)
(
)




2
2
( n − 1) S
( n − 1) S 
2

≥σ ≥
= 1−α
P
χ2

2
χα / 2; n−1 
 1−α / 2; n−1



2
2
( n − 1) S
( n − 1) S 
P
≤σ2 ≤
= 1−α
 χ2

2
χ
1−α / 2;n −1 
 α / 2;n−1
I.C. para σ 2, con media poblacional desconocida,
al nivel de confianza 1−α

2
2 
(
n
1)
S
(
n
1)
S
−
−


,
χ2

2
χ
1−α / 2 ; n −1 
 α / 2; n−1
221
Ejemplo
Se desea estimar la varianza del nivel de nistamina en un
ungüento. Se conoce por larga experiencia que su
distribución sigue una ley Normal. Se toma una muestra
de 9 ungüentos, dando el nivel siguiente (en millones de
unidades/gr): 1, 0.9, 1.5, 2.8, 3.1, 3.2, 2.5, 1.9, 2. Estimar
la varianza mediante dos intervalos de confianza al nivel
de confianza del 99% y del 95%.
Solución
1
2
2
s =
x
−
x
= 0.74
Cuasivarianza:
(
)
∑
i
n −1
i
Nivel de confianza: 1 − α = 0.99; α = 0.01; α / 2 = 0.005
2
2
χα2 / 2;n−1 = χ 0.005;8
= 22.0; χ12−α / 2;n−1 = χ 0.995;8
= 1.34
0.005
0.005
0.99
2
χ 0.995;8
= 1.34
χ 20.005;8 = 22.0


2
2
 ( n − 1) s , ( n − 1) s  =
χ2

2
χ
1−α / 2; n−1 
 α / 2; n−1
= [ 0.2691, 4.4179]
222
Nivel de confianza: 1 − α =
0.95
1 − α = 0.95; α = 0.05; α / 2 = 0.025
s2 =
Cuasi-varianza:
1
2
x
−
x
= 0.74
(
)
n −1∑ i
i
2
χ α2 / 2 ; n−1 = χ 0.025
; 8 = 17.5
2
χ 12−α / 2; n−1 = χ 0.975;8
= 2.18
0.025
0.025
0.95
2
χ 0.975;8
= 2.18
χ 20.025;8 = 17.5

2
2 
(
n
1)
s
(
n
1)
s
−
−

=
,
χ2

2
χ
 α / 2; n−1 1−α / 2; n−1 
= [ 0.3383, 2.7156]
223
7.3.3.
Intervalos de confianza para dos
poblaciones Normales independientes
Se muestrean dos poblaciones normales para estimar
los parámetros “comparativamente”
Sean las variables aleatorias X e Y tales que
N ( µX ; σ X )
X
N ( µ Y ; σY )
Y
Independientes
Consideramos:
m.a.s. de tamaño nX de X
X1, X 2 ,..., X n
X , S X2
m.a.s. de tamaño n Y de Y
Y , S Y2
x
Y1, Y2 ,..., Yn Y
Se desean estimar comparativamente los parámetros
de ambas poblaciones
224
7.3.3.1. Intervalos de confianza para la
diferencia de medias
Varianzas poblacionales conocidas
Estimador: T = X − Y
Distribución muestral:
Z=
( X − Y ) − ( µ X − µY )
σ X2
nX
+
σ Y2
→ N (0; 1)
nY
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α
α/2
α/2
1−α
z1−α / 2 = − zα / 2
zα / 2
225
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α






X − Y ) − µ X − µY
(
P  − zα / 2 ≤
≤ zα / 2  = 1 − α
2
2


σ
σ
X
Y


+


n X nY


(
)

2
2
σ
σ

X
Y
+
≤ µ X − µY ≤
P  X − Y − zα / 2
nX
nY


2
2 
σ X σY 
≤ X − Y + zα / 2
+
= 1−α

nX
nY


(
)
(
)
I.C. para µ X − µ Y con varianzas poblacionales
conocidas, al nivel de confianza 1−α

2
2
σ
σ
X
Y 
 X −Y ± z
+
) α /2 n n 
(
X
Y 


226
Ejemplo
Se están utilizando normalmente en una granja avícola
dos tipos de piensos compuestos A y B. Queriendo
comparar la media de engorde con ambos piensos, para
un nivel de confianza 0.9, se alimentan a 20 aves durante
cierto tiempo con el pienso A obteniéndose una ganancia
media de peso de 0.4 Kgr por ave. Simultáneamente a
otras 19 aves se les alimenta con el pienso B y se obtiene
un engorde medio de 0.5 Kgr.
Se conoce por experiencias previas que las variables
objeto de estudio, engorde con cada uno de los piensos,
son normales con varianzas de 0.05 para el pienso A y
0.1 para pienso B. Estimar la diferencia de engorde
medio.
Solución
n A = 20 ;
x A = 0.4 ;
2 = 0.05
σA
nB = 19 ;
xB = 0.5 ;
σ B2 = 0.1

2 σ2
2 σ2 
σ
σ
A + B, x −x +z
A+ B
 x A − xB − zα / 2
A
B
α /2
n A nB
n A nB 



227
n A = 20 ;
x A = 0.4 ;
2 = 0.05
σA
nB = 19 ;
xB = 0.5 ;
σ B2 = 0.1

2 σ2
2 σ2 
σ
σ
A + B, x −x +z
A+ B
 x A − xB − zα / 2
α /2
A
B
n A nB
n A nB 



1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒
zα / 2 = z0.05 = 1.645
0.05
0.90
− z 0.05 = −1.645
0.05
z 0.05 = 1.645

0.05 0.1
0.05 0.1 
+
, 0.4 − 0.5 + 1.645
+
0.4 − 0.5 − 1.645
=
20 19
20 19 

= [ −0.2449, 0.0449]
228
Varianzas poblacionales desconocidas
pero iguales
σ X2 = σ Y2
Estimador: T = X − Y
Distribución muestral
T=
( X − Y ) − ( µx − µ y )
Sp
Sp =
1
1
+
n X nY
→ tn + n − 2
x y
(nx − 1) S x2 + (n y − 1) S y2
nx + n y − 2
P  −tα / 2;n X −nY −2 ≤ tn X −nY −2 ≤ tα / 2;n X −nY −2  = 1 − α


t nX + nY −2
α/2
1−α
t1−α / 2 = −tα / 2
α/2
tα / 2
229
P  −tα / 2;n X −nY −2 ≤ tn X −nY −2 ≤ tα / 2;n X −nY −2  = 1 − α






X − Y ) − µ X − µY
(
≤ tα / 2; n + n − 2  =
P  −tα / 2; n + n − 2 ≤
X
Y
X
Y


1
1
+
Sp


n
n


X
Y
(
)

1
1
P  X − Y − tα / 2; n X + nY −2 × S p
+
≤ µ X − µY ≤
n X nY

1
1 
≤ X − Y + tα / 2; n X + nY − 2 × S p
+
 = 1−α
n X nY 

I.C. para µx−µy, al nivel de confianza 1−α, con
varianzas poblacionales desconocidas pero iguales y
muestra pequeñas

1
1 
+
 X − Y ± tα / 2; n X + nY − 2 × S p

n X nY 


230
Ejemplo
Se están utilizando normalmente en una granja avícola
dos tipos de piensos compuestos A y B. Queriendo
comparar la media de engorde con ambos piensos, para
un nivel de confianza 0.9, se alimentan a 22 aves durante
cierto tiempo con el pienso A obteniéndose una ganancia
media de peso de 0.4 Kgr por ave con una varianza de
0.03. Simultáneamente a otras 20 aves se les alimenta
con el pienso B y se obtiene un engorde medio de 0.5
Kgr con una varianza de 0.09.
Se conoce por experiencias previas que las variables
objeto de estudio, engorde con cada uno de los piensos,
son normales con varianzas poblacionales iguales.
Estimar la diferencia de engorde medio.
Solución

1
1 
+
 x A − xB ± tα / 2;n A + nB − 2 × s p

n
n
A
B

n A = 22 ;
x A = 0.4 ;
σˆ A2 = 0.03
nB = 20 ;
xB = 0.5 ;
σˆ B2 = 0.09
231
n A = 22 ;
x A = 0.4 ;
σˆ A2 = 0.03
nB = 20 ;
xB = 0.5 ;
σˆ B2 = 0.09
nA ˆ 2
2
sA =
σ A = 0.0316 ;
nA − 1
nB ˆ 2
2
sB =
σ B = 0.095
nB − 1
1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒
tα / 2; n A + nB − 2 = t 0.05;40 = 1.684
sp =
2
2
(n A − 1) s A + (nB − 1) sB
n A + nB − 2
= 0.2484
t nX + nY −2 = t40
0.05
0.90
−t 0.05 = −1.684
0.05
t0.05 = 1.684

1
1
+
 x A − xB ± tα / 2;n A + nB − 2×s p
n A nB


=

= [ −0.2292, 0.0292]
232
Varianzas poblacionales desconocidas
2
2
pero iguales, σ X = σ Y
Tamaños muestrales grandes
Estimador: T = X − Y
Distribución muestral:
Z=
( X − Y ) − ( µ X − µY )
S X2
nX
+
S Y2
n X , nY → ∞

→ N (0; 1)
nY
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α
α/2
α/2
1−α
z1−α / 2 = − zα / 2
zα / 2
NOTA: La aproximación se considera correcta para
n X y n Y > 30
233
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α






X − Y ) − µ X − µY
(
≤ zα / 2  = 1 − α
P  − zα / 2 ≤


2
2
S X SY


+


n
n
X
Y


(
)

2
2
S
S

X
Y
+
≤ µ X − µY ≤
P  X − Y − zα / 2
n X nY


2
2 
S X SY 
≤ X − Y + zα / 2
+
= 1−α

n X nY


(
)
(
I.C. para
)
µX − µY, al nivel de confianza 1−α, con
varianzas poblacionales desconocidas y muestras grandes

 X −Y ± z
) α /2
(


S Y2 
+
n X nY 

2
SX
234
Ejemplo
Se están utilizando normalmente en una granja avícola
dos tipos de piensos compuestos A y B. Queriendo
comparar la media de engorde con ambos piensos, para
un nivel de confianza 0.9, se alimentan a 100 aves
durante cierto tiempo con el pienso A obteniéndose una
ganancia media de peso de 0.5 Kgr por ave con una
cuasivarianza de 0.08. Simultáneamente a otras 120 aves
se les alimenta con el pienso B y se obtiene un engorde
medio de 0.2 Kgr con una cuasivarianza de 0.09.
Estimar la diferencia de engorde medio.
Solución

s 2A s B2 
( x − x ) ± z

+
B
α /2
 A
n A nB 


nA = 100 ; x A = 0.5 ;
s 2A = 0.08
nB = 120 ; xB = 0.2 ;
sB2 = 0.09
235
nA = 100 ; x A = 0.5 ;
s 2A = 0.08
nB = 120 ; xB = 0.2 ;
sB2 = 0.09
1 − α = 0.90; α = 0.10; α 2 = 0.05 ⇒
zα / 2 = z0.05 = 1.645
0.05
0.90
− z 0.05 = −1.645
0.05
z 0.05 = 1.645

S A2 S B2 
( x − x ) ± z
=
+
A
B
/2
α

n A nB 



0.08 0.09
0.08 0.09 
= 0.5 − 0.2 − 1.645
+
, 0.5 − 0.2 + 1.645
+
=
100 120
100 120 

= [ 0.2352, 0.3648]
236
7.3.3.2. Intervalos de confianza para el
cociente de varianzas: σ X2 / σ Y2
nX
T=
Estimador:
S X2
S Y2
(
)
2
1
Xi − X
∑
n X − 1 i =1
=
nY
2
1
Yi − Y
∑
nY − 1 i =1
(
)
Distribución muestral
S X2
F=
S Y2
σ X2
=
σ Y2
S X2 σ Y2
S Y2 σ X2
→ Fn X −1, nY −1
P  F1−α / 2; nX −1, nY −1 ≤ F nX −1, nY −1 ≤ Fα / 2; nX −1, nY −1  = 1 − α


α/2
1−α
F1−α / 2; n X −1, nY −1
α/2
Fα / 2; n X −1, nY −1
237
P  F1−α / 2; nX −1, nY −1 ≤ F nX −1, nY −1 ≤ Fα / 2; nX −1, nY −1  = 1 − α




σ Y2 S X2
≤ Fα / 2; nX −1, nY −1  = 1 − α
P  F1−α / 2; nX −1, nY −1 ≤


σ X2 S Y2



2
S Y2 σ Y2
S
≤
≤ Fα / 2; nX −1, nY −1 Y
P  F1−α / 2; nX −1, nY −1
2
2

SX
SX
σ 2X


1

P
 F1−α / 2; n −1, n −1
X
Y

S X2

1

P
 Fα / 2; n −1, n −1
X
Y

2
σ X2
S X2

 = 1−α



 = 1−α
≥
≥
S Y2 σ Y2 S Y2 Fα / 2; nX −1, nY −1 

σ 2X
2
1

 = 1−α
≤
≤
2
2
2
SY σ Y
S Y F1−α / 2; nX −1, nY −1 

SX
SX
1
238

1
P
 Fα / 2; n −1, n −1
X
Y

2
σ 2X
2

1
 = 1−α
≤
≤
2
2
2
SY σ Y
S Y F1−α / 2; nX −1, nY −1 

SX
1
F1−α / 2; nX −1, nY −1

1

P
 F1−α / 2; n −1, n −1
X
Y

S X2
SX
= Fα / 2; nY −1, n X −1
σ 2X

S X2 
≤
≤ Fα / 2; nY −1, n X −1
= 1−α
2
2
2
SY
SY
σY

2
2
I.C. para σ X / σ Y con medias poblacionales
desconocidas, al nivel de confianza 1−α

1

 Fα / 2; nX −1, nY −1

2 
SX

, Fα / 2 ; nY −1 , n X −1
SY2
SY2 
2
SX
239
Ejemplo
Una central lechera recibe diariamente leche de dos
granjas A y B. Deseando estudiar la calidad de los
productos se eligen dos muestras al azar de la leche
suministrada por cada una de las granjas analizando el
contenido en grasa. Para la granja A se han tomado 11
muestras obteniéndose una cuasivarianza de 0.034,
mientras que para la granja B ha sido de 0.027 en un total
de 16 muestras.
Es conocido por experiencias previas que los contenidos
medios en grasa de la granjas son normales e
independientes. Estimar el cociente de varianzas al nivel
de confianza de 0.98.
Solución

1

 Fα / 2; nA −1, n B −1

s 2A
s 2A 

,
F
/
2;
1,
1
α
n
−
n
−
B
A
s B2
s B2 

n A = 11 ; s A2 = 0.034 ; nB = 16 ; sB2 = 0.027
240
n A = 11 ; s A2 = 0.034 ; nB = 16 ; sB2 = 0.027
1 − α = 0.98; α = 0.02; α 2 = 0.01 ⇒
Fα / 2; n A −1, nB −1 = F 0.01;10, 15 = 3.80
Fα / 2; nB −1, n A −1 = F 0.01;15, 10 = 4.56

1

 Fα / 2; nA −1, n B −1

s 2A
s 2A 
=
,
F
/
2;
1,
1
α
n
−
n
−
B
A
s B2
s B2 

0.034 
 1 0.034
×
=
= [ 0.3314, 5.7422]
, 4.56 ×

0.027 
 3.80 0.027
241
7.3.4.
Intervalo de confianza para una
proporción
Se muestrea una población para estimar el parámetro
proporción
p : proporción de éxitos en la población
X : “número de éxitos en n realizaciones independientes”
n conocido
X
B (n; p)
Parámetro a estimar: p
Estimador puntual de p: p̂ = X / n
Distribución asintótica ( n → ∞ ):
n → ∞
X → N ( np ; npˆ (1 − pˆ ) )

pˆ (1 − pˆ ) 
X
n→∞
pˆ =

→ N  p;

n
n


Z=
pˆ − p
pˆ ( 1 − pˆ )
n
n → ∞
→ N ( 0; 1)
242
pˆ − p
Z=
pˆ (1 − pˆ )
n
α/2
n→∞
→ N (0;1)
α/2
1−α
z1−α / 2 = − zα / 2
zα / 2
P [ − zα / 2 ≤ Z ≤ zα / 2 ] = 1 − α
P [ − zα / 2 ≤
pˆ − p
≤ zα / 2 ] = 1 − α
pˆ (1 − pˆ )
n

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
P  pˆ − zα / 2
≤ p ≤ pˆ + zα / 2
 = 1−α
n
n


I.C. para el parámetro proporción, al nivel 1−α

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + zα / 2
 pˆ − zα / 2

n
n


243
Ejemplo
Se ignora la proporción de ranas tigre que se encuentran
en una región de México. Para dar una estimación se ha
tomado una muestra de 100 ranas observando que 15 de
ellas son de este tipo. Hallar un intervalo de confianza al
nivel de confianza del 0.95 para la proporción de ranas
tigre.
Solución
15
pˆ =
= 0.15
100
;
zα / 2 = z0.025 = 1.96

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + zα / 2
 pˆ − zα / 2
=
n
n



0.15 × 0.85
0.15 × 0.85 
, 0.15 + 1.96
=  0.15 − 1.96
=
100
100


= [ 0.081, 0.219]
244
7.3.5.
Intervalo de confianza para la
diferencia de proporciones
Se muestrean dos poblaciones independientes para
estimar la diferencia de proporciones
p1 − p2 : diferencia de proporciones de éxitos en la población
X : “número de éxitos en n realizaciones independientes”
Y : “número de éxitos en m realizaciones independientes”
nX y nY conocidos
Parámetro a estimar : p1 − p 2
p1 − p 2 = X n X − Y nY
Estimador puntual de p1 − p 2 : Distribución asintótica
X
Y
p1 − p 2 =
−
n X nY
(
( n X , nY
)
→ ∞ :
∞
→
n X , nY →
)
(

p1 1 − p1
p2 1− p2
+
N  p1 − p2 ;

nX
nY

) 


245
Z=
p 2 ) − ( p1 − p 2 )
( p1 − n ,n → ∞
→ N (0; 1)
p1 (1 − p1 ) p 2 (1 − p2 )
+
X
nX
Y
nY
α/2
α/2
1−α
z1−α / 2 = − zα / 2
zα / 2
P [ − zα / 2 ≤ Z ≤ zα / 2 ] =



P  − zα 2 ≤







− p1 − p 2
≤ zα 2  = 1 − α

p2 1 − p2

+

nY

p2 ) (
)
( p1 − p1 (1 − p1 )
( )
nX
246



P  − zα 2 ≤







− p1 − p 2
≤ = 1 − α

p2 1 − p2

+

nY

p2 ) (
)
( p1 − p1 (1 − p1 )
( )
nX
(
)
(
) (

p
1
p
p
1
p2
−
−
1
1
2
 P  p1 − p 2 − zα 2
+
≤ p1 − p 2 ≤
nX
nY

(
)
(
)
p1 − p 2 + zα 2
≤ (
p1 1 − p1
nX
)
(
)
)

p2 1 − p2 
+
= 1−α

nY

I.C. para la diferencia de proporciones, al nivel
de confianza 1−α
(
)
(

p
1
p
p
1
p2
−
−
1
1
2
 +
 p1 − p 2 ± zα 2
nX
nY

(
)
)




247
Ejemplo
Se desean comparar las proporciones de ranas pipiens
que se encuentran en dos regiones independientes de
México. Para dar una estimación se ha tomado una
muestra de 80 ranas observando que 5 de ellas son de
este tipo en la zona A, habiendo 8 de 100 en la zona B.
Hallar un intervalo de confianza al nivel de confianza del
0.95 para la diferencia de proporciones de ranas pipiens.
Solución
5
p1 =
= 0.0625 ;
80
8
p2 =
= 0.08 ;
100
zα / 2 = z 0.025 = 1.96
n X = 80 ;
(
)
nY = 100
(

p
1
p
p
1
p2
−
−
1
1
2

−
+
p
p 2 ± zα / 2
1

nX
nY

)

=



 0.0625 − 0.08 ± 1.96 0.0625(1 − 0.0625) + 0.08(1 − 0.08)
80
100



=


= [ −0.0926, 0.0576]
248
Descargar