Inferencia estadística – Intervalos de confianza

Anuncio
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
Inferencia estadística – Intervalos de confianza
Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar
dicha estimación por una “medida” de la precisión de la estimación. Un modo de hacerlo
es informar el estimador y su error standard. Otro modo es reemplazar la estimación
puntual por un intervalo de valores posibles para el parámetro.
Ejemplo:
Supongamos que
tenemos una m.a.
X 1 , X 2 ,..., X n de una distribución
N ( µ , σ ) con varianza σ conocida. Por ser los datos normales, sabemos que
2
o
2
o
 σ o2
X ~ N  µ ,
n





⇔
X −µ
~ N (0,1)
σo
n
y, por lo tanto, sabemos que la probabilidad de que
n
X −µ
se encuentre entre –1.96 y
σo
1.96 es 0.95, es decir


X −µ
P − 1.96 ≤ n
≤ 1.96  = 0.95
σo


177
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
A partir de esta expresión obtenemos
σ
σ 

P − 1.96 o ≤ X − µ ≤ 1.96 o  = 0.95
n
n

⇔
σ
σ 

P X − 1.96 o ≤ µ ≤ X + 1.96 o  = 0.95
n
n

Es decir, que la probabilidad de que el intervalo
σo
σ 

, X + 1.96 o 
 X − 1.96
n
n

contenga al verdadero valor del parámetro µ es 0.95. Este intervalo se denomina intervalo de
confianza para µ de nivel de confianza 0.95.
Definición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ.
Dadas dos funciones de la muestra a ( X 1 , X 2 ,...., X n ) y b( X 1 , X 2 ,...., X n ) tales que
P(a ( X 1 , X 2 ,..., X n ) ≤ θ ≤ b( X 1 , X 2 ,..., X n ) ) = 1 − α
con α pequeño (por ejemplo, 0.10, 0.05, 0.01), el intervalo [a ( X 1 , X 2 ,..., X n ), b( X 1 , X 2 ,..., X n )] se
denomina intervalo de confianza de nivel 1 - α para el parámetro θ.
Interpretación: Supongamos que, en base a diferentes muestras calculamos los correspondientes
intervalos de confianza para θ. Entonces el (1 - α) 100% de ellos contendrán al verdadero valor θ.
178
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
Observaciones: 1) No es correcto decir “la probabilidad de que θ pertenezca al intervalo (a,b)
es 1 - α” porque θ no es una variable aleatoria. El intervalo es aleatorio ya que sus extremos son
funciones de la muestra y por lo tanto, debemos decir “la probabilidad de que el intervalo (a,b)
contenga al parámetro θ es 1 - α”
2) Una vez construído el intervalo a partir de una muestra dada, ya no tiene sentido hablar de
probabilidad. En todo caso, tenemos “confianza” de que el intervalo contenga a θ. La confianza
está puesta en el método de construcción de los intervalos, que nos asegura que (1 - α) 100% de
las muestras producirán intervalos que contienen a θ.
Intervalos de confianza para los parámetros de una distribución normal
n 1
2 2
Distribución t: Sean dos v.a. Z ~N(0,1) y U ~ χ n2 = Γ ,  independientes, entonces
Z
T=
U
~ tn
n
Se dice que T tiene distribución t de Student con n grados de libertad. Esta distribución
está tabulada para diferentes valores de n. Su densidad es simétrica respecto al 0 y tiene
forma de campana, pero tiene colas más pesadas que la distribución normal standard.
Cuando n tiende a infinito, la distribución de Student tiende a la distribución normal
standard.
Proposición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ2), entonces
a)
 σ2
X ~ N  µ ,
n




⇔
n
X −µ
~ N (0,1)
σ
n
b)
(n − 1) S
~ χ n2−1
2
σ
c)
X y S 2 son independientes
2
d)
n
con S 2 =
∑ (X
i =1
i
− X )2
n −1
X −µ
~ t n −1
S
Dem: a) Ya hemos visto que cualquier combinación de v.a. normales independientes es
normal y el promedio es una combinación lineal particular.
179
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
b) y c) Están fuera del alcance de este curso.
e) Resulta de a) b) y c) pues
n
X −µ
~ N (0,1)
σ
y
(n − 1) S 2
~ χ n2−1
2
σ
son v.a. independientes. Entonces, por definición de la distribución t de Student,
X −µ
X −µ
σ
= n
~ t n −1
S
(n − 1) S 2
σ 2 (n − 1)
n
Intervalo de confianza para la media de la distribución normal con varianza
conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ o2 ), con varianza σ o2
conocida, entonces
n
X −µ
~ N (0,1)
σo


X −µ
P − zα / 2 ≤ n
≤ zα / 2  = 1 − α
σo


de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,
σo
σ 

, X + zε / 2 o 
 X − zε / 2
n
n

(1)
Intervalo de confianza para la media de la distribución normal con varianza
desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces
n
X −µ
~ t n −1
S
180
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004


X −µ
P − t n −1,α / 2 ≤ n
≤ t n −1,α / 2  = 1 − α
S


de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,

S
S 
, X + t n −1,α / 2
 X − t n −1,α / 2

n
n

Intervalo de confianza para la varianza de la distribución normal con media
conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µo, σ 2 ), con media µo
conocida, entonces
X i − µo
~ N (0,1)
σ
2
∀1 ≤ i ≤ n
⇒
 X i − µo 
1 1

 ~ χ 12 = Γ , 
2 2
 σ

∀1 ≤ i ≤ n
Como además las v.a. son independientes
2
 X i − µo 
n 1

 ~ χ n2 = Γ , 
∑
σ
 2 2

i =1 
n
¿Cómo elegimos los percentiles de la distribución χ2 que encierran un área igual a 1 - α?
χ n2,1−α / 2
χ n2,α / 2
181
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
Los elegimos de manera tal que quede un área igual a α/2 en cada extremo. Entonces,
n


( X i − µ o )2


∑
2
2
i =1

≤ χ n ,α / 2  = 1 − α
P χ n ,1−α / 2 ≤


σ2




Se obtiene el siguiente intervalo
n
 n
2
(
)
( X i − µ o )2 
µ
X
−
∑
∑
i
o

 i =1 2

, i =1 2
χ
χ n ,1−α / 2


n ,α / 2




Intervalo de confianza para la varianza de la distribución normal con media
desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces
(n − 1) S 2
~ χ n2−1
2
σ
Por lo tanto,


(n − 1) S 2
P χ n2−1,1−α / 2 ≤
≤ χ n2−1,α / 2  = 1 − α
2
σ


Se obtiene el siguiente intervalo
 (n − 1) S 2 (n − 1) S 2 
, 2
 2

 χ n −1,ε / 2 χ n −1,1−ε / 2 
Ejemplos: Sea X 1 , X 2 ,..., X 49 una m.a., X i ~ N ( µ , σ 2 ) .
a) Supongamos que el verdadero valor del desvío standard es σo = 35 y que se observa
x = 160 y construyamos un intervalo de confianza para la media de nivel 0.95.
Como las v.a. son normales y la varianza es conocida, el intervalo para µ será de la forma
182
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
σ
σ 

 X − z ε / 2 o , X + z ε / 2 o 
n
n

con zα / 2 = z 0.025 = 1.96 , σ o = 35, n = 49 y valor observado de X igual a 160. Obtenemos

35
35 
160 − 1.96
 = (160 − 9.8, 160 + 9.8) = (150.2, 169.8)
, 160 + 1.96
49
49 

b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S
es s=35. El correspondiente intervalo de confianza para µ será de la forma

S
S 
 X − t n −1,α / 2

, X + t n −1,α / 2
n
n

con t n −1,α / 2 = t 48, 0.025 = 2.01 . Obtenemos

35
35 
160 − 2.01
 = (160 − 10.05, 160 + 10.05) = (149.95, 170.05)
, 160 + 2.01
49
49 

Notemos que es más ancho que el anterior
c) Suponiendo como antes que observamos x = 160 y s = 35 , hallemos un intervalo de
confianza para σ2 de nivel 0.95.
Por tratarse de una muestra normal con media desconocida, el intervalo para σ2 será de
la forma
 (n − 1) S 2 (n − 1) S 2

, 2
 χ2
 n −1,ε / 2 χ n −1,1−ε / 2




2
con χ n2−1,α / 2 = χ 48
, 0.025 = 69.02 y χ n −1,1−α / 2 = χ 48, 0.975 = 30.75 . Obtenemos
 48 ⋅ 35 2 48 ⋅ 35 2

,
 69.02 30.75

 = (851.93, 1912.20)

y un intervalo de confianza para σ de nivel 0.95 será
 48 ⋅ 35 2 48 ⋅ 35 2

,
 69.02
30.75


=


(
)
851.93 , 1912.20 = (29.19, 43.73)
183
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
Esto último resulta de aplicar una función monótona creciente a cada extremo del
intervalo para σ2
Determinación del tamaño de muestra: Consideremos el intervalo de confianza para µ con
varianza conocida en el caso de una m.a. normal. La longitud del intervalo obtenido (1) es
L = 2 zα / 2
σo
n
y depende de
•
•
•
nivel de confianza (α)
varianza o desvío standard de las observaciones (σo)
tamaño de la muestra (n)
Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando
el tamaño de la muestra. Si se desea una longitud menor o igual que Lo, entonces
L = 2 zα / 2
 2z σ
2z σ
≤ Lo ⇔ n ≥ α / 2 o ⇔ n ≥  α / 2 o
Lo
n
 Lo
σo



2
Ejemplo: Supongamos que σo = 35, ¿qué tamaño de muestra se requiere como mínimo
para obtener un intervalo de nivel 0.95 de longitud menor o igual que 10?.
Por lo tanto, Lo = 10, σ o = 35 y z 0.025 = 1.96 , entonces
2
 2 ⋅ 1.96 ⋅ 35 
n≥
 = 188.23
10


⇒
n ≥ 189
En el caso de varianza desconocida el problema es más complejo porque el percentil t
también depende del tamaño de muestra.
Método general para obtener intervalos de confianza:
Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ.
Supongamos que existe una función T ( X 1 , X 2 ,..., X n , θ ) (es decir, una función de la
muestra y del parámetro) cuya distribución no depende de θ ni de ningún otro parámetro
desconocido. Entonces, existen dos valores a y b tales que
P(a ≤ T ( X 1 , X 2 ,..., X n ,θ ) ≤ b ) = 1 − α
y, a partir de esta expresión, es posible obtener un intervalo de confianza para θ.
184
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
La función T ( X 1 , X 2 ,..., X n , θ ) se denomina pivote.
Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución exponencial de parámetro λ.
Hemos demostrado que
n
∑X
i =1
i
~ Γ(n, λ )


Usando este resultado y que, si V ~ Γ(α , λ ) y a > 0 entonces aV ~ Γα,
λ
 , se puede
a
demostrar que
n
 2n 1 
2λ ∑ X i ~ χ 22n = Γ , 
 2 2
i =1
función T ( X 1 , X 2 ,..., X n , λ ) = 2λ
Usando como pivote la
n
∑X
i =1
i
, podemos obtener un
intervalo de confianza de nivel 1 - α para el parámetro λ.
n


P χ 22n ,1−α / 2 ≤ 2λ ∑ X i ≤ χ 22n ,α / 2  = 1 − α
i =1




χ 2 n ,1−α / 2
χ 2 n ,α / 2
≤λ ≤ n
P n

2∑ X i
 2∑ X i
i =1
 i =1


 =1−α



y el intervalo requerido es


χ

χ
 2 nn,1−α / 2 , 2nn ,α / 2 


 2∑ X i 2 ∑ X i 
i =1
 i =1

Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución U(0,θ). Para obtener un intervalo
de confianza para θ , recordemos que el EMV de θ es θˆ = max ( X 1 ,..., X n ) y probemos
que la distribución de θˆ / θ no depende de θ.
Llamemos V a la v.a. max ( X 1 ,..., X n ) . Recordemos que, si X 1 , X 2 ,..., X n es una m.a. de
una distribución FX, entonces la función de distribución de V está dada por
185
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
FV (v) = (FX (v) )
2004
n
Queremos demostrar que la distribución de V/θ. no depende de θ.
(
V

FV / θ ( w) = P ≤ w  = P(V ≤ θ w) = FV (θ w) = FX i (θ w)
θ

)
n
Como, en nuestro caso, X i ~U(0,θ),
(
FV / θ ( w) = FX i (θw)
)
n
si θ w ≤ 0
 0
 θw  n
=  
 θ 
 1
si 0 < θ w < θ
si θ w ≥ θ
 0

= w n
 1

si w ≤ 0
si 0 < w < 1
si w ≥ 1
Por lo tanto, la distribución de V/θ no depende de θ. Derivando, se obtiene la densidad de
V/θ
f V / θ ( w) = n w n −1 I ( 0,1) ( w)
Utilizando T ( X 1 , X 2 ,..., X n , θ ) =
max ( X 1 ,..., X n )
como pivote, obtendremos un intervalo
θ
de confianza para θ de nivel 1 - α. Buscamos a y b tales que
max ( X 1 ,..., X n )


P a ≤
≤ b = 1−α
θ


y, obtenemos el siguiente intervalo
 max ( X 1 ,..., X n ) max ( X 1 ,..., X n ) 
,


b
a


¿Cómo elegimos a y b?. Observando (2), debemos hallar a y b , 0 < a < b < 1, tales que
b
∫nw
a
n −1
dw = w n
b
a
= bn − an =1 − α
(2)
Obviamente hay infinitas soluciones de esta ecuación, pero podríamos elegir la solución
que produce el intervalo de menor longitud esperada, es decir, buscar a y b que
minimicen E(L) sujeto a la condición (2), siendo
186
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
1 1
L = max ( X 1 ,..., X n ) − 
a b
Como ya hemos demostrado que E (max ( X 1 ,..., X n ) =
n 1
θ −
n +1  b
n
θ , debemos minimizar
n +1
1

a
(3)
sujeto a la condición b n − a n = 1 − α .
Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta
última expresión a en función de b, reemplazándola en (3) y minimizando la expresión
resultante respecto de a.
El intervalo de mínima longitud esperada es
 max( X 1 ,..., X n ) max ( X 1 ,..., X n ) 


,
n
1
α


Intervalos de confianza de nivel asintótico 1 - α:
En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto
1 - α, o bien son de muy difícil construcción. En otro casos disponemos de muy poca
información sobre la distribución de las variables aleatorias. En estos dos tipos de
situaciones es posible obtener intervalos de confianza de nivel aproximado cuando
tenemos un tamaño de muestra grande.
Definición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro
θ. Dadas dos sucesiones {a n ( X 1 , X 2 ,...., X n )} y {bn ( X 1 , X 2 ,...., X n )} tales que
lim P(a n ( X 1 , X 2 ,..., X n ) ≤ θ ≤ bn ( X 1 , X 2 ,..., X n ) ) = 1 − α
n→∞
la sucesión de intervalos
[a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )]
es una sucesión de
intervalos de confianza de nivel asintótico 1 - α para el parámetro θ. También se dice
que, si n es suficientemente grande, el intervalo [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )]
tiene nivel aproximado 1 - α.
¿Porqué calcular intervalos de nivel asintótico?
•
•
•
Porque no es posible encontrar una función pivote que no dependa del parámetro
Porque no se conoce a distribución exacta de la función pivote
Porque en general es más fácil encontrar la distribución asintótica que la exacta de la
función pivote
187
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
Ejemplos: 1) Sea
2004
X 1 , X 2 ,..., X n una m.a. de una distribución F con E(Xi) = µ y
2
V(Xi) = σ < ∞. Buscamos un intervalo de confianza para µ.
Sabemos que X es un estimador insesgado y consistente de µ. No conocemos su
distribución exacta porque no conocemos la de Xi, pero sabemos que
n
X −µ d
→ N (0,1)
σ
Si σ2 es conocido, esta función podría servir de pivote para el intervalo de nivel
aproximado, pero qué usamos si σ2 es desconocido.
Propiedad:
d
Yn 
→
Y

p
Un 
→ a 
⇒
d
U n Yn 
aY
→
p
→
σ por ser un estimador consistente, entonces
Como s 
s p
σ p

→1 y 
→1 .
σ
s
Luego,

X −µ d
→ N (0,1)
σ

σ p

→1
s

n
⇒
n
X −µ d
→ N (0,1)
s
A partir de este resultado,


X −µ
P − zα / 2 ≤ n
≤ zα / 2  → 1 − α
s


y se obtiene el siguiente intervalo de nivel aproximado 1 - α
s
s 

, X + zα / 2
 X − zα / 2

n
n

188
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
Intervalo de confianza de nivel asintótico 1 - α para el parámetro p de la
distribución Binomial:
X 1 , X 2 ,..., X n una
Sea
m.a.
de
una
distribución
Bi(1,p) . Entonces
n
X = ∑ X i ~ Bi (n, p) . Queremos construir un intervalo de nivel asintótico 1 - α para p.
i =1
Recordemos que, por el TCL,
n
X
pˆ = =
n
∑X
i =1
n
i (a)
 p (1 − p ) 
~ N  p,

n


y, por lo tanto


P − zα / 2 ≤



X

−p
n
≤ zα / 2  ≅ 1 − α
p (1 − p )

n

(4)
Hay dos formas de obtener un intervalo para p a partir de esta última expresión.
n
X
=
a) Como
n
∑X
i =1
n
i
p

→
p por la Ley de los Grandes Números, podemos aplicar la
Propiedad enunciada antes y reemplazar en el denominador del pivote p por su
estimador. Entonces


P − zα / 2 ≤




X
P − z α / 2
n



X

−p
n
≤ zα / 2  ≅ 1 − α
pˆ (1 − pˆ )

n

X
X
1 − 
X
n
n
≤ p ≤ + zα / 2
n
n
X
X 
1 −  
n
n 
 ≅1−α
n



189
Probabilidades y Estadística (Computación)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martínez
2004
obteniendo un intervalo para p de nivel aproximado 1 – α.
b) Reescribimos la expresión (4) en la forma



P




X

−p

n
≤ zα / 2  ≅ 1 − α
p(1 − p)


n

⇔
2
 X

  − p 

 n


2
P
≤ zα / 2  ≅ 1 − α
p(1 − p)




n


Observemos que
2
X

 − p
n
 ≤ z2
α /2
p (1 − p )
n
2
p (1 − p )

X
2
 − p  ≤ zα / 2
n
n

⇔
2
⇔
⇔
p(1 − p )
X
X
2
2
≤0
  − 2 p + p − zα / 2
n
n
n

zα2 / 2 

−
p 1 +

n


2
2
 2 X zα2 / 2   X 
+  ≤0
p
+
 n
n
n


Buscamos las raíces de esta ecuación de segundo grado, que llamaremos p̂1 y p̂ 2 y el
intervalo pedido será
( pˆ 1 , pˆ 2 )
190
Descargar