PRCTICA 11: ESTIMACIN POR INTERVALO

Anuncio
1
PRÁCTICA 11: ESTIMACIÓN POR INTERVALO
EJERCICIO 1
25
) = N (μ, ¼) .
100
Construyamos un intervalo aleatorio simétrico respecto a la media (si no se exige que sea
simétrico, entonces se pueden encontrar infinitos intervalos aleatorios):
1)
Como X ∼ N (μ, 25) y X1, ..., X100 son i.i.d, entonces X100 ∼ N (μ,
P ( X100 – ε ≤ μ ≤ X100 + ε) = 0,95 ⇔ P (μ – ε ≤ X100 ≤ μ + ε) = 0,95 ⇔ P ( X100 − μ ≤ ε ) =
X100 − μ
X100 − μ
ε
) = 0,95 donde Z =
∼ N (0, 1) ⇔
1/ 2
1/ 2
1/ 2
−ε
−ε
) = 0,025 ⇔
= – 1,96 ⇔ ε = 0,98.
(simetría de la normal) : P ( Z ≤
1/ 2
1/ 2
Por lo tanto el intervalo aleatorio simétrico (respecto a la media muestral) para μ y al 95% es:
0,95 ⇔ (estandarizo): P (
≤
( X100 – 0,98; X100 + 0,98) es decir, cumple que: P ( X100 – 0,98 ≤ μ ≤ X100 + 0,98) = 0,95
En general podemos escribir este intervalo aleatorio, con una confianza (1 – α), de la siguiente
forma:
σ
σ
( Xn – z α
; Xn + z α
)
−
1−
1
n
n
2
2
2) Si X100 = 20 ⇒ el intervalo nos queda: ( X100 – 0,98; X100 + 0,98) = (19,02; 20,98).
3) Observemos que μ es una constante (es fija, aunque desconocida) no una variable
aleatoria y que el intervalo aleatorio depende de la muestra y, en particular, de la media
muestral. Una vez “sorteada” la muestra, el intervalo es fijo y como μ también, no se puede
hablar de que la probabilidad de que μ esté dentro del intervalo es de un tanto por
ciento: un número fijo está o no está dentro de un intervalo fijo. Por ello se habla de confianza
y se puede interpretar de la siguiente forma: si se eligieran muchas muestras, se puede
esperar que el 95% de los intervalos aleatorios contengan a la media poblacional μ.
EJERCICIO 2
Sean Xi = la variable aleatoria que vale 1 si el i-ésimo encuestado está a favor del candidato A
y 0 en caso contrario, para 1 ≤ i ≤ n. Entonces cada Xi ∼ Bernoulli (p), donde p es la
probabilidad de que una persona esté a favor del candidato A.
Anteriormente vimos que Xn cumple que:
V( X)
p (1 − p)
=
E ( Xn ) = E (Xi) = p; V ( Xn ) =
n
n
Por el Teorema del Límite Central sabemos que:
Xn − p
d
N (0, 1)
⎯⎯→
p (1 − p)
n
Y por la Práctica 8, Ejercicio 4, parte 3:
Xn − p
d
N (0, 1)
⎯⎯→
Xn (1 − Xn )
n
De la misma forma que en Ejercicio 1, podemos plantear un intervalo aleatorio simétrico:
( Xn – z
1−
α
2
Xn (1 − Xn )
; Xn + z α
1−
n
2
Xn (1 − Xn )
)
n
2
a) Por lo antedicho, el intervalo de confianza aproximado al 99% con base en la muestra es:
1400
1400
1400
1400
(1 −
(1 −
)
)
1400
1400
2500
2500
2500 ;
2500 ) = (0,5344; 0,5856)
– 2,576
+ 2,576
(
2500
2500
2500
2500
Con base en este resultado se puede afirmar que A ganará la elección, porque el
intervalo obtenido tenía, a priori, una probabilidad muy alta. El investigador asigna una
probabilidad de confianza del 99% a que el candidato A tendrá más del 50% de los votos.
b) En este caso el intervalo es:
126
126
(1 −
)
126
225
225 ; 126 + 2,576
(
– 2,576
225
225
225
126
126
(1 −
)
225
225 ) = (0,4748; 0,6452)
225
Estos resultados son diferentes a los del literal a), pues al disminuir el tamaño de muestra la
“precisión” es menor, lo que en la variable aleatoria se refleja en que V ( X 2500 ) < V ( X 225 ). Ya
no es posible afirmar que más del 50% de los votos serán para el candidato A.
c) Es claro que la distribución de Xi no es en realidad Bernoulli, lo cual se debe a que en la
práctica la selección no se hace con reposición. Sin embargo, dado que el tamaño de la
población se puede suponer grande en relación a la muestra, la probabilidad de que se
encueste dos o más veces a una misma persona se puede suponer despreciable. En cuanto a
la aproximación por medio de la normal, es razonable dado que se cumplen las
recomendaciones de Cochran (con p ≅ 0,56 alcanza con n > 50).
EJERCICIO 3
a)
Intervalo aleatorio para el promedio con varianza conocida: ( Xn – z
σ
; Xn + z
σ
).
n
n
En este caso el valor de tablas es el que acumula 95% hasta el límite superior, bajo una curva
normal estándar, esto es, 1,645. El promedio es 620 / 20 = 31, de lo que resulta el intervalo:
α
1−
2
α
1−
2
(31 – 1,645 x 2 / 20 ; 31 – 1,645 x 2 / 20 ) = (30,3 ; 31,7)
b) Ahora la varianza es desconocida. Si se la estima con el estimador insesgado proporcionado
por la muestra, entonces el intervalo toma la forma (recordar que la población tiene distribución
normal):
( Xn – t n −1
s
n
; Xn + t n −1
s
)
n
Siendo “s” la raíz cuadrada de la cuasi-varianza de la muestra. En este caso es s = 4,5412 y el
valor de tablas es t19(0,95) = 1,73. El intervalo resulta: (29,2 ; 32,8).
Este intervalo es más amplio por dos motivos: i) porque la estimación del desvío estándar
resultó bastante mayor que el valor de sigma supuesto en la primera parte, ii) porque el valor
de tablas de la distribución t es mayor que el de la normal estándar (la varianza de la “t” es un
poco mayor que la de “z”).
3
EJERCICIO 4
Sea Xi = la v.a. que vale 1 si el i-ésimo consumidor está a favor del nuevo producto, y 0 en
caso contrario. Entonces, si suponemos independencia en las preferencias, cada Xi ∼ Bernoulli
(p); siendo p la probabilidad de que un consumidor prefiera el nuevo producto.
p
p por la Ley débil de los Grandes Números, esto nos sugiere aplicar
Además, como Xn ⎯⎯→
la desigualdad de Tchebychev a la media muestral con lo que obtenemos:
a) Primera interpretación
P ( ⎜ Xn – p ⎪ ≤ 0,01 ) ≥ 1 –
⇔
p (1 − p )
0,012 n
V ( Xn )
2
0,01
= 1–
V ( X)
= 1–
2
0,01 n
p (1 − p )
0,012 n
≤ 0,05 ⇔ n ≥ 200000 p (1 – p)
≥ 0,95 ⇔
n
50.000
Es decir que el tamaño de la muestra depende de p,
aunque para n ≥ 50.000 la condición se satisface
para todo p, pues el máximo de p (1 – p) es ¼.
Además si p está cerca de cero o de uno, alcanza un
tamaño de muestra pequeño.
0
1
p
Segunda interpretación
P ( ⎜ Xn – p ⎪ ≤ 0,01 p) ≥ 1 –
1− p
2
0,01 p n
V ( Xn )
2
0,01 p
≤ 0,05 ⇔ n ≥ 200000
2
=1–
p (1 − p)
2
2
0,01 p n
=1–
1− p
0,012 p n
≥ 0,95 ⇔
1− p
p
n
Para este caso si el p está cerca de cero, como el
error depende de dicho parámetro (y por lo tanto sería
chico) el tamaño de muestra debería ser grande.
0
1
p
b) Utilizando el Teorema del Límite Central, los resultados cambian significativamente:
Primera interpretación
Xn − p
d
En el Ejercicio anterior vimos que:
N (0, 1). Por lo tanto:
⎯⎯→
p (1 − p )
n
P ( ⎜ Xn – p ⎪ ≤ 0,01 ) ≥ 0,95 ⇔ P (
Xn − p
p (1 − p)
n
≤
0,01
p (1 − p)
n
) ≥ 0,95 ⇔
0,01
p (1 − p)
n
≥ 1,96
p (1 − p)
⇔ n ≥ 38416 p (1 – p)
n
La gráfica aquí es similar al caso anterior y la condición se satisface para todo p si n ≥ 9604
⇔ 0,012 ≥ 1,962
Segunda interpretación
P ( ⎜ Xn – p ⎪ ≤ 0,01 p ) ≥ 0,95 ⇔ P (
Xn − p
p (1 − p)
n
≤
0,01 p
p (1 − p)
n
) ≥ 0,95 ⇔
0,01
p
(1 − p)
n
≥ 1,96
4
⇔ n ≥ 38416
1− p
p
EJERCICIO 5 (CANAVOS 8.24)
Sea X = volumen de ventas diarias de donas
a) Se supone que X ∼ N (μ, 502) ⇒ Xn ∼ N (μ, 502/n)
Entonces debemos hallar n, para que P ( Xn − μ ≤ 20 ) = 0,95 ⇔
⇔ P(
Xn − μ
50 / n
≤
20
50 / n
20
) = 0,95 ⇔
50 / n
= z0,97 ⇔ n = 24,01
Por lo tanto como n es un tamaño de muestra, debe cumplir que n ≥ 25.
b) Por Tchebychev:
P ( ⎜ Xn – μ⎪ ≤ 20 ) ≥ 1 –
⇒
V ( Xn )
20
2
≤ 0,05 ⇔
V ( Xn )
20 2
50 2 / n
20 2
≥ 0,95
⇔ n ≥ 125
Nótese la diferencia entre tamaños muestrales necesarios para la mencionada confianza,
cuando se puede suponer normalidad y cuando no se puede.
EJERCICIO 6
a) Intervalo para p:
80
0,2 x0,8
± 1,96 *
= 0,20 ± 0,0392 ⇒ (0,1608 ; 0,2392) .
400
400
b) Intervalo para N.p: 10.000 x (0,1608 ; 0,2392) = (1.608 – 2.392).
⎛
⎜
⎜
c) P X − p < 0,03 ≥ 0,95 ⇒ Φ
⎜
⎜
⎝
(
)
⎞
⎟
0,03 ⎟
≥ 0,975. La “peor” situación se
p.(1 − p ) ⎟
⎟
n
⎠
presenta cuando p= ½ en términos del tamaño de la muestra (porque es cuando la
varianza del estimador se vuelve más grande). En el problema nos dicen que de
ninguna manera puede ser p mayor que 0,30. Entonces en la fórmula anterior
corresponde utilizar dicho valor. Resulta:
⎛
⎜
0,03
Φ⎜
⎜ 0,3 x0,7
⎜
n
⎝
⎞
⎟
⎟ ≥ 0,975 ⇒
⎟
⎟
⎠
2
⎛ 1,96 ⎞
≥ 1,96 ⇒ n ≥ ⎜
⎟ x0,21 ≅ 896,37 .
0,21
⎝ 0,03 ⎠
0,03 x n
En consecuencia, el tamaño mínimo de muestra necesario es n = 897.
5
EJERCICIO 7
1) Como (20, 30) es un intervalo de confianza simétrico respecto de la media muestral para
μ, entonces
μ̂ es
x n = 25. El extremo superior del intervalo es entonces: 25 + 2,576.
σ2
25
=
30 ⇒ σ2 = 25 × (5 / 2,576)2 = 94,19.
2) La Afirmación 1 es falsa. El primer error es asegurar que sucederá algo (99 medias
muestrales pertenecerán a dicho intervalo), pues la esencia del experimento es aleatoria. El
segundo es que la condición P ( Xn − μ ≤ 5 ) = 0,99 (ε = 5, en este caso) de la cual partimos no
nos asegura el verdadero valor de μ y por lo tanto una vez extraída la muestra queda fijo el
intervalo de confianza, pero no se pueden calcular probabilidades con respecto a la variable
Xn .
La Afirmación 2 es falsa: media poblacional hay una sola.
La Afirmación 3 es verdadera: lo esperado es que si se eligen muchas muestras, un 99% de los
intervalos aleatorios generados por respectivas muestras contengan a la media poblacional.
EJERCICIO 8 (CANAVOS 8.34)
Sea X = el espesor de las láminas de plástico que produce una máquina
S2
Si X se supone normal, entonces n 2 ∼ χ2 (n – 1). Queremos, ahora, calcular un intervalo de
σ
confianza simétrico en probabilidad para la varianza poblacional σ2 (recuérdese que en el
intervalo de confianza para la media poblacional la simetría en probabilidad implica la simetría
del intervalo, ya que la distribución de Xn es normal y por lo tanto simétrica), el cual no será
simétrico respecto al valor estimado de dicho parámetro. El razonamiento para ello es el
siguiente:
1
1
σ2
S2
>
) =1–α ⇒
P ( χ2 α < n 2 < χ2
)
=
1
–
α
⇒
P
(
> 2
α
2
2
n −1,
n −1, 1−
χ α
χ
σ
nS
α
2
2
n −1,
P(
nS
χ
2
2
< σ2 <
α
n −1, 1−
2
nS
n −1, 1−
2
2
χ2
2
) =1–α
α
n −1,
2
Por lo tanto:
I.C = (
n S2
χ
2
α
n −1, 1−
2
;
n S2
χ2
)
α
n −1,
2
Notación: Recordamos que χn2, α es el valor que, para una chi-cuadrado con n grados de
libertad, acumula una probabilidad igual a α.
Con los datos de este ejercicio tenemos que n = 12, S2 = 0,13, y:
2
2
- para (1 – α) = 0,90, entonces χ11
, 0,05 = 4,5748, χ11, 0,95 = 19,6752;
-
2
2
para (1 – α) = 0,95, entonces χ11
, 0,025 = 3,8157; χ11, 0,975 = 21,92;
-
2
2
para (1 – α) = 0,99, entonces χ11
, 0,005 = 2,6032; χ11, 0,995 = 26,7569.
Finalmente los intervalos quedan:
Para (1 – α) = 0,90 ⇒ (0,0793; 0,3410)
Para (1 – α) = 0,95 ⇒ (0,0712; 0,4088)
Para (1 – α) = 0,99 ⇒ (0,0583; 0,5993)
6
Dada la evidencia muestral, no hay razón para preocuparse, dado que los tres intervalos
excluyen valores para la varianza poblacional mayores o iguales a 0,9 mm2.
EJERCICIO 9 (CANAVOS 8.32)
Sean E = la tensión de ruptura del metal que se produce con el procedimiento estándar y N =
la tensión de ruptura del metal que se produce con el nuevo procedimiento. Como se supone
que las poblaciones son normales, independientes y con varianzas iguales, entonces:
σ2
σ2
E ∼ N (μE, σ2) ⇒ E n ∼ N (μE,
) y N ∼ N (μN, σ2) ⇒ Nn ∼ N (μN,
)
n
n
Por lo tanto, como hay independencia:
E n – Nn ∼ N (μE – μN, 2
σ2
)
n
Sin embargo, como desconocemos el valor de la varianza debemos estimarla. Podemos utilizar
S2, con lo cual nos aparece una v.a. con distribución t de Student:
S2
S2
S2
S2
2
2
2
n E2 ∼ χ (n – 1); n N2 ∼ χ (n – 1) ⇒ (por independencia): n E2 + n N2 ∼ χ (2n – 2)
σ
σ
σ
σ
( En − Nn ) − (μE − μN )
2 σ2
n
⇒
n
SE2
SN2
=
n −1
(En − Nn ) − (μE − μ n )
+n 2
σ2
σ
2n − 2
SE2 + SN2
∼ t 2 n−2
Por lo tanto con un razonamiento similar a los ejercicios anteriores el intervalo de confianza nos
queda:
( E n – Nn – t
2 n − 2, 1−
α
2
SE2 + SN2
n −1
; E n – Nn + t
2 n − 2, 1−
α
2
SE2 + SN2
n −1
)
Con los datos de la muestra obtenemos:
E n = 443,33; Nn = 451.42; SE2 = 186,89; SN2 = 204,58; n = 12
Los valores de tabla son:
t 22, 0,95 = 1,7171; t 22, 0,975 =2,0739; t 22, 0,995 = 2,8188
Entonces:
(443,33 – 451,42 – 1,7171 x
186,89 + 204,58
;443,33 – 451,42 + 1,7171 x
11
⇒ para (1 – α) = 0,90 ⇒ IC = (– 18,3270; 2,1604)
⇒ para (1 – α) = 0,95 ⇒ IC = (– 20,4551; 4,2885)
⇒ para (1 – α) = 0,99 ⇒ IC = (– 24,8988; 8,7321)
186,89 + 204,58
11
)
Con estos resultados y dado que los tres intervalos contienen al cero, podemos afirmar que,
con una confianza de (1 – α) (son los respectivos niveles), no hay evidencia estadística
suficiente para sostener que hay diferencia entre las medias.
7
EJERCICIO 10 (CANAVOS 8.38)
Sean X1 = la cantidad de sustancia tóxica en el primer estuario y X2 = la cantidad de sustancia
tóxica en el segundo. Como las distribuciones de ambas variables se suponen normales,
entonces:
S2
n2 22 / (n2 − 1)
2
2
S
S
σ2
n1 12 ∼ χ2 (n1 – 1); n2 22 ∼ χ2 (n2 – 1) ⇒ por indep.:
∼ F(n2 – 1, n1 – 1)
σ1
σ2
S12
n1 2 / (n1 − 1)
σ1
Igual que en el Ejercicio 8, planteamos un intervalo simétrico en probabilidad:
n2
P( f
n 2 −1, n1 −1,
P(
S12
f
α
n 2 −1, n1 −1,
S 22
2
α
2
<
n1
S 22
σ 22
S12
σ12
/ (n2 − 1)
< f
/ (n1 − 1)
n 2 −1, n1 −1, 1 −
α
2
) =1–α ⇔
n1
n1
2
2
σ
S1 n1 − 1
n1 − 1
< 12 < f
) =1–α ⇔
α
2
n2
n2
n
1
,
n
1
,
1
−
−
−
σ2
S
2
1
2
2
n2 − 1
n2 − 1
Por lo tanto el intervalo de confianza al (1 – α) es:
n1
n1
2
2
S1 n1 − 1
S1 n1 − 1
s12
s12
;
)
=
(
;
)
(f
f
f
f
α
α
α
α
n 2 −1, n1 −1,
n 2 −1, n1 −1, 1 −
n 2 −1, n1 −1,
S 22 n2
S 22 n2
s22 n 2 −1, n1 −1, 1 − 2 s22
2
2
2
n2 − 1
n2 − 1
(Se utiliza la notación s2, la cuasi-varianza muestral, para simplificar la expresión)
Por lo datos del ejercicio tenemos que:
n1 = 11, n2 = 8, s12 = 4,0182, s22 = 2,1846, α = 0,05 y los valores de tabla: f7,10, 0,025 = 0,210035 y
f 7, 10, 0,975 = 3,94982. Por lo que el intervalo nos queda:
(0,210035 x
4,0182
4,0182
; 3,94982 x
) = (0,38632; 7.26502)
2,1846
2,1846
La conclusión es que, dado que el intervalo, con una confianza del 95%, contiene al uno
(nótese que si el cociente de varianzas es uno, éstas son iguales), no hay evidencia suficiente
para decir que las varianzas son distintas.
EJERCICIO 11 (Novales 10.9)
Sean X = los mg. de nicotina de un cigarrillo con filtro y Y = los mg de nicotina de un cigarrillo
sin filtro. Suponemos que X ∼ N (μX, σ2X ) y Y ∼ N (μY, σ2Y ).
(n X − 1)
s 2X
σ 2X
∼ χ2 (nX – 1); (n Y − 1)
s 2Y
σ 2Y
∼ χ2 (nY – 1)
8
(n Y − 1)
⇒ por indep.:
(n X − 1)
s2Y
σ 2Y
s2X
σ 2X
s 2Y
/ (n Y − 1)
σ 2Y
=
∼ F(nY – 1, nX – 1)
s 2X
/ (n X − 1)
σ 2X
Planteamos un intervalo simétrico en probabilidad:
s 2Y
P( f
n Y −1, n X −1,
P (f
n Y −1, n X −1,
α
2
<
α
2
σ 2Y
s 2X
< f
n Y −1, n X −1, 1 −
σ 2X
s 2X
s 2Y
<
σ 2X
σ 2Y
) =1–α ⇔
α
2
<f
n Y −1, n X −1, 1 −
α
2
s 2X
s 2Y
) =1–α
Por lo tanto el intervalo de confianza al (1 – α) es:
s 2X
s 2X
;
)
(f
f
α
α
n Y −1, n X −1,
s 2Y n Y −1, n X −1, 1 − 2 s 2Y
2
En nuestro caso: nX = 9; nY = 11; s 2X = 0,1186; s 2Y = 0,2085; f 10, 8; 0,01 = 0,19776 y f 10, 8; 0,99 =
5,81429 y por lo tanto el intervalo resulta:
0,1186
0,1186
( 0,19776
; 5,81429
) = (0,11248; 3,30690)
0,2085
0,2085
Es decir que, como el intervalo contiene al 1, no podríamos rechazar la igualdad de varianzas
con un nivel de confianza del 98%.
Observación: el cálculo de este intervalo es equivalente a plantear el siguiente test de
hipótesis:
H0)
H1)
σ 2X
σ 2Y
σ 2X
σ 2Y
= 1 ⇔ σ2X = σ2Y
≠ 1 ⇔ σ2X ≠ σ2Y
El nivel de la prueba es α = 0,02 y la región crítica:
s2
s2
ℜ = ⎨ 2Y < f 10, 8; 0,01 = 0,19776⎬ ∪ ⎨ 2Y > f 10, 8; 0,99 = 5,81429 ⎬ ⇔
sX
sX
⇔ ℜ=⎨
s 2X
s 2Y
> f 8, 10; 0,99 = 5,05668⎬ ∪ ⎨
s 2X
s 2Y
< f 8, 10; 0,01 = 0,17199⎬ ∪
s 2Y
pues si
σ 2X
σ 2Y
=1 ⇒ P( f
α
n Y −1, n X −1,
2
P( f
α
n Y −1, n X −1,
2
<
s 2Y
s 2X
<
σ 2Y
s 2X
< f
n Y −1, n X −1, 1 −
σ 2X
< f
n Y −1, n X −1, 1 −
α
2
α
2
) =1–α ⇔
) =1–α
9
EJERCICIO 12
Sea Xi = la v.a. que vale 1 si el i-ésimo encuestado que ha sido vacunado contrajo gripe y 0 en
caso contrario, para todo i; 1 ≤ i ≤ n; y sea Yi = la v.a. que vale 1 si el i-ésimo encuestado que
no ha sido vacunado contrajo gripe y 0 en caso contrario.
Entonces, suponiendo independencia entre las poblaciones y entre los encuestados de cada
población, se cumple que Xi ∼ Bernoulli (pX) y Yi ∼ Bernoulli (pY). Por ejercicios anteriores
vimos que:
p (1 − p X )
p (1 − p Y )
d
d
X500 ⎯⎯→
N ( p X, X
) y Y1000 ⎯⎯→
N ( pY, Y
)
500
1000
Como las variables son independientes:
p (1 − p X )
p (1 − p Y )
d
X500 − Y1000 ⎯⎯→
N ( pX − pY, X
+ Y
)
500
1000
Finalmente, en virtud del resultado obtenido en la Práctica 8, Ejercicio 4, parte 3:
X 500 − Y1000 − (p X − p Y )
d
N (0, 1)
⎯⎯→
X500 (1 − X 500 ) Y1000 (1 − Y1000 )
+
500
1000
(
)
Por lo tanto para un (1 – α)% de confianza:
X500 − Y1000 − (p X − p Y )
P(– z α ≤
≤ z α ) = (1 – α)
1−
1−
X 500 (1 − X500 ) Y1000 (1 − Y1000 )
2
2
+
500
1000
Con lo que el intervalo de confianza aproximado nos queda:
(
)
( X500 − Y1000 − z
α
1−
2
X500 − Y1000 + z
1−
α
2
X 500 (1 − X500 ) Y1000 (1 − Y1000 )
;
+
500
1000
X 500 (1 − X500 ) Y1000 (1 − Y1000 )
)
+
500
1000
Para nuestro caso:
(0,3 – 0,4 – 1.96 x 0,03; 0,3 – 0,4 + 1.96 x 0,03) = (– 0,1588; – 0,0412)
Es decir que hay un 95% de confianza en que la diferencia de proporciones pX – pY se
encuentre dentro de dicho intervalo, es decir que, como éste contiene sólo valores negativos
(en particular no contiene al cero), hay una real incidencia de la vacuna en la disminución de
los casos de gripe.
EJERCICIO 13
1) La función de verosimilitud es:
n
L (x1, ..., xn; α) =
α
∏x
i =1
2
i
=
αn
n
∏x
2
i
i =1
Si tomo logaritmos:
n
Log (L (x1, ..., xn; α) ) = n L α – L
∏x
i =1
Derivo:
∂ Log ( L ( x1,..., x n ; α )
n
=
>0
∂α
α
2
i
10
Entonces, como la derivada es positiva, la función es estrictamente creciente en α. Sin
embargo, debemos tener en cuenta la restricción α ≤ xi. En consecuencia, para obtener el
máximo valor de la función de verosimilitud, α debe tomar el mayor valor posible. El mayor
valor posible compatible con la muestra obtenida es α̂ mv = T = mín { X1,..., Xn } .
2) α̂ mv = mín { 2, 3, 4, 5,...} .= 2
3) Ya varias veces calculamos la función de densidad del estadístico T = Mínimo de las
observaciones, que es:
fT(t) = n [ 1 – FX(t) ] n –1 fX(t)
En nuestro caso:
t
α
α
2
∫
FX(t) =
x
dx = −
α
x
t
α
α
t
=1 −
Y por lo tanto:
fT(t) = n
α n −1 α
=n
t n −1 t 2
αn
t n +1
, para t ≥ α (0 en otro caso)
4) Como fT(t) = 0, para todo t < α ⇒ P (α < T < b) = P ( T < b) = FT(b)
b
αn
αn
Debo hallar, por lo tanto, b tal que FT(b) = 0,95 ⇔
n n +1 dt = 0,95 ⇔ − n
α
t
t
∫
1–
5)
αn
bn
= 0,95 ⇔
αn
bn
= 0,05 ⇔ 20 αn = bn ⇔ b =
El intervalo (α, b) = ( α,
20 α )
n
y
n
b
α
= 0,95 ⇔
20 α
cumple que P (α < T <
n
20 α ) = 0,95 por
construcción.
5.1)
Entonces, trabajando con las desigualdades se obtiene P (
T
justamente el intervalo (
5.2)
n
20
Una vez extraída la muestra y dado que α̂ mv = T = mín
En el intervalo (
T
n
20
< α < T ) = 0,95 y
, T) es aleatorio (pues T es una v.a.) al 95% para α.
determinado el intervalo de confianza al 95% que es (
5.3)
T
n
2
20
20
{ X1,..., Xn }
nos queda
, 2 ) = (1,7218; 2)
, T) se puede hablar de probabilidad pues T es una variable
20
aleatoria. Por otra parte, como el parámetro α es una constante (aunque desconocida)
está o no está dentro del intervalo (1,7218, 2) y por ello carece de sentido hablar de
T
< α < T) tiene asociada una probabilidad de ocurrencia
probabilidad. El suceso (
n 20
(0,95), mientras que al intervalo (1,7218 < α < 2) le asigna una “confianza” del 95%
como consecuencia de la probabilidad que a priori tiene el intervalo aleatorio.
6) Calculemos para ello en primer lugar esperanza y varianza de T:
∫
E(T) =
E(T2) =
+∞
α
∫
+∞
α
tn
t2 n
αn
t
n +1
αn
t n +1
dt =
n αn
1 − n t n −1
+∞
α
dt =
n αn
2 − n tn−2
+∞
α
=
n
α
n −1
=
n
α2
n−2
11
V(T) =
ECM(T) = V(T) + [E(T) - α]2 =
n
n
n
α )2 =
α2 – (
α2
2
n−2
n −1
(n − 2) (n − 1)
n
(n − 2) (n − 1)
2
α2 + [
α
n −1
]2
⎯
⎯→ 0
Como T es consistente en media cuadrática, también es consistente para estimar α.
EJERCICIO 14 (Segundo Control 2000)
Observación: El muestreo es sin reposición, sin embargo la solución del problema se realizará
como si el muestreo fuera con reposición, en el entendido que la población de la cual proviene
la muestra es muy grande (este resultado se justificará más adelante en el curso).
1. La semi-amplitud del intervalo es
0,02 =
z1−α .
2
0,12 * 0,88
⇒ z1−α = 1,96 ⇒ 1 − α = 0,975 . De donde se deduce que el
2
2
1.015
nivel de confianza utilizado es 95%.
2. Intervalo de confianza:
0,119 ± z 0,96 .
0,119 * 0,881
= 0,119 ± 0,018 = (0,101 – 0,137).
1.015
3. La afirmación no es correcta. Efectivamente, al bajar el nivel de confianza se obtiene un
intervalo de amplitud más reducida; pero esto no tiene ninguna relación con el principio de la
“mínima amplitud esperada”. Según este principio, dado o prefijado el nivel de confianza, de
todos los intervalos aleatorios que satisfacen dicho nivel, el “mejor” es el que tiene la menor
amplitud. Esto se logra, por ejemplo, en el caso de estimadores con distribuciones simétricas.
Descargar