1 PRÁCTICA 11: ESTIMACIÓN POR INTERVALO EJERCICIO 1 25 ) = N (μ, ¼) . 100 Construyamos un intervalo aleatorio simétrico respecto a la media (si no se exige que sea simétrico, entonces se pueden encontrar infinitos intervalos aleatorios): 1) Como X ∼ N (μ, 25) y X1, ..., X100 son i.i.d, entonces X100 ∼ N (μ, P ( X100 – ε ≤ μ ≤ X100 + ε) = 0,95 ⇔ P (μ – ε ≤ X100 ≤ μ + ε) = 0,95 ⇔ P ( X100 − μ ≤ ε ) = X100 − μ X100 − μ ε ) = 0,95 donde Z = ∼ N (0, 1) ⇔ 1/ 2 1/ 2 1/ 2 −ε −ε ) = 0,025 ⇔ = – 1,96 ⇔ ε = 0,98. (simetría de la normal) : P ( Z ≤ 1/ 2 1/ 2 Por lo tanto el intervalo aleatorio simétrico (respecto a la media muestral) para μ y al 95% es: 0,95 ⇔ (estandarizo): P ( ≤ ( X100 – 0,98; X100 + 0,98) es decir, cumple que: P ( X100 – 0,98 ≤ μ ≤ X100 + 0,98) = 0,95 En general podemos escribir este intervalo aleatorio, con una confianza (1 – α), de la siguiente forma: σ σ ( Xn – z α ; Xn + z α ) − 1− 1 n n 2 2 2) Si X100 = 20 ⇒ el intervalo nos queda: ( X100 – 0,98; X100 + 0,98) = (19,02; 20,98). 3) Observemos que μ es una constante (es fija, aunque desconocida) no una variable aleatoria y que el intervalo aleatorio depende de la muestra y, en particular, de la media muestral. Una vez “sorteada” la muestra, el intervalo es fijo y como μ también, no se puede hablar de que la probabilidad de que μ esté dentro del intervalo es de un tanto por ciento: un número fijo está o no está dentro de un intervalo fijo. Por ello se habla de confianza y se puede interpretar de la siguiente forma: si se eligieran muchas muestras, se puede esperar que el 95% de los intervalos aleatorios contengan a la media poblacional μ. EJERCICIO 2 Sean Xi = la variable aleatoria que vale 1 si el i-ésimo encuestado está a favor del candidato A y 0 en caso contrario, para 1 ≤ i ≤ n. Entonces cada Xi ∼ Bernoulli (p), donde p es la probabilidad de que una persona esté a favor del candidato A. Anteriormente vimos que Xn cumple que: V( X) p (1 − p) = E ( Xn ) = E (Xi) = p; V ( Xn ) = n n Por el Teorema del Límite Central sabemos que: Xn − p d N (0, 1) ⎯⎯→ p (1 − p) n Y por la Práctica 8, Ejercicio 4, parte 3: Xn − p d N (0, 1) ⎯⎯→ Xn (1 − Xn ) n De la misma forma que en Ejercicio 1, podemos plantear un intervalo aleatorio simétrico: ( Xn – z 1− α 2 Xn (1 − Xn ) ; Xn + z α 1− n 2 Xn (1 − Xn ) ) n 2 a) Por lo antedicho, el intervalo de confianza aproximado al 99% con base en la muestra es: 1400 1400 1400 1400 (1 − (1 − ) ) 1400 1400 2500 2500 2500 ; 2500 ) = (0,5344; 0,5856) – 2,576 + 2,576 ( 2500 2500 2500 2500 Con base en este resultado se puede afirmar que A ganará la elección, porque el intervalo obtenido tenía, a priori, una probabilidad muy alta. El investigador asigna una probabilidad de confianza del 99% a que el candidato A tendrá más del 50% de los votos. b) En este caso el intervalo es: 126 126 (1 − ) 126 225 225 ; 126 + 2,576 ( – 2,576 225 225 225 126 126 (1 − ) 225 225 ) = (0,4748; 0,6452) 225 Estos resultados son diferentes a los del literal a), pues al disminuir el tamaño de muestra la “precisión” es menor, lo que en la variable aleatoria se refleja en que V ( X 2500 ) < V ( X 225 ). Ya no es posible afirmar que más del 50% de los votos serán para el candidato A. c) Es claro que la distribución de Xi no es en realidad Bernoulli, lo cual se debe a que en la práctica la selección no se hace con reposición. Sin embargo, dado que el tamaño de la población se puede suponer grande en relación a la muestra, la probabilidad de que se encueste dos o más veces a una misma persona se puede suponer despreciable. En cuanto a la aproximación por medio de la normal, es razonable dado que se cumplen las recomendaciones de Cochran (con p ≅ 0,56 alcanza con n > 50). EJERCICIO 3 a) Intervalo aleatorio para el promedio con varianza conocida: ( Xn – z σ ; Xn + z σ ). n n En este caso el valor de tablas es el que acumula 95% hasta el límite superior, bajo una curva normal estándar, esto es, 1,645. El promedio es 620 / 20 = 31, de lo que resulta el intervalo: α 1− 2 α 1− 2 (31 – 1,645 x 2 / 20 ; 31 – 1,645 x 2 / 20 ) = (30,3 ; 31,7) b) Ahora la varianza es desconocida. Si se la estima con el estimador insesgado proporcionado por la muestra, entonces el intervalo toma la forma (recordar que la población tiene distribución normal): ( Xn – t n −1 s n ; Xn + t n −1 s ) n Siendo “s” la raíz cuadrada de la cuasi-varianza de la muestra. En este caso es s = 4,5412 y el valor de tablas es t19(0,95) = 1,73. El intervalo resulta: (29,2 ; 32,8). Este intervalo es más amplio por dos motivos: i) porque la estimación del desvío estándar resultó bastante mayor que el valor de sigma supuesto en la primera parte, ii) porque el valor de tablas de la distribución t es mayor que el de la normal estándar (la varianza de la “t” es un poco mayor que la de “z”). 3 EJERCICIO 4 Sea Xi = la v.a. que vale 1 si el i-ésimo consumidor está a favor del nuevo producto, y 0 en caso contrario. Entonces, si suponemos independencia en las preferencias, cada Xi ∼ Bernoulli (p); siendo p la probabilidad de que un consumidor prefiera el nuevo producto. p p por la Ley débil de los Grandes Números, esto nos sugiere aplicar Además, como Xn ⎯⎯→ la desigualdad de Tchebychev a la media muestral con lo que obtenemos: a) Primera interpretación P ( ⎜ Xn – p ⎪ ≤ 0,01 ) ≥ 1 – ⇔ p (1 − p ) 0,012 n V ( Xn ) 2 0,01 = 1– V ( X) = 1– 2 0,01 n p (1 − p ) 0,012 n ≤ 0,05 ⇔ n ≥ 200000 p (1 – p) ≥ 0,95 ⇔ n 50.000 Es decir que el tamaño de la muestra depende de p, aunque para n ≥ 50.000 la condición se satisface para todo p, pues el máximo de p (1 – p) es ¼. Además si p está cerca de cero o de uno, alcanza un tamaño de muestra pequeño. 0 1 p Segunda interpretación P ( ⎜ Xn – p ⎪ ≤ 0,01 p) ≥ 1 – 1− p 2 0,01 p n V ( Xn ) 2 0,01 p ≤ 0,05 ⇔ n ≥ 200000 2 =1– p (1 − p) 2 2 0,01 p n =1– 1− p 0,012 p n ≥ 0,95 ⇔ 1− p p n Para este caso si el p está cerca de cero, como el error depende de dicho parámetro (y por lo tanto sería chico) el tamaño de muestra debería ser grande. 0 1 p b) Utilizando el Teorema del Límite Central, los resultados cambian significativamente: Primera interpretación Xn − p d En el Ejercicio anterior vimos que: N (0, 1). Por lo tanto: ⎯⎯→ p (1 − p ) n P ( ⎜ Xn – p ⎪ ≤ 0,01 ) ≥ 0,95 ⇔ P ( Xn − p p (1 − p) n ≤ 0,01 p (1 − p) n ) ≥ 0,95 ⇔ 0,01 p (1 − p) n ≥ 1,96 p (1 − p) ⇔ n ≥ 38416 p (1 – p) n La gráfica aquí es similar al caso anterior y la condición se satisface para todo p si n ≥ 9604 ⇔ 0,012 ≥ 1,962 Segunda interpretación P ( ⎜ Xn – p ⎪ ≤ 0,01 p ) ≥ 0,95 ⇔ P ( Xn − p p (1 − p) n ≤ 0,01 p p (1 − p) n ) ≥ 0,95 ⇔ 0,01 p (1 − p) n ≥ 1,96 4 ⇔ n ≥ 38416 1− p p EJERCICIO 5 (CANAVOS 8.24) Sea X = volumen de ventas diarias de donas a) Se supone que X ∼ N (μ, 502) ⇒ Xn ∼ N (μ, 502/n) Entonces debemos hallar n, para que P ( Xn − μ ≤ 20 ) = 0,95 ⇔ ⇔ P( Xn − μ 50 / n ≤ 20 50 / n 20 ) = 0,95 ⇔ 50 / n = z0,97 ⇔ n = 24,01 Por lo tanto como n es un tamaño de muestra, debe cumplir que n ≥ 25. b) Por Tchebychev: P ( ⎜ Xn – μ⎪ ≤ 20 ) ≥ 1 – ⇒ V ( Xn ) 20 2 ≤ 0,05 ⇔ V ( Xn ) 20 2 50 2 / n 20 2 ≥ 0,95 ⇔ n ≥ 125 Nótese la diferencia entre tamaños muestrales necesarios para la mencionada confianza, cuando se puede suponer normalidad y cuando no se puede. EJERCICIO 6 a) Intervalo para p: 80 0,2 x0,8 ± 1,96 * = 0,20 ± 0,0392 ⇒ (0,1608 ; 0,2392) . 400 400 b) Intervalo para N.p: 10.000 x (0,1608 ; 0,2392) = (1.608 – 2.392). ⎛ ⎜ ⎜ c) P X − p < 0,03 ≥ 0,95 ⇒ Φ ⎜ ⎜ ⎝ ( ) ⎞ ⎟ 0,03 ⎟ ≥ 0,975. La “peor” situación se p.(1 − p ) ⎟ ⎟ n ⎠ presenta cuando p= ½ en términos del tamaño de la muestra (porque es cuando la varianza del estimador se vuelve más grande). En el problema nos dicen que de ninguna manera puede ser p mayor que 0,30. Entonces en la fórmula anterior corresponde utilizar dicho valor. Resulta: ⎛ ⎜ 0,03 Φ⎜ ⎜ 0,3 x0,7 ⎜ n ⎝ ⎞ ⎟ ⎟ ≥ 0,975 ⇒ ⎟ ⎟ ⎠ 2 ⎛ 1,96 ⎞ ≥ 1,96 ⇒ n ≥ ⎜ ⎟ x0,21 ≅ 896,37 . 0,21 ⎝ 0,03 ⎠ 0,03 x n En consecuencia, el tamaño mínimo de muestra necesario es n = 897. 5 EJERCICIO 7 1) Como (20, 30) es un intervalo de confianza simétrico respecto de la media muestral para μ, entonces μ̂ es x n = 25. El extremo superior del intervalo es entonces: 25 + 2,576. σ2 25 = 30 ⇒ σ2 = 25 × (5 / 2,576)2 = 94,19. 2) La Afirmación 1 es falsa. El primer error es asegurar que sucederá algo (99 medias muestrales pertenecerán a dicho intervalo), pues la esencia del experimento es aleatoria. El segundo es que la condición P ( Xn − μ ≤ 5 ) = 0,99 (ε = 5, en este caso) de la cual partimos no nos asegura el verdadero valor de μ y por lo tanto una vez extraída la muestra queda fijo el intervalo de confianza, pero no se pueden calcular probabilidades con respecto a la variable Xn . La Afirmación 2 es falsa: media poblacional hay una sola. La Afirmación 3 es verdadera: lo esperado es que si se eligen muchas muestras, un 99% de los intervalos aleatorios generados por respectivas muestras contengan a la media poblacional. EJERCICIO 8 (CANAVOS 8.34) Sea X = el espesor de las láminas de plástico que produce una máquina S2 Si X se supone normal, entonces n 2 ∼ χ2 (n – 1). Queremos, ahora, calcular un intervalo de σ confianza simétrico en probabilidad para la varianza poblacional σ2 (recuérdese que en el intervalo de confianza para la media poblacional la simetría en probabilidad implica la simetría del intervalo, ya que la distribución de Xn es normal y por lo tanto simétrica), el cual no será simétrico respecto al valor estimado de dicho parámetro. El razonamiento para ello es el siguiente: 1 1 σ2 S2 > ) =1–α ⇒ P ( χ2 α < n 2 < χ2 ) = 1 – α ⇒ P ( > 2 α 2 2 n −1, n −1, 1− χ α χ σ nS α 2 2 n −1, P( nS χ 2 2 < σ2 < α n −1, 1− 2 nS n −1, 1− 2 2 χ2 2 ) =1–α α n −1, 2 Por lo tanto: I.C = ( n S2 χ 2 α n −1, 1− 2 ; n S2 χ2 ) α n −1, 2 Notación: Recordamos que χn2, α es el valor que, para una chi-cuadrado con n grados de libertad, acumula una probabilidad igual a α. Con los datos de este ejercicio tenemos que n = 12, S2 = 0,13, y: 2 2 - para (1 – α) = 0,90, entonces χ11 , 0,05 = 4,5748, χ11, 0,95 = 19,6752; - 2 2 para (1 – α) = 0,95, entonces χ11 , 0,025 = 3,8157; χ11, 0,975 = 21,92; - 2 2 para (1 – α) = 0,99, entonces χ11 , 0,005 = 2,6032; χ11, 0,995 = 26,7569. Finalmente los intervalos quedan: Para (1 – α) = 0,90 ⇒ (0,0793; 0,3410) Para (1 – α) = 0,95 ⇒ (0,0712; 0,4088) Para (1 – α) = 0,99 ⇒ (0,0583; 0,5993) 6 Dada la evidencia muestral, no hay razón para preocuparse, dado que los tres intervalos excluyen valores para la varianza poblacional mayores o iguales a 0,9 mm2. EJERCICIO 9 (CANAVOS 8.32) Sean E = la tensión de ruptura del metal que se produce con el procedimiento estándar y N = la tensión de ruptura del metal que se produce con el nuevo procedimiento. Como se supone que las poblaciones son normales, independientes y con varianzas iguales, entonces: σ2 σ2 E ∼ N (μE, σ2) ⇒ E n ∼ N (μE, ) y N ∼ N (μN, σ2) ⇒ Nn ∼ N (μN, ) n n Por lo tanto, como hay independencia: E n – Nn ∼ N (μE – μN, 2 σ2 ) n Sin embargo, como desconocemos el valor de la varianza debemos estimarla. Podemos utilizar S2, con lo cual nos aparece una v.a. con distribución t de Student: S2 S2 S2 S2 2 2 2 n E2 ∼ χ (n – 1); n N2 ∼ χ (n – 1) ⇒ (por independencia): n E2 + n N2 ∼ χ (2n – 2) σ σ σ σ ( En − Nn ) − (μE − μN ) 2 σ2 n ⇒ n SE2 SN2 = n −1 (En − Nn ) − (μE − μ n ) +n 2 σ2 σ 2n − 2 SE2 + SN2 ∼ t 2 n−2 Por lo tanto con un razonamiento similar a los ejercicios anteriores el intervalo de confianza nos queda: ( E n – Nn – t 2 n − 2, 1− α 2 SE2 + SN2 n −1 ; E n – Nn + t 2 n − 2, 1− α 2 SE2 + SN2 n −1 ) Con los datos de la muestra obtenemos: E n = 443,33; Nn = 451.42; SE2 = 186,89; SN2 = 204,58; n = 12 Los valores de tabla son: t 22, 0,95 = 1,7171; t 22, 0,975 =2,0739; t 22, 0,995 = 2,8188 Entonces: (443,33 – 451,42 – 1,7171 x 186,89 + 204,58 ;443,33 – 451,42 + 1,7171 x 11 ⇒ para (1 – α) = 0,90 ⇒ IC = (– 18,3270; 2,1604) ⇒ para (1 – α) = 0,95 ⇒ IC = (– 20,4551; 4,2885) ⇒ para (1 – α) = 0,99 ⇒ IC = (– 24,8988; 8,7321) 186,89 + 204,58 11 ) Con estos resultados y dado que los tres intervalos contienen al cero, podemos afirmar que, con una confianza de (1 – α) (son los respectivos niveles), no hay evidencia estadística suficiente para sostener que hay diferencia entre las medias. 7 EJERCICIO 10 (CANAVOS 8.38) Sean X1 = la cantidad de sustancia tóxica en el primer estuario y X2 = la cantidad de sustancia tóxica en el segundo. Como las distribuciones de ambas variables se suponen normales, entonces: S2 n2 22 / (n2 − 1) 2 2 S S σ2 n1 12 ∼ χ2 (n1 – 1); n2 22 ∼ χ2 (n2 – 1) ⇒ por indep.: ∼ F(n2 – 1, n1 – 1) σ1 σ2 S12 n1 2 / (n1 − 1) σ1 Igual que en el Ejercicio 8, planteamos un intervalo simétrico en probabilidad: n2 P( f n 2 −1, n1 −1, P( S12 f α n 2 −1, n1 −1, S 22 2 α 2 < n1 S 22 σ 22 S12 σ12 / (n2 − 1) < f / (n1 − 1) n 2 −1, n1 −1, 1 − α 2 ) =1–α ⇔ n1 n1 2 2 σ S1 n1 − 1 n1 − 1 < 12 < f ) =1–α ⇔ α 2 n2 n2 n 1 , n 1 , 1 − − − σ2 S 2 1 2 2 n2 − 1 n2 − 1 Por lo tanto el intervalo de confianza al (1 – α) es: n1 n1 2 2 S1 n1 − 1 S1 n1 − 1 s12 s12 ; ) = ( ; ) (f f f f α α α α n 2 −1, n1 −1, n 2 −1, n1 −1, 1 − n 2 −1, n1 −1, S 22 n2 S 22 n2 s22 n 2 −1, n1 −1, 1 − 2 s22 2 2 2 n2 − 1 n2 − 1 (Se utiliza la notación s2, la cuasi-varianza muestral, para simplificar la expresión) Por lo datos del ejercicio tenemos que: n1 = 11, n2 = 8, s12 = 4,0182, s22 = 2,1846, α = 0,05 y los valores de tabla: f7,10, 0,025 = 0,210035 y f 7, 10, 0,975 = 3,94982. Por lo que el intervalo nos queda: (0,210035 x 4,0182 4,0182 ; 3,94982 x ) = (0,38632; 7.26502) 2,1846 2,1846 La conclusión es que, dado que el intervalo, con una confianza del 95%, contiene al uno (nótese que si el cociente de varianzas es uno, éstas son iguales), no hay evidencia suficiente para decir que las varianzas son distintas. EJERCICIO 11 (Novales 10.9) Sean X = los mg. de nicotina de un cigarrillo con filtro y Y = los mg de nicotina de un cigarrillo sin filtro. Suponemos que X ∼ N (μX, σ2X ) y Y ∼ N (μY, σ2Y ). (n X − 1) s 2X σ 2X ∼ χ2 (nX – 1); (n Y − 1) s 2Y σ 2Y ∼ χ2 (nY – 1) 8 (n Y − 1) ⇒ por indep.: (n X − 1) s2Y σ 2Y s2X σ 2X s 2Y / (n Y − 1) σ 2Y = ∼ F(nY – 1, nX – 1) s 2X / (n X − 1) σ 2X Planteamos un intervalo simétrico en probabilidad: s 2Y P( f n Y −1, n X −1, P (f n Y −1, n X −1, α 2 < α 2 σ 2Y s 2X < f n Y −1, n X −1, 1 − σ 2X s 2X s 2Y < σ 2X σ 2Y ) =1–α ⇔ α 2 <f n Y −1, n X −1, 1 − α 2 s 2X s 2Y ) =1–α Por lo tanto el intervalo de confianza al (1 – α) es: s 2X s 2X ; ) (f f α α n Y −1, n X −1, s 2Y n Y −1, n X −1, 1 − 2 s 2Y 2 En nuestro caso: nX = 9; nY = 11; s 2X = 0,1186; s 2Y = 0,2085; f 10, 8; 0,01 = 0,19776 y f 10, 8; 0,99 = 5,81429 y por lo tanto el intervalo resulta: 0,1186 0,1186 ( 0,19776 ; 5,81429 ) = (0,11248; 3,30690) 0,2085 0,2085 Es decir que, como el intervalo contiene al 1, no podríamos rechazar la igualdad de varianzas con un nivel de confianza del 98%. Observación: el cálculo de este intervalo es equivalente a plantear el siguiente test de hipótesis: H0) H1) σ 2X σ 2Y σ 2X σ 2Y = 1 ⇔ σ2X = σ2Y ≠ 1 ⇔ σ2X ≠ σ2Y El nivel de la prueba es α = 0,02 y la región crítica: s2 s2 ℜ = ⎨ 2Y < f 10, 8; 0,01 = 0,19776⎬ ∪ ⎨ 2Y > f 10, 8; 0,99 = 5,81429 ⎬ ⇔ sX sX ⇔ ℜ=⎨ s 2X s 2Y > f 8, 10; 0,99 = 5,05668⎬ ∪ ⎨ s 2X s 2Y < f 8, 10; 0,01 = 0,17199⎬ ∪ s 2Y pues si σ 2X σ 2Y =1 ⇒ P( f α n Y −1, n X −1, 2 P( f α n Y −1, n X −1, 2 < s 2Y s 2X < σ 2Y s 2X < f n Y −1, n X −1, 1 − σ 2X < f n Y −1, n X −1, 1 − α 2 α 2 ) =1–α ⇔ ) =1–α 9 EJERCICIO 12 Sea Xi = la v.a. que vale 1 si el i-ésimo encuestado que ha sido vacunado contrajo gripe y 0 en caso contrario, para todo i; 1 ≤ i ≤ n; y sea Yi = la v.a. que vale 1 si el i-ésimo encuestado que no ha sido vacunado contrajo gripe y 0 en caso contrario. Entonces, suponiendo independencia entre las poblaciones y entre los encuestados de cada población, se cumple que Xi ∼ Bernoulli (pX) y Yi ∼ Bernoulli (pY). Por ejercicios anteriores vimos que: p (1 − p X ) p (1 − p Y ) d d X500 ⎯⎯→ N ( p X, X ) y Y1000 ⎯⎯→ N ( pY, Y ) 500 1000 Como las variables son independientes: p (1 − p X ) p (1 − p Y ) d X500 − Y1000 ⎯⎯→ N ( pX − pY, X + Y ) 500 1000 Finalmente, en virtud del resultado obtenido en la Práctica 8, Ejercicio 4, parte 3: X 500 − Y1000 − (p X − p Y ) d N (0, 1) ⎯⎯→ X500 (1 − X 500 ) Y1000 (1 − Y1000 ) + 500 1000 ( ) Por lo tanto para un (1 – α)% de confianza: X500 − Y1000 − (p X − p Y ) P(– z α ≤ ≤ z α ) = (1 – α) 1− 1− X 500 (1 − X500 ) Y1000 (1 − Y1000 ) 2 2 + 500 1000 Con lo que el intervalo de confianza aproximado nos queda: ( ) ( X500 − Y1000 − z α 1− 2 X500 − Y1000 + z 1− α 2 X 500 (1 − X500 ) Y1000 (1 − Y1000 ) ; + 500 1000 X 500 (1 − X500 ) Y1000 (1 − Y1000 ) ) + 500 1000 Para nuestro caso: (0,3 – 0,4 – 1.96 x 0,03; 0,3 – 0,4 + 1.96 x 0,03) = (– 0,1588; – 0,0412) Es decir que hay un 95% de confianza en que la diferencia de proporciones pX – pY se encuentre dentro de dicho intervalo, es decir que, como éste contiene sólo valores negativos (en particular no contiene al cero), hay una real incidencia de la vacuna en la disminución de los casos de gripe. EJERCICIO 13 1) La función de verosimilitud es: n L (x1, ..., xn; α) = α ∏x i =1 2 i = αn n ∏x 2 i i =1 Si tomo logaritmos: n Log (L (x1, ..., xn; α) ) = n L α – L ∏x i =1 Derivo: ∂ Log ( L ( x1,..., x n ; α ) n = >0 ∂α α 2 i 10 Entonces, como la derivada es positiva, la función es estrictamente creciente en α. Sin embargo, debemos tener en cuenta la restricción α ≤ xi. En consecuencia, para obtener el máximo valor de la función de verosimilitud, α debe tomar el mayor valor posible. El mayor valor posible compatible con la muestra obtenida es α̂ mv = T = mín { X1,..., Xn } . 2) α̂ mv = mín { 2, 3, 4, 5,...} .= 2 3) Ya varias veces calculamos la función de densidad del estadístico T = Mínimo de las observaciones, que es: fT(t) = n [ 1 – FX(t) ] n –1 fX(t) En nuestro caso: t α α 2 ∫ FX(t) = x dx = − α x t α α t =1 − Y por lo tanto: fT(t) = n α n −1 α =n t n −1 t 2 αn t n +1 , para t ≥ α (0 en otro caso) 4) Como fT(t) = 0, para todo t < α ⇒ P (α < T < b) = P ( T < b) = FT(b) b αn αn Debo hallar, por lo tanto, b tal que FT(b) = 0,95 ⇔ n n +1 dt = 0,95 ⇔ − n α t t ∫ 1– 5) αn bn = 0,95 ⇔ αn bn = 0,05 ⇔ 20 αn = bn ⇔ b = El intervalo (α, b) = ( α, 20 α ) n y n b α = 0,95 ⇔ 20 α cumple que P (α < T < n 20 α ) = 0,95 por construcción. 5.1) Entonces, trabajando con las desigualdades se obtiene P ( T justamente el intervalo ( 5.2) n 20 Una vez extraída la muestra y dado que α̂ mv = T = mín En el intervalo ( T n 20 < α < T ) = 0,95 y , T) es aleatorio (pues T es una v.a.) al 95% para α. determinado el intervalo de confianza al 95% que es ( 5.3) T n 2 20 20 { X1,..., Xn } nos queda , 2 ) = (1,7218; 2) , T) se puede hablar de probabilidad pues T es una variable 20 aleatoria. Por otra parte, como el parámetro α es una constante (aunque desconocida) está o no está dentro del intervalo (1,7218, 2) y por ello carece de sentido hablar de T < α < T) tiene asociada una probabilidad de ocurrencia probabilidad. El suceso ( n 20 (0,95), mientras que al intervalo (1,7218 < α < 2) le asigna una “confianza” del 95% como consecuencia de la probabilidad que a priori tiene el intervalo aleatorio. 6) Calculemos para ello en primer lugar esperanza y varianza de T: ∫ E(T) = E(T2) = +∞ α ∫ +∞ α tn t2 n αn t n +1 αn t n +1 dt = n αn 1 − n t n −1 +∞ α dt = n αn 2 − n tn−2 +∞ α = n α n −1 = n α2 n−2 11 V(T) = ECM(T) = V(T) + [E(T) - α]2 = n n n α )2 = α2 – ( α2 2 n−2 n −1 (n − 2) (n − 1) n (n − 2) (n − 1) 2 α2 + [ α n −1 ]2 ⎯ ⎯→ 0 Como T es consistente en media cuadrática, también es consistente para estimar α. EJERCICIO 14 (Segundo Control 2000) Observación: El muestreo es sin reposición, sin embargo la solución del problema se realizará como si el muestreo fuera con reposición, en el entendido que la población de la cual proviene la muestra es muy grande (este resultado se justificará más adelante en el curso). 1. La semi-amplitud del intervalo es 0,02 = z1−α . 2 0,12 * 0,88 ⇒ z1−α = 1,96 ⇒ 1 − α = 0,975 . De donde se deduce que el 2 2 1.015 nivel de confianza utilizado es 95%. 2. Intervalo de confianza: 0,119 ± z 0,96 . 0,119 * 0,881 = 0,119 ± 0,018 = (0,101 – 0,137). 1.015 3. La afirmación no es correcta. Efectivamente, al bajar el nivel de confianza se obtiene un intervalo de amplitud más reducida; pero esto no tiene ninguna relación con el principio de la “mínima amplitud esperada”. Según este principio, dado o prefijado el nivel de confianza, de todos los intervalos aleatorios que satisfacen dicho nivel, el “mejor” es el que tiene la menor amplitud. Esto se logra, por ejemplo, en el caso de estimadores con distribuciones simétricas.