UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD PAUTA DE CORRECCIÓN PRUEBA N◦ 3 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. Sea Y1 , Y2 , . . . , Yn una muestra aleatoria de la variable Y ∼ U (0, θ). Se sabe que el máximo de la muestra T = M ax(Y1 , Y2 , . . . , Yn ) ∼ f (t; θ) donde: f (t; θ) = n n−1 t , θn 0 < t < θ, θ > 0, n ≥ 1 a) Calcular E(T ). Solución θ Z E(T ) = θ Z tf (t; θ)dt = 0 0 n n t n tn−1 dt = n θ θ θ Z n t dt = n θ n 0 θn+1 n+1 = nθ n+1 (6 ptos.) b) Calcular el valor de la constante α para que el estimador αT sea insesgado. Solución Aquı́ el parámetro es θ y para que αT sea insesgado para θ se debe cumplir que E(αT ) = θ. nθ De aquı́ E(αT ) = αE(T ) = α n+1 . Por lo tanto α = n+1 . n (6 ptos.) c) Calcular el ECM (cT ) para c > 0 (constante). Solución Sea S : Sesgo. Debemos calcular ECM (cT ) = V ar(cT ) + S 2 (cT ). Primero calculamos el sesgo: cn − n − 1 cnθ −θ =θ S(cT ) = E(cT ) − θ = n+1 n+1 Ahora necesitamos E((cT )2 ). 2 2 2 E((cT ) ) = c E(T ) = c 2 θ Z n c2 n t n tn−1 dt = n θ θ 2 0 Z θ n+1 t 0 c2 n dt = n θ θn+2 n+2 = c2 nθ2 n+2 Luego la varianza está dada por: c2 nθ2 V ar(cT ) = E((cT ) ) − (E(cT )) = − c2 n+2 2 2 nθ n+1 2 Luego: V ar(cT ) = CORRECCIÓN PRUEBA 3 1 c2 nθ2 (n + 2)(n + 1)2 2 = c nθ 2 1 n − n + 2 (n + 1)2 Ası́ tenemos el error cuadrático medio de cT : ECM (cT ) = c2 nθ2 θ2 (cn − n − 1)2 + (n + 2)(n + 1)2 (n + 1)2 (6 ptos.) d ) Calcular el valor de c para que el ECM (cT ) se mı́nimo. Solución Ahora utilizamos los métodos del cálculo para minimizar el error cuadrático medio en función de c: 2θ2 cn 2θ2 (cn − n − 1) n d(ECM (cT )) = + =0 dc (n + 2) (n + 1)2 (n + 1)2 Luego: n+2 n+1 Para verificar si realmente hay un mı́nimo calculamos la segunda derivada de ECM (cT ): c= 2θ2 n 2θ2 n2 d2 (ECM (cT )) = + dc2 (n + 2) (n + 1)2 (n + 1)2 la cual es positiva ∀n, por lo tanto el ECM (cT ) es mı́nimo para c = (n + 2)/(n + 1). (6 ptos.) 2. Sea X1 , . . . , Xn una muestra aleatoria de una variable X cuya función de densidad está dada por: λα xα−1 −λx e , x > 0, α, λ > 0, f (x; α, λ) = Γ(α) a) Calcular la función de log-verosimilitud l(α, λ). Solución Primero calculamos la función de verosimilitud: L(α, λ) = n Y λα xα−1 e−λxi i i=1 Γ(α) Pn Q λnα ( ni=1 xi )α−1 e−λ i=1 xi = (Γ(α))n Por lo tanto la función de log-verosimilitud está dada por: l(α, λ) = nα log α + (α − 1) n X i=1 log xi − λ n X xi − n log Γ(α) i=1 (8 ptos.) b) Deducir las ecuaciones cuya solución produzcan los estimadores de máxima verosimilitud (EMV) de los parámetros α y λ. ¿Se pueden resolver explı́citamente?. Explicar. Solución CORRECCIÓN PRUEBA 3 2 Al derivar la función de log-verosimilitud con respecto a los parámetros e igualando a cero, se tienen: n X nΓ0 (α) ∂l(α, λ) = n log λ + log xi − =0 ∂α Γ(α) i=1 (1) n ∂l(α, λ) nα X = − xi = 0 ∂λ λ i=1 (2) No se pueden resolver explı́citamente con respecto a los parámetros debido a la complejidad que presenta la función Gamma. (8 ptos.) c) Probar que el EMV de µ = αλ es µ b = X. Solución De la Ecuación (2) se tiene que: n nα X α = xi ⇐⇒ = X ⇐⇒ µ b=X λ λ i=1 (8 ptos.) 3. Cierto tipo de componente electrónico tiene una duración Y (en horas) con función de densidad dada por: y y f (y; β) = 2 e− β , y > 0, β > 0, β Supongamos que 3 de tales componentes, al probarlos de manera independiente, presentan duración de 120, 128 y 130 horas. a) Encontrar la función de log-verosimilitud l(β). Solución Primero calculamos la función de verosimilitud: Qn Pn n Y yi yi − yβi i=1 yi − i=1 β L(β) = e = e 2 2n β β i=1 Por lo tanto la función de log-verosimilitud está dada por: Pn n X yi l(β) = log yi − i=1 − 2n log β β i=1 (3) (6 ptos.) b) Calcular el EMV de β. Solución Derivando la Ecuación (3) con respecto a β e igualando a cero se tiene: Pn yi 2n 0 l (β) = i=1 − =0 β2 β CORRECCIÓN PRUEBA 3 3 (4) De la Ecuación (4) se obtiene el EMV de β: Pn yi Y b β = i=1 = 2n 2 (6 ptos.) b c) Calcular el ECM (β). Solución Primero calculamos los primeros momentos y la varianza de la variable Y . En efecto, Z ∞ 2 Z ∞ y −y/β yf (y; β)dy = E(Y ) = e dy = 2β β2 0 0 Z ∞ 3 Z ∞ y −y/β 2 2 y f (y; β)dy = E(Y ) = e dy = 6β 2 2 β 0 0 V ar(Y ) = E(Y 2 ) − (E(Y ))2 = 6β 2 − 4β 2 = 2β 2 Pn b = i=1 E(Yi ) = El estimador del parámetro β es insesgado. En efecto, E(β) 2n Por lo tanto Pn Pn 2 2 b = V ar(β) b = i=1 V ar(Yi ) = i=1 2β = β ECM (β) 4n2 4n2 2n Pn i=1 2n 2β = β. (6 ptos.) d ) Utilizar los valores numéricos que se dan para obtener la estimación de β. Solución De los datos se tiene que Y = 120+128+130 = 126. Por lo tanto: 3 126 Y = = 63 βb = 2 2 (6 ptos.) 4. Una industria dedicada a la fabricación de harina, para llenar los paquetes usa dos máquinas. Se considera que el contenido de harina (kilos) en los paquetes tiene una distribución normal. Para estudiar el contenido de estos paquetes, se toma una muestra aleatoria de cada máquina obteniendo los siguientes resultados: Máquina A Máquina B 1.03 1.04 1.05 1.08 1.08 0.9 1.1 0.9 1.0 1.06 1.2 1.08 1.09 1.13 1.15 0.92 1.07 a) Se considera que un paquete no cumple con las normas, si su contenido es inferior a un kilo. En base a la muestra total (17 paquetes) y usando un nivel de significancia del 8 %, encontrar un intervalo de confianza para la proporción de paquetes que cumplan con la norma. ¿Cuál es tu conclusión? Solución Primero que todo tenemos 14 paquetes que cumplen con la normativa. Entonces pb = 14 = 17 0.82, luego 1 − pb = 0.18 para n = 17. De lo anterior: r r pb(1 − pb) 0.82 × 0.18 p = pb ± zα/2 = 0.82 ± 1.75 n 17 CORRECCIÓN PRUEBA 3 4 Por lo tanto p ∈ (0.656, 0.983). Esto significa que en el 92 % de los casos, la proporción de paquetes de harina de la industria no cumplen con las normas. (6 ptos.) b) Del item a), ¿qué concluyes ahora si el nivel de significancia es del 5 %?. Solución q Ahora α = 0.05, luego zα/2 = 1.96 y p = 0.82 ± 1.96 0.82×0.18 . Por lo tanto p ∈ 17 (0.637, 1.002). Esto significa que en el 95 % de los casos, la proporción de paquetes de harina de la industria si cumplen con las normas. (6 ptos.) c) Encontrar un intervalo de confianza del 99 % para el cociente de las dos varianzas σA2 /σB2 . ¿Parece razonable concluir que las varianzas son iguales?. Justificar la respuesta. Solución De la tabla se obtiene SB2 = 0.006, SA2 = 0.007, X A = 1.072 y X B = 1.033, de esta manera: 0.006 0.006 σB2 ∈ F7,8,0.005 , F7,8,0.995 σA2 0.007 0.007 σ2 donde F7,8,0.995 = 7.6942 y F7,8,0.005 = 0.1152. Por lo tanto σB2 ∈ (0.09874, 6.5950). Esto A significa que hay un 99 % de probabilidad que las varianzas poblacionales sean iguales, ya que 1 ∈ (0.09874, 6.5950). (6 ptos.) d ) La persona encargada de la mantención de la máquina A, sospecha que no está funcionando correctamente y que existirı́a una diferencia, respecto del contenido medio de los paquetes llenados por la máquina B. Basándote en la muestra y usando un nivel de confianza del 99 %, ¿aceptarı́as la sospecha del encargado?. Justificar la respuesta. Solución Del item c) podemos asumir que las varianzas son iguales, entonces podemos utilizar lo siguiente: r 1 1 + µA − µB = (X A − X B ) ± tα/2,n1 +n2 −2 Sp n1 n2 donde Sp2 = tanto: 7×0.007+8×0.006 8+9−2 = 0.00647, luego Sp = 0.0804. Además t0.005,15 = 2.947. Por lo r 1 1 µA − µB = (1.072 − 1.033) ± 2.947 × 0.0804 + 8 9 Por lo tanto µA − µB ∈ (−0.076, 0.154). Esto significa que no existe diferencia respecto del contenido medio de los paquetes llenados por la maquina A y B. No se acepta la sospecha del encargado con un 99 % de probabilidad, ya que 0 ∈ (−0.076, 0.154). (6 ptos.) CORRECCIÓN PRUEBA 3 5