Solución Prueba de Cátedra 1. Ejercicio 4 La hoja “Problema 4” del

Anuncio
Solución Prueba de Cátedra 1. Ejercicio 4
4. La hoja “Problema 4” del libro Datos_PC1_503_1°2014.xlsx contiene diversas
observaciones del tiempo entre fallas de una máquina (medidas en horas). Se
supone que el tiempo entre fallas sigue una distribución Erlang con parámetro 𝒓 =
𝟐, y parámetro  desconocido.
a) Encuentre el MLE de , y estímelo a partir de los datos suministrados.
Empezamos por la función de máxima verosimilitud
𝐿 = ∏ 𝜆2 𝑥𝑖 𝑒 −𝜆𝑥𝑖 = 𝜆2𝑛 𝑒 −𝜆 ∑ 𝑥𝑖 ∏ 𝑥𝑖
∀𝑖
Logaritmo
𝑙𝑛𝐿 = 2𝑛𝑙𝑛𝜆 − 𝜆 ∑ 𝑥𝑖 + ∑ 𝑙𝑛𝑥𝑖
derivo respecto al parámetro
2𝑛
− ∑ 𝑥𝑖 = 0
𝜆
Por tanto,
𝜆̂ =
2𝑛
∑ 𝑥𝑖
Con los datos incluidos en la hoja de cálculo el estimador es igual a 2,855
b) Determinar un intervalo de confianza del 95% para el valor del parámetro .
Empezaremos con la cota de Crámer-Rao
1
𝑛𝐸 [
2
𝜕
𝑙𝑛𝑓𝑥 (𝑥, 𝜆)]
𝜕𝜆
Primero, determinamos el logaritmo: 𝑙𝑛𝑓𝑥 (𝑥, 𝜆) = 2𝑙𝑛𝜆 + 𝑙𝑛𝑥 − 𝜆𝑥
Derivamos: 2⁄𝜆 − 𝑥
Elevamos al cuadrado 4⁄𝜆2 − 4𝑥⁄𝜆 + 𝑥 2
Determino la esperanza: 4⁄𝜆2 −
4𝐸(𝑥)⁄
2
𝜆 + 𝐸(𝑥 )
Como r=2, sustituyendo E(x) y E(x2), disponible en formulario de distribuciones, la
esperanza es: 2⁄𝜆2 .
̂2
Por tanto, la varianza del estimador es: 𝜆 ⁄2𝑛 y el intervalo de confianza puede obtenerse
̂2
como: 𝐼𝐶 = 𝜆̂ ± 𝑧𝛼/2 ∙ 𝜆 ⁄2𝑛. Sustituyendo:
̂2
𝜆̂ ± 𝑧𝛼/2 ∙ √𝜆 ⁄2𝑛
Utilizando z0,025=1,96 obtenemos un intervalo:
2,855 ± 1,96 ∙ 0,202
c) Para verificar la adecuación de la distribución anterior, se debe verificar el ajuste
en el centro de la distribución. Proponga y utilice un gráfico para detectar errores
en dichas estimaciones. Justifique su elección y explique los resultados
obtenidos.
Debemos realizar una gráfica P-P (véase Excel)
1.2
1
0.8
Ac Real respecto teórico
0.6
Recta
Linear (Recta)
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
1.2
La gráfica muestra en el eje X la función de probabilidad acumulada empírica, mientras
que el eje Y muestra la función de probabilidad acumulada teórica.
Aunque hay variaciones en el centro de la muestra, éstas no deberían considerarse lo
suficientemente importantes como para descartar que la distribución original fuera una
Erlang con los parámetros indicados. En todo caso es conveniente saber que el valor
acumulado empírico es un poco inferior al valor acumulado teórico en el centro de la
distribución, lo que indica que la distribución teórica ofrece valores superiores a los
observados empíricamente.
d) Para verificar la adecuación de la distribución anterior, decide verificar el ajuste
en las colas de la distribución. Tras consultar la literatura (“A modified Anderson
Darling goodness-of-fit test for the gamma distribution with unknown scale and
location parameters”) detecta que el valor crítico para el caso con r=2 sigue la
siguiente fórmula:
𝑽𝑪 = 𝟎, 𝟗𝟖𝟑𝟕𝟗 + 𝟎, 𝟎𝟏𝟐𝟐𝟓𝒏 − 𝟔, 𝟐𝟕𝟏𝟑𝟗𝜶 − 𝟎, 𝟎𝟏𝟗𝟕𝟒𝒏𝜶 − 𝟎, 𝟎𝟎𝟎𝟏𝟓𝟔𝒏𝟐
+ 𝟏𝟗, 𝟎𝟑𝟐𝟕𝜶𝟐
dónde VC es el valor crítico, n es el tamaño de la muestra y 𝛂 es nivel de
significación. Determine si la prueba descarta la hipótesis nula con un nivel de
significación del 10%. El cálculo del valor crítico incluye el tamaño de la muestra
como parámetro, por lo que no es necesario rectificar el estadístico. anexar hoja
Excel con solución
Utilizamos Excel para determinar el índice y el valor crítico. El valor calculado es 0,594 y el
valor crítico es 1,269, por lo que se acepta la hipótesis nula.
Descargar