Ejercicio de estimación de máxima verosimilitud El tiempo de realización en minutos de una determinada tarea dentro de un proceso industrial es una variable aleatoria con función de densidad f (x) = x −x/θ e θ2 si x > 0 donde θ > 0. a) Calcular el estimador máximo-verosı́mil de θ para una muestra aleatoria simple de tamaño n. 1. Escribir la verosimilitud: L(θ) ind. L(x1 , . . . , xn ; θ) = = n Y i.d. fXi (xi ) = i=1 n Y xi = θ2 i=1 ea ·eb =ea+b = 1 θ2 n e −xi /θ 1 = 2 θ n Y n n 1X exp − xi θ i=1 ( ) e−xi /θ i=1 n Y n Y fX (xi ) i=1 n Y xi i=1 xi ; x1 , . . . , x n > 0 i=1 2. Escribir el logaritmo de la verosimilitud: `(θ) ln L(θ) = ln = ln(a·b)=ln a+ln b = ln 1 θ2 n 1 θ2 n n n Y 1X xi xi exp − θ i=1 i=1 ( ) n 1X xi + ln exp − θ i=1 ( = n n Y 1X ln (θ−2n ) − xi + ln xi θ i=1 i=1 = n n Y 1X −2n ln θ − xi + ln xi ; θ i=1 i=1 )! + ln ! n Y ! xi i=1 ! ! 3. Obtener el θ tal que ∂ `(θ) ∂θj = 0. n n Y ∂ ∂ 1X `(θ) = −2n ln θ − xi + ln xi ∂θ ∂θ θ i=1 i=1 ∂ ∂ = (−2n ln θ) − ∂θ ∂θ n −2n xi = − − i=12 θ θ Pn −2n xi = + i=12 θ θ P Estadı́stica I 08/09 x1 , . . . , x n > 0 !! n n Y 1X ∂ xi + ln xi θ i=1 ∂θ i=1 ! !! ! +0 A. Arribas Gil Por lo tanto: n n xi −2n xi ∂ 2n `(θ) = 0 ⇔ + i=12 = 0 ⇔ i=12 = ∂θ θ θ θ θ Pn Pn xi ×θ i=1 xi = 2n ⇔ θ = i=1 ⇔ θ 2n P Pn i=1 El candidato a EMV es θ̂M V = P xi . 2n 4. Comprobar que realmente es un máximo, es decir, que ∂2 ∂ `(θ) = 2 ∂θ ∂θ −2n + θ = (−2n) Pn i=1 θ2 xi ∂2 `(θ)|θ=θ̂M V ∂θ2 ! n −2 −1 X + x i θ2 θ3 i=1 n n 2n 2 2 X 1X = x = xi − n − i θ2 θ3 i=1 θ2 θ i=1 Pn i=1 Si ahora lo evaluamos en el candidato θ̂M V = 2 ∂ `(θ)|θ=θ̂M V ∂θ2 = = 2 2 θ̂M V 2 2 θ̂M V n− < 0. 1 θ̂M V n X ! xi = i=1 (n − 2n) = 2n 2 2 θ̂M V xi ! , tenemos: 2 1 n − Pn 2 θ̂M V i=1 2n n X xi xi i=1 (−n) < 0 obtenemos que la segunda derivada de `(θ) es negativa en θ̂M V y por tanto es un máximo. X El estimador máximo verósimil de θ es θ̂M V = . Para una muestra particular, la 2 x estimación máximo verosı́mil será θ̂M V = . 2 b) Calcular el estimador máximo-verosı́mil de E[X] para una muestra aleatoria simple de tamaño n. Lo primero es calcular E[X]. Como X es una v.a. continua, sabemos que E[X] = R∞ −∞ x f (x)dx. Pero como X sólo toma valores positivos: E[X] = Z ∞ 0 Estadı́stica I 08/09 x f (x) dx = Z ∞ 0 Z ∞ 2 x −x/θ 1 Z ∞ 2 −1 −x/θ x −x/θ x x 2e dx = e dx = − e dx θ θ2 θ 0 θ 0 A. Arribas Gil integr. por partes1 1 h 2 −x/θ i∞ Z ∞ −x/θ du = 2x dx − e 2x dx x e u = x2 =− 0 θ 0 dv = −1 e−x/θ dx v = e−x/θ θ i∞ 1Z ∞ 1h 1Z ∞ 1 − x2 e−x/θ + 2x e−x/θ dx = − lim x2 e−x/θ − lim x2 e−x/θ + 2x e−x/θ dx 0 x→0 θ θ 0 θ x→∞ θ 0 integr. por partes1 Z ∞ Z ∞ −1 −x/θ 1 1 du = dx − (0 − 0) + 2x e−x/θ dx = −2 x e dx = u = x θ θ 0 θ 0 −1 −x/θ −x/θ dv = θ e dx v = e = = =2 = = −2 h −2θ −x/θ xe i∞ 0 − Z ∞ e −x/θ h dx = 2 − 2 0 − −θe−x/θ 0 i∞ 0 lim e−x/θ − lim e−x/θ = −2θ(0 − 1) = 2θ x→∞ x→0 Tenemos que E[X] = 2θ. Por el principio de invarianza del EMV, sabemos que si θ̂M V es el estimador máximo verosı́mil de θ, el estimador máximo verosı́mil de cualquier función h(θ) es h(θ̂M V ). Por tanto, el EMV de E[X] será: d E[X] M V = 2 θ̂M V = 2 X = X. 2 c) Mediante un muestreo aleatorio simple se han recogido los siguientes 15 tiempos de realización de la tarea: 5.56 2.23 0.58 1.37 0.21 1.98 2.44 2.71 10.12 4.69 3.47 1.73 3.51 1.19 0.97 Obtener la estimación máximo-verosı́mil del tiempo medio de realización del proceso. 15 1 X xi = 2.8507, por tanto, la estimación máximo 15 i=1 verosı́mil para el tiempo medio será: Para esta muestra se tiene que x = d E[X] M V = x = 2.8507 minutos. 1 Z Integración por partes: [u · v]ba − Z b u · dv = u · v − Z v · du. Si la integral es definida, entonces Z b u · dv = a v · du. a La exponencial negativa decrece mucho más rápido hacia cero que lo que x2 crece hacia infinito. En general, cuando tenemos una indeterminación en la que aparece una exponencial y cualquier función polinomial, siempre “gana” la exponencial. De forma rigurosa, tenemos: 2 x2 L’Hôpital (x2 )0 2x L’Hôpital 2 = lim = lim x/θ = lim x/θ 2 = 0 x→∞ ex/θ x→∞ (ex/θ )0 x→∞ e x→∞ /θ e /θ lim x2 e−x/θ = lim x→∞ Estadı́stica I 08/09 A. Arribas Gil d) Para la muestra del apartado anterior, dar una aproximación de la varianza asintótica del estimador de máxima verosimilitud de θ. Sabemos que el EMV es asintóticamente normal, y que su varianza asintótica es aprox1 . En nuestro caso, en el apartado a) (paso 4) hemos imadamente − ∂ 2 `(θ)| 2 θ= θ̂ ∂θ MV obtenido que ∂2 −2n `(θ)|θ=θ̂M V = 2 2 ∂θ θ̂M V por tanto, la aproximación de la varianza asintótica de θ̂M V para esta muestra particular será: h V ar θ̂M V i A ≈ − = Estadı́stica I 08/09 2 1 1 θ̂M V = − = ∂2 −2n 2n `(θ)|θ=θ̂M V ∂θ2 2 θ̂M V (x/2)2 c) 2.85072 = = 0.0677 2n 8 · 15 A. Arribas Gil