Comisión Económica para América Latina y el Caribe (CEPAL) División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE) Estimación Puntual de Parámetros Christian A. Hurtado Navarro Mayo, 2006 Estimación Puntual. Introducción En un problema estadístico, donde los datos fueron generados a partir de una distribución Inferencia de probabilidad Estadística permiten F(x) desconocida, señalar algo los métodos respecto de de esta distribución. En presencia de una muestra, se supone que la distribución de donde proviene no es totalmente desconocida - por ejemplo pertenece a una determinada familia de distribuciones teóricas - entonces solamente uno o varios parámetros que definen la familia de distribuciones son desconocidos. En este caso, la teoría de estimación, tiene por objetivo dar valores a estos parámetros a partir de los valores muestrales. La elección de consideraciones la familia teóricas o de bien distribuciones de la se hace distribución a de partir de frecuencias empírica. Los parámetros desconocidos son constantes que toman valores espacio Ω llamado espacio de parámetros, por ejemplo: N (μ ,1) ( N μ,σ 2 Exp(β ) Ω=ℜ ) Ω = ℜ × ]0,+∞[ Ω = ]0,+∞[ Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. en un Ω = [0,1] B(10, p ) Sean x1,x2,…,xn valores muestrales obtenidos sobre una muestra aleatoria simple de una v.a. x de función de f (x θ ) , densidad en θ que es desconocido. La estimación puntual, busca elegir un valor para θ a partir de los valores muestrales. Es decir se tiene que definir una función δ : ℜ → Ω , que es un estadístico llamado estimador de θ. El valor tomado por esta función sobre una muestra particular de tamaño n es una estimación. Otra forma de estimar un parámetro consiste en buscar no un sólo valor para θ, sino un conjunto de valores, un intervalo en general, en el cual se tiene alta probabilidad de encontrar. Es el método de estimación por intervalo. Procediendo así, tratamos de estimar el valor de los parámetros, que son considerados como constantes, a partir de estadísticos que son aleatorios. Para elegir definir entre varios criterios de estimadores comparación. de Los un mismo métodos de parámetro estimación hay son: que el método de los momentos y el método de máxima verosimilitud. 1. Método de los Momentos. Recordemos que el momento no centrado de orden k de una v.a. x, se define como mk = E [x k ] , y el momento centrado de orden k de dicha v.a. se define como [ ] μ k = E x − E (x )k . Para definir estimadores para estos parámetros se sigue el siguiente procedimiento: 9 Dado que la información que tenemos acerca de la v.a. x procede de una muestra aleatoria simple x1,x2,…,xn, se supone entonces que x es una v.a. discreta que toma únicamente dichos valores con una probabilidad igual a la frecuencia relativa observada (evidentemente se trata sólo de una aproximación que será mejor o peor en función del tamaño de la muestra y de las características de x). 9 Para estimar un momento de x se calcula el momento teórico correspondiente a la v.a. discreta definida en el paso anterior. A los estimadores de los momentos que resultan de aplicar este procedimiento los denominaremos momentos muestrales. De este modo, los momentos muestrales correspondientes a los momentos centrados se definen de acuerdo con la siguiente expresión: Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. no Momentos de orden k respecto al origen, mk. +∞ [ ]= ∫ x mk = E x k k f (x )dx −∞ Momentos de orden k respecto a la media. [ +∞ ] ∫ (x − μ ) mk = E (x − μ ) = k k f (x )dx −∞ 2. Método de Máxima Verosimilitud. Sean x1,x2,…,xn los valores muestrales de una muestra aleatoria simple de una v.a. de densidad o función de probabilidad f (x θ ) en que θ ∈ Ω , el espacio de parámetros. Se llama función de verosimilitud a la densidad conjunta o función de probabilidad del vector aleatorio formado de los valores muestrales (x1,x2,…,xn), se denota f n (x1 , x 2 , K , x n θ ) . Como los valores f n (x1 , x 2 , K , x n θ ) muestrales son independientes, se tiene, n ∏ f (x θ ) . n i i 1 Un estimador del parámetro θ basado en una muestra de tamaño n es una función δ de los valores muestrales x1,x2,…,xn a valores en el espacio de parámetro Ω. El valor que toma el estimador δ sobre una muestra estimador x1,x2,…,xn de se Máxima llama estimación Verosimilitud función de verosimilitud es el o valor estimador estimado. que hace El la f n (x1 , x 2 , K , x n θ ) máxima. Tal estimador puede entonces no ser único, o bien no existir. Propiedades del Estimador de Máxima Verosimilitud No es fácil encontrar buenos estimadores - insesgados, de varianza minimal; de hecho estas dos propiedades pueden ser antagónicas en Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. el sentido que a buscar eliminar el sesgo se aumenta la varianza. Por otro varianza lado es la búsqueda relacionada de estimadores con la insesgados existencia de de mínima estadísticos suficientes. Cuando existe, el estimador de Máxima Verosimilitud tiene algunas propiedades interesantes: 9 Generalmente es consistente; 9 Es asintóticamente normal; 9 No es siempre insesgado, pero lo es asintóticamente; 9 Es función de un estadístico suficiente, cuando existe uno; 9 Entre todos los estimadores asintóticamente insesgados, tiene la varianza asintóticamente más pequeña (es eficiente). 9 Si el E.M.V. es un estadístico suficiente, entonces es un estadístico suficiente minimal. Tiene la propiedad de invarianza: Si θˆ 9 Máxima Verosimilitud biyectiva, del entonces parámetro () g θˆ es el θ es el Estimador de y si Estimador g :Ω → Ω de es Máxima Verosimilitud de g(θ). En resumen, al considerar x distribuida de acuerdo a f(x;θ) donde es θ un parámetro (o vector de parámetros) desconocido. El método de máxima verosimilitud es una técnica para estimar los valores de θ dada una muestra finita de datos. Supongamos n medidas de x, x1, x2,…,xn. Puesto que las medidas son independientes, la probabilidad de que x1 esté en [x1,x1+Δx1], x2 en [x2,x2+Δx2], si la pdf y el (los) parámetro(s) probabilidad describen para los realmente datos que los hemos datos, esperamos alta medido. Análogamente un parámetro cuyo valor se desvíe mucho del auténtico resultará en baja probabilidad para las medidas observadas. La probabilidad máxima para la pdf y parámetros correctos, es: L(θ ) = n ∏ f (x ;θ ) i i =1 Se definen los estimadores de máxima verosimilitud de los parámetros como aquellos que maximizan la función de verosimilitud: ∂L =0 ∂θ i Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. La definición no garantiza que los estimadores MV sean “óptimos” en absoluto! En general, sin embargo, suelen ser la aproximación más aceptable al problema de estimar parámetros. Ejemplo 1. El número(X) de grietas que presentan los tensores de concreto se distribuye Poisson, con parámetro θ . Se toma una muestra aleatoria de 40 tensores de concreto y se registra el número de grietas que presenta cada tensor, obteniendo la siguiente información: N° de grietas 0 Cantidad de tensores 4 9 Determine el EMV de θ. 9 1 10 2 11 3 8 4 4 5 2 6 1 Calcule la estimación máxima verosímil con los datos de la tabla. Solución: 9 Para calcular el estimador máximo verosímil debemos calcular la función de verosimilitud. verosimilitud verosimilitud Para es el L(θ ) = verosimilitud es l (θ ) = modelo θ∑ i =1 Xi enθ n ∏ X i! i =1 n ∑X y i , la función Poisson la y la de log- función función de de log- n ln(θ ) + nθ − ln( ∏ X i !) . Se puede mostrar i =1 n que el estimador de máxima verosimilitud es θˆMV = 9 ∑X i =1 n i =X. La estimación máximo verosímil es θˆMV = 2.2 Ejemplo 1. Calcular los Estimadores de Máxima Verosimilitud de la media y varianza de una distribución normal. Solución. La función de distribución normal tiene la forma: ( f x, μ , σ 2 )= 1 2πσ 2 − e 1 ( xi − μ )2 2 σ2 La función de verosimilitud es por tanto igual a: Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. ( Lf x, μ , σ )= ∏ n 2 i =1 ( Lf x, μ , σ ⎛ ⎜ 2 ⎜ 2πσ ⎜ ⎝ )= ∏ ( n 2 1 ( xi − μ )2 ⎛ − 1 ⎜ 2 e 2 σ ⎜ 2 ⎜ 2πσ ⎝ i =1 ) − ⎞ ⎟ ⎟ ⎟ ⎠ 2 1 − 1 ( xi − μ ) 2 2 σ 2e ⎞ ⎟ ⎟ ⎟ ⎠ n ( ) ( Lf x, μ , σ 2 = 2πσ 2 ) − n 2 − e ∑ ( xi − μ )2 1 i =1 σ2 2 donde el logaritmo de la función de verosimilitud es: 2 ∑ (xi − μ ) n ( ) ( ) 1 n n Lf x, μ , σ 2 = − ln (2π ) − ln σ 2 − 2 2 2 i =1 σ2 Derivando con respecto a μ e igualando a cero se tiene: ( ∂Lf x, μ , σ ∂μ 2 )= ∑ (xi − μ ) n i =1 σ2 =0 ∑ ( x i ) − nμ = 0 n i =1 ∑ ( xi ) n μ= i =1 n =x Derivando con respecto a σ2 e igualando a cero se tiene: ( ∂Lf x, μ , σ ∂σ 2 2 )=− 2 ∑ (xi − μ ) n n 2σ 2 + i =1 2σ 4 =0 2 ∑ (xi − μ ) n σ2 = i =1 n 3. Método de Mínimos Cuadrados. Supongamos que hemos medido un conjunto de pares de datos (xi,yi) en una experiencia, por ejemplo, la posición de un móvil en ciertos instantes de tiempo. Queremos obtener una función y=f(x) que se ajuste lo mejor posible a los valores experimentales. Se pueden ensayar muchas funciones, rectas, polinomios, funciones potenciales o logarítmicas. Una vez establecido la función a ajustar se determina sus parámetros, en el caso de un polinomio, serán los coeficientes del Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. polinomio de modo que los datos experimentales se desvíen lo menos posible de la fórmula empírica. La función más sencilla es la función lineal y=ax+b que hemos tratado en la página anterior. El procedimiento de ajustar los datos experimentales a una línea recta se denomina regresión lineal. Polinomio aproximador. Queremos aproximar un polinomio de grado n, a un conjunto de m pares de datos (xi,yi) de modo que n ≤ m. Sea el polinomio P(x)=a0+a1x1+a2x2+…+anxn Se calcula la cantidad: Para obtener aproximador los se valores tienen de que los coeficientes determinar los del valores polinomio de los coeficientes a0,a1,a2,…,an de forma que la cantidad S tome un valor mínimo. Tomando derivadas parciales de S respecto de a0,a1,a2,…,an iguales a cero: (1) Segundo grado y=a0+a1x+a2x2 x x0 x1 x2 x3 y y0 y1 y2 y3 Las ecuaciones (1) se escribirán Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL. Agrupando términos Introduzcamos las expresiones (2) Se obtiene el siguiente sistema de n ecuaciones con n incógnitas (3) Si todos los puntos son distintos, el sistema de ecuaciones tiene una solución única. Material de docente de uso exclusivo de los alumnos del curso de Econometría Básica, CEPAL.