Estadística 2011 Clase 5 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri Clase 5 1. Test de Hipótesis 1. Test de Hipótesis: Método del intervalo de confianza 1. Test de Hipótesis: Terminología y errores (tipo I y II) 1. Test de Hipótesis: Generalización 2. Ejemplos 3. Ejercicios 4. Anexo 4. Anexo: Propiedades de muestras pequeñas • Insesgamiento – Un estimador es insesgado si el valor esperado del mismo es igual al parámetro a estimar, es decir, E E 0 • Mínima Varianza – • Se dice que un estimador es de mínima varianza del parámetro, si la varianza del mismo es menor igual que la del resto de los estimadores. Linealidad – Un estimador es lineal con respecto al parámetro, si es una función lineal de las observaciones muestrales. Así, por ejemplo la media muestral definida como 1 1 X X i x1 ... xn n n es un estimador lineal de X. 4. Anexo: Propiedades de muestras pequeñas • Mejor estimador lineal insesgado – • Si es lineal, es insesgado y tiene mínima varianza entre todos los estimadores lineales e insesgados de , entonces se denomina MELI. Error Medio Cuadrático (EMC) – Definimos al EMC de un estimador como EMC ( ) E 2 Haciendo contraste con la varianza de , la cual está definida como var( ) E E 2 Esta última mide la dispersión de la distribución de alrededor de su media, mientras que EMC( ) mide la dispersión alrededor del verdadero valor del parámetro. El criterio es buscar un estimador cuyo EMC sea el menor en un conjunto de estimadores comparables. 4. Anexo: Propiedades de muestras grandes • Insesgamiento asintótico – Un estimador es asintóticamente insesgado si lim E n • n Consistencia – Se dice que es un estimador consistente si se aproxima al verdadero valor de a medida que el tamaño de la muestra aumenta. lim P 1 n >0 p lim • Eficiencia asintótica – • Si es consistente y su varianza asintótica es menor que la varianza asintótica de todos los demás estimadores consistentes de , entonces es llamado asintóticamente eficiente. Normalidad asintótica – n Se dice que un estimador está normalmente distribuido asintóticamente si su distribución muestral tiende a aproximarse a la distribución normal a medida que el tamaño de la muestra aumenta de manera indefinida 1. Test de Hipótesis • Existen 3 técnicas básicas dentro de la inferencia estadística clásica: 1. Estimación puntual. 2. Estimación por intervalos. 3. Test de hipótesis. • Habiendo ya trabajado con la estimación puntual y por intervalos, vamos a pasar a la aplicación de los tests de hipótesis. Estos últimos también contribuirán a nuestro objetivo último, el cual es obtener conclusiones sobre determinados parámetros poblacionales. 1. Test de Hipótesis • Un test de hipótesis puede ser entendido como un procedimiento estadístico simple cuya finalidad es corroborar o desmentir alguna afirmación que se hace con relación a un parámetro poblacional. En definitiva, es una regla de decisión sobre determinadas características de los parámetros poblacionales de nuestro interés. • Recordemos entonces los principales elementos que se relacionan en la construcción de un test de hipótesis. -> Hipótesis nula: Se llama así a una suposición inicial sobre el parámetro poblacional bajo estudio que sirve para iniciar el procedimiento de prueba o verificación. Generalmente se usa el símbolo H0 para denotar a dicha hipótesis. -> Hipótesis alternativa: Es la hipótesis que se establece como alternativa de la hipótesis nula; si la H0 es rechazada, entonces será la hipótesis alternativa la que se tomará tentativamente como válida (y viceversa). •Se usa el símbolo H1 o HA para denotar la hipótesis alternativa. 1. Test de Hipótesis • Problema: Nuevamente tenemos una v.a. X con una FDP conocida f x; . Después de obtener una muestra aleatoria n, obtenemos el estimador puntual, . Pero este estimador que obtuvimos, ¿es compatible con algún valor específico de bajo hipótesis? TEST H 0 : * Hipótesis nula de * H1 : Hipótesis alternativa HIPOTESIS Simples • Compuestas Para comprobar la hipótesis nula, utilizamos la información muestral y así obtenemos el estadístico de prueba, un estimador puntual del parámetro desconocido. Entonces pasamos a averiguar la distribución muestral de dicho estadístico de prueba y utilizamos el método de intervalos de confianza para probar la hipótesis nula. 1. Test de Hipótesis: Método del intervalo de confianza Dado que tenemos a X i distribuido como N , 2 , podemos inferir que el estadístico de prueba está X N , 2 n Entonces, si conocemos la distribución de probabilidades de X , ¿cómo establecemos si un intervalo de confianza de 100 1 para , basado en este último, contiene al planteo de nuestra hipótesis nula? Veamos los pasos a seguir: 1. Puesto que X N , 2 n , se cumple que: X Zi n 2. N 0,1 Entonces, de la tabal de distribución normal se sabe que: P Z 2 Zi Z 2 100 1 % 1. Test de Hipótesis: Método del intervalo de confianza 3. Reordenando y sustituyendo términos da: Pr X Z 2 X Z 2 100 1 % n n Éste es un intervalo de confianza al 100 1 para . Lo único que se debe hacer es ver si * se encuentra en este intervalo. Si se encuentra no podemos rechazar la hipótesis nula, en caso contrario sí. 1. Test de Hipótesis: Terminología y errores (tipo I y II) Terminología: el intervalo de confianza que se construye se denomina la región de aceptación y el o las áreas por fuera de ella se conocen como regiones críticas, o de rechazo. Por último, los límites inferior y superior de la región de aceptación se denominan valores críticos. ERRORES TIPO I y TIPO II Estado de la naturaleza Decisión H0 es verdadera H0 es falsa Rechazar Error tipo I No hay error No rechazar No hay error Error tipo II Deseable: minimizar los errores tipo I y tipo II. Pero, para cualquier tamaño de muestra dado, no es posible minimizar ambos simultáneamente. Es preferible tener baja probabilidad de cometer un error de tipo I y luego tratar de minimizar al máximo la probabilidad de incurrir en un error de tipo II. 1. Test de Hipótesis: Terminología y errores (tipo I y II) • Un test de hipótesis debe ser construido de forma tal que la hipótesis nula sea o no rechazada. Se dice entonces que H0 es la hipótesis a ser probada. Sin embargo, con la inclusión de la hipótesis alternativa, puede ser mas descriptivo decir que probar una hipótesis estadística es proporcionar una regla de decisión entre H0 y H1. Por ello, se debe ejercer una precaución extrema al establecer las hipótesis nula y alternativa. • Recurramos a una analogía. En un proceso judicial, un acusado es inocente hasta que no se demuestre lo contrario. Si la hipótesis nula es “inocente”, entonces, con toda seguridad, la hipótesis alternativa es “culpable”. El rechazo de la hipótesis nula, implicaría que el juicio ha sido capaz de proporcionar suficiente evidencia para garantizar un veredicto culpable. Por otro lado, si el juicio no presenta evidencia sustancial, el veredicto será inocente. Esta decisión no implica necesariamente que el acusado sea inocente, más bien hace énfasis en la falta de evidencia sustancial necesaria para condenar al acusado. 1. Test de Hipótesis: Terminología y errores (tipo I y II) • Por lo tanto, en cierto sentido, un veredicto de culpabilidad ante un inocente (el rechazo de H0 cuando ésta es verdadera) debe considerarse como una decisión más fuerte que un veredicto de inocencia a un culpable (equivocarse al no rechazar H0 cuando es falsa), lo cual surge del principio judicial generalmente aceptado de que es peor condenar a una persona inocente que dejar libre a una culpable. • Si el veredicto es culpable, se deseará tener un grado muy alto de seguridad de que no se va a condenar a una persona inocente. Por lo tanto, en muchas situaciones, el error del tipo I se considera como un error mucho más grave que el error de tipo II. 1. Test de Hipótesis: Terminología y errores (tipo I y II) Distribución muestral de x cuando H 0 es verdadera y H 0 : 0 = 0 H1 : 0 Distribución muestral de x cuando H 0 es falsa y a < 0 La distribución estándar de ambas distribuciones es la misma: x n 1. Test de Hipótesis: Terminología y errores (tipo I y II) Terminología: • Nivel de significancia : probabilidad de cometer un error de tipo I. • Potencia de la prueba: dado que la probabilidad de un error tipo II está representada por , la probabilidad de no cometerlo se denomina de esta última forma (entiéndase como “la capacidad de no rechazar una hipótesis nula falsa”). P-value de un estadístico de prueba: • También conocido como nivel exacto de significancia, es el nivel más bajo de significancia al cual puede rechazarse una hipótesis nula. • Un test de hipótesis se llama bilateral (o de dos colas) cuando la hipótesis alternativa involucra el signo “≠” para el parámetro que se somete a prueba. • Un test de hipótesis se llama unilateral (o de una cola) cuando la hipótesis alternativa involucra el signo “<” (test unilateral izquierdo) o bien el signo “>” (test unilateral derecho). 1. Test de Hipótesis: Generalización • A fin de realizar un test de hipótesis sobre un parámetro poblacional, es recomendable seguir los siguientes 5 pasos: 1. Emitir una hipótesis nula (H0) relativa a algún parámetro de la población. La hipótesis debe involucrar alguno de los signos “=”, “≥” o “≤”, pero no puede involucrar ninguno de los signos “<”, “>”, ni tampoco “≠”. 2. Especificar un nivel de significación α a emplear. Lo convencional es emplear los niveles del 5% ( α = 0,05) o del 1% ( α = 0,01). 3. Extraer de la población una muestra aleatoria de tamaño n, y calcular el estadístico de prueba apropiado (Z, t, etc.). 4. Comparar el valor numérico obtenido para el estadístico de prueba con un valor tabulado (valor crítico - Z*, t*, etc. -) de la distribución estadística teórica correspondiente. 5. Decidir si se rechaza o no la hipótesis nula. 2. Ejemplos • Veamos tres casos de tests para la media poblacional 1- Los paquetes de harina marca XYZ de medio kilogramo afirman contener en su etiqueta un contenido neto de 500 gr. Supongamos que deseamos evaluar dicha afirmación a partir de nuestra creencia de que los paquetes contienen menor cantidad de harina. Para ello, se eligen al azar 50 paquetes y se los pesa con una balanza de precisión, obteniendo los siguientes datos muestrales: X = 492 gr. S = 34,4 gr. Planteamos entonces las hipótesis nula y alternativa: H0 : {µ ≥ 500 gr.} H1 : {µ < 500 gr.} Para la realización del test, usaremos un nivel de significación del α = 0,05. 2. Ejemplos Aunque desconocemos cómo se distribuye el peso de los paquetes, por tratarse de una muestra grande (n > 30) usaremos la distribución normal estándar a fin de hallar nuestro valor crítico. Para un nivel de significación de 0,05 la tabla correspondiente arroja un valor de Z* = -1,645. 5% del área bajo la curva zona de rechazo de la hipótesis H 0 2. Ejemplos El estadístico que utilizaremos es: x m n Reemplazando en el mismo por los datos del ejercicio se obtiene que: Z = (492 - 500) / (34,4 / 7,07) = -1,644 Dado que -1,645 < -1,6444 el valor calculado del estadístico de prueba no alcanza a caer en zona de rechazo. Por lo tanto, al nivel de significación del 5% no se puede rechazar la hipótesis nula. Es decir, no existen argumentos para afirmar que los paquetes de harina XYZ contienen (en promedio) menos que lo anunciado en sus etiquetas. 2. Ejemplos 2- En cierto país se estableció que hace 20 años el promedio de vida de una persona era de 71,4 años. Recientemente, se tomó una muestra aleatoria de 100 muertes, y se obtuvo que: X = 73,8 años. S = 9,8 años. ¿Se puede argumentar que actualmente la gente vive, en promedio, más que hace 20 años? Planteamos entonces la hipótesis nula y alternativa: H0 : {µ ≤ 71,4 años} H1 : {µ > 71,4 años} Para la realización del test, usaremos un nivel de significación del α =0,05. 2. Ejemplos Para un nivel de significación de 0,05 la tabla correspondiente arroja un valor de Z* = 1,645. El estadístico que utilizaremos es, nuevamente: x m n Reemplazando en el mismo por los datos del ejercicio se obtiene que: Z = (73,8 - 71,4) / (9,8 / 10) = 2,448 Dado que 2,448 > 1,645 el valor calculado del estadístico de prueba cae en zona de rechazo. Por lo tanto, al nivel de significación del 5% se puede rechazar la hipótesis nula. Es decir, se rechaza H0 y se concluye que los resultados de la muestra son altamente significativos para argumentar que actualmente las personas viven, en promedio, más que hace 20 años. 2. Ejemplos 3- El departamento de seguridad de una fábrica desea saber si el tiempo promedio real que requiere un sereno para realizar su ronda nocturna es de 30 minutos. Se tomó una muestra al azar de 32 rondas y el sereno promedió 30,8 minutos con una desviación estándar de 1,7 minutos. X = 30,8 minutos. S = 1,7 minutos. Realicemos un test de hipótesis con α = 0,01, que permita averiguar si hay evidencia suficiente para rechazar la hipótesis nula: H0: {µ = 30 minutos} en favor de la hipótesis alternativa: H1: {µ ≠ 30 minutos} 2. Ejemplos A diferencia de los dos ejemplos anteriores, el test es un ensayo bilateral o a dos colas. Los valores de z críticos son aquellos con respectivas áreas de 0,005 en sendas esquinas bajo la curva, es decir, Z* ± 2.576. El estadístico de prueba es nuevamente: xm n Reemplazando en el mismo por los datos del ejercicio se obtiene que: Z = (30,8 - 30) / (1,7 / 5,65) = 2,662 Este valor cae en zona de rechazo ya que es mayor que 2,576. Por lo tanto, se rechaza la hipótesis de que el tiempo promedio real que hace el sereno en sus rondas es de 30 minutos, en favor de la alternativa, por lo que concluimos que es muy probable que el sereno haga un tiempo promedio diferente a 30 minutos. 2. Ejemplos • Al igual que en los casos de estimación por intervalos, para muestras pequeñas con varianza poblacional desconocida y población supuestamente normal, se emplean las tablas de valores críticos de la distribución t de Student con n−1 grados de libertad. • Veamos un ejemplo. Supongamos que deseamos analizar el tiempo promedio para entregar pizzas en un barrio determinado ya que se cree que el responsable de la sucursal miente al decir que sus repartidores tardan, a lo sumo 40 minutos para cualquier entrega dentro de la zona de operaciones. Para realizar el test, se obtiene una muestra aleatoria de 10 pedidos de pizza (redondeados al minuto más cercano): 38, 48, 37, 39, 46, 46, 43, 42, 44 y 40 minutos. 2. Ejemplos Si se supone distribución normal y deseamos realizar el test de hipótesis con α = 0,01, ensayaremos la hipótesis nula: H0:{µ ≤ 40} contra la hipótesis alternativa H1:{µ > 40} A partir de los datos, se sabe que: X = 42,3 minutos S = 3,743 minutos Reemplazando en el estadístico de prueba por los datos del ejercicio se obtiene que: t = (42,3 - 40) / (3,743 / 3,162) = 1,943 El valor crítico en la distribución t de Student con ν = 10 − 1 = 9 grados es igual a 2,821. Como 1.943 es menor al t*, no se puede rechazar la afirmación del responsable del local a un nivel de α = 0,01. 2. Ejemplos • Supongamos que ahora deseamos realizar un test de hipótesis relativo a la varianza o la desviación estándar poblacionales. Para ello, deberemos usar el estadístico de prueba llamado chi−cuadrado muestral, definido como sigue: n 1 S 2 2 2 • En un test unilateral a la derecha (o de cola derecha), la hipótesis nula será: H0:{σ2 ≤ σ20} o bien H0:{σ2 = σ20} y la hipótesis alternativa será: H1:{σ2 > σ20} • Para un nivel de significación α, la región de rechazo se busca en tablas de la distribución chi−cuadrada con ν = n −1 grados de libertad. 2. Ejemplos • En cambio, en un test unilateral a la izquierda (o de cola izquierda), la hipótesis nula es: H0:{σ2 ≥ σ20} o bien H0:{σ2 = σ20}, y la hipótesis alternativa es: H1:{σ2 < σ20} Por último, para un test bilateral (o de dos colas), se tiene: H0:{σ2 = σ20 }, y la hipótesis alternativa es: H1:{σ20 ≠ σ20} 2. Ejemplos • Veamos un ejemplo. Supongamos que estamos analizando el tiempo (en minutos) de espera de los clientes en la ventanilla de un banco. Antes de un curso de capacitación para los empleados de atención al público se sabía que la desviación estándar era 2,3 minutos. Luego del curso de capacitación, el tiempo de espera de 10 clientes tomados al azar fue de: 1,8; 5,2; 4,3; 6,6; 2,5; 3,4; 2,6; 5,6; 4,7 y 4,0. Por lo tanto: H0:{σ2 ≥ (2,3)2} H1:{σ2 < (2,3)2} con α = 0,05. ¿Sirvió el curso de capacitación para disminuir la varianza de los tiempos de espera? 2. Ejemplos De los datos muestrales, hallamos que S = 1,5166 minutos. A primera vista podríamos sospechar que el curso sí sirvió, pero veamos: el valor crítico para la distribución chi−cuadrado con 9 grados de libertad es de 3,32. Si reemplazamos en el estadístico de prueba por los datos del ejercicio, obtendremos que: c =[9 * (1,5166)2 ] / 2,32 = 3,913 > 3,32 Por lo tanto, no existe suficiente evidencia estadística en contra de la hipótesis H0, así que se concluye que probablemente el curso de capacitación no sirvió para disminuir la varianza de manera perceptible (o significativa). 3. Ejercicios Ejercicio 1: Con el fin de estimar la rentabilidad diaria promedio del activo XXX se tomó una muestra compuesta de 400 observaciones sobre sus precios de cierre, obteniéndose los siguientes resultados: Rentabilidad promedio = 0,1563 Volatilidad muestral = 0,4795 Teniendo en cuenta las condiciones de mercado eficiente, se supone que las variables que componen la población son independientes y todas con distribución de probabilidades del tipo N(µ, σ2), siendo µ y σ2 desconocidos para el observador. a) Se pide construir el intervalo de confiabilidad para la rentabilidad diaria del activo XXX con un nivel de significación del 90%. b) La consultora A asegura a sus clientes que la rentabilidad diaria del activo XXX es en promedio 0,2, contra la opinión de la consultora B que asegura que la rentabilidad diaria promedio es menor que dicho valor. A partir de los resultados vistos, testear la hipótesis de la consultora A contra la de la consultora B con un nivel de significación del 95%. 3. Ejercicios c) La consultora A asegura a sus clientes que XXX tiene volatilidad y rentabilidad promedio diaria similar a YYY, contra la opinión de la consultora B que asegura que la rentabilidad diaria promedio de YYY es mayor que la de XXX. Con este fin se toma una muestra diaria de tamaño 900 sobre las rentabilidades de YYY, obteniéndose una rentabilidad diaria promedio igual a 0,1701 y una volatilidad de las rentabilidades diarias igual a 0,4924. Suponiendo que las variables que corresponden a las rentabilidades de YYY se distribuyen una normal N(µ, σ2), testear la hipótesis de la consultora A con un nivel de significación del 90%. 3. Ejercicios Ejercicio 2: Se tomó una muestra de 15 observaciones sobre la evolución de la acción ZZZ, cuyas rentabilidades son variables independientes con distribución N(µ, σ2) de la que se obtuvo que la varianza de las rentabilidades es igual a 0,234. a) Se pide construir el intervalo de confianza para la volatilidad diaria de ZZZ con un nivel de significación del 90%. b) La consultora A asegura a sus clientes que la varianza del activo ZZZ es igual a 0,17 contra la opinión de la consultora B que asegura que dicha varianza es mayor a 0,17. A partir de los resultados de la muestra, testear la hipótesis de la consultora A, con un nivel de significación del 95%. 3. Ejercicios Ejercicio 3: Se realizó un estudio para comparar el promedio del número de llamadas de emergencia a la policia por turno de 8 hs, en dos distritos de una ciudad. Se seleccionaron al azar muestras de los registros policiacos para cada una de las regiones, y se registro el numero de llamadas en cada turno. Las estadísticas muestrales son las siguientes: Región 1 Región 2 Tamaño muestral 100 100 Media muestral 2,4 3,1 Varianza muestral 1,44 2,64 a) Verifique la hipotesis nula de que el promedio del numero de llamadas de emergencia por turno es igual en los dos distritos de la ciudad con una significacion del 5% 3. Ejercicios Ejercicio 4: Un investigador ha preparado el nivel de dosificación de un fármaco que afirma provocará sueño en por lo menos el 80% de las personas que padecen insomnio. Despues de examinar la dosificación, se considera que su afirmación acerca de la efectividad del fármaco es exagerada. En un intento de refutar su afirmación se administra la dosificación prescrita a 20 personas que padecen insomnio, y se observa Y, el numero de personas que se adormecen debido al fármaco. Se desea probar la hipotesis H0: p = 0,08 frente a la alternativa H1: p < 0,8 Suponga que se utiliza la región de rechazo (Y<12) a) Encuentre α. b) Encuentre β para p = 0,6 3. Ejercicios Ejercicio 5: Una agencia gubernamental recibe reclamos de algunos consumidores sobre ciertas botellas de amaretto vendidas por una empresa que contienen menos de los 20 grados de alcohol de producto publicados. Para verificar el reclamo de los consumidores, la agencia compra 9 botellas y encuentra que la media es de 18 grados y la desviación estándar de 3 grados. ¿Cómo realizaría el test esta agencia, con un 5% de significación? 3. Ejercicios Ejercicio 6: Un gran comprador de lámparas de luz quiere decidir cual de dos marcas de igual precio va a comprar. Para ello, toma una muestra aleatoria de 100 lamparas de cada marca y encuentra que la marca A tiene una duración media de 980 hs y un desvío estándar de la muestra de 80 hs. Para la marca B, la media es de 1010 hs y el desvío estándar de 120 hs. ¿Qué marca debería comprar si quiere tomar la decision a un nivel de significacion del 5%? ¿Y si el nivel de sifnificación fuera del 1%? FIN Me pueden escribir a: [email protected] Las presentaciones estarán colgadas en: www.cema.edu.ar/u/jrs06