Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena VI - TEORIA DE PRUEBA DE HIPÓTESIS 6.1 Prueba de Hipótesis En esta sección miraremnos a una rama principal de los métodos cuantitativos y de la estadística, conocida como Pruebas de Hipótesis. Estamos interesados en la elección de una de dos decisiónes en base a la evidencia de los datos que se encuentran sujetos a aleatoriedad y pueden, por consiguiente, ser considerados como realizaciónes de una variable aleatoria. Las decisiónes se realizan entre dos afirmaciónes en conflicto entre si acerca de la población, y estas afirmaciónes son conocidas como hipótesis. Si denotamos las mismas como H0 y H1, entonces ejemplos de estas hipótesis pueden ser: H0 H1 Un proceso modificado no produce Un proceso modificado produce un un rendimiento mayor que un proceso rendimiento mayor que un proceso estándar. estándar. Un índice económico no se ha incrementado Un índice económico se ha en un año incrementado en un año Una persona no esta dotada de Una persona esta dotada de sentidos extrasensoriales sentidos extrasensoriales. 1 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Una división no es mas productiva Una división es mas productiva que otra en la compañía que otra en la compañia Debe notarse que siempre la Hipótesis H0 presupone falta de cambio, no diferencia, etc., es por ello que es llamada Hipótesis nula, mientras que la hipótesis H1 es denominada Hipótesis alternativa. La mayoria de los procedimientos estadísticos pueden ser representados por afirmaciónes sobre los valores de algunos parámetros poblaciónales como ser la media o la varianza, no obstante existe una rama de las estadísticas que trata con métodos no paramétricos. El primer paso, en consiguiente, en cualquier problema de test de hipótesis es trasladar el problema “real” a su equivalente técnico. Por ejemplo, las hipótesis menciónadas anteriormente pueden ser trasladadas a su equivalente técnico de la forma: “Observamos y1, y2...yn de una distribución N (µ, σ2) y deseamos testear H0: µ = µ0 v H1: µ > µ0 o H1: µ < µ0 en los µ0 representa un valor especifico”. Mas adelante veremos como resolver esto. Es muy importante que la formulación del problema sea realizado correctamente, y es sorprendente como el analista muchas veces obtiene intuiciónes (“insights”) con el solo hecho de pensar en el problema. Una palabra de advertencia aquí- generalmente el problema es descripto como : “Deseamos testear la hipótesis que la media poblaciónal es cero”. En otras palabras, la hipótesis alternativa se deja sin especificar. Debe de haber una, por supuesto, o caso contrario no habría problema!. La hipótesis alternativa implicita en esta afirmación es H1: µ ≠ 0, pero es mejor establecerla en forma explícita, debido a que muchas veces la naturaleza de la hipótesis alternativa puede afectar tanto el test como el tamaño muestral requerido. 2 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 6.2 El Test El procedimiento de prueba en si mismo es un cálculo directo de un dato, cuyo resultado es comparado con una constante obtenida de las tablas estadísticas. La elección de la hipótesis resulta de esta comparación. Para muchos problemas de prueba de hipótesis existen procedimientos estándar. En capítulos posteriores describiremos varios de los mismos, y demostraremos sus aplicaciones. Pero primero analicemos la lógica detrás de estos procedimientos de prueba porque ello, además de ser interesante en si mismo, nos posibilita a decidir sobre el tamaño muestral en una manera razonable, y a apreciar el valor de las conclusiones obtenidas a partir del test. No obstante no intentaremos derivar el procedimiento del test –es muy complicado- desde el punto de vista matemático- es un reaseguro saber que todos los tests se basan en conceptos lógicos descriptos en las siguiente dos secciones. 6.3 Lógica del Test. En orden de comprender los conceptos detrás de Pruebas de Hipótesis, debemos empezar por describir dos ejemplos simples pero extremos. 1. Una moneda es lanzada 100 veces a los efectos de determinar en que medida esta bien balanceada o no. Observamos 98 caras y 2 cecas. El sentido común nos dirá que existe una evidencia fuerte que la moneda se encuentra desbalanceada en favor de “cara”. Más formalmente, rechazamos la hipótesis que la moneda se encuentra bien balanceada porque la chance de obtener 98 caras con una moneda bien balanceada es extremadamente baja. La observación o resultado del experimento, es incompatible con una moneda bien balanceada. 3 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 2. Supongamos que ha sido sugerido que el retorno medio de cierta industria es tal que supera el 25% anual. A los efectos de evaluar la verdad de tal afirmación, tomamos una muestra de los balances de 50 empresas de la industria y obtenemos que la media es 24% y el error estándar 0.2%, lo que dividido por la raiz cuadrada de 50 nos da 0.028%, de manera tal que nuestra hipótesis de rendimiento se encuentra a mas de 35 desviaciónes estandar de la media muestral – muy improbable!. En base a esta evidencia rechazamos el valor sugerido de rendimiento de la media de retorno de la industria. En estos ejemplo es perfectamente razonable hacer una evaluación de sentido común y descartar una hipótesis en base a la evidencia, siendo los datos tan extremos, pero aún un juicio de sentido común esta usando la lógica en algún sentido, y entendiendo cabalmente esta lógica estaremos en condiciones de tomar decisiones acertadas en situaciones menos extremas y mas complicadas. Una segunda ventaja de este enfoque formal es que nos posibilita expresar confianza en nuestro procedimiento de inferencia; esto puede ser de extremada importancia al comunicar nuestras conclusiones a traves de un reporte, presentaciones, etc., y a entenderlas. El procedimiento a seguir es el siguiente. Con una hipótesis en particular en mente procedemos a observar un set de información relevante. Medimos la compatibilidad de estos datos con nuestra hipótesis computando la probabilidad de observar este o un dato mas extremo bajo el supuesto que la hipótesis es correcta. Si esta probabilidad es baja, entonces se dice que los datos se juzgan como refutantes de la hipótesis, y en consecuencia es rechazada a favor de la hipótesis alternativa dado que los datos son mas probables de haber ocurrido bajo el supuesto de esta alternativa. Otra forma de ver el procedimiento es la siguiente. Aun cuando el real retorno de la industria sea 25%, no esperamos el retorno medio igual a exactamente 25%. Esperamos que 4 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena el retorno medio pueda encontrarse cerca de 25% y esperamos que pueda existir alguna desviación debido al azar. La pregunta importante aquí es “es una desviación de 25% debida al azar solamente, o es muy grande para ser explicada unicamente por el azar?”. La desviación de 24% a 25% es muy grande (dada la desviación estándar) para ser explicada únicamente por azar. También debemos decidir cuando consideraremos una probabilidad como tan baja que implique incompatibilidad. Los standards, arbitrarios pero aceptados son:- Probabilidad < .05, rechazar H0 Probabilidad < .01, rechazar definitivamente H0 con confianza. Probabilidad < .10, no rechazar H0 pero mirarlo con sospecha. Estos son comunmente conocidos como niveles de significancia para un test estadístico. Son estandares aceptados, no obstante los niveles efectivamente utilizados deben depender en las consecuencias de cometer errores. 6.4 Tipos de errores En cualquier problema que implique una decisión sobre dos alternativas existen dos errores involucrados, y nuestro propósito es trata de reducir las probabilidades de cometer estos errores, tanto como nos posibilite una decisión raciónal de procedimiento de selección. Para ilustrar estos errores, consideremos el problema simple de todos los días de cruzar una calle o ruta. Si cruzamos cuando no hubiésemos debido (un tipo de error) terminamos en un Hospital, o peor todavía. Si no cruzamos cuando podríamos haberlo hecho en forma segura, podemos llegar tarde a una cita, por ejemplo (otro tipo de error). Dos puntos importantes surgen de este ejemplo: 5 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 1) los dos errores son indeseables, y debemos actuar de manera tal que sus probabilidades sean bajas. 2) debemos requerir que las probabilidades del primer tipo de error sean bastantes menores que las del segundo tipo. Las pruebas de hipótesis que veremos mas adelante estan todos derivados con este criterio de error en mente- de controlar y minimizar las probabilidades de cometer errores. Para ver como es hecho, examinemos en detalle el simple problema de testear un valor puntual para una media normal con respecto a otro valor puntual, cuando la varianza es conocida. Es mas bien un ejemplo artificial, pero sirve al propósito de ilustrar el concepto claramente. Todos los tests que veremos despues estan basados en estos conceptos. Obsrevamos y1, y2, ...yn de una población con distribución N(µ, 36), de forma que s se asume igual a 6, y deseamos testear H0 : µ = 0 v H1 : µ = 5 Suponemos que no existen otros valores de µ posibles. Puede ser mostrado, y es obvio en forma intuitiva, que el mejor test deberia ser de la forma – “elije H1 cuando m > a, para una constante a, todavia a ser determinada”. Si elegimos H1 cuando H0 era cierta, cometemos error Tipo I, Si elegimos H0 cuando H1 era cierta, cometemos error Tipo II. 6 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Sean α y β las probabilidades de cometer dichos errores, respectivamente. Entonces podemos argumentar asi: Error Tipo I α = prob (Error tipo I) = prob (m > a cuando H0 es cierta), y siendo que m ~ N (0, 36/n) bajo la hipótesis nula (tomándola a los efectos del cálculo como si fuera correcta), entonces α = prob (Z > a√n/6) donde Z es una variable normal estandar, de manera que Zα = a√n/6 (1) donde Zα es la variable normal estándar que corta la distribución a un nivel de probabilidad de α. Error Tipo II β = prob (Error tipo II) = prob (m < a cuando H1 es cierta), y siendo que m ~ N (5, 36/n) bajo la hipótesis alternativa (tomándola a los efectos del cálculo como si fuese correcta), entonces β = prob (Z < (a – 5) *√n/6) donde Z es una variable normal estandar, 7 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena de manera que -Zβ = (a- 5) * √n/6 (2) donde Zβ es la variable normal estándar que corta la distribución a un nivel de probabilidad de α. Las ecuaciónes (1) y (2) relaciónan los cuatro valores α, β, a y n de manera tal que dados dos, los otros dos son determinados en forma inequívoca Por ejemplo, suipongamos que deseamos testear con un nivel de probabilidad de error tipo I de 5%, y tipo II de 10%. Entonces el tamaño muestral estara dado por: n = (36/25) * (Zα + Zβ)2 (3) = (36/25) * (1.645 + 1.28)2 = 12.32 entonces utilizaremos una muestra de tamaño 13, y un valor limite a de: a = 5* Zα/ (Zα + Zβ) = 5 * 1.645/(1.645 + 1.28) = 2.81 de aquí que si elegimos las probabilidades, podemos encontrar un punto de decisión a, y un tamaño muestral n, que nos darán las probabilidades de error especificadas. Esto es lo que queremos decir cuando hablamos de controlar las probabilidades de error. 8 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena DISTRIBUCIÓN BAJO HIPÓTESIS NULA Y ALTERNATIVA H0 H1 a Del diagrama podemos observar; (a) Si disminuimos α al movernos hacia la derecha, entonces automáticamente incrementamos β, i.e. las probabilidades de errores actuan en forma contraria una de otra. (b) Si incrementamos el tamaño de la muestra, entonces las dos curvas se hace mas delgadas y tanto α como β disminuyen.Nos dice que podemos disminuir las probabilidades de error al incrementar el tamaño de la muestra, pero esto seguramente es mas costoso. 9 Universidad del CEMA Métodos Cuantitativos (c) Prof. José P Dapena Si las hipótesis se encontraran bastantemente distanciados, entonces los dos errores serian menores.Esto confirma el punto que mientras mas diferentes sean las hipótesis, mas facil es discriminar entre ellas. En el ejemplo anterior, hubieramos cometido un error Tipo I si hubiesemos dicho que el nivel de retorno de la industria es menor que 25% cuando era en realidad mayor, y viceversa para un error Tipo II. Estos errores son tomados en consideración en la formulación de procedimiento de prueba; las pruebas estándar descriptas en los siguientes dos capitulos estan diseñados todos para minimizar las probabilidades de cometer estos errores. 6.5 La Función de Poder Las probabilidades de error descriptas son, de hecho, casos especiales de una importante función conocida como la función de Poder. Su complemento (1 – función de poder) es conocida como la función de Caracteristicas Operativas, y es muy utilizada en Control de Calidad. La función de Poder es una función del parámetro de consideración, y se define como: P(θ) = Prob de aceptar H1 cuando el parámetro es igual a θ La función complementaria es P(θ) = Prob de aceptar H0 cuando el parámetro es igual a θ 10 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Como ejemplo consideremos el test normal descripto precedentemente. Para este test tomamos una muestra de trece valores (13) y elegimos a favor de H1 si m > 2.74. Entonces la función de poder es :P(µ) = p (m > 2.74) cuando la media poblaciónal es µ = p (Z > 2.74 - µ) * (√13)/6 y podemos utilizarla para tabular P(µ) por µ. El diagrama analizado muestra la función de Poder. Es una función importante porque representa el desempeño de un procedimiento de decisión particular sobre los posibles valores de un parámetro desconocido. Querremos una función de poder alta sobre valores que deseamos rechazar, y baja para valores que deseamos aceptar. Es utilizada en gran medida para evaluar el desempeño de un procedimiento de Control de Calidad; estudiada tambien como función de caracteristicas operativas, simplemente {1 – función de poder}. 11 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena TESTS DE HIPÓTESIS – PRUEBAS DE SIGNIFICANCIA 6.6 Procedimiento de Prueba En este capítulo veremos distintas pruebas básicas, todas basadas en los conceptos elaborados en los capítulos anteriores. Empezamos por ver la prueba desde otro punto de vista – uno que explica el procedimiento adoptado en los ejemplos que siguen. El procedimiento de prueba es similar, de alguna manera, al método conocido en matematicas como “reducción al absurdo”. Una vista simple del método es : Queremos probar que A ≠ B, entonces asumimos que A = B, y bajo este supuesto obtenemos una falsedad indudable del tipo 1 = 2, lo que prueba lo que inicialmente se buscaba. Los tests de hipótesis son similares excepto que no arribamos a un resultado imposible, (como el anterior 1 = 2) sobre el que basamos nuestra conclusión, pero, debido a la presnecia de aleatoriedad, arribamos a un resultado extremadamente similar, un resultadi improbable. Esta comparación es resumida mas abajo, donde las flechas representan pasos logicos y el resultado al final, no obstante posible, 1 chance en 10.000.000, es virtualmente imposible. REDUCTIO AD ABSURDUM A=B 1=2 PRUEBA DE HIPÓTESIS H0 P = 0.0000001 12 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena El procedimiento, en consecuencia, es trabajar como si la hipótesis nula fuese cierta, y después computar la probabilidad de obtener datos tanto o mas extremos que aquellos que han sido observados. Si esta probabilidad (conocida como valor P) es extremadamente baja, entonces consideramos los datos como incompatibles con la hipótesis nula y la rechazamos. Si, sin embargo, esta probabilidad no es extrema, entonces consideramos los datos compatibles con la hipótesis nula y la aceptamos. Notese que nunca podemos probar que sea cierta, solamente decimos que los datos observados son compatibles con ella en el sentido que es bastante probable que se pudiesen producido cuando la hipótesis nula es cierta. El punto limite (“cut off o treshold point”) en considerar una probabilidad extrema o no es de alguna manera subjetivo, y los costos relativos de equivocarse deben ser tenidos en cuenta. Un punto límite ampliamente aceptado es 5% no obstante 1% y 10% son a veces utilizados. Si utilizamos 5% entonces se dice que estamos testeando “a un nivel de significancia del 5%”; esto es equivalente a testear de manera tal que la probabilidad de cometer un error tipo I es 5%. La interpretación del nivel de significancia sera discutido mas adelante. El procedimiento estándar de prueba se encuentra resumido mas abajo; este enfoque es demostrado en la sección 9.2 donde una forma general del estadístico de prueba es derivado cuando los datos se distribuyen normalmente. PROCEDIMIENTO DE PRUEBA I ESTABLECER LAS HIPÓTESIS II COMPUTAR EL ESTADÍSTICO DE PRUEBA III COMPARALO CON LA DISTRIBUCIÓN IV SACAR CONCLUSIONES 13 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 6.7 Pruebas para poblaciones normales. Supongamos que, para una muestra de datos distribuídos normalmente tenemos un estimador u de un parámetro desconocido θ, y u sigue la siguiente distribución muestral: u ~ N{ θ, V} donde, en primera instancia, asumimos V conocida, de manera que tambien conocemos el valor del error estándar de u, SE = √V Paso I Deseamos testear la hipótesis H0: θ = θ0 v H1: θ > θ0 de manera que valores altos de u tienden a soportar H1 mientras que valores bajo trabajan a favor de H0. Notese que, en este caso, la hipótesis alternativa es de un solo lado, y esto posee un efecto en el fromato del test – desarrollamos un test de “una cola”. Paso II Ahora computamos un estadístico de prueba. Este es elegido de manera tal que, condicional en H0 cierta, posee una distribución tabulada estandar; en este caso la normal. Computamos el valor de: (u - θ0)/ SE 14 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena y puede ser fácilmente visto que, si θ0 es la media poblacional, este estadístico tiene una distribución normal estandar. Paso III Ahora comparamos el valor del estadístico de prueba con la distribución normal estandar, para ver donde yace. Si esta bien adentro para el lado derecho (cola derecha) esto implica que los datos son incompatibles con la hipótesis nula, y de hecho la rechazamos. Si el estadístico de prueba cae en el grueso de la distribución normal, entonces decimos que los datos se corresponden con la hipótesis nula, y entonces la aceptamos. Solo valores extremos nos conducen a rechazar la hipótesis nula H0 dado que la hipótesis alternativa representa valores hacia la derecha. En orden de decidir un valor límite para la toma de la decisión, podemos testear a un nivel de significancia del 5%; para hacer esto, tomamos las tablas normales estandarizadas, y buscamos el valor que corta la distribución por el lado derecho a un nivel de 5% de probabilidades (o 95% acumulado), podemos ver que este valor es 1.65. Utilizando este valor limite, rechazamos H0 si el estadístico de prueba es mayor a 1.65, y la aceptamos si es menor. Alternativamente podemos encontrar, de las tablas, la probabilidad de obtener valores mas extremos que el estadístico de prueba que hemos observado; esto es conocido como el valor P para la prueba. Valores bajo de P son evidencia en contra de la hipótesis nula, y valores razonables la soportan. Si utilizamos 5% como limite para el valor P, es lo mismo que encontrarse testeando a un nivel de significancia de 5%. 15 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Paso IV Finalmente debemos sacar conclusiones en el contexto de las variables del problema original. No es suficiente con concluir que el test es significativo a un nivel de 5%. Este es un paso técnico que nos guía para tomar mejores decisiónes acerca del problema real original, y conclusiones finales deben ser elaboradas en estos términos. Un importante aspecto de este test es la forma simple del estadístico Estimador – valor hipotetico Error Estándar Esto se aplica unicamente a estimadores distribuidos normalmente pero cubre una amplia gama de situaciónes tales como: Prueba de media poblacional Comparaciones de medias Prueba de proporciones poblacionales Comparaciones de proporciones Prueba sobre el coeficiente de pendiente de la regresión Prueba sobre el termino constante de la regresión Prueba para coeficiente en series de tiempo Veremos mas adelante alguna situaciones no-normales, donde esta forma de estadístico no se aplica, pero el procedimiento general de prueba se mantiene para todas las pruebas y distribuciones. 16 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 6.8 Niveles de Significancia El nivel es significancia de un test es de hecho la probabilidad de cometer un error tipo I; si llevamos a cabo una prueba a un nivel de 5%, estamos basando nuestra decisión en un procedimiento que nos da un 5% de chance de cometer un error tipo I (cuando la hipótesis nula es cierta). En el desarrollo de la prueba normal general de la sección previa utilizamos un nivel de significancia de 5%. Este es uno de los niveles de significancia mas comunmente utilizados, no obstante 1% y 10% son tambien citados. El valor de citar el nivel de significancia utilizado es que nos da un método aceptable de expresar la confianza del usuario en la decisión que ha tomado. Un test significativo al 1% evidencia una fuerte convicción que la hipótesis nula es falsa, en tanto que un test significativo al 10% expresa ciertas dudas en la hipótesis nula, pero el usuario no se encuentra lo suficientemente confiado para rechazarla. Los niveles de significancia 10%, 5% y 15 proveen de un medio para decidir que valores del estadístico son extremos. Consideremos por ejemplo un test de una cola:H0: µ = 2.24 v H1: µ > 2.24 Calculamos el estadístico y analizamos que tan lejos hacia la derecha de la distribución normal estándar se encuentra . Si se encuentra adentro de la cola, rechazamos la hipótesis nula, si se encuentra a la izquierda, en la distribución, la aceptamos. Pero donde establecer la linea? Como fue mencionado, un criterio aceptable es utilizar el punto de probabilidad de 5%, que para la distribución normal estandar es 1.65, de forma que rechazamos la hipótesis nula si el estadístico es mayor que dicho valor y lo aceptamos en caso contrario. Esto es denominado prueba al nivel de significancia del 5%. 17 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 10% 5% 1% 1.28 1.65 2.33 Si el estadístico de prueba excede 2.33, entonces se dice que el test es significativo a un nivel de 1%, proveyendo de evidencia fuerte en contra de H0; si excede solamente 1.28, se dice que la prueba es significativa al 10%, proveyendo de una evidencia debil para rebatir H0. Claramente, significancia al 1% implica significancia al 5 y al 10%. Cuando un test es significativo, se debe establecer siempre el nivel mas bajo posible de significancia, de manera de proporciónar una medida correcta de la compatibilidad de datos con la hipótesis nula. Si el estadístico de prueba cae entre 1.28 y 1.65, entonces el test es significativo al 10% pero no a un nivel de 5%. Este tipo de resultados surgen de datos incompletos, y seria una buena decisión extender el tamaño de la muestra de manera tal de obtener conclusiónes definitivas. Esta prueba estaria diciendo que la hipótesis nula debe ser tratado con alguna sospecha, pero no tenemos evidencia concluyente para rechazarla. Estos puntos e ideas seran reforzados en los siguientes puntos. 18 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena 6.9 Pruebas de una y dos colas Hasta ahora las pruebas que hemos descripto han sido de una cola (“one tailed”); esto es asi porque la hipótesis alternativa es hacia un lado unicamente. Si la hipótesis alternativa a H0: θ = θ0 fuese H1: θ ≠ θ0 entonces las dos colas de la distribución muestral bajo la hipótesis nula seran utilizadas para rechazar la misma, y el nivel de significancia se dividira en dos en parte iguales. Si, por ejemplo, la distribución muestral nula es la estándar normal y la alternativa es de un lado hacia la derecha, entonces el nivel de significancia total se asigna a la zona derecha y la región de rechazo sera Z > 1.645. Por otra parte, si la hipótesis alternativa fuese hacia los dos lados, entonces el nivel de significancia se compartira entre las dos colas, cada una con un 2.5% y la zona de rechazo estara dada por Z < -1.96 o Z > 1.96. para muchas pruebas, por consiguiente, la forma de la hipótesis alternativa es clave para la elección de una prueba de una o dos colas. Proporcionamos ahora una ennumeración de las pruebas básicas; estas se corresponden con el detalle de situaciones para intervalos de confianza descriptos en el capitulo 7, y la teoria de distribución muestral es de lo mismo; para no caer en repeticiones, por consiguiente, no las consideraremos en detalle. 6.10 Prueba para una media (varianza conocida). 19 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Dado un conjunto de datos independientes x1, x2, ...xn deseamos testear una hipótesis acerca de la media poblaciónal µ. Dado que el error estándar de la media muestral m es σ/√n, el estadístico de prueba a ser calculado es (m - µ0 ) * √n /σ y la prueba consiste en la comparación de este valor con el mismo de la distribución normal estandar. No es usual conocer σ pero si n es muy grande, la formula puede ser utilizada con σ reemplazada por s; esto porque s es un muy buen estimador de σ debido al gran tamaño de la muestra, y no existe razon para preocuparse por su volatilidad. 6.11 Prueba para la media (varianza desconocida) Es igual que 9.5 excepto que utilizamos s en lugar de σ y el estadístico se transforma en (m - µ0 ) * √n /s y la prueba consiste en la comparación de este valor con su similar de la distribución t de Student (en lugar de la estándar normal). 20 Universidad del CEMA Métodos Cuantitativos 6.12 Prof. José P Dapena Prueba de proporciones Sabemos que la varianza de una proporción muestral es npq, donde p es la proporción, n el tamaño de la muestra u q = 1- p. Cuando conducimos la prueba para la proporción, el estadístico de prueba es computado bajo el supuesto que la hipótesis nula es cierta, entonces utilizamos el valo nulo p en la formula para el error estándar. El estadístico de prueba en este caso es, (r/n – p0)/√ √ (p0q0/n) donde p0 es el valor atribuido a p por la hipótesis nula, y la prueba es realizada a traves de la comparación de este estadístico con la(s) cola (s) de la distribución normal standar. 6.13 Prueba para comparación de proporciones El enfoque correcto para la comparación de proporciones es, naturalmente, a través de la diferencia entre las proporciones poblacionales. Para muestras grandes, el estadístico (r1/n1 – r2/n2) ~ N (p1 – p2 , p1q1/n1 + p2q2/n2) bajo la hipótesis nula que las proporciones poblacionales son iguales, con un valor en común pero desconocido p, el error estándar del estimador sera √(pq/(1/n1 + 1/n2)) 21 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena para computar este estadístico de prueba, sin embargo, es necesario estimar p, desde que ningun valor le es atribuido por hipótesis nula. Dado que las proporciones poblacionales son iguales bajo la hipótesis nula, entonces estimamos la proporción en comun por el ratio del numero total de exitos respecto al tamaño total de la muestra, a saber, p’ = (r1+ r2) /(n1 + n2) y el estadístico de prueba es ahora (r1/n1 – r2/n2)/√{p’q’(1/n1 + 1/n2)} 6.14 Comparación de medias poblacionales En esta sección estamos principalmente interesados en la diferencia entre dos medias poblaciónes, Como en el capitulo anterior, existen tres casos a considerar dependiendo del tamaño de la muestra, y de que los datos esten matcheados o no. Caso 1 Datos no matcheados, - muestras grandes o varianzas conocidas Supongamos que tenemos muestras aleatorias de dos poblaciónes con medias desconocidas y varianza conocidas. Para la población 1 media= µ1 Tamaño muestral = n1 SD= σ1 media muestral= m1 22 Universidad del CEMA Métodos Cuantitativos Para la población 2 media= µ2 Prof. José P Dapena SD= σ2 Tamaño muestral = n2 media muestral= m2 y deseamos estimar µ1 - µ2 Estimamos esto a traves de estimado insesgado que surge naturalmente m1 - m2 entonces m1 - m2 ~ N (µ1 - µ2, σ12/n1+ σ22/n2) y el error estándar del estimador puntual es SE = √(σ12/n1+ σ22/n2) entonces (m1 - m2) / √(σ12/n1+ σ22/n2) provee un estadístico de prueba. Si las varianzas poblacionales no son conocidas, pero los tamaños de las muestras son grandes, entonces la fórmula anterior puede ser utilizada reemplazando las varianzas poblacionales por las varianzas muestrales. 23 Universidad del CEMA Métodos Cuantitativos Caso 2 Prof. José P Dapena Datos no matcheados – tamaños muestrales pequeños Este es un caso difícil que debe ser analizado con cuidado. El problema es similar al visto en el caso 1 de manera tal que tenemos la siguiente distribución muestral m1 - m2 ~ N (µ1 - µ2, σ12/n1+ σ22/n2) como antes. Sin embargo, si procedemos a reemplazar las varianzas poblacionales por su correspondiente estimador muestral, entonces encontraremos dificultades porque el estadístico standarizado que obtenemos no sigue una distribución t y en consecuencia la teoria de intervalo de confianza no es de aplicación. Este dificil problema ya fuen tratado anteriormente. En su lugar, si estamos en condiciones de hacer el supuesto que las poblaciones poseen la misma variabilidad, entonces es materia simple el computar el intervalo de confianza. Suponiendo σ1 = σ2 = σ, entonces el error estándar se transforma en σ√(1/n1 + 1/n2), Que procedemos a estimar por s√(1/n1 + 1/n2) en n1 + n2 - 2 grados de libertad., donde s2 es computada a traves de hacer un pool entre la suma corregida de cuadrados de ambas muestras, asi s2 = (SCC1 + SCC1) / (n1 + n2 - 2), o equivalentemente s2 = {(n1 – 1)s12 + (n2 – 1)s22}/ (n1 + n2 - 2) con n1 + n2 - 2 grados de libertad. Esta ultima formula muestra que s2 es una función ponderada de las varianzas muestrales – ponderada por los grado de libertad. 24 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena El estadístico de prueba es entonces (m1 - m2) / √{((n1 – 1)s12 + (n2 – 1)s22/ (n1 + n2 - 2))/(1/n1+ 1/n2)} Caso 3 Datos matcheados – muestras pequeñas Este es el caso mas facil de analizar, debido a que se reduce unicamente al analisis de diferencias. Si, en cada par de datos, tomamos la diferencia de los mismos, tendremos d1 = x1 – y1, d2 = x2 – y2, ........dn = xn – yn, entonces µd = µx - µy, entonces utilizando los d’s podemos testear µd = 0, usando un estadístico t, como en la sección 9.6. 6.15 Prueba para las varianzas La teoría de distribuciones subyacentes en estas pruebas ya fué descripta, y el método de prueba hace un paralelo con el correspondiente para la determinación de intervalos de confianza, pero con el procedimiento usual de decisión de comparar el estadístico de prueba con la(s) cola(s) de la distribución muestral bajo la hipótesis nula. 25 Universidad del CEMA Métodos Cuantitativos Prof. José P Dapena Prueba para la varianza En orden de testear una hipótesis nula como H0: σ2 = σ02 utilizamos el estadístico de prueba (n – 1) s2 /σ02 y comparamos su valor con aquel correspondiente a la(s) cola(s) en la distribución chi cuadrada con n – 1 grados de libertad Prueba para la comparación de varianzas En orden de testear la hipótesis nula H0: σ12 = σ22 utilizamos el estadístico F = {s12 / s22} y comparamos dicho valor con el correspondiente a la(s) cola(s) de la distribución F con {n1 -1, n2 – 2} grados de libertad. 26