ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS INTRODUCCIÓN A menudo el científico o el administrador debe formular un procedimiento de decisión basado en los datos que conduzcan a una conclusión sobre algún planteamiento científico. El responsable del estudio postula algo acerca de un sistema. La función de la estadística en su aspecto inferencial es la de apoyar el razonamiento para llegar a decisiones sólidas. Hay que tomar decisiones a partir de datos experimentales. Hay que tomar decisiones porque hay alternativas, cada alternativa se llama hipótesis estadística. El proceso por el que confrontamos las hipótesis al tomar como punto de apoyo los datos muestrales constituye lo que denominamos prueba de hipótesis. DEFINICIONES Hipóteis estadística es una proposición acerca del valor de un parámetro, relación entre parámetros, la forma de la distribución, etc., la cuál se desea analizar con base en la evidencia de la muestra o del experimento para tomar una decisión sobre su validez. Hipótesis nula, H0, es aquella que esperamos rechazar. Hipótesis alterna, Ha, es aquella que esperamos aprobar. Estadística de prueba nos proporcionará un número obtenido a partir de los datos muestrales y que nos indicará si la hipótesis nula debe ser rechazada o aceptada. Regla de decisión define las condiciones que conducen a la aceptación o rechazo de H0. Región de aceptación conjunto de valores, determinado bajo ciertas reglas, tal que si el valor de la estadística de prueba cae dentro , la hipótesis H0 se declara no contraria al valor de la estadística (esto no significa que sea verdadera, sino que no la podemos rechazar). Región de rechazo conjunto de valores, determinado bajo ciertas reglas, tal que si el valor de la estadística de prueba cae dentro, la hipótesis H0 se declara contraria a la evidencia de la muestra y por tanto debe ser rechazada. Valor crítico es el número que separa la región de aceptación de la región de rechazo. Si la región de rechazo se encuentra en un solo extremo de la curva de distribución de la estadística de prueba, la prueba se dice de una cola (unilateral). Cuando la región de rechazo se encuentra en ambos extremos se dice de dos colas (bilateral). Al tomar decisiones basadas en la evidencia de la muestra nos exponemos a equivocarnos, dándose dos tipos de errores posibles: Error tipo I, EI, error que se comete al rechazar H0 siendo verdadera. Error tipo II, EII, error que se comete cuando aceptamos H0 siendo falsa. El error tipo I se considera de mayor gravedad en su ocurrencia. Estado de la naturaleza Decisión Rechazar Aceptar V F EI Correcto Correcto EII 1 ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS Dada la gravedad de cometer el error tipo I y ante la imposibilidad de descartarlo, la única alternativa es asignarle una probabilidad, obviamente pequeña, de que éste ocurra. Esta probabilidad es lo que llamaremos nivel de significancia. Nivel de significancia, , es la probabilidad de rechazar H0 siendo verdadera. Corresponde al área de rechazo, se igualará al total del área derecha, o izquierda, si se trata de pruebas de una cola o se repartirá en partes iguales entre las dos colas si se trata de una prueba bilateral. Si el valor de la estadística de prueba cae en la región de rechazo la prueba se dice significativa. La probabilidad de cometer el error tipo II se denota con la letra . 1- es la probabilidad de aceptar H0 cuando es verdadera. 1- es la probabilidad de rechazar H0 cuando es falsa. Esta probabilidad desempeña un papel de gran importancia para evaluar el procedimiento que se sigue para tomar la decisión y se denomina potencia de la prueba. En la prueba de hipótesis se presentará una y sólo una de las siguientes situaciones: Estado de naturaleza H0 es cierta H0 es falsa Decisión Aceptar H0 Correcto (1- ) Error tipo II ( ) Descartar H0 Error tipo I ( ) Correcto (1- ) PASOS EN UNA PRUEBA DE HIPÓTESIS Primer paso: Formular la hipótesis. Segundo paso: Establecer el tamaño de la muestra y el nivel de significancia. Tercer paso: Determinar una estadística de prueba. Cuarto paso: Formular una regla de decisión. Quinto paso: Recolectar los datos mediante algún procedimiento de muestreo y calcular el correspondiente valor de la estadística de prueba. Sexto paso: Aplicar la regla de decisión. Si el valor de la estadística de prueba cae en la región de rechazo, entonces rechazamos H0 ; si cae en la región de aceptación, no hay evidencia para rechazarla. PRUEBAS DE HIPÓTESIS RESPECTO DE LAS MEDIAS EN POBLACIONES NORMALES. 2 ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS Se trata de un procedimiento estadístico que nos permite decidir si los datos muestrales son consistentes o no con algún valor que hemos fijado para la media de una población normalmente distribuida. 1. Pruebas para una muestra. a) Varianza poblacional conocida. Estadístico de prueba: z x que sigue la normal estándar n b) Varianza poblacional desconocida y muestra pequeña. Estadístico de prueba: t x que sigue una t de student con n-1 grados de s n libertad. c) Varianza poblacional desconocida y muestra grande. Basándonos en el teorema central de límite, el estadístico de prueba sería x z que seguiría la normal estándar. s n 2. Pruebas para dos muestras independientes. Las hipótesis a probar son: a) H0: 1 2 vs. Ha: 1 2 que es equivalente a H0: 1 2 0 vs.Ha: 1 2 0 . Prueba de cola derecha. b) H0: 1 2 vs. Ha: 1 2 que es equivalente a H0: 1 2 0 vs. Ha: 1 2 0 . Prueba de cola izquierda. c) H0: 1 2 vs. Ha: 1 2 que es equivalente a H0: 1 2 0 vs. Ha: 1 2 0 . Prueba de dos colas. Se tienen en cuenta dos casos: 1. Las varianzas de las poblaciones son conocidas, o desconocidas y n>30. Estadístico de prueba Z= X 1 X 2 ( 1 2 ) 12 2 2 que sigue la normal estándar. n1 n2 2. Las varianzas son desconocidas pero se suponen iguales y n<30. 3 ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS Estadístico de prueba T= X 1 X 2 1 2 Sp 1 n1 1 que sigue una t de student con n2 (n1+n2-2) grados de libertad 3. Pruebas sobre las medias cuando las observaciones son pareadas. Requiere que las unidades que formen pareja tengan las mismas características. El procedimiento estadístico para analizar el comportamiento de la variable de interés se basa en la diferencia de las mediciones de las unidades que forman la pareja. n xd d que tiene una distribución t con n-1 grados de Sd libertad. xd = diferencia promedio de los datos muestrales. Sd=desviación estándar de dichas diferencias. Estadística de prueba: T= PRUEBAS DE HIPÓTESIS POBLACIONES NORMALES. RESPECTO DE LAS VARIANZAS EN 1. Una sola varianza Estadística de prueba X= n 1S 2 2 que sigue una distribución ji cuadrado con n-1 grados de libertad. 2. Comparar dos varianzas S 12 Se utiliza la estadística F= 2 que sigue una distribución F con (n1-1,n2-1) grados de S2 libertad. Se debe colocar siempre en el numerador la varianza muestral asociada a la varianza poblacional mayor. PRUEBAS PARA PROPORCIONES. Utilizaremos muestras grandes para utilizar una aproximación normal. 1. Una sola proporción. Estadística de prueba Z= p n que sigue una normal estándar. 1 2. Comparación de proporciones. 4 ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS Estadística de prueba Z= p 1 p 2 1 2 p(1 p) / n1 p(1 p) / n2 que sigue una normal estándar, m1 m2 , m1= número de elementos del total n1 que poseen la característica, n1 n2 m2= número de elementos del total n2 que poseen la característica. donde p LA FUNCIÓN DE POTENCIA DE LA PRUEBA. Potencia de una prueba capacidad que tiene una prueba de detectar la hipótesis alterna cuando realmente es verdadera. La probabilidad de rechazar la hipótesis nula cuando es falsa es 1- que es lo mismo que aceptar la hipótesis alterna cuando es verdadera. En esta expresión es la probabilidad de cometer el error tipo II (rechazar la alterna cuando es verdadera). Para un nivel de significancia dado, , una prueba se considera más potente que otra cuando 1- es mayor. El valor 1- = P[ Aceptar Ha/Ha sea verdadera] sólo se puede calcular cuando se conoce la distribución muestral de la estadística de prueba, lo que implicaría que se debería conocer el valor del parámetro contenido en Ha. Para conocerlo es necesaria la función de potencia, que es una función que nos ofrece la probabilidad de rechazar H0 para cada valor dado del parámetro en consideración. Si la prueba en cuestión es de la siguiente forma: H0: 0 vs. Ha: V y ˆ es la estadística de prueba. Se rechaza H0 si el valor observado para ˆ se aparta suficientemente de 0 .El conjunto de valores de ˆ que conducen al rechazo de H0 se llama región de rechazo o región crítica. PF( ) = P ˆ CR / es la función potencia de la prueba. Su complemento se denomina función característica de operación, OC( ) = 1-PF( ) FACTORES QUE AFECTAN LA POTENCIA DE LA PRUEBA. Nivel de significancia. Magnitud del error estándar que depende de la desviación estándar de la población y del tamaño n de la muestra. Como varia al contrario que , 1- varia proporcionalmente a . Cuando se haga menor, la potencia de la prueba aumentará si se mantienen los demás factores. Una prueba de una cola es más potente que una prueba de dos colas. Cuanto mayor sea n, menor será el error estándar y por lo tanto la distribución estadística muestral estará más concentrada en trono a la media y los valores críticos serán más cercanos a ésta. Por lo tanto la potencia de la prueba será más grande. 5 ESTADÍSTICA EMPRESARIAL TEMA 13-II: TEST DE HIPÓTESIS Si se reduce la desviación estándar se disminuye el error estándar de la distribución muestral aumentando así la potencia de la prueba. 6