Elisabeth Álvarez Zapata 1. ¿QUÉ ES UNA PRUEBA DE HIPOTESIS? Una prueba de hipótesis estadística es una conjetura de una o más poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se examine la población entera. Esto por su puesto sería impráctico en la mayoría de las situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis conduce a su aceptación. Definición de prueba de hipótesis estadística es que cuantifica el proceso de toma de decisiones. Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada. Esta prueba estadística mide el acercamiento del calor de la muestra (como un promedio) a la hipótesis nula. La prueba estadística, sigue una distribución estadística bien conocida (normal, etc.) o se puede desarrollar una distribución para la prueba estadística particular. La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente. Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo. Pasos de la prueba de hipótesis 1. 2. 3. 4. 5. 6. 7. 8. 9. Expresar la hipótesis nula expresar la hipótesis alternativa especificar el nivel de significancia determinar el tamaño de la muestra establecer los valores críticos que establecen las regiones de rechazo de las de no rechazo. determinar la prueba estadística. coleccionar los datos y calcular el valor de la muestra de la prueba estadística apropiada. determinar si la prueba estadística ha sido en la zona de rechazo a una de no rechazo. determinar la decisión estadística. Muestreo Elisabeth Álvarez Zapata 10. expresar la decisión estadística en términos del problema. 2. ¿QUÉ ES UNA HIPOTESIS? Es una proposición que establece relaciones, entre los hechos; para otros es una posible solución al problema; otros más sustentan que la hipótesis no es mas otra cosa que una relación entre las variables, y por último, hay quienes afirman que es un método de comprobación. La hipótesis como proposición que establece relación entre los hechos: una hipótesis es el establecimiento de un vínculo entre los hechos que el investigador va aclarando en la medida en que pueda generar explicaciones lógicas del porqué se produce este vínculo. La hipótesis como una posible solución del problema: la hipótesis no es solamente la explicación o comprensión del vínculo que se establece entre los elementos inmersos en un problema, es también el planteamiento de una posible solución al mismo. 3. ¿QUÉ ES LA HIPOTESIS NULA? Hipótesis nula (Ho). Es aquella que nos dice que no existen diferencias significativas entre los grupos. Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hipótesis toma al azar una muestra de jóvenes, y también al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibirá entrenamiento, y otro que no recibirá entrenamiento alguno, al que llamaremos control. La hipótesis nula señalará que no hay diferencia en el desempeño de la natación entre el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió. Una hipótesis nula es importante por varias razones: Es una hipótesis que se acepta o se rechaza según el resultado de la investigación. El hecho de contar con una hipótesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debió al azar. No toda investigación precisa de formular hipótesis nula. Recordemos que la hipótesis nula es aquella por la cual indicamos que la información a obtener es contraria a la hipótesis de trabajo. Al formular esta hipótesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema fluctúa, por tanto, debe rechazarse como tal. Muestreo Elisabeth Álvarez Zapata 4. ¿QUÉ ES EL NIVEL DE SIGNIFICANCIA? Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por , se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra elección. En la práctica es frecuente un nivel de significancia de 0.05 ó 0.01, si bien se usan otros valores. Si, por ejemplo, se escoge un nivel de significancia del 5% ó 0.05 al diseñar una regla de decisión entonces hay unas cinco oportunidades entre cien de rechazar la hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis a sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hipótesis tiene una probabilidad del 5% de ser falsa. 5. ¿QUÉ ES EL P-VALOR O P-VALUE? En pruebas de significación estadística, el valor de p es la probabilidad de obtener una prueba estadística de por lo menos tan extrema como el que realmente se observó, suponiendo que la hipótesis nula es cierta. Un concepto estrechamente relacionado es el valor de E, que es el número promedio de veces en múltiples pruebas que uno espera obtener una estadística de la prueba al menos tan extrema como el que realmente se observó, suponiendo que la hipótesis nula es cierta. Cuando las pruebas son estadísticamente independientes el E-valor es el producto del número de pruebas y el valor de p. La baja el valor p, el menos probable es que el resultado es si la hipótesis nula es cierta, y, en consecuencia, el más "sensible" el resultado es, en el sentido de significación estadística. Uno a menudo acepta la hipótesis alternativa, (es decir, rechaza una hipótesis nula) si el valor p es menos de 0,05 o 0,01, correspondientes, Muestreo Elisabeth Álvarez Zapata respectivamente, a una probabilidad de 1% o 5% de rechazar la hipótesis nula cuando es cierto (error de tipo I). Si pv ≤ α, aceptar H1 Si pv > α, aceptar H0 6. ¿CÓMO SE USA EL P-VALOR O P-VALUE? Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se puede elegir de forma arbitraria y determinar su tamaño. Si es demasiado grande, se puede reducir al hacer un ajuste en el valor crítico. Puede ser necesario aumentar el tamaño de la muestra para compensar la disminución que ocurre de manera automática en la potencia de la prueba (probabilidad de rechazar Ho dado que una alternativa específica es verdadera). Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa región crítica. En la estadística aplicada los usuarios han adoptado de forma extensa la aproximación del valor P. La aproximación se diseña para dar al usuario una alternativa a la simple conclusión de "rechazo" o "no rechazo". La aproximación del valor P como ayuda en la toma de decisiones es bastante natural pues casi todos los paquetes de computadora que proporcionan el cálculo de prueba de hipótesis entregan valores de P junto con valores de la estadística de la prueba apropiada. Un valor P es el nivel (de significancia) más bajo en el que el valor observado de la estadística de prueba es significativo. El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula Ho. El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto dado de información. Una vez que el valor de P se haya determinado, la Muestreo Elisabeth Álvarez Zapata conclusión en cualquier nivel : 1. Valor P 2. Valor P > particular resulta de comparar el valor P con Þ rechazar Ho al nivel . Þ No rechazar Ho al nivel 7. ¿CUALES SON LOS TIPOS DE ERROR? En un estudio de investigación, el error de tipo I también mal llamado error de tipo alfa (α) (α es la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe. Es también conocido como nivel de significancia, si el nivel de confianza es 95% el nivel de significancia vendría a ser 5% En un estudio de investigación, el error de tipo II, también llamado error de tipo beta (β) (aunque β es la probabilidad de que exista éste error), se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad. Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%... El poder o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o efecto, si existe en la población. Es el complementario del error de tipo II (1-β). 8. ¿QUÉ ES LA POTENCIA DE UNA PRUEBA ESTADISTICA? Muestreo Elisabeth Álvarez Zapata De la probabilidad de cometer un error del tipo II se conoce como potencia de una prueba estadística. La potencia de una prueba es la probabilidad de rechazar la hipótesis nula cuando de hecho esta es falsa y debería ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra, nos permitirán detectar diferencias incluso muy pequeñas entre las ,estadísticas de muestra y los parámetros de la población. Cuando se disminuye aumentará de modo que una reducción en el riesgo de cometer un error de tipo I tendrá como resultado un aumento en el riesgo de cometer un error tipo II. Prueba de hipótesis Z para la media (desvío de la población conocido) El estadístico de prueba a utilizar es: La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β representa la sensibilidad de la prueba estadística para detectar cambios que se presentan al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es la media verdadera de la población del valor supuesto. Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar siempre que sea adecuado especificar la dirección de la hipótesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba (1-β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el valor del nivel de significación escogido, tendría como resultado un aumento en la potencia y una disminución en α tendría como resultado una disminución en la potencia. Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría como resultado una disminución en la potencia. Muestreo