prueba de hipótesis

Anuncio
Elisabeth Álvarez Zapata
1. ¿QUÉ ES UNA PRUEBA DE HIPOTESIS?
Una prueba de hipótesis estadística es una conjetura de una o más poblaciones.
Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a
no ser que se examine la población entera. Esto por su puesto sería impráctico en la
mayoría de las situaciones. En su lugar, se toma una muestra aleatoria de la población
de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hipótesis. La evidencia de la muestra que es un constante con la
hipótesis planteada conduce a un rechazo de la misma mientras que la evidencia que
apoya la hipótesis conduce a su aceptación.
Definición de prueba de hipótesis estadística es que cuantifica el proceso de toma de
decisiones.
Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística
apropiada. Esta prueba estadística mide el acercamiento del calor de la muestra (como
un promedio) a la hipótesis nula. La prueba estadística, sigue una distribución
estadística bien conocida (normal, etc.) o se puede desarrollar una distribución para la
prueba estadística particular.
La distribución apropiada de la prueba estadística se divide en dos regiones: una región
de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no
se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso
funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico
en la distribución estadística que divide la región del rechazo (en la cual la hipótesis
nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico
depende del tamaño de la región de rechazo.
Pasos de la prueba de hipótesis
1.
2.
3.
4.
5.
6.
7.
8.
9.
Expresar la hipótesis nula
expresar la hipótesis alternativa
especificar el nivel de significancia
determinar el tamaño de la muestra
establecer los valores críticos que establecen las regiones de rechazo de las de
no rechazo.
determinar la prueba estadística.
coleccionar los datos y calcular el valor de la muestra de la prueba estadística
apropiada.
determinar si la prueba estadística ha sido en la zona de rechazo a una de no
rechazo.
determinar la decisión estadística.
Muestreo
Elisabeth Álvarez Zapata
10. expresar la decisión estadística en términos del problema.
2. ¿QUÉ ES UNA HIPOTESIS?
Es una proposición que establece relaciones, entre los hechos; para otros es una
posible solución al problema; otros más sustentan que la hipótesis no es mas otra cosa
que una relación entre las variables, y por último, hay quienes afirman que es un
método de comprobación.
La hipótesis como proposición que establece relación entre los hechos: una hipótesis
es el establecimiento de un vínculo entre los hechos que el investigador va aclarando
en la medida en que pueda generar explicaciones lógicas del porqué se produce este
vínculo.
La hipótesis como una posible solución del problema: la hipótesis no es solamente la
explicación o comprensión del vínculo que se establece entre los elementos inmersos
en un problema, es también el planteamiento de una posible solución al mismo.
3. ¿QUÉ ES LA HIPOTESIS NULA?
Hipótesis nula (Ho). Es aquella que nos dice que no existen diferencias significativas
entre los grupos.
Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se
somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores que
aquellos que no recibieron entrenamiento. Para demostrar su hipótesis toma al azar
una muestra de jóvenes, y también al azar los distribuye en dos grupos: uno que
llamaremos experimental, el cual recibirá entrenamiento, y otro que no recibirá
entrenamiento alguno, al que llamaremos control.
La hipótesis nula señalará que no hay diferencia en el desempeño de la natación entre
el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió. Una hipótesis
nula es importante por varias razones: Es una hipótesis que se acepta o se rechaza
según el resultado de la investigación. El hecho de contar con una hipótesis nula ayuda
a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa,
y si no se debió al azar.
No toda investigación precisa de formular hipótesis nula. Recordemos que la hipótesis
nula es aquella por la cual indicamos que la información a obtener es contraria a la
hipótesis de trabajo. Al formular esta hipótesis, se pretende negar la variable
independiente. Es decir, se enuncia que la causa determinada como origen del
problema fluctúa, por tanto, debe rechazarse como tal.
Muestreo
Elisabeth Álvarez Zapata
4. ¿QUÉ ES EL NIVEL DE SIGNIFICANCIA?
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos
dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de
significancia. Esta probabilidad se denota por
, se suele especificar antes de la
muestra, de manera que los resultados no influyan en nuestra elección.
En la práctica es frecuente un nivel de significancia de 0.05 ó 0.01, si bien se usan otros
valores. Si, por ejemplo, se escoge un nivel de significancia del 5% ó 0.05 al diseñar una
regla de decisión entonces hay unas cinco oportunidades entre cien de rechazar la
hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de
que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis a sido
rechazada al nivel de significancia 0.05 lo cual quiere decir que la hipótesis tiene una
probabilidad del 5% de ser falsa.
5. ¿QUÉ ES EL P-VALOR O P-VALUE?
En pruebas de significación estadística, el valor de p es la probabilidad de obtener una
prueba estadística de por lo menos tan extrema como el que realmente se observó,
suponiendo que la hipótesis nula es cierta. Un concepto estrechamente relacionado es
el valor de E, que es el número promedio de veces en múltiples pruebas que uno
espera obtener una estadística de la prueba al menos tan extrema como el que
realmente se observó, suponiendo que la hipótesis nula es cierta. Cuando las pruebas
son estadísticamente independientes el E-valor es el producto del número de pruebas
y el valor de p.
La baja el valor p, el menos probable es que el resultado es si la hipótesis nula es
cierta, y, en consecuencia, el más "sensible" el resultado es, en el sentido de
significación estadística. Uno a menudo acepta la hipótesis alternativa, (es decir,
rechaza una hipótesis nula) si el valor p es menos de 0,05 o 0,01, correspondientes,
Muestreo
Elisabeth Álvarez Zapata
respectivamente, a una probabilidad de 1% o 5% de rechazar la hipótesis nula cuando
es cierto (error de tipo I).
Si pv ≤ α, aceptar H1
Si pv > α, aceptar H0
6. ¿CÓMO SE USA EL P-VALOR O P-VALUE?
Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se
puede elegir de forma arbitraria y determinar su tamaño. Si
es demasiado grande,
se puede reducir al hacer un ajuste en el valor crítico. Puede ser necesario aumentar el
tamaño de la muestra para compensar la disminución que ocurre de manera
automática en la potencia de la prueba (probabilidad de rechazar Ho dado que una
alternativa específica es verdadera).
Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un nivel
de significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia.
Entonces, por supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa
región crítica. En la estadística aplicada los usuarios han adoptado de forma extensa la
aproximación del valor P. La aproximación se diseña para dar al usuario una
alternativa a la simple conclusión de "rechazo" o "no rechazo".
La aproximación del valor P como ayuda en la toma de decisiones es bastante natural
pues casi todos los paquetes de computadora que proporcionan el cálculo de prueba
de hipótesis entregan valores de P junto con valores de la estadística de la prueba
apropiada.



Un valor P es el nivel (de significancia) más bajo en el que el valor observado de
la estadística de prueba es significativo.
El valor P es el nivel de significancia más pequeño que conduce al rechazo de la
hipótesis nula Ho.
El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada
cuando se utiliza un procedimiento de prueba especificado con un conjunto
dado de información. Una vez que el valor de P se haya determinado, la
Muestreo
Elisabeth Álvarez Zapata
conclusión en cualquier nivel
:
1. Valor P
2. Valor P >
particular resulta de comparar el valor P con
Þ rechazar Ho al nivel .
Þ No rechazar Ho al nivel
7. ¿CUALES SON LOS TIPOS DE ERROR?
En un estudio de investigación, el error de tipo I también mal llamado error de tipo
alfa (α) (α es la probabilidad de que ocurra este error), es el error que se comete
cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la
población. Es equivalente a encontrar un resultado falso positivo, porque el
investigador llega a la conclusión de que existe una diferencia entre las hipótesis
cuando en realidad no existe. Es también conocido como nivel de significancia, si el
nivel de confianza es 95% el nivel de significancia vendría a ser 5%
En un estudio de investigación, el error de tipo II, también llamado error de tipo beta
(β) (aunque β es la probabilidad de que exista éste error), se comete cuando el
investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es
equivalente a la probabilidad de un resultado falso negativo, ya que el investigador
llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en
la realidad.
Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%...
El poder o potencia del estudio representa la probabilidad de observar en la muestra
una determinada diferencia o efecto, si existe en la población. Es el complementario
del error de tipo II (1-β).
8. ¿QUÉ ES LA POTENCIA DE UNA PRUEBA ESTADISTICA?
Muestreo
Elisabeth Álvarez Zapata
De la probabilidad de cometer un error del tipo II se conoce como potencia de una
prueba estadística. La potencia de una prueba es la probabilidad de rechazar la
hipótesis nula cuando de hecho esta es falsa y debería ser rechazada. Una manera en
que podemos controlar la probabilidad de cometer un error del tipo II en un estudio,
consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra, nos
permitirán detectar diferencias incluso muy pequeñas entre las ,estadísticas de
muestra y los parámetros de la población. Cuando se disminuye aumentará de modo
que una reducción en el riesgo de cometer un error de tipo I tendrá como resultado
un aumento en el riesgo de cometer un error tipo II. Prueba de hipótesis Z para la
media (desvío de la población conocido) El estadístico de prueba a utilizar es:
La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea
rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β
representa la sensibilidad de la prueba estadística para detectar cambios que se
presentan al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es
falsa y debería ser rechazada. La potencia de prueba estadística depende de qué tan
diferente en realidad es la media verdadera de la población del valor supuesto. Una
prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar
siempre que sea adecuado especificar la dirección de la hipótesis alternativa. Puesto
que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error
tipo II tienen una relación inversa y esta última es el complemento de la potencia de
prueba (1-β), entonces α y la potencia de la prueba varían en proporción directa. Un
aumento en el valor del nivel de significación escogido, tendría como resultado un
aumento en la potencia y una disminución en α tendría como resultado una
disminución en la potencia. Un aumento en el tamaño de la muestra escogida tendría
como resultado un aumento en la potencia de la prueba, una disminución en el
tamaño de la muestra seleccionada tendría como resultado una disminución en la
potencia.
Muestreo
Descargar