PRUEBAS DE HIPÓTESIS Clases de hipótesis.

Anuncio
PRUEBAS DE HIPÓTESIS
Clases de hipótesis.
Una hipótesis estadística es un enunciado provisional referente a uno o más
parámetros de una población o grupo de poblaciones. En el proceso de
estadística inferencial hay dos tipos de hipótesis:
1. Hipótesis nula, designada mediante Ho y se lee .H subcero.. La letra H significa
hipótesis y el subíndice cero indica .no hay diferencia.. Por lo general en la
hipótesis nula se plantea en términos de .no hay cambio., no hay diferencia., se
plantea con el objetivo de aceptarla o rechazarla.
2. Hipótesis alternativa, describe lo que se considerará si se rechaza la
hipótesis nula. A menudo también se le denomina hipótesis de investigación, y se
designa por H1, que se lee .h subuno.
Tipos de error.
La hipótesis nula y alternativa son entonces aseveraciones sobre la población
que compiten entre sí, en el siguiente sentido: ó la hipótesis nula (Ho) es
verdadera, o lo es la hipótesis alternativa (H1), pero no ambas. En el caso ideal, el
procedimiento de prueba de hipótesis debe conducir a la aceptación de Ho cuando sea
verdadera y al rechazo de H1. Desafortunadamente no siempre es posible puesto que
como las pruebas de hipótesis se basan en la información de la muestra, se debe
considerar la posibilidad de cometer errores. La siguiente cuadro muestra los dos tipos
de errores que se pueden cometer:
Probabilidad de cometer el error tipo I
Probabilidad de rechazar Ho cuando es verdadera.
(1 - ) Probabilidad de acertar la Ho cuando es verdadera.
Probabilidad de cometer el error tipo II
Probabilidad de aceptar Ho cuando es falsa.
(1 - ) Probabilidad de rechazar Ho cuando es falsa.
Toda prueba de hipótesis determina una región de rechazo de la hipótesis llamada
región crítica, la cual depende del tipo de hipótesis que se pruebe y se
determina utilizando un nivel de significancia .
El p-valor
Es el mínimo nivel de significancia en el cual Ho sería rechazado cuando se
utiliza como procedimiento de prueba específico con un conjunto dado de
información. Si el p-valor es menor que el nivel de significancia, la hipótesis nula se
rechaza.
Pruebas para Grandes Muestras.
Este procedimiento de formulas dos hipótesis es muy similar al de un juicio en donde
se supone que el acusado es inocente hasta que se le demuestre su culpabilidad. Por
tanto se hace una hipótesis de culpabilidad cero, lo cual también ayuda a explicar
el nombre de la hipótesis.
Prueba para la media (muestra grande).
En las pruebas para la media de población de muestra grande se distingue dos
situaciones:
Conocida la desviación estándar de la población.
Desconocida la desviación estándar de la población.
CONOCIDA LA DESVIACIÓN ESTANDAR POBLACIONAL.
Las pruebas de hipótesis utilizan un procedimiento de cinco pasos, los cuales se
recuerdan a continuación:
a. Plantear las hipótesis nula y alternativa.
b. Determinar el nivel de significancia.
c. Estimar el valor estadístico de prueba.
d. Establecer la regla de decisión.
e. Tomar la decisión.
Dependiendo del planteamiento de la hipótesis alternativa (H1) se distingue dos tipos
de pruebas:
Pruebas bilaterales.
Pruebas unilaterales
PRUEBA BILATERAL
El procedimiento de prueba de hipótesis para pruebas bilaterales a cerca de la
media de una población, cuando se considera el caso de muestra grande ( (n 30) ,
en que el teorema del límite central permite suponer que la media de la
distribución muestral de medias se puede aproximar a una distribución normal de
probabilidad, y la desviación estándar de la población
es conocida, sigue la siguiente forma general:
Muestra grande (n 30)
Planteamiento de hipótesis:
Estadístico de prueba para desviación estándar poblacional conocida:
Regla de rechazo a un nivel de significancia :
Ejemplo
La empresa coca cola ha establecido como política general para su producción en
pequeña escala, un promedio () de llenado para sus envases de 200 centímetros
cúbicos con una desviación estándar () de 16 centímetros cúbicos. Dado que
recientemente se han contratado y diseñado nuevos métodos de producción,
utilizando un nivel de significancia del 0.01, se desea probar la hipótesis, que el
promedio de llenado sigue siendo de 200 centímetros cúbicos.
Para tal efecto se tomó una muestra de 100 envases llenos, los cuales mostraron
una media de llenado de 203.5 centímetros cúbicos.
Solución:
Paso 1
Planteamiento de la hipótesis nula: la media poblacional es 200
Planteamiento de la hipótesis alternativa: La media poblacional es diferente a
200. Estas hipótesis se expresan como sigue:
Esta es una prueba de dos colas, debido a que la hipótesis alternativa ( 0 H ) es
planteada en palabras de diferencia, es decir, la hipótesis no indica si la media es
mayor o menor que 200.
Paso 2
El nivel de significancia es de 0.01 que es el alfa (), la probabilidad de cometer el
error de tipo uno, es decir la probabilidad de rechazar la hipótesis siendo verdadera.
Para éste tipo de problema se utiliza la distribución normal estandarizada en Z.
Paso 3
El valor estadístico de prueba para este tipo de problema es utilizando la
distribución normal estandarizada en Z:
Paso 4
La formulación de la regla de decisión consiste en hallar el valor crítico de Z con
una prueba de dos colas. En el anexo C (tabla de la distribución normal) se identifica
el valor de Z correspondiente a una probabilidad igual a 0.4950 (0.5 . 0.01/2). El valor
más cercano a 0.4950 es 0.4951 que corresponde a una valor de Z igual a 2.58, que es
el valor crítico para la prueba de hipótesis. Dado que es una prueba de dos colas,
se tendrán dos valores críticos, tal como se indica en la siguiente figura:
La regla de decisión es aceptar la hipótesis nula (Ho), puesto que el valor
estadístico de prueba (2.19) ha caído en la zona de aceptación de dicha
hipótesis.
Paso 5
Se concluye que el llenado de los envases cumple con las políticas generales de la
empresa, y la diferencia de promedios se atribuye a variaciones aleatorias.
Prueba para media (pequeña muestra)
Si también es razonable suponer que la población tiene una distribución normal
de probabilidad, con la distribución t se puede hacer inferencia a cerca del valor
de la media de la población.
Ejemplo
Una compañía de seguros revela que en promedio la investigación por
demandas en accidentes y todos los trámites tiene un costo promedio de 60
unidades monetarias. Este costo se considera exagerado comparado con el de otras
compañías del mismo tipo. A fin de evaluar el costo se seleccionó una muestra
aleatoria de 26 demandas recientes y se realizó el estudio de costos. Se concluyó
que el costo promedio es de 57 unidades monetaria con una desviación
estándar de 10 unidades monetarias. Con un nivel de significancia del 0.01 se
puede decir que ¿el estudio reveló un costo menor al establecido por la empresa?
Solución:
Paso 1: La hipótesis nula se plantea en el sentido que el costo promedio es de
60 unidades monetarias.
La hipótesis alternativa que el costo es menor a 60 unidades monetarias. Esto
se expresa en la siguiente forma:
La prueba es de una cola a la izquierda, según el planteamiento de la hipótesis
alternativa.
Paso 2: Se usa un nivel de significancia del 0.01 con una distribución .t., en
consideración a que la muestra en menor a 30, es decir, es una pequeña muestra.
Paso 3: Utilizando los datos de la muestra, se utiliza la siguiente fórmula como
estadístico de prueba:
Paso 4: Los valores críticos para la distribución .t. se encuentran en la tabla
correspondiente (anexo D), con 25 grados de libertad (26 . 1), prueba de una cola a
un nivel de significancia de 0.01, correspondiendo un valor crítico de 2.485. En el
siguiente figura se indica el presente planteamiento:
Paso 5: Puesto que .1.53 se encuentra en la región de aceptación de la hipótesis
nula a un nivel del 1% de significancia, se concluye que los costos para los tramites de
seguros de accidente no se han disminuido y se mantiene a un nivel promedio de costo
de 60 unidades monetarias.
Descargar