¿Por qué estudiar estadística

Anuncio
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
INTRODUCCIÓN
A menudo el científico o el administrador debe formular un procedimiento de decisión
basado en los datos que conduzcan a una conclusión sobre algún planteamiento
científico.
El responsable del estudio postula algo acerca de un sistema. La función de la
estadística en su aspecto inferencial es la de apoyar el razonamiento para llegar a
decisiones sólidas.
Hay que tomar decisiones a partir de datos experimentales. Hay que tomar decisiones
porque hay alternativas, cada alternativa se llama hipótesis estadística. El proceso por
el que confrontamos las hipótesis al tomar como punto de apoyo los datos muestrales
constituye lo que denominamos prueba de hipótesis.
DEFINICIONES
Hipóteis estadística es una proposición acerca del valor de un parámetro, relación entre
parámetros, la forma de la distribución, etc., la cuál se desea analizar con base en la
evidencia de la muestra o del experimento para tomar una decisión sobre su validez.
Hipótesis nula, H0, es aquella que esperamos rechazar.
Hipótesis alterna, Ha, es aquella que esperamos aprobar.
Estadística de prueba nos proporcionará un número obtenido a partir de los datos
muestrales y que nos indicará si la hipótesis nula debe ser rechazada o aceptada.
Regla de decisión define las condiciones que conducen a la aceptación o rechazo de H0.
Región de aceptación conjunto de valores, determinado bajo ciertas reglas, tal que si el
valor de la estadística de prueba cae dentro , la hipótesis H0 se declara no contraria al
valor de la estadística (esto no significa que sea verdadera, sino que no la podemos
rechazar).
Región de rechazo conjunto de valores, determinado bajo ciertas reglas, tal que si el
valor de la estadística de prueba cae dentro, la hipótesis H0 se declara contraria a la
evidencia de la muestra y por tanto debe ser rechazada.
Valor crítico es el número que separa la región de aceptación de la región de rechazo.
Si la región de rechazo se encuentra en un solo extremo de la curva de distribución de la
estadística de prueba, la prueba se dice de una cola (unilateral). Cuando la región de
rechazo se encuentra en ambos extremos se dice de dos colas (bilateral).
Al tomar decisiones basadas en la evidencia de la muestra nos exponemos a
equivocarnos, dándose dos tipos de errores posibles:


Error tipo I, EI, error que se comete al rechazar H0 siendo verdadera.
Error tipo II, EII, error que se comete cuando aceptamos H0 siendo falsa.
El error tipo I se considera de mayor gravedad en su ocurrencia.
Estado de la naturaleza
Decisión
Rechazar
Aceptar
V
F
EI
Correcto
Correcto
EII
1
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
Dada la gravedad de cometer el error tipo I y ante la imposibilidad de descartarlo, la
única alternativa es asignarle una probabilidad, obviamente pequeña, de que éste ocurra.
Esta probabilidad es lo que llamaremos nivel de significancia.
Nivel de significancia,  , es la probabilidad de rechazar H0 siendo verdadera.
Corresponde al área de rechazo, se igualará al total del área derecha, o izquierda, si se
trata de pruebas de una cola o se repartirá en partes iguales entre las dos colas si se trata
de una prueba bilateral.
Si el valor de la estadística de prueba cae en la región de rechazo la prueba se dice
significativa.
La probabilidad de cometer el error tipo II se denota con la letra  .
1-  es la probabilidad de aceptar H0 cuando es verdadera.
1-  es la probabilidad de rechazar H0 cuando es falsa. Esta probabilidad desempeña un
papel de gran importancia para evaluar el procedimiento que se sigue para tomar la
decisión y se denomina potencia de la prueba.
En la prueba de hipótesis se presentará una y sólo una de las siguientes situaciones:
Estado de naturaleza
H0 es cierta
H0 es falsa
Decisión
Aceptar H0
Correcto
(1-  )
Error tipo II
( )
Descartar H0
Error tipo I
( )
Correcto
(1-  )
PASOS EN UNA PRUEBA DE HIPÓTESIS
Primer paso: Formular la hipótesis.
Segundo paso: Establecer el tamaño de la muestra y el nivel de significancia.
Tercer paso: Determinar una estadística de prueba.
Cuarto paso: Formular una regla de decisión.
Quinto paso: Recolectar los datos mediante algún procedimiento de muestreo y
calcular el correspondiente valor de la estadística de prueba.
Sexto paso: Aplicar la regla de decisión. Si el valor de la estadística de prueba cae en la
región de rechazo, entonces rechazamos H0 ; si cae en la región de aceptación, no hay
evidencia para rechazarla.
PRUEBAS DE HIPÓTESIS RESPECTO DE LAS MEDIAS EN POBLACIONES
NORMALES.
2
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
Se trata de un procedimiento estadístico que nos permite decidir si los datos muestrales
son consistentes o no con algún valor que hemos fijado para la media de una población
normalmente distribuida.
1. Pruebas para una muestra.
a)
Varianza poblacional conocida.
Estadístico de prueba: z 
x

que sigue la normal estándar
n
b)
Varianza poblacional desconocida y muestra pequeña.
Estadístico de prueba: t 
x
que sigue una t de student con n-1 grados de
s
n
libertad.
c)
Varianza poblacional desconocida y muestra grande.
Basándonos en el teorema central de límite, el estadístico de prueba sería
x
z
que seguiría la normal estándar.
s
n
2. Pruebas para dos muestras independientes.
Las hipótesis a probar son:
a) H0: 1   2 vs. Ha: 1   2 que es equivalente a H0: 1   2  0 vs.Ha:
1   2  0 . Prueba de cola derecha.
b) H0: 1   2 vs. Ha: 1   2 que es equivalente a H0: 1   2  0 vs. Ha:
1   2  0 . Prueba de cola izquierda.
c) H0: 1   2 vs. Ha: 1   2 que es equivalente a H0: 1   2  0 vs. Ha:
1   2  0 . Prueba de dos colas.
Se tienen en cuenta dos casos:
1. Las varianzas de las poblaciones son conocidas, o desconocidas y n>30.
Estadístico de prueba Z=
X
1
 X 2   ( 1   2 )
 12
2
 2
que sigue la normal estándar.
n1
n2
2. Las varianzas son desconocidas pero se suponen iguales y n<30.
3
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
Estadístico de prueba T=
X
1
 X 2   1   2 
Sp
1
n1
 1
que sigue una t de student con
n2
(n1+n2-2) grados de libertad
3. Pruebas sobre las medias cuando las observaciones son pareadas.
Requiere que las unidades que formen pareja tengan las mismas características.
El procedimiento estadístico para analizar el comportamiento de la variable de interés se
basa en la diferencia de las mediciones de las unidades que forman la pareja.


n xd   d
que tiene una distribución t con n-1 grados de
Sd
libertad. xd = diferencia promedio de los datos muestrales. Sd=desviación estándar de
dichas diferencias.
Estadística de prueba: T=
PRUEBAS DE HIPÓTESIS
POBLACIONES NORMALES.
RESPECTO
DE
LAS
VARIANZAS
EN
1. Una sola varianza
Estadística de prueba X=
n  1S 2
2
que sigue una distribución ji cuadrado con n-1
grados de libertad.
2. Comparar dos varianzas
S 12
Se utiliza la estadística F= 2 que sigue una distribución F con (n1-1,n2-1) grados de
S2
libertad. Se debe colocar siempre en el numerador la varianza muestral asociada a la
varianza poblacional mayor.
PRUEBAS PARA PROPORCIONES.
Utilizaremos muestras grandes para utilizar una aproximación normal.
1. Una sola proporción.
Estadística de prueba Z=
p   
n
que sigue una normal estándar.
 1   
2. Comparación de proporciones.
4
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
Estadística de prueba Z=
p
1

 p 2   1   2 
p(1  p) / n1  p(1  p) / n2
que sigue una normal estándar,
m1  m2
, m1= número de elementos del total n1 que poseen la característica,
n1  n2
m2= número de elementos del total n2 que poseen la característica.
donde p 
LA FUNCIÓN DE POTENCIA DE LA PRUEBA.
Potencia de una prueba capacidad que tiene una prueba de detectar la hipótesis alterna
cuando realmente es verdadera.
La probabilidad de rechazar la hipótesis nula cuando es falsa es 1-  que es lo mismo
que aceptar la hipótesis alterna cuando es verdadera. En esta expresión  es la
probabilidad de cometer el error tipo II (rechazar la alterna cuando es verdadera).
Para un nivel de significancia dado,  , una prueba se considera más potente que otra
cuando 1-  es mayor.
El valor 1-  = P[ Aceptar Ha/Ha sea verdadera] sólo se puede calcular cuando se conoce
la distribución muestral de la estadística de prueba, lo que implicaría que se debería
conocer el valor del parámetro contenido en Ha. Para conocerlo es necesaria la función
de potencia, que es una función que nos ofrece la probabilidad de rechazar H0 para cada
valor dado del parámetro en consideración.
Si la prueba en cuestión es de la siguiente forma:
H0:    0 vs. Ha:   V y ˆ es la estadística de prueba. Se rechaza H0 si el valor
observado para ˆ se aparta suficientemente de  0 .El conjunto de valores de ˆ que
conducen al rechazo de H0 se llama región de rechazo o región crítica. PF(  ) =
P ˆ  CR /  es la función potencia de la prueba. Su complemento se denomina
función característica de operación, OC(  ) = 1-PF(  )


FACTORES QUE AFECTAN LA POTENCIA DE LA PRUEBA.
Nivel de significancia.
Magnitud del error estándar que depende de la desviación estándar de la población y del
tamaño n de la muestra.
Como  varia al contrario que  , 1-  varia proporcionalmente a  . Cuando  se
haga menor, la potencia de la prueba aumentará si se mantienen los demás factores.
Una prueba de una cola es más potente que una prueba de dos colas.
Cuanto mayor sea n, menor será el error estándar y por lo tanto la distribución
estadística muestral estará más concentrada en trono a la media y los valores críticos
serán más cercanos a ésta. Por lo tanto la potencia de la prueba será más grande.
5
ESTADÍSTICA EMPRESARIAL
TEMA 13-II: TEST DE HIPÓTESIS
Si se reduce la desviación estándar se disminuye el error estándar de la distribución
muestral aumentando así la potencia de la prueba.
6
Descargar