Pasos para realizar una prueba de hipótesis

Anuncio
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
PRUEBAS DE HIPÓTESIS
DE UNA POBLACION
P. Reyes
Septiembre 2007
1
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
CONTENIDO
1. Introducción
2. Pruebas de hipótesis para una población
3. Prueba de hipótesis estadística
4. Ejemplos de fórmulas para calcular los estadísticos de prueba
5. Ejemplos de pruebas de hipótesis de una población
6. Ejercicios adicionales
2
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Pruebas de hipótesis de una población
1. Introducción
La inferencia estadística es el proceso mediante el cual se utiliza la
información de los datos de una muestra para extraer conclusiones acerca
de la población
de la que se seleccionó la muestra. Las técnicas de
inferencia estadística se dividen en dos áreas principales: Estimación de
intervalos de confianza y Pruebas de hipótesis.
En cada
contra
prueba estadística, se comparan algunos valores observados
algunos
esperados
u
otro
valor
observado
comparando
estimaciones de parámetros (media, desviación estándar, varianza). Estas
estimaciones de los verdaderos parámetros son obtenidos usando una
muestra de datos y calculando los estadísticos.
La capacidad para detectar una diferencia entre lo que es observado y lo
que es esperado depende del desarrollo de la muestra de datos.
Incrementando el tamaño de la muestra mejora la estimación y la
confianza en las conclusiones estadísticas.
Al realizar pruebas de hipótesis, se parte de que un valor supuesto
(hipotético) es el parámetro poblacional. Después de recolectar una
muestra aleatoria, se compara el estadístico muestral, así como la media
(x), con el parámetro hipotético, se compara con una supuesta media
poblacional (). Después se acepta o se rechaza el valor hipotético, según
proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta
muy poco probable cuando la hipótesis es cierta.
3
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Se trata de probar una afirmación sobre parámetros de la población
(media ; varianza σ2 o proporción ) en base a datos de estadísticos de
una muestra (X media, s2 o p respectivamente):
Por ejemplo, probar las afirmaciones en los parámetros se usan los
estadísticos:
En una población

La media poblacional  = 12;
estadístico Zc

La varianza poblacional σ2 = 12;
estadístico c2

La proporción poblacional  = 0.3
estadístico Zc
En dos poblaciones

Las medias poblacionales son iguales  1 = 2 o 1 - 2 = 0;
estadístico Zc o Tc

Las varianzas poblacionalesson iguales σ12 = σ22 o σ12 - σ22 = 0;
estadístico Fc

Las proporciones poblacionales son iguales 1 = 2 o 1 - 2 = 0
estadístico Zc
La prueba de hipótesis tiene varias etapas:
Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula
(H0) es el valor hipotético del parámetro que se compra con el resultado
muestral resulta muy poco probable cuando la hipótesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hipótesis nula solamente si el
4
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
resultado muestral es tan diferente del valor hipotético que una diferencia
de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una
probabilidad de 0.05 o menos.
Etapa 3.- Elegir el estadístico de prueba. El estadístico de prueba puede ser
el estadístico muestral (el estimador no segado del parámetro que se
prueba) o una versión transformada de ese estadístico muestral. Por
ejemplo, para probar el valor hipotético de una media poblacional, se
toma la media de una muestra aleatoria de esa distribución normal,
entonces es común que se transforme la media en un valor Z el cual, a su
vez, sirve como estadística de prueba.
Etapa 4.- Establecer el valor o valores críticos del estadístico de prueba.
Habiendo especificado la hipótesis nula, el nivel de significancia y el
estadístico de prueba que se van a utilizar, se procede a establecer el o los
valores críticos del estadístico de prueba. Puede haber uno o más de esos
valores, dependiendo de si se va a realizar una prueba de uno o dos
extremos o colas.
Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al
probar un valor hipotético de la media poblacional, se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crítico que
se establece es un valor de Z, entonces se transforma la media muestral en
un valor de Z.
Etapa 6.- Tomar la decisión. Se compara el valor observado del estadístico
muestral con el valor (o valores) críticos del estadístico de prueba. Después
no se rechaza o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta
la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones
5
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
de los administradores operativos, como por ejemplo, mantener o no un
estándar de desempeño o cuál de dos estrategias de mercadotecnia
utilizar.
La distribución apropiada de la prueba estadística se divide en dos
regiones: una región de rechazo y una de no rechazo. Si estadístico de
prueba cae en esta última región no se puede rechazar la hipótesis nula y
se llega a la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el
valor crítico en la distribución estadística que divide la región del rechazo
(en la cual la hipótesis nula no se puede rechazar) de la región de rechazo.
A hora bien el valor crítico depende del tamaño de la región de rechazo.
Pasos de la prueba de hipótesis:
1. Definir el Problema ( Problema Práctico).
2. Señalar los Objetivos ( Problema Estadístico).
3. Determinar tipo de datos: Atributo o Variable.
4. Si son datos Variables: Hacer Prueba de Normalidad.
5. Establecer las Hipótesis: Hipótesis Nula (Ho con signo igual), o la
Hipótesis Alterna (Ha con signo de mayor o menor).
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%).
7. Establecer el tamaño de la muestra,  10 .
8. Desarrollar el Plan de Muestreo.
9. Seleccionar Muestras y Obtener Datos.
10. Decidir la prueba estadística apropiada y calcular el estadístico
de prueba (Z, t, X2 o F) a partir de los datos.
11. Obtener el estadístico correspondiente de tablas o Excel.
6
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
12. Determinar la probabilidad de que el estadístico de prueba
calculado ocurra al azar.
13. Comparar el estadístico calculado con el de tablas y ver si cae
en la región de rechazo o ver si la probabilidad es menor a alfa,
rechace Ho y acepte Ha. En caso contrario no rechace Ho.
14. Con los resultados interprete una conclusión estadística para la
solución práctica.
7
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
2. Pruebas de hipótesis para una población
Se trata de probar una afirmación sobre parámetros de la población
(media ; varianza σ2 o proporción ) en base a datos de estadísticos de
una muestra (X media, s2 o p respectivamente):
ELEMENTOS DE LA PRUEBA:

Prueba Estadística: Procedimiento para decidir aceptar o rechazar
hipótesis.

Hipótesis: Es una afirmación acerca de una o más poblaciones.

Hipótesis Nula (Ho): Usualmente es una afirmación representando una
situación “status quo”. Generalmente deseamos rechazar la hipótesis
nula.

o
Es la hipótesis o afirmación a ser probada
o
Puede ser por ejemplo  =, σ, o  a constante
o
Sólo puede ser rechazada o no rechazada
Hipótesis Alterna (Ha): Es lo que aceptamos si podemos rechazar la
hipótesis nula. Ha es lo que queremos probar.
o
Es la hipótesis que se acepta como verdadera cuando se rechaza
Ho, es su complemento
o
Puede ser por ejemplo
para prueba de dos colas
 < 7 para prueba de cola izquierda
 > 7 para prueba de cola derecha
8
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007

Estadístico de prueba: Calculado con datos de la muestra.

Región de Rechazo: Indica los valores de la prueba estadística para
que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada
en un riesgo a deseado, normalmente 0.05 o 5%.

Estadístico de prueba(Z, t, X2 o F): Para probar la hipótesis nula se calcula
un estadístico de prueba con la información de la muestra el cual se
compara a un valor crítico apropiado. De esta forma se toma una
decisión sobre rechazar o no rechazar la Ho.

Error tipo I (alfa = nivel de significancia, normal=0.05): Se comete al
rechazar la Ho cuando en realidad es verdadera. También se denomina
riesgo del productor

Error tipo II (beta): Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor
Las pruebas de hipótesis pueden ser de dos colas, de cola derecha o de
cola izquierda, a continuación se esquematizan cada una de ellas.
9
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Pruebas de Hipótesis de dos colas:
Ho: a = b
Ha: a  b
Región de
Rechazo
Región de
Rechazo
-Z
Z
0
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b
Región de
Rechazo
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b
0
Z
Región de
Rechazo
-Z
0
Z
3. Prueba de hipótesis Estadística
-
Hipótesis nula Ho, complemento de la Hipótesis alterna:
o Es la hipótesis o afirmación a ser probada
o Puede ser por ejemplo  =, , o  a 5
o Sólo puede ser rechazada o no rechazada
-
Hipótesis alterna Ha, complemento de la hipótesis nula:
o Es la hipótesis que se acepta como verdadera cuando se
rechaza Ho, es su complemento
o
Si el signo de la hipótesis alterna es  entonces se trata de una
prueba de dos colas; si es > de cola derecha y si es < de cola
izquierda.
o Puede ser por ejemplo   5 para prueba de dos colas
10
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
o  < 5 para prueba de cola izquierda
o  > 5 para prueba de cola derecha
P(Z<= - Zexcel ) = alfa/2
P(Z>= + Zexcel ) = alfa/2
Regiones de rechazo
Pasos de la prueba de hipótesis:

Se plantea inicialmente la Ha si en el problema se muestra la
afirmación de ser menor o mayor a un valor establecido histórico.

Se plantea inicialmente la Ho si en el problema se muestra la
afirmación igual (es, históricamente ha sido); mayor o igual (cuando
menos) o menor o igual (a lo más) a un valor establecido histórico.

No importa cual se plantee primero, siempre la conclusión se hace
contra la Ho (se rechaza o no se rechaza)

El intervalo de confianza es el intervalo donde se estima que se
encuentre el parámetro de la población (media ; varianza σ2 o
proporción ) para un cierto nivel de confianza o de significancia.
11
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Estadístico de prueba
o Para probar la hipótesis nula se calcula un estadístico de
prueba con la información de la muestra el cual se compara a
un valor crítico apropiado. De esta forma se toma una decisión
sobre rechazar o no rechazar la Ho
-
Error tipo I (alfa = nivel de significancia, es común = 0.05 ). Alfa = 1Nivel de confianza
o Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor.
-
Error tipo II (beta )
o Se comete cuando no se rechaza la hipótesis nula siendo en
realidad falsa. Es el riesgo del consumidor
Pruebas de Hipótesis de dos colas:
Si la Ho:  = que un valor poblacional, entonces el riesgo alfa se
reparte en ambos extremos de la distribución. Por ejemplo si Ha:
≠ 10 se tiene:
Ho: a = b
Ha: a  b
12
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P(Z<= - Zexcel ) = alfa/2
P. Reyes/Sept. 2007
P(Z>= + Zexcel ) = alfa/2
Regiones de rechazo
Pruebas de Hipótesis de cola derecha:
Si la Ho:  , que un valor poblacional, entonces el riesgo alfa se
coloca en el extremo derecho de la distribución. Por ejemplo si Ho
  10 y Ha:  >10 se tiene una prueba de cola derecha:
Ho: a  b
Ha: a > b
Región de
rechazo
P(Z>= + Zexcel ) = alfa
13
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Pruebas de Hipótesis cola izquierda:
Si la Ho:   que un valor poblacional, entonces el riesgo alfa se
coloca en el extremo izquierdo de la distribución. Por ejemplo si
Ho   10 y Ha:  < 10 se tiene una prueba de cola izquierda:
Ho: a  b
Ha: a < b
Región de
rechazo
P(Z<= - Zexcel ) = alfa
Zexcel (
0.01
)
14
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Pasos para realizar una prueba de hipótesis
Probar la hipótesis de igualdad de una media  para n > 30
1) Establecer las hipótesis e identificar el nivel de significancia alfa o 1- Nivel
de confianza (NC)
Ho:  Ha: 
2) Calcular el estadístico de prueba Zc o Tc con fórmula
3) Determinar el estadístico de tablas Zt o Tc de Excel para una cierta alfa
o 1-NC
4) Establecer la región de rechazo con Zt y ver si cae ahí Zc
Las regiones de rechazo prueba de 2 colas: -Z/2 y Z/2
5) Determinar el Intervalo de confianza para la media y ver si incluye a la
media de la hipótesis, si no rechazar Ho
6) Determinar el valor P correspondiente a Zc y comparar contra Alfa/2, si
es menor rechazar Ho
15
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
4. Fórmulas
P. Reyes/Sept. 2007
para calcular los estadísticos de prueba
Fórmulas para Intervalos de confianza de parámetros de una población
a) Intervalo de confianza para estimar  con muestras grandes (n >= 30 ) y
cuando ya se cuenta con historial, o sea que  es conocida:
IC para   X  Z  / 2

n
Si la  no se conoce entonces se usa S de la muestra en su lugar
IC para   X  Z  / 2
S
n
b) Intervalo de confianza para estimar  con muestras pequeñas (n < 30;
grados de libertad = gl. = n –1):
IC para   X  t / 2, gl
S
n
c) Intervalo de confianza para estimar  proporción poblacional:
p(1  p)
n
IC para  p  Z / 2 S p
Sp 
d) Tamaño de muestra para estimar  en función del error ( X   ) :
Z 2 / 2
n
( X  )2
e) Tamaño de muestra para estimar  en función del error ( p   ) , en el
peor caso  = 0.5:
Z2 / 2 ( )(1   )
n
( p   )2
16
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Fórmulas para calcular los estadísticos utilizados en las pruebas de
Hipótesis de una pob.
f) Estadístico Zc muestras grandes (n >= 30 ) y cuando la  es conocida (ya
se tiene historial):
Zc 
X   HIPOTESIS

n
f) Si no se conoce la  entonces se reemplaza por la S
de la muestra.
g) Estadístico tc para muestras pequeñas (n < 30) y la  es desconocida:
tC 
X   HIPOTESIS
s
n
h) Estadístico Zc para proporciones y muestras grandes (n >= 30):
p 
Zc 
 HIPOTESIS (1   HIPOTESIS )
n
p   HIPOTESIS
p
17
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Ejemplos de cada uno de los casos
a) Estadístico Zc muestras grandes (n >= 30 ) o cuando la  es
conocida (ya se tiene historial):
Ho :   valor
Ha :   valor
Zc 
X   HIPOTESIS

n
Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa
o alfa/2)
Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability
distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2
Intervalo de confianza para estimar  con muestras grandes (n >= 30) o
cuando ya se cuenta con historial, o sea que  es conocida:
IC para   X  Z  / 2

n
Si no se conoce la  entonces se reemplaza por la S de la muestra.
IC para   X  Z  / 2
S
n
El valor p de probabilidad correspondiente al estadístico Zc se determina
como sigue:
18
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
P value en Excel =DISTR.NORM.ESTAND(Zc)
P value en Minitab >Calc >Probability distributions> Normal:
Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc
Prueba de hipótesis en Minitab:
>Stat >Basic statistics > 1-Sample Z
Utilizar Sample in columns o Summarized data
Sample size 49
Mean 11.5 Standar deviation 1.1
Test Mean 12
Graphs – Seleccionar º! Individual value plot
Confidence level 90%
Alternative not equal
OK
Resultados:
One-Sample Z
Test of mu = 12 vs not = 12
The assumed standard deviation = 1.1
N
Mean SE Mean
90% CI
Z
P
49 11.5000 0.1571 (11.2415, 11.7585) -3.18 0.001
Criterios de rechazo de Ho:
19
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Si Zc cae en la zona de rechazo
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
b) Estadístico tc para muestras pequeñas (n < 30) y la  es desconocida:
Ho :   valor
Ha :   valor
tC 
X   HIPOTESIS
s
n
Estadístico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o alfa,
grados de libertad n-1)
Estadístico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability
distributions> :
Inverse Cummulative prob; Degrees of freedom = n-1; Input constant
= Alfa o alfa/2
Intervalo de confianza para estimar  con muestras pequeñas (n < 30;
grados de libertad (gl.) = n –1):
IC para   X  t / 2, gl
S
n
El valor p de probabilidad correspondiente al estadístico Tc se determina
como sigue:
P value en Excel =DISTR.T(Tc, grados de libertad, 1 o 2 colas)
20
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
P value en Minitab >Calc >Probability distributions> T:
Cummulative prob; Degrees of freedom = n-1; Input constant = Tc
Prueba de hipótesis en Minitab:
>Stat >Basic statistics > 1-Sample t
Utilizar Sample in columns o Summarized data
Sample size 10
Mean 11277
Standar deviation 3772
Test Mean 12000
Graphs – Seleccionar º! Individual value plot
Confidence level 95%
Alternative not equal
OK
Resultados:
One-Sample T
Test of mu = 12000 vs not = 12000
N
Mean StDev SE Mean
95% CI
T
P
10 11277.0 3772.0 1192.8 (8578.7, 13975.3) -0.61 0.559
Criterios de rechazo de Ho:
Si Tc cae en la zona de rechazo
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
21
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
c) Estadístico Zc para proporciones y muestras grandes (n >=
30):
Ho :   valor
Ha :   valor
p 
Zc 
 HIPOTESIS (1   HIPOTESIS )
n
p   HIPOTESIS
p
Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa
o alfa/2)
Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability
distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2
Intervalo de confianza para estimar  proporción poblacional:
p(1  p)
n
IC para  p  Z / 2 S p
Sp 
El valor p de probabilidad correspondiente al estadístico Zc se determina
como sigue:
22
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
P value en Excel =DISTR.NORM.ESTAND(Zc)
P value en Minitab >Calc >Probability distributions> Normal:
Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc
23
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Prueba de hipótesis en Minitab
>Stat >Basic statistics > 1- Proportion
Summarized data
Number of trial 500
Number of events 225
Graphs – Seleccionar º! Individual value plot
Confidence level 98% Test proportion 0.40
Alternative Less than
º! Use test and interval based on normal distribution
OK
Resultados
Test and CI for One Proportion
Test of p = 0.4 vs p < 0.4
98%
Upper
Sample
1
X
N Sample p
Bound Z-Value P-Value
225 500 0.450000 0.495693
2.28
Criterios de rechazo de Ho:
Si Zc cae en la zona de rechazo
24
0.989
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
El valor de la Hipótesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).
d) Cálculo del estadístico con base en Chi cuadrada
para prueba de una varianza.
Ho:  2 =  02
Ho:  2   02
El estad
Donde:
 02 la varianza de la hipótesis
N = número de datos de la muestra
S2 = varianza de los datos de la muestra
25
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
e) Tamaño de muestra para estimar  en función del error
( X  ) :
n
Z 2 / 2
( X  )2
f) Tamaño de muestra para estimar  en función del error ( p   ) ,
en el peor caso  = 0.5:
Z2 / 2 ( )(1   )
n
( p   )2
26
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
5. Ejemplos de pruebas de hipótesis de una población
Ejemplos de Prueba de hipótesis Estadística
Paso 1. Para una muestra grande (n >30) probar la hipótesis de una media
 . Establecer alfa.
Ho:    o
Ha:
  0
Paso 2. Calcular el estadístico de prueba
Z calc 
  0
s
n
Paso 3. Establecer la región de rechazo, para prueba de 2 colas:
 Z 2  Z 2
Región de
Región de
Rechazo
Rechazo
0
-Z
Z
Paso 4. Si el valor del estadístico de prueba cae en la región de rechazo
rechazaremos Ho de otra manera no podemos rechazar Ho.
Paso 5. Calcular el intervalo de confianza IC para un nivel de confianza de
1-alfa, si la media de la hipótesis se encuentra dentro del intervalo, no
rechazar Ho y viceversa.
27
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Paso 6. Calcular el valor de Probabilidad P para el estadístico calculado a
partir de la muestra Zc o Tc por medio de:
Para Zc:
Para Tc:
P = distr.norm.estand.inv(-Zc)
P = distr.t.inv(Tc, grados de libertad, 1 o 2 colas)
Para Chi2: P = Prueba.chi.inv(Chi c, grados de libertad)
Si el valor de P es menor o igual a alfa se rechaza Ho y se acepta Ha (en el
caso de dos colas el valor de P total es del doble del calculado).
Prueba Z de 2 colas
Problema 1
Los enanos de Blanca Nieves le informan que excavan 12 toneladas
promedio por semana. Nieves recolecta datos de 49 semanas y obtiene
X=11.5, s= 1.1 a un nivel de significancia α=10%. Los Enanos están en lo
cierto.
Solución
1) Planteamiento de hipótesis
Ho: μ=12
Ha: μ≠12
2) Determinar estadístico de la prueba Z
Zc= 11.5 – 12/ (1.1 / √49) = -0.5/ 0.157 = -3.185
28
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
3) Determinar el valor de Zt de acuerdo al valor de alfa
10% / 2 = 0.05
Z de tablas 0.05 = -1.64
4) Interpretación y conclusiones
Dado que Zc=-3.185 es menor que Zt=-1.64 la Ho se rechaza a un nivel alfa
del 10%.
Los enanos no excavan 12 toneladas al día
5) Intervalo de confianza
IC = Media +-Zalfa/2* S/ raiz(n)
IC = 11.5+- 1.64* 1.1/raiz(49) = (11.242, 11.75)
La media de la hipótesis no se encuentra en el intervalo de
confianza, se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand(Zc) =distr.norm.estand(-3.18) = 0.00073
Como el valor P es menor a alfa/2 entonces se rechaza Ho
29
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Prueba Minitab:
>Stat >Basic statistics > 1-Sample Z
Summarized data
Sample size 49
Mean 11.5 Standar deviation 1.1
Test Mean 12
Graphs – Seleccionar º! Individual value plot
Confidence level 90%
Alternative not equal
OK
RESULTADOS Y CONCLUSIONES……
Problema 2
Se quiere probar la afirmación de que la distancia promedio viajada por
pelotas de golf es de 250 yardas a un 95% de confianza.
Z
Se toma una muestra de 16 distancias
269
300
268
278
282
263
301
295
288
278
30
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
276
286
296
265
271
279
RESULTADOS Y CONCLUSIONES……
En vez de seleccionar Summarized data, seleccionar Samples in columns
Prueba Z de una cola
Problema 3
Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que
las ventas habían descendido por debajo de la media histórica de $4500.
¿Parece
una
decisión
adecuada
si
en
una
muestra
de
observaciones se observa Xmedia= 4,477, s=1,128 con α= 2%?
Solución
1) Planteamiento de hipótesis
Ho: μ≥4500
Ha: μ<4500
2) Determinar estadístico de la prueba Z
Zc= 4477 – 4500 / (1128 / √144) = -23/ 94= -0.245
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa 2%
Zt de tablas 0.02 = -2.053
31
n=144
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
4) Interpretación y conclusiones
Dado que Zc=-0.245 es mayor que Zt=-2.053 la Ho no se rechaza a una alfa
del 2%.
5) Intervalo de confianza
IC = Media +-Zalfa/2* S/ raiz(n)
IC = 4477 +- 2.053* 1128/raiz(144) = (4284.01, 4669.98)
La media de la hipótesis si se encuentra en el intervalo de confianza,
no se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand(Zc) =distr.norm.estand(-0.245) = 0.4032
Como el valor P es mayor a alfa entonces no se rechaza Ho, no han
descendido las ventas.
Prueba Minitab (Options: Confidence level 98%
Alternative Less
Than)
RESULTADOS Y CONCLUSIONES……
Prueba t de dos colas
Problema 4
Un distribuidor piensa que el promedio de sus ventas son de $12000 al mes.
Selecciona n=10 meses y encuentra X=11,277, s=3,772. Aun alfa del 5%
¿qué se puede concluir?
32
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Solución
1) Planteamiento de hipótesis
Ho: μ=12000
Ha: μ≠12000
2) Determinar estadístico de la prueba t
tc= 11277 – 12000 / (3772 / √10) = -723 / 1192.81 = - 0.6061
3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los
grados de libertad
gl= n-1= 10-1 =9 para un alfa / 2 de 0.05/2= 0.025
tt de tablas para 0.025 con 9 gl = 2.262 con =distr.t.inv(0.05,9) = 2.262
4) Interpretación y conclusiones
Dado que tc= -0.6061 es mayor que tt= - 2.262 la Ho no se rechaza a un
nivel alfa del 5%.
Las ventas son de $12000 al mes
5) Intervalo de confianza
IC = Media +-Talfa/2* S/ raiz(n)
IC = 11277+- 2.262* 3772/raiz(10) = ( 8578.86, 13975.14)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
33
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
P =distr.t(Tc, gl, colas) =distr.t(0.6061, 9, 2) = 0.5594
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, las
ventas son de $12000.
Prueba Minitab
>Stat >Basic statistics > 1-Sample t
Summarized data
Sample size 10
Mean 11277
Standar deviation 3772
Test Mean 12000
Graphs – Seleccionar º! Individual value plot
Confidence level 95%
Alternative not equal
OK
RESULTADOS Y CONCLUSIONES……
Problema 5
Las ganancias por acción son de 3 dolares, probar para un 95% de
confianza si esto es cierto. Una muestra de datos arrojó los resultados
siguientes:
34
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
1.92
2.16
3.63
3.16
4.02
3.14
2.2
2.34
3.05
2.38
RESULTADOS Y CONCLUSIONES……
Prueba t de una cola
Problema 6
La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa
incremente esta vida. Se prueban n=25 focos con fusión a X=5,117, s=
1,886. Concluir para un nivel alfa del 5%.
Solución
1) Planteamiento de hipótesis
Ho: μ≤5000
Ha: μ>5000
2) Determinar estadístico de la prueba t
tc= 5117 – 5000 / (1886 / √25) = 117 / 377.2 = 0.310
35
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los
grados de libertad
gl= n-1= 25-1 =24 para alfa de 0.05
tt de tablas 0.05 con 24 gl = 1.71 de =distr.t.inv(0.1,24) =1.71
4) Interpretación y conclusiones
Dado que tc=0.310 es menor que tt=1.71 la Ho no se rechaza a un nivel alfa
de 5%.
La vida de los focos es de 5000 horas.
5) Intervalo de confianza
IC = Media +-Talfa/2* S/ raiz(n)
IC = 5117+- 1.71* 1886/raiz(25) = ( 4471.988, 5762.012 )
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.t(Tc, gl, colas) =distr.t(0.31, 24, 1) = 0.3796
Como el valor P es mayor a alfa entonces NO se rechaza Ho, la vida es de
5000 Hrs.
Prueba Minitab (Confidence level 95%
RESULTADOS Y CONCLUSIONES……
Problema 7
36
Alternative greater than)
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Las horas tomadas para plantar un árbol mediano son las siguientes. Probar
a un 5% si el tiempo es > 2 Hrs.
1.9
1.7
2.8
2.4
2.6
2.5
2.8
3.2
1.6
2.5
RESULTADOS Y CONCLUSIONES……
Prueba Z para una proporción
Problema 8
Midwest planea comercializar un producto sólo si por lo menos el 40% del
público lo prefiere. En una muestra de 500 personas encuentra que 225 lo
prefieren. ¿A un nivel alfa de 2%, Midwest debe comercializar el producto?
Solución
1) Planteamiento de hipótesis
Ho: π≥0.40
Ha: π<0.40
2) Determinar estadístico de la prueba Z
σp = √(0.40)(1-0.40) / 500 = 0.022
37
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
p= 225/500 = 0.45
Zc= 0.45-0.40/ 0.022) = 0.05/ 0.022 = 2.27
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa
0.02%
Z de tablas para 0.02 = -2.053
4) Interpretación y conclusiones
Dado que Zc=2.27 es mayor que Zt=-2.053 la Ho no se rechaza a un nivel
alfa del 2%.
La proporción no es menor al 40% se debe comercializar el producto.
5) Intervalo de confianza
p = 225/500 = 0.45
Sp = raiz (p(1-p)/n)) = raiz(0.45(0.55)/500) = 0.02418
IC = p +- Zalfa/2 * Sp
IC = 045 +- 2.053*0.024 = (0.400, 0.4992)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand (Zc) =distr.norm.estand (2.27) = 0.98839
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la
proporción es 0.40.
38
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
Prueba Minitab
>Stat >Basic statistics > 1- Proportion
Summarized data
Number of trial 500
Number of events 225
Graphs – Seleccionar º! Individual value plot
Confidence level 98% Test proportion 0.40
Alternative Less than
º! Use test and interval based on normal distribution
OK
RESULTADOS Y CONCLUSIONES……
39
P. Reyes/Sept. 2007
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Problema 9
Un estudio indicó que el 64% de los consumidores de supermercado creen
en las marcas propias. El fabricante de una salsa de tomate preguntó a
100 compradores donde 52 prefieren marca propia, probar si el porcentaje
de preferencias es menor al 64%, para un 5% de nivel de significancia
Ha: pi < 0.64
Ho: Pi >= 0.64
Prueba de cola izquierda
Trials 100
Events
NC
52
95%
Alternate
Less Than
RESULTADOS Y CONCLUSIONES……
Problema 10
Midlakes canceló sus vuelos ya que se estimó que más del 18% involucraba
aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel alfa
del 0.05 si D = 24 aviones de n = 120 tenían fallas?
Solución
1) Planteamiento de hipótesis
Ho: π ≤0.18
Ha: π >0.18
2) Determinar estadístico de la prueba Z
σp = √(0.18)(1-0.18) / 120 = 0.035
p= 24/120 = 0.2
Zc= 0.2-0.18/ 0.035) = 0.02/ 0.035 = 0.571
3) Determinar el valor de Z en tablas de acuerdo al valor de alfa de 0.05%
40
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Z de tablas para 0.05 = 1.64
4) Interpretación y conclusiones
Dado que Zc=0.571 es menor que Zt=1.64 la Ho no se rechaza a un nivel de
confianza del 5%.
La proporción de aviones con falla es del 0.18
5) Intervalo de confianza
p = 24/120 = 0.2
Sp = raiz (p(1-p)/n)) = raíz(0.2(0.8)/120) = 0.0365
IC = p +- Zalfa/2 * Sp
IC = 0.2 +- 1.64*0.0365 = (0.1402, 0.2598)
La media de la hipótesis se encuentra en el intervalo de confianza,
NO se rechaza Ho.
6) Valor P del estadístico de prueba
P =distr.norm.estand (Zc) =distr.norm.estand (-0.571) = 0.284
Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la
proporción es 0.18.
Prueba Minitab (Confidence level 95%
RESULTADOS Y CONCLUSIONES……
41
Alternative Greater than)
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Prueba de hipótesis para una varianza
Problema 10
Se trata de probar si la varianza poblacional de las rentas en las ciudades
es de 30.
Los datos de la renta para diferentes ciudades es la siguiente:
Ciudad
Renta
A
47
B
50
C
53
D
45
E
40
F
43
G
39
H
37
La varianza de los datos en Excel es: = Var( datos de rentas ) = 31.0714286
Paso 1. 2 = 02
2  02
Ho: Varianza = 30
Ha: Varianza  30
Paso 2. Estadístico de Prueba Chi cuadrado calculado Chic:
Donde:
02 = Varianza de Ho = 30;
42
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
N = número de datos = 8;
Varianza de datos S2= 31.0714286
c2 = (8-1)*31.0714286 / 30 = 7.25
Paso 3. Estadístico correspondiente a alfa  =0.05 (por tanto /2 = 0.025).
De tablas o con Excel por ser una prueba de dos colas:
2/2, n-1 = prueba.chi.inv(0.025, 8-1) = 16.0127643
2 (1-/2), n-1 = prueba.chi.inv(0.975, 8-1) = 1.68986919
/2 =
0.025
/2 = 0.025
Paso 4. Se observa si el 2c cae en la zona de rechazo, como en este caso
no es así, no hay evidencia suficiente para rechazar Ho, y se considera que
la varianza si es de 30.
Paso 5. Calculando el valor P correspondiente a la Chi calculada (2c se
tiene:
P = distr.Chi(2c, n-1) = distr.chi(7.25, 7) = 0.4033
P =0.4033
/2 =
0.025
43
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
Como el valor P correspondiente a X2c es mayor que Alfa/2, no se rechaza
la Ho
Paso 6. Calculando ahora el intervalo de confianza para la varianza
poblacional se tiene:
Sustituyendo valores se tiene: (13.58291398, 128.7081872)
Como el 30 de la Ho se encuentra en el intervalo de confianza, no se
rechaza Ho indicando que la varianza no es diferente de 70.
44
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
6. Ejercicios adicionales:
12. Los tiempos que toma el registro de las órdenes en un negocio son los
siguientes:
1.9
1.7
2.8
2.4
2.6
2.5
2.8
3.2
1.6
2.5
a) Probar a un Nivel de Confianza del 90% si el tiempo es mayor a 1.98.
b) Probar a un alfa de 0.02 si la desviación estándar es mayor a 0.6.
13. Se quiere probar la afirmación de que la distancia viajada por pelotas
de golf es de 250 yardas a un 95% de confianza. Se toma una muestra de
36 distancias
269 300 268 278 282 263 301 295 288 278 276 286 296 265 271 279
284 260 275 282 260 266 270 293 272 285 293 281 269 291 274 277
299 263 264 273
14. Las Ganancias por acción son de 3 dólares para un 95% de confianza,
probar esta afirmación..
Una muestra de datos arrojó los resultados siguientes:
1.92 2.16 3.63 3.16 4.02 3.14 2.2 2.34 3.05 2.38
45
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
15. Un estudio encontró que 40% de los usuarios de Internet recibieron más
de 10 mensajes diarios. Si de 420 usuarios 188 recibieron estos mensajes, a
un nivel de 5% ¿Cuál es la conclusión?
16. Un estudio indicó que el 64% de los consumidores de supermercado
creen en las marcas propias. El fabricante de una salsa de tomate
preguntó a 100 compradores donde 52 prefieren marca propia,
probar si
el porcentaje de preferencias es menor al 64%, para un 5% de nivel de
significancia.
17. Un restaurante planea una oferta especial si más del 15% de los clientes
compra vasos de diseño especial
con personajes de caricaturas. En una
prueba 88 de 500 clientes compraron vasos. A un 0.01 de nivel de
significancia, ¿Cuál es su recomendación?
18. Las rentas diarias de automoviles en Dólares de ocho ciudades se
muestra a continuación:
Ciudad
A
B
C
D
E
F
G
H
Renta
47
50
53
45
40
43
39
37
¿A un 5% se comprueba la hipótesis de que la varianza de la población es
de 30?
19. Se midió la temperatura de fusión de un aceite vegetal hidrogenado
en n=16 muestras y se encontró una media de 94.32. Si la temperatura de
fusión sigue una distribución normal con sigma = 1.20.
46
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
a) Probar a un 95% de nivel de confianza de que la media se ha
mantenido en 95.
20. La duración promedio de cierto foco es de 750 horas. El cliente
cambiaría de marca sólo que se demuestre que de manera concluyente
que la vida de los focos es menor que la anunciada. Se elige una muestra
aleatoria de 20 focos, se determina su duración y se obtiene una vida
media de 738.44 con una desviación estándar de 38.20.
a) ¿Cuál sería la conclusión a un 95% de nivel de confianza?
21. Después de ciertas horas de trabajo se determinó el desgaste de
flechas en 0.0001” para cada una de las n=8 máquinas que tienen plomo y
cobre como material de soporte, y se obtuvo como resultado que la
media fue de 3.72 con desviación estándar de 1.25.
a) Se desea probar si el desgaste es mayor a 3.5 a un 95% de nivel de
confianza.
22. Las lecturas de radiación de Radón tomadas en 12 lugares fueron
como sigue:
105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105, 99.6, 107.7, 103.3 y 92.4.
a) A un alfa de 5%, ¿indican las lecturas que difieren de 100?.
23. Se prueban 100 baterías de Ni-H para celdas de prueba y se determina
que 14 de ellas se ampoyan en sus placas fallando. Para un 5% de nivel de
significancia.
47
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
a) ¿Proporciona lo anterior una evidencia de que más del 10% de las
baterías fallan?
24. Para un cierto servicio los tiempos de respuesta son de 3 horas, probar
la afirmación para un 98% de nivel de confianza.
Una muestra de datos arrojó los resultados siguientes:
1.92
2.16
3.63
3.16
4.02
3.14
2.2
2.34
3.05
2.38
25. Las horas tomadas para mantenimiento son las siguientes. Probar a un
5% si el tiempo es > 2 Hrs.
Tiempos
1.9
1.7
2.8
2.4
2.6
48
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN
P. Reyes/Sept. 2007
2.5
2.8
3.2
1.6
2.5
26. Un estudio encontró que 40% de los usuarios de Internet recibieron más
de 10 mensajes diarios
Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cúal es
la conclusión?
27. Un estudio indicó que el 64% de los consumidores de supermercado
creen en las marcas propias. El fabricante de una salsa de tomate
preguntó a 100 compradores donde 52 prefieren marca propia,
probar si el porcentaje de preferencias es menor al 64%, para un 5% de
nivel de significancia.
49
Descargar