Contrastes de hipótesis.

Anuncio
INFERENCIA ESTADÍSTICA. CONTRASTE DE HIPÓTESIS
1. El peso medio de una muestra aleatoria de 100 naranjas de una determinada variedad es de 272
g. Se sabe que la desviación típica poblacional es de 20 g. ¿A un nivel de significación de 0,05 hay
suficiente evidencia para refutar la afirmación de que el peso medio de la población es de 275 g?
Solución:
Puede plantearse como un contraste de hipótesis sobre la media.
Hipótesis nula, H0: µ = 275
Hipótesis alternativa, H1: µ ≠ 275
Si se admite la hipótesis nula, las medias muestrales siguen una distribución:
20 

N  275,
 = N (275, 2)
100 

Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando:
σ
σ 

x ∉  µ − Z α/2
,µ + Z α/2

n
n

siendo x la media muestral, σ la desviación típica, n el tamaño de la muestra y Zα/2 el valor
correspondiente en la tabla normal para un nivel de confianza de 1 − α (nivel de significación α).
En nuestro caso se tiene: µ = 275, n = 100 y, para un nivel de significación del 0,05 (95 % de
confianza), Zα/2 = 1,96. Luego:
σ
σ  
20
20 

,µ + Z α/2
, 275 + 1,96
 µ − Z α/2
 =  275 − 1,96
 = (271,08; 278,92)
n
n 
100
100 

Como x = 272 ∈ (268,08; 275,92), no puede rechazarse la hipótesis nula. Por tanto, podemos
admitir que el peso medio es de 275 g.
2. Un estudio realizado en el ámbito de la Unión Europea concluye que la edad de los propietarios
de un automóvil "Mercedes" en el momento de su adquisición tiene un comportamiento Normal con
media 38 años y varianza 16. Un concesionario de dicha marca, instalado recientemente en España,
ha vendido sólo 150 vehículos y ha comprobado que la edad media de sus clientes es de 38,3 años.
Aceptando para los clientes españoles la varianza obtenida para los clientes europeos, ¿se puede
aceptar que la edad media al adquirir un vehículo de esa marca es la misma en España que en
Europa, para un nivel de significación del 5 %?
Solución:
Hay que hacer un contraste de hipótesis (bilateral) para la media.
Hipótesis nula, H0: µ = 38
Hipótesis alternativa, H1: µ ≠ 38
Si se admite la hipótesis nula, las medias muestrales siguen una distribución:
4 

N  38,
 = N (38; 0,33)
150 

Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando:
σ
σ 

x ∉  µ − Z α/2
,µ + Z α/2

n
n

siendo n el tamaño muestral, x la media de la muestra, σ la desviación típica y Zα/2 el valor
correspondiente en la tabla normal para una confianza de 1 − α. Si se rechaza H0 hay que admitir
que la media ha cambiado.
En este caso:
Dpto. de Matemáticas
1/9
IES “Ramón Olleros”
µ = 38
σ=4
n = 150
y
Zα/2 = 1,96
Por tanto, la región de aceptación es:
σ
σ  
4
4 

,µ + Z α/2
,38 + 1,96
 µ − Z α/2
 =  38 − 1,96
 = (37,36; 38,64)
n
n 
150
150 

Como 38,3 ∈ (37,36; 38,64) no puede rechazarse H0; en consecuencia se puede aceptar que la edad
media al adquirir un vehículo de esa marca es la misma en España que en Europa, para un nivel de
significación del 5 %.
3. En una determinada población juvenil el peso, en kilos sigue una distribución normal con una
desviación típica de 10 kg. Se extrae una muestra aleatoria de 25 jóvenes cuya media muestral es de
48 kg. Para un nivel de significación del 5 %, ¿podemos aceptar la hipótesis de que la media
poblacional es de 50 kg?
Solución:
Aplicaremos un contrate de hipótesis bilateral:
Hipótesis nula, H0: µ = 50
Hipótesis alternativa, H1: µ ≠ 50
Si se admite la hipótesis nula, las medias muestrales siguen una distribución:
10 

N  50,
 = N (50, 2)
25 

Se rechaza la hipótesis nula si:
σ
σ 

x ∉  µ − Z α/2
,µ + Z α/2

n
n

siendo σ la desviación típica poblacional y Zα/2 el valor correspondiente en la tabla normal para una
significación α. En nuestro caso x = 48, µ = 50, σ = 10, n = 25 y, para un nivel de significación del
5 %, Zα/2 =1,96, luego:
σ
σ  
10
10 

,µ + Z α/2
,50 + 1,96
 µ − Z α/2
 =  50 − 1,96
 = (46,08; 53,92)
n
n 
25
25 

Como x = 48 ∈ (46,08; 53,92), no se puede rechazar la hipótesis nula, esto es, podemos aceptar
que la media poblacional es de 50 kg.
4. Se quiere estimar, en una determinada población, la media de la paga mensual que se da a los
chicos de 14 años.
a) Si la varianza de la paga en la población es de 1000 ptas2. ¿Cuál es la varianza de la media
muestral cuando el tamaño de la muestra es de 100?
b) Si en las condiciones del apartado anterior, la media muestral es de 4008 ptas, ¿se aceptaría, con
un nivel de significación de 0,05, la hipótesis de que la paga media es de 4000 ptas?
Solución:
a) La distribución de la media muestral de tamaño n obtenidas en una población de media µ y
 σ 
desviación típica σ, N (µ,σ), se distribuye según una normal N  µ,
.
n

En nuestro caso, si σ2 = 1000 , se tendrá:
σ
1000
=
= 10 ⇒ la varianza de la media muestral = 10
n
100
Dpto. de Matemáticas
2/9
IES “Ramón Olleros”
b) Se trata de un contrate de hipótesis.
Hipótesis nula, H0: µ = 4000
Hipótesis alternativa, H1: µ ≠ 4000
Si se admite la hipótesis nula, las medias muestrales siguen una distribución:

1000 
N  4000,
 = N (4000; 3,16)
100 

Se admite la hipótesis nula si x = 4008 pertenece al intervalo:
σ
σ 

,µ + Z α/2
 µ − Z α/2

n
n

siendo σ la desviación típica poblacional y Zα/2 el valor correspondiente en la tabla normal para una
significación α.
En nuestro caso: µ = 4000, σ = 1000 , n =100 y, para el 0,05 de significación Zα/2 =1,96, luego:
1000
1000 
σ
σ  

Z
Z
µ
−
,µ
+
4000
−
1,96
,
4000
+
1,96
=

 = (3993,8; 4006,2)
α/2
α/2


n
n  
100
100 

Como 4008 cae fuera de ese intervalo no se acepta que ese valor sea la media poblacional. Esto es,
no se acepta que la paga media sea 4000 ptas.
5. Hace 10 años, el consumo medio mensual de electricidad por vivienda en Canarias era de 320
Kw. En el año 2005 se ha tomado una muestra aleatoria de 25 viviendas y se ha obtenido un
consumo medio mensual de 350 Kw con una desviación típica de 80 Kw.
a) Con un nivel de significación del 10 % ¿se acepta que el consumo medio sigue siendo 320 Kw
frente a que ha aumentado?
b) Para estimar el consumo medio con un error menor de 6 Kw y con un nivel de confianza del 90%
¿que número de viviendas es necesario considerar?
Solución:
a) Se trata de un contraste de hipótesis unilateral (cola izquierda):
Hipótesis nula, H0: µ ≤ 320
Hipótesis alternativa, H1: µ > 320
80 

Las medias muestrales muestras siguen una distribución N  320,
 = N (320, 16)
25 

Se rechaza H0, con un nivel de significación α, si:
σ
σ 

x > µ + Zα
x ∉  −∞, µ + Z α
o

n
n

Esto equivale a admitir que la media no ha aumentado.
En este caso: µ = 320; σ = 80; n = 25; Zα = 1,28. Luego:
σ
80
µ + Zα
= 320 + 1,28 ·
= 320 + 20,28 = 340,28
n
25
Como x = 350 > 340,28, hay que rechazar la hipótesis nula. Por tanto, debe aceptarse que el
consumo medio ha aumentado.
σ
σ2
⇒ n = (Zα/2)2 2
E
n
En nuestro caso, para una confianza del 90 %, α = 0,10, Zα/2 = 1,645, σ = 80 y E < 6 se tendrá:
b) El error admitido E, viene dado por E = Zα/2
Dpto. de Matemáticas
3/9
IES “Ramón Olleros”
n = (1,645)2
802
= 481,07
62
Esto es, n > 481.
6. Se cree que el comportamiento de ciertos microorganismos marinos se ha visto afectado por un
vertido de residuos, reduciéndose en particular el tiempo de vida de dichos microorganismos. Antes
del vertido ese tiempo seguía una Normal de media 45 días y desviación típica 4 días. Unas
semanas después del vertido se contabilizó el tiempo de vida de una muestra de 50
microorganismos, obteniéndose una media de 43 días de vida. Suponiendo que el tiempo de vida
sigue siendo aproximadamente Normal y que la desviación típica se ha mantenido:
a) Plantea un test para contrastar la hipótesis de que el vertido de residuos no les ha afectado frente
a que ha influido en la forma en que se cree. Si se concluye que sí afectó y esta conclusión fuera
falsa, ¿cómo se llama el error cometido?
b) Explica claramente a qué conclusión se llega en el test planteado en el apartado anterior para un
nivel de significación del 3 %.
Solución:
Se trata de un contraste de hipótesis sobre la media.
a) El contraste es unilateral, de una cola.
Hipótesis nula, H0: µ ≥ 45 (la media sigue igual o incluso subió)
Hipótesis alternativa, H1: µ < 45 (la media bajó)
Si se concluye que la media ha bajado (aceptándose H1) y sin embargo esta conclusión fuera falsa,
se dice que se comete un error de tipo I.
4 

b) Las medias muestrales muestras siguen una distribución N  45,
 = N (45; 0,57)
50 

Se admite que la media poblacional ha disminuido, para un nivel de significación α, cuando:
σ
σ


x < µ – Zα
o
x ∉  µ − Zα
,+ ∞
n
n


siendo µ y σ los parámetros poblacionales (media y desviación típica poblacional), x la media
muestral y Zα el valor correspondiente, para una distribución normal, con una confianza de 1 − α.
En nuestro caso, para α = 3 % , el 97 % de confianza Zα = 1,82. Luego:
σ
4
µ – Zα
= 45 – 1,82 ·
= 43,97
n
50
Como x = 43 < 43,97 se admite que la media de vida de dichos microorganismos ha disminuido.
7. Una marca de nueces afirma que, como máximo, el 6 % de las nueces están vacías. Se eligieron
300 nueces al azar y se detectaron 21 vacías.
a) Con un nivel de significación del 1 %, ¿se puede aceptar la afirmación de la marca?
b) Si se mantiene el porcentaje muestral de nueces que están vacías y 1 − α = 0,95, ¿qué tamaño
muestral se necesitaría para estimar la proporción de nueces vacías con un error menor del 1 %?
Solución:
21
= 0,07
La proporción de la muestra es lp =
300
Dpto. de Matemáticas
4/9
IES “Ramón Olleros”
a) Se trata de un contraste de hipótesis (que supondremos bilateral, al no decirse nada en concreto).
Hipótesis nula, H0: p = 0,06
Hipótesis alternativa, H1: p ≠ 0,06 (la proporción de nueces vacías no es la indicada)
Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando:
pq
pq 
lp ∉  p − Z
,
p
+
Z

α/2
α/2

n
n 

siendo p la proporción de la población, q = 1 − p, Zα el valor correspondiente en la tabla normal
para una confianza de 1 − α (significación α) y n el tamaño muestral. En nuestro caso se tiene:
α = 0,01
Zα/2 = 3,27
n = 300
p = 0,06
y
q = 0,94
Luego:

0, 06·0,94
0, 06·0,94 
;0, 06 + 3, 27·
 0, 06 − 3, 27·
 = (0,015; 0,105)
300
300


l
Como p ∈ (0,015; 0,105), no puede rechazarse la hipótesis nula. Por tanto, debe aceptarse la
afirmación de la marca.
b) Para la misma proporción lp = 0,07 y, para un nivel de confianza del 95 %, Zα/2 = 1,96, si se
desea que el error Z α/2
lpq
< 0,01, se tendrá:
n
0, 07·0,93
< 0,01
⇒
n
El tamaño muestral mínimo debe ser n = 2501.
1,96·
n>
1,962 ·0, 07·0,93
= 2500,9
0, 012
8. Un 10 % de quienes utilizan cierto analgésico sufren pequeñas molestias gástricas. Un nuevo
producto tiene un mayor poder analgésico, pero sin embargo parece que es más fácil que ocasione
esos pequeños efectos secundarios. De hecho, 21 personas afirmaron haberlos sufrido, de una
muestra de 140 que habían utilizado el nuevo medicamento.
a) Plantea un test para contrastar la hipótesis de que con el nuevo medicamento se corre el mismo
riesgo de padecer efectos secundarios que con el otro, frente a que, como parece, el riesgo es mayor.
Explica qué tipo de errores se pueden cometer al obtener las conclusiones y cómo se llaman.
b) Explica claramente a qué conclusión se llega en el test planteado en el apartado anterior para un
nivel de significación del 2 %.
Solución:
a) Se trata de un contraste de hipótesis sobre la proporción.
Con el analgésico anterior: p = 0,10
Con el analgésico nuevo: p nuevo = 21/140 = 0,15
El contraste es unilateral, de una cola.
Hipótesis nula, H0: p ≤ 0,10 (la proporción sigue igual o incluso bajó)
Hipótesis alternativa, H1: p > 0,10 (la proporción subió)
Si se admite la hipótesis alternativa, que la proporción de molestias subió, siendo falsa se comete un
error de Tipo I. (esto es, se rechaza H0 siendo verdadera)
El error de Tipo II consiste en no admitir la hipótesis alternativa siendo verdadera (esto es, no
rechazar H0 siendo falsa)
Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando:
p0 q0
p0 q0
⇔ p nuevo – p > Zα
p nuevo > p + Zα
n
n
Dpto. de Matemáticas
5/9
IES “Ramón Olleros”
siendo p la proporción poblacional, n el tamaño muestral, p nuevo la proporción muestral y Zα el
valor correspondiente en la tabla normal para una confianza de 1 −α.
En nuestro caso, para el 98 % de confianza, Zα = 2,06. Luego:
pq
0,1·0,9
= 2,06 ·
≈ 0,052
Zα
n
140
Como p nuevo – p = 0,15 − 0,10 = 0,05 < 0,052, no hay evidencia estadística suficiente para rechazar
la hipótesis nula.
9. Una fábrica de muebles se encargaba también del transporte y montaje de los pedidos a sus
clientes. Sin embargo, recibía aproximadamente un 16 % de reclamaciones por dicho servicio. En
los últimos meses, ha contratado una empresa especializada. De 250 servicios realizados por la
empresa contratada, 30 han tenido reclamación.
a) Plantea un test para contrastar la hipótesis de que con la empresa contratada la situación sigue
igual, frente a que, como parece, ha mejorado. ¿A qué conclusión se llega para un nivel de
significación del 5 %?
b) Calcula un intervalo de confianza del 95 % para la proporción de servicios reclamados con la
empresa contratada.
Solución:
La proporción inicial es p = 0,16.
La proporción de la muestra es lp = 30/250 = 0,12
a) Se trata de un contraste de hipótesis unilateral (de la cola derecha)
Hipótesis nula: H0: p ≥ 0,16
Hipótesis alternativa: H1: p < 0,16
Se rechaza H0, con un nivel de significación α, si:
lp < p – Zα pq , o bien, si lp ∉  p − Z pq , + ∞ 
α


n
n


Esto equivale a admitir que la proporción ha disminuido. En este caso, el área α se toma íntegra en
la cola izquierda de la campana. Para n = 250, lp = 0,12 y α = 0,05 (Z0,05 = 1,64), se tiene que:
p – Zα
pq
0,16·0,84
= 0,16 – 1,64
= 0,16 – 0,023 = 0,137
n
250
Como lp = 0,12 < 0,137 hay que rechazar H0: hay evidencias estadísticas de que la situación ha
mejorado (la proporción ha disminuido).
b) El intervalo de confianza de la proporción, con un nivel de confianza de 1 − α, es:

lpq
lp q 
 lp − Z α / 2

, lp + Z α / 2

n
n 


l
l
siendo p la proporción de la muestra y q = 1 − p , n el tamaño muestral y Zα/2 el valor
correspondiente en la tabla normal para una significación α. En nuestro caso:

lpq
lp q  
0,12·0,88
0,12·0,88 
 lp − Z α / 2
 =  0,12 − 1,96
,
0,12
1,96
, lp + Z α / 2
+
 = (0,10; 0,14)

n
n  
250
250 


Dpto. de Matemáticas
6/9
IES “Ramón Olleros”
10. El consumo de carne pollo parece haberse disparado desde que hace unos meses cundió la
alarma sobre otros tipos de carne. En cierta carnicería, las ventas diarias de carne de pollo seguían
hasta entonces una Normal de media 19 kilos y desviación típica 3 kilos. En una muestra de 35 días
posteriores a la citada alarma, se obtuvo una media de 21 kilos de carne de pollo vendidos al día.
Suponiendo que las ventas siguen siendo una Normal con la misma desviación típica.
a) Plantear un test para contrastar que la venta de pollo no ha aumentado, frente a que sí lo ha
hecho, como parecen indicar los datos. ¿A qué conclusión se llega a un nivel de significación del
5%?
b) Calcula un intervalo de confianza del 95 % para la venta diaria media de carne de pollo después
de la alarma?
Solución:
a) Se trata de un contraste de hipótesis sobre la media. En concreto, un contraste unilateral (cola
derecha), que se formula así:
Hipótesis nula, H0: µ ≤ 19
Hipótesis alternativa, H1: µ > 19
Se rechaza H0, con un nivel de significación α, si:
σ
σ 

o bien
x > µ + Zα
x ∉  −∞,µ + Z α

n
n

siendo x la nueva media, que en este caso vale 21, σ la desviación típica y Zα el valor
correspondiente al nivel de significación α. (Si se rechaza H0 debe admitirse H1).
En nuestro caso, para α = 0,05, Zα = 1,64. Luego:
σ
3
= 19 + 1,64 ·
µ + Zα
= 19,83
n
35
Como x = 21 > 19, se rechaza la hipótesis nula, y por tanto se admite que la media ha aumentado.
b) El intervalo de confianza de la media poblacional, para las muestras de tamaño muestral n, de
media x y desviación típica σ es:
σ
σ 

, x + Zα / 2
 x − Zα / 2

n
n

siendo Zα/2 el valor correspondiente en la tabla normal para una confianza de 1 − α.
Para x = 21, σ = 3, n = 35 y, para el 95 % de confianza, Zα/2 = 1,96, se tiene:
σ
σ  
3
3 

, 21 + 1,96
, x + Zα / 2
 = (20,01; 21,99)
 x − Zα / 2
 =  21 − 1,96
35
35 
n
n 

11. Hace diez años la proporción poblacional de personas que leían el periódico LA CIUDAD era
del 35 %. Para comprobar si dicha proporción se mantiene tomamos una muestra de 225 personas
de las cuales sólo 65 leen LA CIUDAD.
a) Si α = 0,05, ¿podemos aceptar que la proporción de personas que leen dicho periódico es mayor
o igual al 35% frente a que ha disminuido?
b) ¿Se concluiría lo mismo si el nivel de significación es del 1 %?
Solución:
a) Se trata de realizar un contraste de hipótesis unilateral. Se realiza como sigue:
Hipótesis nula, H0: p ≥ 0,35
Hipótesis alternativa, H1: p < 0,35
Se rechaza H0, con un nivel de significación α, si:
Dpto. de Matemáticas
7/9
IES “Ramón Olleros”
lp < p − Z
α
pq
n
o bien
⇔
lp ∉  p − Z
α



pq
, + ∞ 
n

siendo lp la proporción de la media muestral y Zα el valor correspondiente en la tabla normal para
una significación α. Esto equivale a admitir que la proporción ha disminuido.
En este caso:
lp = 65/225 = 0,2889
p = 0,35
Zα = 1,645
y
n = 225
Por tanto:
pq
0,35·0, 65
= 0,35 – 1,645 ·
= 0,2977
p − Zα
225
n
Como, lp = 0,2889 < 0,2977 hay que rechazar H0 con ese nivel de significación. Luego la
proporción de lectores de dicho periódico ha disminuido.
b) Para α = 0,01, Zα = 2,33. Por tanto:
pq
0,35·0, 65
= 0,35 + 2,33 ·
= 0,0320
p − Zα
225
n
Como, lp = 0,2889 > 0,0320 no se puede rechazar H0 para este nivel de significación. Esto es, no se
puede admitir que la proporción de lectores ha disminuido.
Nota: Al aumentar la significación disminuye nuestra confianza en el resultado; por eso, lo que se
admite con una confianza del 95 % puede rechazarse si exigimos una confianza del 99 %.
12. Hace 10 años, se hizo un amplio estudio y se concluyó que, como máximo, el 40 % de los
estudiantes universitarios eran fumadores. Para ver si actualmente se mantienen las mismas
conclusiones, se tomó una muestra de 78 estudiantes entre los que 38 eran fumadores.
a) Con un nivel de significación del 10 %, ¿se acepta que el porcentaje de fumadores entre los
universitarios es menor o igual que el 40 %?
b) Se amplió la encuesta hasta 120 personas, y se obtuvo que 54 eran fumadores. Con un nivel de
significación del 5 %, ¿se tomaría la misma decisión que en el apartado anterior?
Solución:
La proporción de la muestra es:
lp = 38 = 0,487
78
a) Se trata de un contraste unilateral.
Hipótesis nula: H0: p ≤ 0,40
Hipótesis alternativa: H1: p > 0,40 (la proporción de fumaderos aumentó)
Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para un nivel de significación α,
cuando:
lp > p + Z pq
lp ∉  −∞, p + Z pq 
o bien
α
α

n 
n

siendo p la proporción de la población, q = 1 − p, Zα el valor correspondiente en la tabla normal
para una confianza de 1 − α (significación α) y n el tamaño muestral.
En nuestro caso se tiene:
α = 0,10
Zα = 1,28
n = 78
p = 0,40
y
q = 0,60
Luego:
Dpto. de Matemáticas
8/9
IES “Ramón Olleros”
p + Zα
pq
= 0,40 + 1,28 ·
n
0, 40·0, 60
≈ 0,471
78
Como lp = 0,487 > 0,471, se rechaza la hipótesis nula; esto es, el porcentaje de fumadores ha
aumentado, esto es, es mayor del 40 %.
54
b) Para n = 120, lp =
= 0,45 y para un nivel de confianza del 95 %, Zα = 1,645, se tiene que:
120
pq
0, 40·0, 60
p + Zα
= 0,40 + 1,645 ·
≈ 0,474
120
n
En este caso, lp = 0,45 < 0,474, por tanto, en este caso, no puede rechazarse la hipótesis nula, esto
es, no se acepta que el porcentaje de fumadores ha aumentado.
Dpto. de Matemáticas
9/9
IES “Ramón Olleros”
Descargar