Métodos Estad´ısticos de la Ingenier´ıa Práctica 6: Intervalos de

Anuncio
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6: Intervalos de Confianza y Contrastes de Hipótesis
Área de Estadı́stica e Investigación Operativa
Mariano Amo Salas y Licesio J. Rodrı́guez-Aragón
Abril 2010
Contenidos Práctica 6 . . . . . . . . . . . . . .
Intervalo de Confianza . . . . . . . . . . . . . .
Intervalo de Confianza para p . . . . . . . . .
El valor z ⋆ . . . . . . . . . . . . . . . . . . . . . .
Construcción de un Intervalo de Confianza
Contraste de Hipótesis . . . . . . . . . . . . . .
Contraste Bilateral. . . . . . . . . . . . . . . . .
Contraste Unilateral . . . . . . . . . . . . . . . .
Intervalo de confianza para µ. . . . . . . . . .
Contraste de Hipótesis . . . . . . . . . . . . . .
Contraste Bilateral. . . . . . . . . . . . . . . . .
Contraste Unilateral . . . . . . . . . . . . . . . .
Ejercicios . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
3
4
5
6
7
8
9
10
11
12
13
14
Contenidos Práctica 6
Intervalos de Confianza para p.
Contrastes de Hipótesis para p.
– Contraste Bilateral.
– Contraste Unilateral.
Intervalos de Confianza para µ.
Contrastes de Hipótesis para µ.
– Contraste Bilateral.
– Contraste Unilateral.
Ejercicios.
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 2 / 14
Intervalo de Confianza
Siempre que tomamos una medida o hacemos un muestreo (observar una muestra de una población)
obtenemos una medida diferente de la cualidad a observar.
Los errores de medición y el azar en la selección de la muestra hacen que nuestra variable de interés se
comporte como una variable aleatoria.
Muchas veces resulta necesario indicar no sólo un valor de referencia, sino un intervalo de valores.
Cuando observamos una V.A. discreta (binaria) se suele considerar la proporción, p, de
individuos que tienen una determinada caracterı́stica.
Cuando observamos una V.A. continua la media, µ, suele proporcionar una medida de tendencia
central.
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 3 / 14
2
Intervalo de Confianza para p
Diremos que la proporción p es la proporción de individuos a favor o en contra de algo, o la
proporción de piezas con una determinada caracterı́stica, por ejemplo defectuosas.
Esta proporción p suele ser desconocida y conocer su valor implicarı́a preguntar o muestrear toda la
población.
Normalmente se toma una muestra de tamaño n y se obtiene p̂ que es el valor que toma la proporción
en la muestra de tamaño n. Sabemos que p̂ sigue una distribución Binomial, que se puede aproximar
por una distribución normal, con n suficientemente grande y verificándose n > 20 y np(1 − p) > 35.
p
p̂ ≡ N (p, p(1 − p)/n)
Podemos entonces estandarizar p̂ y considerar la V.A. Z:
p̂ − p
Z=q
p(1−p)
n
≡ N (0, 1).
Cada vez que tomemos una muestra de tamaño n de la población, obtendremos un valor diferente
de p̂ y de Z.
Buscamos entonces un intervalo, que con un grado de confianza dado γ = (1 − α), en el que esté el
valor de p̂ o Z.
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 4 / 14
3
El valor z ⋆
En definitiva buscamos valores z1 y z2 tales que,
P (z1 ≤ Z ≤ z2 ) = 1 − α.
La distribución normal es simétrica con lo que tendremos que −z1 = z2 = z ⋆ ,
p̂ − p
P (−z ⋆ ≤ q
p(1−p)
n
≤ z ⋆ ) = 1 − α.
Pero la desviación tı́pica
p de p̂ incluye el valor p desconocido, para resolver esto aproximamos la
desviación tı́pica por p̂(1 − p̂)/(n − 1), con lo que
p̂ − p
P (−z ⋆ ≤ q
p̂(1−p̂)
n−1
≤ z ⋆ ) = 1 − α.
El intervalo de confianza vendrá entonces dado por,
p
p
(p̂ − z ⋆ p̂(1 − p̂)/(n − 1), p̂ + z ⋆ p̂(1 − p̂)/(n − 1)),
que contendrá el valor de p con una confianza de 1 − α medida en términos de probabilidad.
α
= P (Z ≤ −z ⋆ )
2
En R y para una confianza 1 − α del 95%:
ó
1−
α
= P (Z ≤ z ⋆ )
2
>alfa<-0.05
>z1<-qnorm(alfa/2)
>z2<-qnorm(1-alfa/2)
Comprobándose que −z1 = z2 = z ⋆ :
>zestrella<--z1
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 5 / 14
4
Construcción de un Intervalo de Confianza
Supongamos ahora que del total de piezas recibidas en una fábrica hemos sometido a control de
calidad a 1000 de ellas.
De estas 1000 piezas muestreadas 120 han resultado defectuosas, podrı́amos estableces un intervalo
de confianza al 95% para la proporción de piezas defectuosas:
>n<-1000
>prop<-120/n
>alfa<-0.05
>zestrella<--qnorm(alfa/2)
>c(prop-zestrella*(sqrt(prop*(1-prop)/(n-1))), +
prop+zestrella*(sqrt(prop*(1-prop)/(n-1))))
R también genera los intervalos de confianza con la instrucción:
>prop.test(x=120,n=1000,conf.level=0.95)
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 6 / 14
Contraste de Hipótesis
La instrucción prop.test no sólo nos facilita la construcción de intervalos de confianza sino que nos
permite realizar contrastes de hipótesis.
Si p0 es un valor dado, podemos considerar el siguiente contraste de hipótesis:
H 0 : p = p0
H1 : p 6= p0
Tomando una muestra de tamaño n, obteniendo p̂ y usando el estadı́stico,
Z=p
p̂ − p0
≡ N (0, 1) condicionado a H0 .
p0 (1 − p0 )/n
El contraste da como resultado un p−valor, que es la probabilidad de obtener un valor tan extremo
como el estadı́stico Z obtenido, condicionado a la hipótesis nula H0 .
p − valor = P (|p̂ − p0 | ≥ |valor observado − p0 ||H0 )
Cuanto menor es el p−valor, menos probable es que se cumpla la hipótesis nula H0 . En ese caso
decimos que el valor de p indica diferencias significativas entre p y p0 .
Normalmente rechazaremos la hipótesis nula H0 para valores,
p ≤ 0.05
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 7 / 14
5
Contraste Bilateral
Un proveedor nos proporciona un lote de piezas asegurándonos que la proporción de piezas defectuosas
es del 2%. Hemos muestreado 500 piezas y hemos comprobado que 17 de ellas resultan defectuosas.
H0 : p = 0.02
H1 : p 6= 0.02
En nuestro muestreo obtenemos p̂ = 14/500 y el contraste:
>prop.test(x=17,n=500,p=0.02,alt="two.sided")
0.1
0.2
0.3
0.4
Resultando el contraste claramente significativo con lo que rechazaremos la hipótesis nula.
0.025
0.025
0.0
Z
−2
0
2
4
0.1
0.2
0.3
0.4
−4
0.0189
0.0
0.0189
−4
−2
0
Métodos Estadı́sticos de la Ingenierı́a
2
4
Práctica 6 – 8 / 14
6
Contraste Unilateral
Si el proveedor nos asegurase que el porcentaje de piezas defectuosas es menor o igual al 2%:
H0 : p ≤ 0.02
H1 : p > 0.02
>prop.test(x=17,n=500,p=0.02,alt="greater")
0.1
0.2
0.3
0.4
Nuevamente el resultado del contraste es significativo, luego no nos queda más remedio que rechazar
la hipótesis nula.
0.05
0.0
Z
−2
0
2
4
0.1
0.2
0.3
0.4
−4
0.0
0.0189
−4
−2
0
2
4
Para considerar la H1 : p < 0.02 usarı́amos la opción alt="less".
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 9 / 14
7
Intervalo de confianza para µ
De forma equivalente a como hemos hecho con las proporciones, podemos construir intervalos de
confianza para la media, µ:
T =
X̄ − µ
√ ≡ tn−1
Sc / n
y el intervalo para un grado de confianza de γ = 1 − α serı́a:
Sc
Sc
(X̄ − tn−1, 1+γ √ , X̄ + tn−1, 1+γ √ )
2
2
n
n
Consideremos las mediciones del grosor del recubrimiento aislante de 10 equipos:
>aislante<-c(10.3,10.1,9.8,9.9,10.2,
+ 10.1,9.7,9.9,9.7,10.2)
Entonces la instrucción,
>t.test(aislante, conf.level=0.95)
nos proporcionará el intervalo de confianza al 95% del grosor del recubrimiento.
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 10 / 14
Contraste de Hipótesis
La instrucción t.test no sólo nos facilita la construcción de intervalos de confianza sino que nos
permite realizar contrastes de hipótesis.
Si µ0 es un valor dado, podemos considerar el siguiente contraste:
H 0 : µ = µ0
H1 : µ 6= µ0
Tomando una muestra de tamaño n, obteniendo X̄ y usando el estadı́stico,
T =
X̄ − µ
√ ≡ tn−1 condicionado a H0
Sc / n
El contraste nos devolverá un p−valor, que es la probabilidad de obtener un valor tan extremo como
el estadı́stico T obtenido, condicionado a la hipótesis nula H0 .
Cuanto menor es el p−valor, menos probable es que se cumpla la hipótesis nula H0 . En ese caso
decimos que el valor de p indica diferencias significativo entre µ y µ0 .
Normalmente rechazaremos la hipótesis nula H0 para valores,
p ≤ 0.05
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 11 / 14
8
Contraste Bilateral
Considerando que la protección de aislante está especificada a 10, ¿Podemos asegurar que esta
hipótesis se cumple?
H0 : µ = 10
H1 : µ 6= 10
>t.test(aislante,mu=10,alt="two.sided")
0.1
0.2
0.3
0.4
Resultando en este caso el contraste claramente no significativo por lo que podremos aceptar la
hipótesis nula.
0.0
0.025
0.025
T
−2
−1
0
1
2
3
2
3
0.1
0.2
0.3
0.4
−3
0.44
0.0
0.44
−3
−2
−1
0
Métodos Estadı́sticos de la Ingenierı́a
1
Práctica 6 – 12 / 14
9
Contraste Unilateral
Ahora bien, el exceso de aislante no nos preocupa, lo que verdaderamente nos interesa es que el grosor
de aislante no sea inferior a 10.
H0 : µ ≥ 10
H1 : µ < 10
>t.test(aislante,mu=10,alt="less")
0.1
0.2
0.3
0.4
Nuevamente el resultado del contraste es no significativo, luego podremos aceptar la hipótesis nula.
0.0
0.05
T
−2
−1
0
1
2
3
0
1
2
3
0.1
0.2
0.3
0.4
−3
0.0
0.44
−3
−2
−1
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 13 / 14
10
Ejercicios
Ejercicio 6.1: El equipo directivo de una empresa automovilı́stica ha encargado un sondeo que mida
el grado de satisfacción de los clientes que adquirieron hace más de un año un determinado modelo.
Obtener intervalos de confianza y realizar contrastes de hipótesis de la medida obtenida.
Ejercicio 6.2: En un proceso de depuración y control de aguas residuales, se mide el contenido de
biomasa de en miligramos por litro de agua. Se ha tomado una muestra de cada uno de los 10
tanques de depuración. Obtener intervalos de confianza y realizar contrastes de hipótesis de la medida
obtenida.
Métodos Estadı́sticos de la Ingenierı́a
Práctica 6 – 14 / 14
11
Descargar