Métodos Estad´ısticos de la Ingenier´ıa Tema 11: Contrastes de

Anuncio
Métodos Estadı́sticos de la Ingenierı́a
Tema 11: Contrastes de Hipótesis
Grupo B
Área de Estadı́stica e Investigación Operativa
Licesio J. Rodrı́guez-Aragón
Abril 2010
Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Conceptos Generales
3
Contrastes de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Pruebas relacionadas con la Media de una Población
Prueba para µ = µ0 cuando σ es Conocida. . . . . . . . . . .
Prueba para µ ≤ µ0 cuando σ es Conocida. . . . . . . . . . .
Prueba para µ = µ0 cuando σ es Desconocida . . . . . . . .
Ejemplo de contraste de hipótesis con R . . . . . . . . . . . .
Prueba para µ ≤ µ0 cuando σ es Desconocida . . . . . . . .
Ejemplo de contraste de hipótesis con R . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Pruebas relacionadas con las Medias de dos Poblaciones Independientes
Prueba para µ1 = µ2 cuando σ1 y σ2 son Conocidas . . . . . . . . . . . . . . . . . . . .
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Conocidas . . . . . . . . . . . . . . . . . . . .
Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas pero Iguales. . . . . . . . .
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas pero Iguales. . . . . . . . .
Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas y Distintas . . . . . . . . .
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas y Distintas . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
. 7
. 8
. 9
10
12
13
.
.
.
.
.
.
15
16
17
18
19
20
21
Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas
22
Prueba para µ1 = µ2 cuando σ1 , σ2 y ρ son Desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Prueba para µ1 ≤ µ2 cuando σ1 , σ2 y ρ son Desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Pruebas relacionadas con las Varianzas de dos Poblaciones
25
2
2
Prueba para σ1 = σ2 con µ1 y µ2 Desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Prueba para σ12 ≤ σ22 con µ1 y µ2 Desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Pruebas relacionadas con Proporciones
28
Prueba para p = p0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Prueba para p ≤ p0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Contrastes de Hipótesis: p-valor
31
p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
Contenidos
Conceptos Generales.
Pruebas relacionadas con la media de una población.
Pruebas relacionadas con la igualdad de medias de dos poblaciones.
Pruebas para datos relacionados.
Pruebas para las varianzas.
Pruebas para proporciones.
Los contrastes de hipótesis permitirán decidirnos entre dos hipótesis formuladas
previamente con un determinado nivel de error.
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 2 / 32
2
3 / 32
Conceptos Generales
Contrastes de Hipótesis
Una Hipótesis Estadı́stica es una proposición que se establece acerca de una o más poblaciones:
Acerca de los parámetros de una distribución.
Acerca de el tipo y forma de la distribución.
Los contrastes de hipótesis se basan en la información proporcionada por una muestra.
La terminologı́a estadı́stica habla de Aceptar o Rechazar una hipótesis:
Rechazar, significa que la hipótesis es falsa.
Aceptar, solamente implica que no se tiene suficiente información para rechazarla.
Las Hipótesis se plantean sobre los posibles valores que puede tomar un parámetro poblacional.
Hipótesis Simples, son aquellas que sólo plantean un valor posible para el parámetro.
Hipótesis Compuestas, establecen un rango de valores que puede tomar el parámetro
poblacional.
Se plantea en el contraste dos Hipótesis excluyentes y complementarias:
Hipótesis Nula, H0 : Suele ser la más concreta, la que contenga el signo de igualdad, suele
ser simple.
Hipótesis Alternativa, H1 : Complementaria a la Nula, suele ser compuesta.
El planteamiento de H0 permite elaborar un modelo probabilı́stico a partir del cual podemos
llegar a la decisión final.
γ
0.2
Densidad
0.3
0.4
El Contraste de Hipótesis conlleva establecer dos zonas disjuntas y complementarias, Zona de
Rechazo de H0 (Región Crı́tica) y la Zona de Aceptación de H0 .
1−α
α 2
0.1
α 2
0.0
Z((1 − γ) 2)
−3
−2
Z((1 + γ) 2)
−1
0
1
2
3
Z
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 4 / 32
3
Contrastes de Hipótesis
La decisión de aceptar o rechazar H0 se basa en probabilidades, no en certezas, al tomar la
decisión podemos cometer dos tipo de errores.
Error Tipo I: Rechazar la Hipótesis Nula, H0 siendo verdadera.
Error Tipo II: Aceptar la Hipótesis Nula, H0 siendo falsa.
Aceptar H0
Rechazar H0
H0 Verdadera
Decisión Correcta
1−α
Error Tipo I
α
H0 Falsa
Error Tipo II
β
Decisión Correcta
1−β
Las probabilidades de los Errores de tipo I y II son probabilidades condicionadas:
Nivel de Significación, α:
α = P(Error I) = P(Rechazar H0 |H0 Verdadera)
Nivel de Confianza, 1 − α = γ:
γ = 1 − P(Error I) = P(Aceptar H0 |H0 Verdadera)
β = P(Error II) = P(Aceptar H0 |H0 Falsa)
Al valor complementario de β se le denomina Potencia del Contraste, 1 − β
1 − β = P(Rechazar H0 |H0 Falsa)
El objetivo serı́a disponer de un contraste que maximicen la Confianza (γ = 1 − α) y la
Potencia (1 − β) y minimizen los Errores de tipo I y II, esto se logra aumentando el tamaño
de la muestra n, hasta un cierto valor.
El nivel de Significación α es normalmente controlado por el experimentador mientras que β es
controlado mediante la elección correcta del tamaño de la muestra.
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 5 / 32
4
Pruebas relacionadas con la Media de una Población
6 / 32
Prueba para µ = µ0 cuando σ es Conocida
Consideremos el problema de probar la hipótesis de que la media de una población, con varianza
σ 2 conocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral de
que la media sea diferente.
H 0 : µ = µ0
H1 : µ 6= µ0
Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media
muestral X.
√
El Teorema Central del Limite nos asegura que X ≡ N (µ, σ/ n).
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
Z = (X − µ0 )/(σ/ n) ≡ N (0, 1) bajo H0 .
Los valores crı́ticos se obtienen,
√
√
(a − µ0 )/(σ/ n) = z α2 = z 1−γ ⇒ a = µ0 + (σ/ n)z α2
2
√
√
α
(b − µ0 )/(σ/ n) = z1− 2 = z 1+γ ⇒ b = µ0 + (σ/ n)z1− α2
γ
0.2
Densidad
0.3
0.4
2
1−α
0.1
α 2
α 2
0.0
Z(α 2)
−3
−2
Z(1 − α 2)
−1
0
1
2
3
Z
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico Z = (X − µ0 )/(σ/ n)
caerá en la Región de Aceptación,
|Z| < z1− α2 ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
|Z| ≥ z1− α2 ,
se rechazará H0 .
Los Coeficientes de Confianza o Niveles de Significación más usuales son:
γ = 0.95, α = 0.05 ⇒ z 1+γ = z1− α2 = z0.975 = 1.96,
2
γ = 0.99, α = 0.01 ⇒ z 1+γ = z1− α2 = z0.995 = 2.58.
2
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 7 / 32
5
Prueba para µ ≤ µ0 cuando σ es Conocida
En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2
conocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa
unilateral de que la media sea mayor.
H 0 : µ ≤ µ0
H 1 : µ > µ0
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
Z = (X − µ0 )/(σ/ n) ≡ N (0, 1) bajo H0 .
El valor crı́tico se obtiene,
γ
0.2
Densidad
0.3
0.4
√
√
(a − µ0 )/(σ/ n) = z1−α = zγ ⇒ a = µ0 + (σ/ n)z1−α
1−α
0.1
α
0.0
Z(1 − α)
−3
−2
−1
0
1
2
3
Z
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico Z = (X − µ0 )/(σ/ n) caerá
en la Región de Aceptación,
Z < z1−α ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
Z ≥ z1−α ,
se rechazará H0 .
Los Coeficientes de Confianza o Niveles de Significación más usuales son:
γ = 0.95, α = 0.05 ⇒ zγ = z1−α = z0.95 = 1.65,
γ = 0.99, α = 0.01 ⇒ zγ = z1−α = z0.99 = 2.33.
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 8 / 32
6
Prueba para µ = µ0 cuando σ es Desconocida
Consideremos el problema de probar la hipótesis de que la media de una población, con varianza
σ 2 desconocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral
de que la media sea diferente.
H 0 : µ = µ0
H1 : µ 6= µ0
Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media
muestral X.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 .
Los valores crı́ticos se obtienen,
γ
0.2
Densidad
0.3
0.4
√
a = µ0 + (Sc / n)tn−1, α2
√
b = µ0 + (Sc / n)tn−1,1− α2
α 2
t(α 2)
0.0
0.1
1−α
α 2
−3
−2
t(1 − α 2)
−1
0
1
2
3
T
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico T = (X − µ0 )/(Sc / n)
caerá en la Región de Aceptación,
|T | < tn−1,1− α2 ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
|T | ≥ tn−1,1− α2 ,
se rechazará H0 .
Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20:
γ = 0.95, α = 0.05 ⇒ t19, 1+γ = t19,1− α2 = t19,0.975 = 2.09,
2
γ = 0.99, α = 0.01 ⇒ t19, 1+γ = t19,1− α2 = t19,0.995 = 2.86.
2
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 9 / 32
7
Ejemplo de contraste de hipótesis con R
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5)
> t.test(x, mu = 15, alt = "two.sided", conf.level = 0.95)
One Sample t-test
data: x
t = 0.6359, df = 9, p-value = 0.5407
alternative hypothesis: true mean is not equal to 15
95 percent confidence interval:
13.56776 17.55224
sample estimates:
mean of x
15.56
> pt(0.6359, df = 9)
[1] 0.7296637
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 10 / 32
Ejemplo de contraste de hipótesis con R
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5)
> t.test(x, mu = 18, alt = "two.sided", conf.level = 0.95)
One Sample t-test
data: x
t = -2.7706, df = 9, p-value = 0.02173
alternative hypothesis: true mean is not equal to 18
95 percent confidence interval:
13.56776 17.55224
sample estimates:
mean of x
15.56
> pt(-2.7706, df = 9)
[1] 0.01086609
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 11 / 32
8
Prueba para µ ≤ µ0 cuando σ es Desconocida
En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2
desconocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa
unilateral de que la media sea mayor.
H 0 : µ ≤ µ0
H 1 : µ > µ0
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
√
T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 .
El valor crı́tico se obtiene,
γ
0.2
Densidad
0.3
0.4
√
√
(a − µ0 )/(Sc / n) = tn−1,1−α = tn−1,γ ⇒ a = µ0 + (Sc / n)tn−1,1−α
1−α
0.1
α
0.0
t(1 − α)
−3
−2
−1
0
1
2
3
T
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X.
√
Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico T = (X − µ0 )/(Sc / n)
caerá en la Región de Aceptación,
T < tn−1,1−α ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
T ≥ tn−1,1−α ,
se rechazará H0 .
Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20:
γ = 0.95, α = 0.05 ⇒ tn−1,γ = tn−1,1−α = t19,0.95 = 1.73,
γ = 0.99, α = 0.01 ⇒ tn−1,γ = tn−1,1−α = t19,0.99 = 2.54.
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 12 / 32
9
Ejemplo de contraste de hipótesis con R
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5)
> t.test(x, mu = 15, alt = "greater", conf.level = 0.95)
One Sample t-test
data: x
t = 0.6359, df = 9, p-value = 0.2703
alternative hypothesis: true mean is greater than 15
95 percent confidence interval:
13.94561
Inf
sample estimates:
mean of x
15.56
> pt(0.6359, df = 9)
[1] 0.7296637
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 13 / 32
10
Ejemplo de contraste de hipótesis con R
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5)
> t.test(x, mu = 12, alt = "greater", conf.level = 0.95)
One Sample t-test
data: x
t = 4.0423, df = 9, p-value = 0.001459
alternative hypothesis: true mean is greater than 12
95 percent confidence interval:
13.94561
Inf
sample estimates:
mean of x
15.56
> pt(4.0423, df = 9)
[1] 0.9985408
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 14 / 32
11
Pruebas relacionadas con las Medias de dos Poblaciones Independientes
15 / 32
Prueba para µ1 = µ2 cuando σ1 y σ2 son Conocidas
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 conocidas, sean iguales, en contra de una hipótesis
alternativa bilateral de que las medias sean diferentes.
H 0 : µ1 = µ2
H1 : µ1 6= µ2
El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales
X 1 − X 2.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(X 1 − X 2 )
≡ N (0, 1) bajo H0 .
σ12 /n1 + σ22 /n2
γ
0.2
Densidad
0.3
0.4
Z=p
1−α
0.1
α 2
α 2
0.0
Z(α 2)
−3
−2
Z(1 − α 2)
−1
0
1
2
3
Z
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose Z.
La Región de Aceptación vendrá definida por,
|Z| < z1− α2 ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
|Z| ≥ z1− α2 ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 16 / 32
12
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Conocidas
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 conocidas, sean µ1 ≤ µ2 , en contra de una hipótesis
alternativa unilateral de que sean µ1 > µ2 .
H 0 : µ1 ≤ µ2
H 1 : µ1 > µ2
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(X 1 − X 2 )
≡ N (0, 1) bajo H0 .
σ12 /n1 + σ22 /n2
γ
0.2
Densidad
0.3
0.4
Z=p
1−α
0.1
α
0.0
Z(1 − α)
−3
−2
−1
0
1
2
3
Z
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
Z < z1−α ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
Z ≥ z1−α ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 17 / 32
13
Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas pero Iguales
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 desconocidas e iguales, sean iguales, en contra de una
hipótesis alternativa bilateral de que las medias sean diferentes.
H 0 : µ1 = µ2
H1 : µ1 6= µ2
El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales
X 1 − X 2.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(X 1 − X 2 )
n1 S12 +n2 S22 1
n1 +n2 −2 ( n1
+
1
n2 )
≡ tn1 +n2 −2 bajo H0 .
γ
0.2
Densidad
0.3
0.4
T =q
α 2
t(α 2)
0.0
0.1
1−α
α 2
−3
−2
t(1 − α 2)
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
|T | < tn−1,1− α2 ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
|T | ≥ tn−1,1− α2 ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 18 / 32
14
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas pero Iguales
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 desconocidas e iguales, sean µ1 ≤ µ2 , en contra de una
hipótesis alternativa unilateral de que sean µ1 > µ2 .
H 0 : µ1 ≤ µ2
H 1 : µ1 > µ2
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(X 1 − X 2 )
n1 S12 +n2 S22 1
n1 +n2 −2 ( n1
+
1
n2 )
≡ tn1 +n2 −2 bajo H0 .
γ
0.2
Densidad
0.3
0.4
T =q
1−α
0.1
α
0.0
t(1 − α)
−3
−2
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
T < tn1 +n2 −2,1−α ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
T ≥ tn1 +n2 −2,1−α ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 19 / 32
15
Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas y Distintas
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 desconocidas y distintas, sean iguales, en contra de una
hipótesis alternativa bilateral de que las medias sean diferentes.
H 0 : µ1 = µ2
H1 : µ1 6= µ2
El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales
X 1 − X 2.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(X 1 − X 2 )
T =q 2
≡ tg bajo H0 , con g =
Sc 1
Sc22
+
n1
n2
Sc21
n1
+
2
(Sc22 /n2 )2
n2 −1
.
γ
0.2
Densidad
0.3
0.4
(Sc21 /n1 )2
n1 −1
+
Sc22
n2
α 2
t(α 2)
0.0
0.1
1−α
α 2
−3
−2
t(1 − α 2)
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
|T | < tg,1− α2 ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
|T | ≥ tg,1− α2 ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 20 / 32
16
Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas y Distintas
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con varianzas σ12 y σ22 desconocidas y distintas, sean µ1 ≤ µ2 , en contra de una
hipótesis alternativa unilateral de que sean µ1 > µ2 .
H 0 : µ1 ≤ µ2
H 1 : µ1 > µ2
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
Sc21
n1
(Sc21 /n1 )2
n1 −1
+
+
Sc22
n2
2
(Sc22 /n2 )2
n2 −1
.
γ
0.2
Densidad
0.3
0.4
(X 1 − X 2 )
T =q 2
≡ tg bajo H0 , con g =
Sc 1
Sc22
+
n1
n2
1−α
0.1
α
0.0
t(1 − α)
−3
−2
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
T < tg,1−α ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
T ≥ tg,1−α ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 21 / 32
17
Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas
22 / 32
Prueba para µ1 = µ2 cuando σ1 , σ2 y ρ son Desconocidos
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales y
apareadas, con σ12 , σ22 y ρ desconocidos, sean iguales, en contra de una hipótesis alternativa
bilateral de que las medias sean diferentes.
H 0 : µ1 = µ2
H1 : µ1 6= µ2
Sean (X11 , X21 ), (X12 , X22 ), . . . , (X1n , X2n ) n pares de muestras aleatorias simples. El estadı́stico
apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 − X 2 , con
Di = X1i − X2i .
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
S√cD
n
≡ tn−1 bajo H0 , con ScD =
Pn
i
(Di − D)2
.
n−1
γ
0.2
Densidad
0.3
0.4
T =
(X 1 − X 2 )
α 2
α 2
t(α 2)
0.0
0.1
1−α
−3
−2
t(1 − α 2)
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
|T | < tn−1,1− α2 ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
|T | ≥ tn−1,1− α2 ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 23 / 32
18
Prueba para µ1 ≤ µ2 cuando σ1 , σ2 y ρ son Desconocidos
Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e
independientes, con σ12 , σ22 y ρ desconocidos, sean µ1 ≤ µ2 , en contra de una hipótesis alternativa
unilateral de que sean µ1 > µ2 .
H 0 : µ1 ≤ µ2
H 1 : µ1 > µ2
Sean (X11 , X21 ), (X12 , X22 ), . . . , (X1n , X2n ) n pares de muestras aleatorias simples. El estadı́stico
apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 − X 2 , con
Di = X1i − X2i .
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
S√cD
n
≡ tn−1 bajo H0 , con ScD =
Pn
i
(Di − D)2
.
n−1
γ
0.2
Densidad
0.3
0.4
T =
(X 1 − X 2 )
1−α
0.1
α
0.0
t(1 − α)
−3
−2
−1
0
1
2
3
T
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan
las medias muestrales X 1 y X 2 , obteniéndose T .
La Región de Aceptación vendrá definida por,
T < tn−1,1−α ,
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
T ≥ tn−1,1−α ,
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 24 / 32
19
Pruebas relacionadas con las Varianzas de dos Poblaciones
25 / 32
Prueba para σ12 = σ22 con µ1 y µ2 Desconocidas
Consideremos el problema de probar la hipótesis de la igualdad de las varianzas σ12 y σ22 de dos
poblaciones, en contra de una hipótesis alternativa bilateral de que sean diferentes.
H 0 : σ1 = σ2
H1 : σ1 6= σ2
El estadı́stico apropiado para este caso está basado en el cociente de las Cuasivarianzas
muestrales Sc21 /Sc22 .
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < Sc21 /Sc22 < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
Sc21
≡ Fn1 −1,n2 −1 bajo H0 .
Sc22
Densidad
0.6
0.8
F =
0.4
γ
0.2
1−α
α 2
0.0
α 2
F(α 2)
0
F ( 1 − α 2)
1
2
3
4
5
6
F
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calcula el
estadı́stico de contraste F .
La Región de Aceptación vendrá definida por,
Fn1 −1,n2 −2, α2 < F < Fn1 −1,n2 −1,1− α2
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
F ≤ Fn1 −1,n2 −2, α2 o Fn1 −1,n2 −1,1− α2 ≤ F
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 26 / 32
20
Prueba para σ12 ≤ σ22 con µ1 y µ2 Desconocidas
Consideremos el problema de probar la hipótesis de que las varianzas de dos poblaciones, sean
σ12 ≤ σ22 , en contra de una hipótesis alternativa unilateral de que sean σ12 > σ22 .
H0 : σ12 ≤ σ22
H1 : σ12 > σ22
El estadı́stico apropiado para este caso está basado en el cociente de las Cuasivarianzas
muestrales Sc21 /Sc22 .
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo Sc21 /Sc22 < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
Sc21
≡ Fn1 −1,n2 −1 bajo H0 .
Sc22
Densidad
0.6
0.8
F =
0.4
γ
0.2
1−α
α
0.0
F(1 − α)
0
1
2
3
4
5
6
F
Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calcula el
estadı́stico de contraste F .
La Región de Aceptación vendrá definida por,
F < Fn1 −1,n2 −1,1−α
y se aceptará H0 .
Mientras que en caso contrario, se define la Región de Rechazo,
F ≥ Fn1 −1,n2 −1,1−α
y se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 27 / 32
21
28 / 32
Pruebas relacionadas con Proporciones
Prueba para p = p0
Consideremos el problema de probar la hipótesis de que la proporción de elementos con un
atributo en una población, sea igual a un valor concreto p0 , en contra de una hipótesis alternativa
bilateral de que sea diferente.
H 0 : p = p0
H1 : p 6= p0
El estadı́stico apropiado para este caso está basado en p̂ = X/n, siendo X el número de elementos
con el atributo y n el tamaño de la muestra.
Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el
intervalo a < p̂ < b defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(p̂ − p0 )
q
≡ N (0, 1) bajo H0 .
p̂q̂
n
γ
0.2
Densidad
0.3
0.4
Z=
1−α
0.1
α 2
α 2
0.0
Z(α 2)
−3
−2
Z(1 − α 2)
−1
0
1
2
3
Z
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula p̂ = X/n.
Si p̂ cae en la Región de Aceptación, a < p̂ < b, entonces, el estadı́stico Z caerá en la Región de
Aceptación,
|Z| < z1− α2 ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
|Z| ≥ z1− α2 ,
se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 29 / 32
22
Prueba para p ≤ p0
Consideremos el problema de probar la hipótesis de que la proporción de elementos con un
atributo en una población, sea menor o igual a un valor concreto p0 , en contra de una hipótesis
alternativa unilateral de que sea mayor.
H 0 : p ≤ p0
H 1 : p > p0
Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo
p̂ < a defina la Región de Aceptación y la Región Crı́tica.
Definamos,
(p̂ − p0 )
q
≡ N (0, 1) bajo H0 .
p̂q̂
n
γ
0.2
Densidad
0.3
0.4
Z=
1−α
0.1
α
0.0
Z(1 − α)
−3
−2
−1
0
1
2
3
Z
Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula p̂ = X/n.
Si p̂ cae en la Región de Aceptación, p̂ < a, entonces, el estadı́stico Z caerá en la Región de
Aceptación,
Z < z1−α ,
y se aceptará H0 ; en caso contrario, Región de Rechazo,
Z ≥ z1−α ,
se rechazará H0 .
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 30 / 32
23
31 / 32
Contrastes de Hipótesis: p-valor
p-valor
En contrastes de hipótesis, en Estadı́stica, el p-valor está definido como la probabilidad de
obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo
que la hipótesis nula es cierta.
p = P(|Z| > Zobs |H0 )
Si el p-valor es inferior a α lo más probable es que la hipótesis H0 sea falsa.
Sin embargo, también es posible que estemos ante una observación atı́pica, por lo que estarı́amos
cometiendo el error estadı́stico de rechazar la hipótesis nula cuando ésta es cierta basándonos en
que hemos tenido la mala suerte de encontrar una observación atı́pica.
Este tipo de errores se puede subsanar rebajando el nivel de significación, un nivel de 0.05 es
usado en investigaciones habituales sociológicas mientras que niveles de 0.01 se utilizan en
investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves.
También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida,
esto reduce la posibilidad de que el dato obtenido sea casualmente raro.
Licesio J. Rodrı́guez-Aragón
Tema 11, M.E.I. – 32 / 32
24
Descargar