Contrastes para los parámetros de dos poblaciones Normales

Anuncio
Estadística
Contrastes para los parámetros de dos
poblaciones Normales
Independientes y dependientes
Prof, Dr. Jose Jacobo Zubcoff
Departamento de Ciencias del Mar y Biología Aplicada
Estadística
Contrastes para dos Poblaciones independientes
Ejemplo de problema a resolver:
Se quiere comprobar si entre la zona Norte (x) y Sur (y) del Cabo de
Santa Pola existen diferencias en la Litorina punctata. Para ello se han
recogido mediante observación dos muestras en cada zona,
obteniéndose los siguientes datos:
Comprobar si se observan diferencias entre ambas poblaciones
Estadística
Contrastes para dos Poblaciones independientes
Objetivo y contenidos
Comparación de medias de dos poblaciones a partir de muestras
independientes.
Se pueden dar tres situaciones que vamos a estudiar:
1.  Varianzas conocidas
2.  Varianzas desconocidas iguales
3.  Varianzas desconocidas y distintas
Recordar: Para el segundo y tercer caso se debe averiguar si en efecto
las varianzas son iguales a partir de:
Contraste de igualdad de varianzas
Estadística
Contrastes para dos Poblaciones Independientes
Estadística
Contrastes para dos Poblaciones independientes.
Igualdad de varianzas
Intervalos de confianza
Para dos variables independientes X ≡ N ( µ x , σ x )
y sabiendo que
(nx − 1) S x
σ x2
≅χ
2
n x −1
(n y − 1) S y
σ y2
Y ≡ N (µ y ,σ y )
≅ χ n2y −1
Para obtener los intervalos de confianza para los cocientes de las
varianzas se busca una variable aleatoria con función de distribución
conocida y parámetro desconocido σ x2 σ y2
Distribución F de Sdenecor:
S x2σ y2
2
y
Sσ
2
x
= Fnx −1,n y −1
Estadística
Contrastes para dos Poblaciones independientes.
Igualdad de varianzas
Intervalos:
⎛
⎞
⎛
⎞
S x2σ y2
S x2σ y2
⎟
P⎜ a ≤ 2 2 ≤ b ⎟ = 1 − α ⇒ P⎜ F
α ≤ 2 2 ≤F
α ⎟ = 1 − α
⎜
⎟
⎜
n −1, n −1,1−
nx −1, n y −1,
S yσ x
2 ⎠
⎝
⎠
⎝ x y 2 S yσ x
que queda como:
Iσ1−2α/ σ 2
x
y
⎛
⎞
2
2 ⎟
⎜
Sx
Sx
1
= ⎜
,
F
α
2
2 ⎟
n
−
1
,
n
−
1
,
y
x
S y ⎟
⎜ Fnx −1,n y −1,α S y
2
2
⎝
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Igualdad de varianzas
Contraste de hipótesis (bilateral)
H 0 : σ x2 = σ y2 ⎫⎪
H 0 : σ x2 / σ y2 = 1⎫⎪
⇔
⎬
2
2 ⎬
2
2
H1 : σ x ≠ σ y ⎪⎭
H1 : σ x / σ y ≠ 1⎪⎭
1.  Región de aceptación:
⎛
⎞
2
2 ⎟
⎜
Sx
Sx
1
1∈ ⎜
,
F
α
2
2 ⎟
n
−
1
,
n
−
1
,
y
x
S y ⎟
⎜ Fnx −1,n y −1,α S y
2
2
⎝
⎠
2.  Método alternativo (recomendado por su simplicidad):
2
σ mayor
<F
2
n
σ menor
num −1, nde nom −1,
α
2
⇒
2
S mayor
S
2
menor
<F
nnum −1, nde nom −1,
α
2
Estadística
Contrastes para dos Poblaciones independientes.
Igualdad de varianzas
Ejemplo: Para comparar la efectividad de dos medicamentos en la
hipertensión se administran cada uno de ellos a dos grupos de
pacientes diferentes, obteniéndose los siguientes resultados:
Admitiendo normalidad, ¿se puede aceptar la igualdad de varianzas para
un alfa de 0.1?
1.  Formula hipótesis:
H 0 : σ x2 = σ y2 ⎫⎪
H 0 : σ x2 / σ y2 = 1⎫⎪
⇔
⎬
2
2 ⎬
2
2
H1 : σ x ≠ σ y ⎪⎭
H1 : σ x / σ y ≠ 1⎪⎭
2. Calcula datos necesarios:
nx = 7
n yy = 7
x = 15.571
y = 13.857
S x2 = 17.619
S y2 = 14.476
Estadística
Contrastes para dos Poblaciones independientes.
Igualdad de varianzas
3. Calcula la región de aceptación
⎛
⎞
2
2
⎜
Sx
S x ⎟
1
1∈ ⎜
,F
α
2
2 ⎟
n y −1, n x −1, S
F
S
y ⎟
⎜ nx −1,n y −1,α y
2
2
⎝
⎠
⎛
⎞
⎜
1
17.619
17.619 ⎟ ⎛ 1 17.619
17.619 ⎞
1∈ ⎜
,F
,4.28
⎟
⎟ = ⎜
0.05
7
−
1
,
7
−
1
,
14.476 ⎟ ⎝ 4.28 14.476
14.476 ⎠
⎜ F7 −1,7 −1, 0.05 14.476
2
2
⎝
⎠
1∈ (0.284,5.209)
No rechazamos
Estadística
Contrastes para dos Poblaciones independientes.
Diferencia de medias, varianzas conocidas
Intervalos de confianza
⎧ X ≡ N ( µ x , σ x )
Sabiendo que ⎨
⎩Y ≡ N ( µ y , σ y )
y
2 ⎞
2
⎛
σ
σ
x
X − Y ≅ N ⎜ µ x − µ y ,
+ y ⎟
⎜
nx n y ⎟
⎝
⎠
Al conocer las varianzas de la pob. es posible tipificar la var. aleatoria a
partir de:
Z=
( X − Y ) − (µ x − µ y )
σ x2
nx
+
σ y2
ny
Estadística
Contrastes para dos Poblaciones independientes.
Diferencia de medias, varianzas conocidas
Por tanto:
⎛
⎞
⎜
⎟
⎜
⎟
( X − Y ) − (µ x − µ y )
P⎜ a ≤
≤ b ⎟ = 1 − α
2
2
⎜
⎟
σx σy
+
⎜⎜
⎟⎟
n
n
x
y
⎝
⎠
I µ1−xα− µ y
2
2 ⎞
2
2
⎛
σ
σ
σ
σ
y
y
x
x
⎟
= ⎜ ( X − Y ) − Zα / 2
+
, ( X − Y ) + Zα / 2
+
⎜
nx n y
nx n y ⎟
⎝
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Diferencia de medias, varianzas conocidas
⎧⎪H 0 : µ x = µ y
⎧⎪H 0 : µ x − µ y = 0
⇔ ⎨
⎨
H
:
µ
≠
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y ≠ 0
y
1.  No se rechaza para un determinado nivel de significación si
Contraste de hipótesis
2
2 ⎞
2
2
⎛
σ
σ
σ
σ
x
x
X − Y ∈ ⎜ − zα / 2
+ y , zα / 2
+ y ⎟
⎜
nx n y
nx n y ⎟
⎝
⎠
X −Y
2.  Que traducido a estadístico queda como
σ
2
x
nx
+
σ
3. Recordad que para el p-valor p > α ⇒ No Re chazo
⎛
⎞
⎛
⎜
⎟
⎜
⎜
⎜
X − Y ⎟
X −Y
p / 2 = P⎜ Z >
⇒
p
−
valor
=
2
*
P
Z
>
⎟
⎜
2
2
⎜
⎜
σ x2 σ y ⎟
σ x2 σ y
+
+
⎜⎜
⎟⎟
⎜⎜
n
n
n
ny
x
y ⎠
x
⎝
⎝
2
y
< zα / 2 ⇒ No Re chazo
ny
calculado como:
⎞
⎟
⎟
⎟
⎟
⎟⎟
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Diferencia de medias, varianzas conocidas
⎧⎪H 0 : µ x ≥ µ y
⎧⎪H 0 : µ x − µ y ≥ 0
⇔ ⎨
⎨
H
:
µ
<
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y < 0
y
1.  No se rechaza si
2
2
⎛
⎞
σ
σ
y
x
X ∈ ⎜ − Zα
+
,+∞ ⎟
⎜
⎟
nx n y
⎝
⎠
2 ⎞
2
⎛
σ
σ
x
X ∈ ⎜ − ∞, Zα
+ y ⎟
⎜
nx n y ⎟
⎝
⎠
2.  Estadístico:
No Re chazo ⇒
σ
3. p-valor:
2.  Estadístico
X −Y
2
x
nx
+
σ
⎧⎪H 0 : µ x ≤ µ y
⎧⎪H 0 : µ x − µ y ≤ 0
⇔ ⎨
⎨
H
:
µ
>
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y > 0
y
1.  No se rechaza si
2
y
X −Y
> − zα
ny
⎛
⎞
⎜
⎟
⎜
X − Y ⎟
p − valor = P⎜ Z <
⎟
2
2
⎜
σ x σ y ⎟
+
⎜⎜
⎟⎟
n
n
x
y ⎠
⎝
σ
3. p-valor:
2
x
nx
+
σ
2
y
< zα ⇒ No Re chazo
ny
⎛
⎞
⎜
⎟
⎜
X − Y ⎟
p − valor = P⎜ Z >
⎟
2
2
⎜
σ x σ y ⎟
+
⎜⎜
⎟⎟
n
n
x
y ⎠
⎝
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
Intervalos de confianza
⎧ X ≡ N ( µ x , σ x )
Sabiendo que ⎨
⎩Y ≡ N ( µ y , σ y )
y
2 ⎞
2
⎛
σ
σ
y
x
⎟
X − Y ≅ N ⎜ µ x − µ y ,
+
⎜
nx n y ⎟
⎝
⎠
La varianza desconocida se puede estimar como media ponderada de las
varianzas muestrales:
2
2
Sd =
Y el estadístico sería t =
(nx − 1)S x + (n y − 1)S y
nx + n y − 2
( X − Y ) − (µ x − µ y )
Sd
1 1
+
nx n y
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
Por tanto:
I
1−α
µx −µ y
⎛
⎞
⎜
⎟
( X − Y ) − (µ x − µ y )
⎜
⎟
P⎜ a ≤
≤ b ⎟ = 1 − α
1 1
⎜
⎟
Sd
+
⎜
⎟
n
n
x
y
⎝
⎠
⎛
1 1
1 1 ⎞⎟
⎜
= ( X − Y ) − t nx + n y − 2,α / 2 S d
+ , ( X − Y ) + t nx + n y − 2,α / 2 S d
+
⎜
nx n y
nx n y ⎟⎠
⎝
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
⎧⎪H 0 : µ x = µ y
⎧⎪H 0 : µ x − µ y = 0
⇔ ⎨
⎨
H
:
µ
≠
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y ≠ 0
y
1.  No se rechaza para un determinado nivel de significación si
Contraste de hipótesis
⎛
⎞
1
1
1
1
X − Y ∈ ⎜ − t nx + n y − 2,α / 2 S d
+ , t nx + n y − 2,α / 2 S d
+ ⎟
⎜
nx n y
nx n y ⎟⎠
⎝
2.  Que traducido a estadístico queda como
No Re chazo ⇒
X −Y
< t nx + n y −2,α / 2
1 1
Sd
+
nx n y
3. Recordad que para el p-valor p > α ⇒ No Re chazo calculado como:
⎛
⎞
⎛
⎞
⎜
⎟
⎜
⎟
⎜
⎟
⎜
⎟
X −Y
X −Y
p / 2 = P⎜ t nx + n y − 2 >
⎟ ⇒ p − valor = 2 * P⎜ t nx + n y − 2 >
⎟
1
1
1
1
⎜
⎟
⎜
⎟
Sd
+
Sd
+
⎜
⎜
nx n y ⎟
nx n y ⎟
⎝
⎠
⎝
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
⎧⎪H 0 : µ x ≥ µ y
⎧⎪H 0 : µ x − µ y ≥ 0
⇔ ⎨
⎨
H
:
µ
<
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y < 0
y
1.  No se rechaza si
⎛
⎞
1 1
⎜
X − Y ∈ − t nx + n y ,α S d
+ ,+∞ ⎟
⎜
⎟
nx n y
⎝
⎠
2.  Estadístico:
No Re chazo ⇒
3. p-valor:
⎧⎪H 0 : µ x ≤ µ y
⎧⎪H 0 : µ x − µ y ≤ 0
⇔ ⎨
⎨
H
:
µ
>
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y > 0
y
1.  No se rechaza si
⎛
⎞
1
1
X − Y ∈ ⎜ − ∞, t nx + n y ,α S d
+ ⎟
⎜
nx n y ⎟⎠
⎝
2.  Estadístico
X −Y
> −tnx + n y −2,α
1 1
sd
+
nx n y
⎛
⎞
⎜
⎟
⎜
⎟
X −Y
p − valor = P⎜ t nx + n y −2 <
⎟
1
1
⎜
⎟
sd
+
⎜
nx n y ⎟⎠
⎝
No Re chazo ⇒
3. p-valor:
X −Y
< tnx + n y −2,α
1 1
sd
+
nx n y
⎛
⎞
⎜
⎟
⎜
⎟
X −Y
p − valor = P⎜ t nx + n y −2 >
⎟
1
1
⎜
⎟
sd
+
⎜
nx n y ⎟⎠
⎝
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
Ejemplo 1:
Los sig. datos corresponden a muestras de la sp. Jania de dos zonas
cercanas a un punto de vertido de aguas residuales. Verificar si hay
diferencias entre ambas zonas.
x
y
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
1.  Comprueba si se da la igualdad de varianzas:
⎛
⎞
2
2
⎜
Sx
S x ⎟
1
1∈ ⎜
,F
α
2
2 ⎟
n y −1, n x −1, S
F
S
y ⎟
⎜ nx −1,n y −1,α y
2
2
⎝
⎠
1∈ (0.299,2.561)
⎛
⎞
2
2
⎜
7.51
7.51 ⎟
1
1∈ ⎜
,F
0.005
2
2 ⎟
16−1,15−1,
F
8
.
06
8
.
06
⎜ 15−1,16−1, 0.05
⎟
2
2
⎝
⎠
No rechazo, igualdad de varianzas
2.  Calcula datos necesarios desconocidos
Sd =
Sd =
(nx − 1)S x2 + (n y − 1)S y2
nx + n y − 2
(15 − 1)7.512 + (16 − 1)8.06 2
15 + 16 − 2
Sd = 7.779
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
3. Criterio de región de aceptación:
⎛
1 1
1 1 ⎞⎟
⎜
X − Y ∈ − t nx + n y − 2,α / 2 S d
+ , t nx + n y − 2,α / 2 S d
+
⎜
nx n y
nx n y ⎟⎠
⎝
⎛
1 1
1 1 ⎞
0.61 ∈ ⎜⎜ − t15+16−2,0.05 / 2 * 7.779 *
+ , t15+16−2,0.05 / 2 * 7.779 *
+ ⎟⎟
15 16
15 16 ⎠
⎝
0.61∈ (− 2.0452* 7.779 * 0.360,2.0452* 7.779 * 0.360) = (−5.727,5.727) No rechazo
4. Calcula por estadístico:
tobs
X −Y
=
1 1
Sd
+
nx n y
tobs =
0.61
= 0.218
1 1
7.779
+
15 16
t 29, 0.025 = 2.0452
tobs = 0.218 < 2.0452 = t29,0.025
No rechazo
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
5. P-valor:
(
p / 2 = P tnx + n y −2 >t obs
)
(
)
p / 2 = P tnx +n y −2 > 0.218 ⇒ p / 2 > 0.25
p − valor > 0.5 No rechazo
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas e iguales
Ejemplo 2:
Se quiere comprobar si entre la zona Norte (x) y Sur (y) del Cabo de
Santa Pola existen diferencias en la Litorina punctata. Para ello se han
recogido mediante observación dos muestras en cada zona,
obteniéndose los siguientes datos:
Medx = 2,2
Medy = 1,9
Sx = 0,12
Sy= 0,10
nx= 155
ny = 208
Comprobar si se observan diferencias entre ambas poblaciones
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
Intervalos de confianza
⎧ X ≡ N ( µ x , σ x )
Sabiendo que ⎨
⎩Y ≡ N ( µ y , σ y )
y
2 ⎞
2
⎛
σ
σ
y
x
⎟
X − Y ≅ N ⎜ µ x − µ y ,
+
⎜
nx n y ⎟
⎝
⎠
Situación sin solución exacta. Utilizaremos método de Welch que
sustituye las varianzas por sus estimadores insesgados en el
estadístico:
t=
( X − Y ) − (µ x − µ y )
2
S x2 S y
+
nx n y
En este caso, el estadístico se aproxima auna dist. t de Student con m
grados de libertad, donde m (como nº natural):
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
Por tanto:
I µ1−xα− µ y
⎛
⎞
⎜
⎟
⎜
⎟
( X − Y ) − (µ x − µ y )
P⎜ a ≤
≤ b ⎟ = 1 − α
Sx S y
⎜
⎟
+
⎜
⎟
n
n
x
y
⎝
⎠
2
2 ⎞
2
2
⎛
S
S
S
S
= ⎜ ( X − Y ) − t m,α / 2 x + y , ( X − Y ) + t m,α / 2 x + y ⎟
⎜
nx n y
nx n y ⎟
⎝
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
⎧⎪H 0 : µ x = µ y
⎧⎪H 0 : µ x − µ y = 0
⇔ ⎨
⎨
H
:
µ
≠
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y ≠ 0
y
1.  No se rechaza para un determinado nivel de significación si
Contraste de hipótesis
2
2 ⎞
2
2
⎛
S
S
S
S
X − Y ∈ ⎜ − t m,α / 2 x + y , t m ,α / 2 x + y ⎟
⎜
nx n y
nx n y ⎟
⎝
⎠
2.  Que traducido a estadístico queda como
No Re chazo ⇒
3. Recordad que para el p-valor p > α ⇒ No Re chazo
⎛
⎞
⎛
⎜
⎟
⎜
⎜
⎜
X − Y ⎟
X −Y
⎟ ⇒ p − valor = 2 * P⎜ t m >
p / 2 = P⎜ t m >
2
2
⎜
⎜
S x2 S y ⎟
S x2 S y
+
+
⎜⎜
⎟
⎜⎜
nx n y ⎟
nx n y
⎝
⎠
⎝
X −Y
2
y
S
S
+
nx n y
2
x
< t m,α / 2
calculado como:
⎞
⎟
⎟
⎟
⎟
⎟⎟
⎠
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
⎧⎪H 0 : µ x ≥ µ y
⎧⎪H 0 : µ x − µ y ≥ 0
⇔ ⎨
⎨
H
:
µ
<
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y < 0
y
1.  No se rechaza si
2
2
⎛
⎞
S
S
y
x
⎜
X − Y ∈ − t m,α
+ ,+∞ ⎟
⎜
⎟
nx n y
⎝
⎠
2.  Estadístico:
No Re chazo ⇒
3. p-valor:
⎛
⎜
⎜
p − valor = P⎜ t m <
⎜
⎜⎜
⎝
2 ⎞
2
⎛
S
S
x
X − Y ∈ ⎜ − ∞, t m,α
+ y ⎟
⎜
nx n y ⎟
⎝
⎠
2.  Estadístico
X −Y
2
y
S
S
+
nx n y
2
x
⎧⎪H 0 : µ x ≤ µ y
⎧⎪H 0 : µ x − µ y ≤ 0
⇔ ⎨
⎨
H
:
µ
>
µ
⎪⎩ 1 x
⎪⎩H1 : µ x − µ y > 0
y
1.  No se rechaza si
> −t m,α
⎞
⎟
X − Y ⎟
⎟
2
2
S x S y ⎟
+
nx n y ⎟⎟⎠
No Re chazo ⇒
3. p-valor:
⎛
⎜
⎜
p − valor = P⎜ t m >
⎜
⎜⎜
⎝
X −Y
2
y
S
S
+
nx n y
2
x
< t m,α
⎞
⎟
X − Y ⎟
⎟
2
2
S x S y ⎟
+
nx n y ⎟⎟⎠
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
Ejemplo
Se ha efectuado un estudio por parte de la Comisión de Caza y Pesca para estimar
cantidades de residuos químicos en tejidos de pelícanos. En una prueba de DDT para
muestras aleatorias de 10 pelícanos jóvenes y 13 polluelos se obtuvieron los
siguientes resultados:
Jóvenes Adultos
Número
10
13
Media
0.041
0.026
S
0.017
0.006
¿Se puede afirmar que el comportamiento en ambos es igual con una significación
del 0.05?
⎧⎪H 0 : µ x = µ y
⎧⎪H 0 : µ x − µ y = 0
⇔ ⎨
⎨
⎪⎩H1 : µ x ≠ µ y
⎪⎩H1 : µ x − µ y ≠ 0
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
1.  Comprueba que efectivamente las varianzas son diferentes:
⎛
⎞
2
2 ⎟
⎜
Sx
Sx
1
1∈ ⎜
,
F
α
2
2 ⎟
n y −1, n x −1, S
F
S
y ⎟
⎜ nx −1,n y −1,α y
2
2
⎝
⎠
1∈ (2.175,29.025)
⎛
⎞
2
2
⎜
0.017
0.017 ⎟
1
1∈ ⎜
,F
0.005
2
2 ⎟
13−1,10−1,
F
0
.
006
0
.
006
⎜ 10−1,13−1, 0.05
⎟
2
2
⎝
⎠
Rechazo, varianzas diferentes
2.  Calcula m
m = 10.85 ⇒ m = 11
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
3. Criterio de región de aceptación:
2
2 ⎞
2
2
⎛
S
S
S
S
X − Y ∈ ⎜ − t m,α / 2 x + y , t m ,α / 2 x + y ⎟
⎜
nx n y
nx n y ⎟
⎝
⎠
2
2
2
2
⎛
0
.
017
0
.
006
0
.
017
0
.
006
0.015 ∈ ⎜ − t11,0.025
+
, t11,0.025
+
⎜
10
13
10
13
⎝
⎞
⎟
⎟
⎠
0.015 ∈ (− 0.0123,0.0123)
4. Criterio de estadístico:
tobs =
tobs =
X −Y
2
S x2 S y
+
nx n y
0.015
= 2.66
0.0078
t11, 0.025 = 2.201
tobs = 2.66 < 2.201 = t11,0.025 Rechazo
Rechazo
Estadística
Contrastes para dos Poblaciones independientes.
Dif. de medias, varianzas desconocidas y distintas
4. p-valor:
p / 2 = P(tm > tobs )
0.01 < p / 2 < 0.025
0.02 < p − valor < 0.05
p − valor < α Rechazo
Dado que se demuestra que no son iguales, ¿serías capaz de saber si es mayor o
menor? (compara con contrastes unilaterales)
Estadística
Contrastes para los parámetros de la Normal
Contrastes para los parámetros de dos
poblaciones normales dependientes
Estadística
Contrastes para dos Poblaciones Dependientes
Supongamos que queremos comprobar
si realmente se produce una disminución significativa en la cobertura de
Enteromorpha después de constatar un impacto ambiental con residuos de
alquitrán. Se tienen medidas de antes y se mide después del impacto.
Estadística
Contrastes para dos Poblaciones Dependientes
- En este tipo de análisis el interés no se centra en la variabilidad que puede
haber entre los individuos
- Sino en las diferencias que se observan en un mismo sujeto entre un
momento y otro
Por este motivo, resulta intuitivo trabajar con la diferencia de ambas
observaciones (en el ejemplo será la disminución de porcentaje de
cobertura), de modo que se quiere contrastar la hipótesis
H1:La disminución del porcentaje de cobertura es mayor que cero
Estadística
Contrastes para dos Poblaciones Dependientes
Intervalos de confianza
⎧ X ≡ N ( µ x , σ x )
Sabiendo que ⎨
⎩Y ≡ N ( µ y , σ y )
y
D ≅ N (µD , σ D )
El procedimiento de obtención del intervalo es el mismo que en temas
anteriores:
1−α
I µD
⎛
S
S
= ⎜⎜ D − tn−1,α / 2 D , D + tn−1,α / 2 D
n
n
⎝
⎞
⎟
⎟
⎠
Donde:
n
1 n
D = ∑ Di = ∑ ( X i − Yi )
n i =1
i =1
1 n
2
(
)
S =
D
−
D
∑ i
n − 1 i =1
2
D
Estadística
Contrastes para dos Poblaciones Dependientes
Contraste de hipótesis
texp t =
D
SD
n
1) Definimos la variable D como:
D = {Antes - Despues} ó
D = {Despues - Antes} ó
D = { X - Y} ó
D = { Y - X}
2) Proponemos el contraste
3) Calculamos el estadístico en
función de la definición de D y del
contraste propuesto, siendo D una
variable Normal
4) Obtenemos las conclusiones y
aportamos el p-valor
Estadística
Contrastes para dos Poblaciones Dependientes
⎧ H 0 : µ D = 0
⎨
⎩ H1 : µ D ≠ 0
1.  No se rechaza para un determinado nivel de significación si
S
S ⎞
⎛
D ∈ ⎜ − t n −1,α / 2 D , t n −1,α / 2 D ⎟
n
n ⎠
⎝
2.  Que traducido a estadístico queda como
No Re chazo ⇒
D
Sd
n
< tn−1,α / 2
3. Recordad que para el p-valor p > α ⇒ No Re chazo calculado como:
⎛
⎛
D ⎞⎟
D ⎞⎟
⎜
⎜
p / 2 = P⎜ tn−1 >
⎟ ⇒ p − valor = 2 * P⎜ tn−1 > S
S
n
n ⎟⎠
d
d
⎝
⎠
⎝
Estadística
Contrastes para dos Poblaciones Dependientes
⎧ H 0 : µ D ≥ 0
⎨
⎩ H1 : µ D < 0
1.  No se rechaza si
⎧ H 0 : µ D ≤ 0
⎨
⎩ H1 : µ D > 0
1.  No se rechaza si
S
⎛
⎞
D ∈ ⎜ − t n −1,α D ,+∞ ⎟
n
⎝
⎠
2.  Estadístico:
No Re chazo ⇒
S ⎞
⎛
D ∈ ⎜ − ∞, t n −1,α D ⎟
n ⎠
⎝
2.  Estadístico
D
Sd
n
> −t n −1,α / 2
3. p-valor:
⎛
D ⎞
⎟⎟
p − valor = P⎜⎜ tn−1 <
S d n ⎠
⎝
No Re chazo ⇒
D
Sd
n
< t n −1,α / 2
3. p-valor:
⎛
D ⎞
⎟⎟
p − valor = P⎜⎜ tn−1 >
S d n ⎠
⎝
Estadística
Contrastes para dos Poblaciones Dependientes
Supongamos que queremos comprobar
si realmente se produce una disminución significativa en la cobertura de
Enteromorpha después de constatar un impacto ambiental con residuos de
alquitrán. Se tienen medidas de antes y se mide después del impacto.
⎧ H 0 : µ D ≥ 0
⎨
⎩ H1 : µ D < 0
1. Calculemos los estadísticos
X = 90.81 Y = 85.74
S x = 5.081 S y = 5.081
Estadística
Contrastes para dos Poblaciones Dependientes
2. Calculemos D media y S de D:
n
1 n
D = ∑ Di = ∑ ( X i − Yi ) = 5.071
n i =1
i =1
1 n
2
(
)
S =
D
−
D
= 2.511
∑
i
n − 1 i =1
2
D
3. Calculemos los criterios de aceptación o rechazo
a) Región de aceptación:
S
⎛
⎞
D ∈ ⎜ − t n −1,α D ,+∞ ⎟
n
⎝
⎠
1.584
⎛
⎞
5.071∈ ⎜ − t9, 0.05
,+∞ ⎟ = (− 1.8331 ⋅ 0.501,+∞ ) = (−0.918,+∞)
10
⎝
⎠
No rechazo
Estadística
Contrastes para dos Poblaciones Dependientes
b) Estadístico:
texp t =
D
Sd
n
texp t =
5.071
= 10.12
1.584 10
− texp t > −t9, 0.05
− t n −1,α = −t9, 0.05 = −1.8331
c) p-valor
⎛
D ⎞
⎜
⎟⎟
p − valor = P⎜ tn−1 <
S d n ⎠
⎝
p − valor = 1 − P(t9 > 10.12) ⇒ p − valor > 0.995
No rechazo
No rechazo
Estadística
Contrastes para dos Poblaciones Independientes o
Dependientes
Comandos de R:
Dos pob., diferencia de varianzas:
var.test(x, y, ratio = 1,alternative = "two.sided“,conf.level = 0.95)
Dos pob. independientes, varianzas desconocidas e iguales:
t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0,
var.equal = TRUE, conf.level = 0.95)
Dos pob. independientes, varianzas desconocidas y diferentes:
t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0,
var.equal = FALSE, conf.level = 0.95)
Dos pob. apareadas (dependientes):
t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0, paired
= TRUE, conf.level = 0.95)
Descargar