Bioestadística: Inferencia Estadística. Análisis de Dos Muestras

Anuncio
Bioestadística: Inferencia Estadística.
Análisis de Dos Muestras
M. González
Departamento de Matemáticas. Universidad de Extremadura
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
MUESTRAS INDEPENDIENTES:
TEST PARAMÉTRICO:
VARIANZAS POBLACIONALES IGUALES:Test de t-Student
(RESUMEN VIII)
VARIANZAS POBLACIONALES DIFERENTES:Test de Welch
(RESUMEN VIII)
Para contrastar si las varianzas poblacionales son iguales utilizamos el
test de F-Snedecor (RESUMEN VII).
TEST NO PARAMÉTRICO:Test de Mann-Whitney-Wilcoxon de
suma de rangos (RESUMEN X)
MUESTRAS APAREADAS O RELACIONADAS:
TEST PARAMÉTRICO:Test de t-Student (RESUMEN XI)
TEST NO PARAMÉTRICO:Test de Wilcoxon de rangos con signo
(RESUMEN XII)
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
2. En un experimento sobre los efectos de la insulina en la disminución de la
glucemia en conejos, se administró una dosis alta de insulina a 9 conejos,
resultando una disminución media de glucemia de 16.4 con una desviación
típica muestral de 4. A otro grupo de 9 conejos se les administró una dosis
baja de insulina, resultando una disminución media de 9.3 con una
desviación típica muestral de 3. Si suponemos que la distribución de la
glucemia es Normal, contesta las siguientes preguntas:
(a) ¿Es posible afirmar, con un nivel de significación del 5%, que existe
diferencia significativa en la disminución de la glucemia según se aplique
una dosis alta o baja de insulina?
X =disminución glucemia dosis alta insulina ∼ N(µ1 , σ12 )
Y =disminución glucemia dosis baja insulina ∼ N(µ2 , σ22 )
MUESTRAS INDEPENDIENTES
m=9
x̄ = 16.4, s1 = 4
n=9
ȳ = 9.3, s2 = 3
H0 : µ1 = µ2 vs. H1 : µ1 6= µ2
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
MUESTRAS INDEPENDIENTES:
TEST PARAMÉTRICO:
VARIANZAS POBLACIONALES IGUALES: Test de t-Student
(RESUMEN VIII)
VARIANZAS POBLACIONALES DIFERENTES: Test de
Welch (RESUMEN VIII)
Para contrastar si las varianzas poblacionales son iguales utilizamos el
test de F-Snedecor (RESUMEN VII).
TEST NO PARAMÉTRICO: Test de Mann-Whitney-Wilcoxon de
suma de rangos (RESUMEN X)
MUESTRAS APAREADAS O RELACIONADAS:
TEST PARAMÉTRICO: Test de t-Student (RESUMEN XI)
TEST NO PARAMÉTRICO: Test de Wilcoxon de rangos con signo
(RESUMEN XII)
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
2. (a) MUESTRAS INDEPENDIENTES
X =disminución glucemia dosis alta insulina ∼ N(µ1 , σ12 )
Y =disminución glucemia dosis baja insulina ∼ N(µ2 , σ22 )
m=9
x̄ = 16.4, s1 = 4
n=9
ȳ = 9.3, s2 = 3
H0 : σ12 = σ22 vs. H1 : σ12 6= σ22
RESUMEN VII: Rechazamos H0 al nivel α si
s21
s22
2
2
> Fα/2 (n − 1, m − 1) si s21 ≤ s22
2 > Fα/2 (m − 1, n − 1) si s1 ≥ s2 ó
s2
s21
2
4
s21
= 1.78
α ⇒ Fα/2 (8, 8)
Fexp = 2 =
3
s2
α = 0.05 ⇒
α = 0.1 ⇒
α = 0.2 ⇒
F0.025 (8, 8) = 4.43
F0.05 (8, 8) = 3.44
F0.1 (8, 8) = 2.59
⇒
⇒
⇒
Fexp < F0.025 (8, 8) ⇒
Fexp < F0.05 (8, 8) ⇒
Fexp < F0.1 (8, 8) ⇒
H0
H0
H0
p > 0.2
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
2. (a) H0 : µ1 = µ2 vs. H1 : µ1 6= µ2
RESUMEN VIII: σ12 , σ22 DESCONOCIDAS, σ12 = σ22
m=9
x̄ = 16.4, s1 = 4
n=9
ȳ = 9.3, s2 = 3
2
2
2
2
(m
−
1)s
+
(n
−
1)s
8
∗
4
+
8
∗
3
1
2
s2 =
=
= 12.5 ⇒ s = 3.54
m+n+2
8∗2
texp =
16.4−9.3
√
3.54 1/9+1/9
= 4.25
α = 0.05 ⇒ t0.05 (16) = 2.120 ⇒ |texp | > t0.05 (16) ⇒ H1
α = 0.001 ⇒ t0.001 (16) = 4.015 ⇒ |texp | > t0.001 (16) ⇒ H1
p < 0.001
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
2. (b) ¿En cuánto podemos estimar dicha diferencia?
m=9
x̄ = 16.4, s1 = 4
2
s =
(m−1)s21 +(n−1)s22
m+n+2
=
n=9
8∗42 +8∗32
8∗2
ȳ = 9.3, s2 = 3
= 12.5 ⇒ s = 3.54
ESTIMACIÓN PUNTUAL: µ\
1 − µ2 = x̄ − ȳ = 16.4 − 9.3 = 7.1
ESTIMACIÓN POR INTERVALO DE CONFIANZA: RESUMEN IX
Nivel de confianza 1 − α
q
µ1 − µ2 ∈ (x̄ − ȳ) ± tα (m + n − 2)s m1 + n1
1 − α = 0.95
q
µ1 − µ2 ∈ 7.1 ± 2.120 ∗ 3.54 ∗ 19 +
CON UNA CONFIANZA DEL 95%
M. González
1
9
= 7.1 ± 3.54 = [3.56, 10.64]
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos
de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un
tratamiento que reduce el colesterol:
Placebo
Tratamiento
5.6
3.35
6.25
3.6
7.45
3.75
5.05
4.15
4.56
3.6
4.5
3.9
4.3
(a) Probar si existe diferencia significativa entre las dosis medias de
colesterol sérico en ambas poblaciones, suponiendo normalidad de ambas
variables.
(b) ¿Qué podemos hacer si no tenemos la hipótesis de normalidad?
MUESTRAS INDEPENDIENTES
NO PARAMÉTRICO:
TEST DE SUMA DE RANGOS DE MANN-WHITNEY-WILCOXON
RESUMEN X
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos
de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un
tratamiento que reduce el colesterol:
Placebo
Tratamiento
5.6
3.35
6.25
3.6
7.45
3.75
M. González
5.05
4.15
4.56
3.6
4.5
3.9
4.3
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos
de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un
tratamiento que reduce el colesterol:
Placebo
Tratamiento
5.6
3.35
6.25
3.6
7.45
3.75
5.05
4.15
4.56
3.6
4.5
3.9
4.3
RESUMEN X:
Rexp = RX = 16
Rechazamos H0 al nivel de significación α si Rexp ≤ VI (α) ó Rexp ≥ VS (α)
VI (0.05) = 21, VS (0.05) = 49
Rexp < VI (α)
H1
α = 0.05
VI (0.01) = 17, VS (0.01) = 53
Rexp < VI (α)
H1
α = 0.01
p < 0.01
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
7. Se ha estudiado el tiempo de reacción ante un estímulo auditivo bajo dos
situaciones o condiciones radicalmente diferentes F y Q. Para ello se ha
elegido una muestra aleatoria de 9 niños, los cuales han sido estimulados, en
primer lugar, bajo la situación F y pasado un tiempo prudencial de reposo,
son nuevamente estimulados bajo Q. Los tiempos de reacción, en centésimas
de segundo, aparecen en la siguiente tabla:
niño
sist. F
sist. Q
1
14
17
2
12
14
3
9
13
4
13
15
5
15
16
6
17
16
7
13
16
8
12
15
9
13
13
(a) Suponiendo que la diferencia de los tiempos de reacción se distribuye
normalmente, ¿puede afirmarse que el tiempo de reacción medio difiere de la
situación F a la Q, si admitimos un nivel de error del 1%?
X=TIEMPO DE REACCIÓN ANTE F
Y=TIEMPO DE REACCIÓN ANTE Q
µ1 , σ12
µ2 , σ22
(X1 , Y1 ), . . . , (X9 , Y9 )
Di = Xi − Yi , i = 1, . . . , 9, m.a.s. N(µD , σD2 ), µD = µ1 − µ2 .
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
7. (a) PARAMÉTRICO. MUESTRAS APAREADAS. TEST T-STUDENT.
RESUMEN XI
H0 : µ1 = µ2 vs. H1 : µ1 6= µ2
H0 : µD = 0 vs. H1 : µD 6= 0
niño
sist. F
sist. Q
di
d̄ = −1.89
1
14
17
-3
2
12
14
-2
3
9
13
-4
4
13
15
-2
5
15
16
-1
s2D = 2.61 (sD = 1.616)
6
17
16
1
texp
7
13
16
-3
8
12
15
-3
d̄
√
=
sd / n
9
13
13
0
= −3.51
Rechazamos H0 al nivel de significación α si |texp | > tα (n − 1)
α = 0.01
α = 0.001
t0.01 (8) = 3.355
t0.001 (8) = 5.041
|texp | > t0.01 (8)
H1
|texp | < t0.001 (8)
H0
0.001 < p < 0.01
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Comparación Medias Poblacionales
7. (b) ¿Cómo podemos establecer la comparación si no tenemos la hipótesis
de normalidad? NO PARAMÉTRICO. MUESTRAS APAREADAS. TEST
DE WILCOXON DE RANGOS CON SIGNO. RESUMEN XII.
niño
di
1
-3
2
-2
3
-4
4
-2
5
-1
6
1
7
-3
8
-3
3
(6)
4
(8)
9
0
n=8
+
−
(1.5)
1
1
(1.5)
2
(3.5)
2
(3.5)
3
(6)
3
(6)
R(+) = 1.5
R(−) = 34.5
Rechazamos H0 al nivel de significación α si
R(+) ≤ Tα (n) ó R(−) ≤ Tα (n)
α = 0.05
α = 0.01
T0.05 (8) = 3
T0.01 (8) = 0
R(+) < T0.05 (8)
H1
R(+) , R(−) > T0.01 (8)
H0
0.01 < p < 0.05
M. González
Bioestadística: Inferencia Estadística. Análisis de Dos Muestras
Descargar