Bioestadística: Inferencia Estadística. Análisis de Dos Muestras M. González Departamento de Matemáticas. Universidad de Extremadura M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales MUESTRAS INDEPENDIENTES: TEST PARAMÉTRICO: VARIANZAS POBLACIONALES IGUALES:Test de t-Student (RESUMEN VIII) VARIANZAS POBLACIONALES DIFERENTES:Test de Welch (RESUMEN VIII) Para contrastar si las varianzas poblacionales son iguales utilizamos el test de F-Snedecor (RESUMEN VII). TEST NO PARAMÉTRICO:Test de Mann-Whitney-Wilcoxon de suma de rangos (RESUMEN X) MUESTRAS APAREADAS O RELACIONADAS: TEST PARAMÉTRICO:Test de t-Student (RESUMEN XI) TEST NO PARAMÉTRICO:Test de Wilcoxon de rangos con signo (RESUMEN XII) M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 2. En un experimento sobre los efectos de la insulina en la disminución de la glucemia en conejos, se administró una dosis alta de insulina a 9 conejos, resultando una disminución media de glucemia de 16.4 con una desviación típica muestral de 4. A otro grupo de 9 conejos se les administró una dosis baja de insulina, resultando una disminución media de 9.3 con una desviación típica muestral de 3. Si suponemos que la distribución de la glucemia es Normal, contesta las siguientes preguntas: (a) ¿Es posible afirmar, con un nivel de significación del 5%, que existe diferencia significativa en la disminución de la glucemia según se aplique una dosis alta o baja de insulina? X =disminución glucemia dosis alta insulina ∼ N(µ1 , σ12 ) Y =disminución glucemia dosis baja insulina ∼ N(µ2 , σ22 ) MUESTRAS INDEPENDIENTES m=9 x̄ = 16.4, s1 = 4 n=9 ȳ = 9.3, s2 = 3 H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales MUESTRAS INDEPENDIENTES: TEST PARAMÉTRICO: VARIANZAS POBLACIONALES IGUALES: Test de t-Student (RESUMEN VIII) VARIANZAS POBLACIONALES DIFERENTES: Test de Welch (RESUMEN VIII) Para contrastar si las varianzas poblacionales son iguales utilizamos el test de F-Snedecor (RESUMEN VII). TEST NO PARAMÉTRICO: Test de Mann-Whitney-Wilcoxon de suma de rangos (RESUMEN X) MUESTRAS APAREADAS O RELACIONADAS: TEST PARAMÉTRICO: Test de t-Student (RESUMEN XI) TEST NO PARAMÉTRICO: Test de Wilcoxon de rangos con signo (RESUMEN XII) M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 2. (a) MUESTRAS INDEPENDIENTES X =disminución glucemia dosis alta insulina ∼ N(µ1 , σ12 ) Y =disminución glucemia dosis baja insulina ∼ N(µ2 , σ22 ) m=9 x̄ = 16.4, s1 = 4 n=9 ȳ = 9.3, s2 = 3 H0 : σ12 = σ22 vs. H1 : σ12 6= σ22 RESUMEN VII: Rechazamos H0 al nivel α si s21 s22 2 2 > Fα/2 (n − 1, m − 1) si s21 ≤ s22 2 > Fα/2 (m − 1, n − 1) si s1 ≥ s2 ó s2 s21 2 4 s21 = 1.78 α ⇒ Fα/2 (8, 8) Fexp = 2 = 3 s2 α = 0.05 ⇒ α = 0.1 ⇒ α = 0.2 ⇒ F0.025 (8, 8) = 4.43 F0.05 (8, 8) = 3.44 F0.1 (8, 8) = 2.59 ⇒ ⇒ ⇒ Fexp < F0.025 (8, 8) ⇒ Fexp < F0.05 (8, 8) ⇒ Fexp < F0.1 (8, 8) ⇒ H0 H0 H0 p > 0.2 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 2. (a) H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 RESUMEN VIII: σ12 , σ22 DESCONOCIDAS, σ12 = σ22 m=9 x̄ = 16.4, s1 = 4 n=9 ȳ = 9.3, s2 = 3 2 2 2 2 (m − 1)s + (n − 1)s 8 ∗ 4 + 8 ∗ 3 1 2 s2 = = = 12.5 ⇒ s = 3.54 m+n+2 8∗2 texp = 16.4−9.3 √ 3.54 1/9+1/9 = 4.25 α = 0.05 ⇒ t0.05 (16) = 2.120 ⇒ |texp | > t0.05 (16) ⇒ H1 α = 0.001 ⇒ t0.001 (16) = 4.015 ⇒ |texp | > t0.001 (16) ⇒ H1 p < 0.001 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 2. (b) ¿En cuánto podemos estimar dicha diferencia? m=9 x̄ = 16.4, s1 = 4 2 s = (m−1)s21 +(n−1)s22 m+n+2 = n=9 8∗42 +8∗32 8∗2 ȳ = 9.3, s2 = 3 = 12.5 ⇒ s = 3.54 ESTIMACIÓN PUNTUAL: µ\ 1 − µ2 = x̄ − ȳ = 16.4 − 9.3 = 7.1 ESTIMACIÓN POR INTERVALO DE CONFIANZA: RESUMEN IX Nivel de confianza 1 − α q µ1 − µ2 ∈ (x̄ − ȳ) ± tα (m + n − 2)s m1 + n1 1 − α = 0.95 q µ1 − µ2 ∈ 7.1 ± 2.120 ∗ 3.54 ∗ 19 + CON UNA CONFIANZA DEL 95% M. González 1 9 = 7.1 ± 3.54 = [3.56, 10.64] Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un tratamiento que reduce el colesterol: Placebo Tratamiento 5.6 3.35 6.25 3.6 7.45 3.75 5.05 4.15 4.56 3.6 4.5 3.9 4.3 (a) Probar si existe diferencia significativa entre las dosis medias de colesterol sérico en ambas poblaciones, suponiendo normalidad de ambas variables. (b) ¿Qué podemos hacer si no tenemos la hipótesis de normalidad? MUESTRAS INDEPENDIENTES NO PARAMÉTRICO: TEST DE SUMA DE RANGOS DE MANN-WHITNEY-WILCOXON RESUMEN X M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un tratamiento que reduce el colesterol: Placebo Tratamiento 5.6 3.35 6.25 3.6 7.45 3.75 M. González 5.05 4.15 4.56 3.6 4.5 3.9 4.3 Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos de individuos hiperlipidémicos, bajo el efecto de un placebo y después de un tratamiento que reduce el colesterol: Placebo Tratamiento 5.6 3.35 6.25 3.6 7.45 3.75 5.05 4.15 4.56 3.6 4.5 3.9 4.3 RESUMEN X: Rexp = RX = 16 Rechazamos H0 al nivel de significación α si Rexp ≤ VI (α) ó Rexp ≥ VS (α) VI (0.05) = 21, VS (0.05) = 49 Rexp < VI (α) H1 α = 0.05 VI (0.01) = 17, VS (0.01) = 53 Rexp < VI (α) H1 α = 0.01 p < 0.01 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 7. Se ha estudiado el tiempo de reacción ante un estímulo auditivo bajo dos situaciones o condiciones radicalmente diferentes F y Q. Para ello se ha elegido una muestra aleatoria de 9 niños, los cuales han sido estimulados, en primer lugar, bajo la situación F y pasado un tiempo prudencial de reposo, son nuevamente estimulados bajo Q. Los tiempos de reacción, en centésimas de segundo, aparecen en la siguiente tabla: niño sist. F sist. Q 1 14 17 2 12 14 3 9 13 4 13 15 5 15 16 6 17 16 7 13 16 8 12 15 9 13 13 (a) Suponiendo que la diferencia de los tiempos de reacción se distribuye normalmente, ¿puede afirmarse que el tiempo de reacción medio difiere de la situación F a la Q, si admitimos un nivel de error del 1%? X=TIEMPO DE REACCIÓN ANTE F Y=TIEMPO DE REACCIÓN ANTE Q µ1 , σ12 µ2 , σ22 (X1 , Y1 ), . . . , (X9 , Y9 ) Di = Xi − Yi , i = 1, . . . , 9, m.a.s. N(µD , σD2 ), µD = µ1 − µ2 . M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 7. (a) PARAMÉTRICO. MUESTRAS APAREADAS. TEST T-STUDENT. RESUMEN XI H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 H0 : µD = 0 vs. H1 : µD 6= 0 niño sist. F sist. Q di d̄ = −1.89 1 14 17 -3 2 12 14 -2 3 9 13 -4 4 13 15 -2 5 15 16 -1 s2D = 2.61 (sD = 1.616) 6 17 16 1 texp 7 13 16 -3 8 12 15 -3 d̄ √ = sd / n 9 13 13 0 = −3.51 Rechazamos H0 al nivel de significación α si |texp | > tα (n − 1) α = 0.01 α = 0.001 t0.01 (8) = 3.355 t0.001 (8) = 5.041 |texp | > t0.01 (8) H1 |texp | < t0.001 (8) H0 0.001 < p < 0.01 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras Comparación Medias Poblacionales 7. (b) ¿Cómo podemos establecer la comparación si no tenemos la hipótesis de normalidad? NO PARAMÉTRICO. MUESTRAS APAREADAS. TEST DE WILCOXON DE RANGOS CON SIGNO. RESUMEN XII. niño di 1 -3 2 -2 3 -4 4 -2 5 -1 6 1 7 -3 8 -3 3 (6) 4 (8) 9 0 n=8 + − (1.5) 1 1 (1.5) 2 (3.5) 2 (3.5) 3 (6) 3 (6) R(+) = 1.5 R(−) = 34.5 Rechazamos H0 al nivel de significación α si R(+) ≤ Tα (n) ó R(−) ≤ Tα (n) α = 0.05 α = 0.01 T0.05 (8) = 3 T0.01 (8) = 0 R(+) < T0.05 (8) H1 R(+) , R(−) > T0.01 (8) H0 0.01 < p < 0.05 M. González Bioestadística: Inferencia Estadística. Análisis de Dos Muestras