Comparación. Variable Cuantitativa Dos Muestras Comparación. Variable Cuantitativa Dos situaciones al comparar grupos: Muestras Independientes Muestras Relacionadas Si son dos: Pareadas o Emparejadas Dos Muestras Independientes J.F. Casanova Ácido úrico en suero (mg/l) Independientes 52, 57, 55│49, 53, 48 58, 54, 60│51 En las pareadas cada dato de la primera serie está emparejado con uno de la segunda: Tienen una relación “previa”. Los datos vienen por pares. Dos muestras independientes J.F. Casanova 3 1) MUESTRAS GRANDES (AMBAS 30) De cada muestra se usa su media (pruebas paramétricas) “Comparación de medias” Estadístico de Contraste: J.F. Casanova Dos muestras independientes 4 Distribución (para H0: d x 0 ): · Aproximadamente Normal · Centrada en cero · Error estándar: d x x1 x 2 Dos muestras independientes Clasificación de las pruebas 1) Muestras Grandes 2) Muestras Pequeñas 2.1) Variable Normal 2.1.1) Varianzas Homogéneas 2.1.2) Varianzas Heterogéneas 2.2) Variable No Normal J.F. Casanova 2 Comparación. Variable Cuantitativa Dos Muestras Independientes Ejemplo Pareadas 57 ┼ 50 41 ┼ 42 51 ┼ 49 Dos muestras independientes 5 Comparación. Variable cuantitativa. Independientes sd x 21P n1 J.F. Casanova 22 P n2 S12 S22 n1 n 2 Dos muestras independientes 6 1 Ejemplo Regiones de Aceptación y de Rechazo: RECHAZAR H0 dx EXP –Z·s dx dx EXP –Z·s dx “ACEPTAR” H0 Sin Fármaco n1 = 100 x1 = 50 Con Fármaco n2 = 100 x2 = 60 sd x Si se RECHAZA la H0, ↦ Se considera demostrada la diferencia Si se “ACEPTA” la H0, ↦ NO se considera 202 122 2'332 100 100 d x EXP 60 50 10 1'96·2'332 4'6 2'58·2'332 6 3'29·2'332 7'7 P<0’001 demostrada la igualdad J.F. Casanova 7 Dos muestras independientes S1 = 20 S2 = 12 J.F. Casanova Dos muestras independientes * COMPARACIÓN DE VARIANZAS 2) MUESTRAS PEQUEÑAS (AL MENOS UNA < 30) Estadístico de Contraste: FEXP 2.1) VARIABLES NORMALES Igual procedimiento Grandes, excepto que: que para Muestras El método es distinto según sean Varianzas HOMOGÉNEAS o HETEROGÉNEAS el primer paso será comparar las varianzas Dos muestras independientes 9 Valor crítico habitual de la F para decidir si las varianzas son homogéneas en una comparación de medias – ↪ P = 0’05 2 S FEXP 12 F0 '05 Varianzas homogéneas S2 “Aceptar” H0 S12 FEXP 2 F0 '05 Varianzas heterogéneas S2 Rechazar H0 J.F. Casanova Dos muestras independientes S12 S22 (Siempre en el numerador la S mayor) DISTRIBUCIÓN (para H0: FEX = 1) : DISTRIBUCIÓN : t de Student J.F. Casanova 8 11 Comparación. Variable cuantitativa. Independientes F de Snedecor depende de dos números distintos de grados de libertad: 1 = n1-1 2 = n2-1 Siendo la muestra 1 la de S mayor J.F. Casanova Dos muestras independientes 10 2.1.1) VARIANZAS HOMOGÉNEAS DISTRIBUCIÓN t de Student con grados de libertad = n1+n2-2 y con s dx SC 1 1 n1 n 2 donde SC es la S común o ponderada: SC (n1 - 1) S12 (n 2 - 1) S2 2 n1 n 2 2 J.F. Casanova Dos muestras independientes 12 2 2.1.2) VARIANZAS HETEROGÉNEAS Elección de la probabilidad de error DISTRIBUCIÓN t de Student 2 2 con s S1 S2 dx n1 n 2 y con grados de libertad según la corrección de Welch: s A priori: Prefijada externamente A posteriori: La mínima que dé resultado estadísticamente significativo H0 2 s 2x 2 S12 2 4 2 donde : s x1 s x1 s4 n1 x2 n1 1 n 2 1 2 x1 J.F. Casanova Dos muestras independientes 0 0’05 5% 1% 0’001 1º/00 13 Método corto Comparación de Medias mediante Intervalos de Confianza d x EXP ≶ Z · s d x , despejando: Planteamiento d x EXP s dx Más orientado a situaciones prácticas que las técnicas clásicas (pruebas del nivel de significación). Preguntas que contestan: ≶ Z → ZEXP ≶ Z En el ejemplo Karnofsky: 60 50 ZEXP = = 4’29 > Z0’001 = 3’29 2'332 Nivel de significación: ¿Hay diferencia? Intervalos de Confianza: ¿Cuánta diferencia hay? J.F. Casanova 0’01 Dos muestras independientes 16 Comparación de Medias mediante Intervalos de Confianza Comparación de Medias mediante Intervalos de Confianza Ejemplo 1 Ejemplo 2 Al comprar un coche, me dicen que el A es más caro que el B. Parece una información importante. Pero … Podría ser que el A cueste 10.001 € y el B, 10.000. O bien que el A cueste 40.000 € y el B, 10.000. J.F. Casanova Dos muestras independientes 17 Comparación. Variable cuantitativa. Independientes Leo que hay 2 dietas y que una reduce más el peso que otra ¿Vale la pena que la use, suponiendo que es mucho más exigente que la otra? Si me dicen que la diferencia está entre 0’5 y 0’7 Kg/mes, ya puedo decidir si vale realmente la pena. J.F. Casanova Dos muestras independientes 18 3 Comparación de Medias mediante Intervalos de Confianza Comparación de Medias mediante Intervalos de Confianza Obtención del intervalo Procedimiento Muestras Grandes Se obtiene el Intervalo de Confianza de la Diferencia de Medias I.C.d x d x EXP Z·s.d x Centrado en la dx experimental Distribución: la misma que para las técnicas clásicas (y el mismo error estándar de la diferencia) Nos dice cuánto de grande es la diferencia en la población J.F. Casanova Dos muestras independientes I.C.d x d x EXP t·s.d x J.F. Casanova Si el intervalo de confianza Incluye la H0, ↪ No se ha demostrado la diferencia Deja fuera la H0, ↪ Se ha demostrado la diferencia Dos muestras independientes 21 Comparación de Medias mediante Intervalos de Confianza 3 Dos muestras independientes EJ.º A) d x x 2 x1 0 5’4 10 14’6 Demostrado que la diferencia a favor del grupo 2 está entre 5’4 y 14’6 (Demostrado x 2 x1 ) J.F. Casanova Dos muestras independientes 22 Decisión de “Aceptar H0” dependiente de n 8 Objetivo principal no práctico: Probabilidad 0 de que exactamente d x 0 Demostrado que la diferencia a favor del grupo 2 está entre -2 y 8 (Aceptable x 2 x1 ) J.F. Casanova No proporcionan la Magnitud del Efecto d x x 2 x1 0 Ejemplos: Nivel de confianza 95% Inconvenientes “Técnicas Clásicas” (o “Nivel de Significación”) EJ.º B) -2 20 Comparación de Medias mediante Intervalos de Confianza Ejemplos: Nivel de confianza 95% Dos muestras independientes Comparación de Medias mediante Intervalos de Confianza Relación con las Técnicas Clásicas J.F. Casanova Es equivalente a desplazar la Región de Aceptación hasta centrarla en d x EXP 19 Comparación de Medias mediante Intervalos de Confianza Muestras Pequeñas Variable Normal 23 Comparación. Variable cuantitativa. Independientes J.F. Casanova Dos muestras independientes 24 4 Comparación de Medias mediante Intervalos de Confianza Comparación de Medias mediante Intervalos de Confianza Inconvenientes “Técnicas Clásicas” (o “Nivel de Significación”) Ventajas técnicas clásicas (o “Nivel de Significación”) El error (Ej.º: P=0’05) no coincide con la probabilidad de equivocarnos: P(resultado / H0) P(H0 / resultado) Resultado muy simple (SÍ/NO) Propenso a errores de interpretación y “poco natural” Existen para casi todas las situaciones habituales J.F. Casanova Dos muestras independientes 25 Comparación. Variable cuantitativa. Independientes Valor P escogido en función de los datos (no prefijado) J.F. Casanova Dos muestras independientes 26 5