Tema 14 Análisis de Varianza. 1 Problemas resueltos. Tema 14 Análisis de Varianza 1.- Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes: Método I 15 16 14 15 17 Método II 14 13 15 16 14 Método III 13 12 11 14 11 A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás? Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el número de observaciones: 2 Suma Sum2/n Metd. I Metd. II Metd. III Total Sum /n 77 1185,8 72 1036,8 61 744,2 210 2966,8 2940 A continuación calculamos los cuadrados de las observaciones y su total: Metd. I Metd. II Metd. III 225 196 169 256 169 144 196 225 121 225 256 196 289 196 121 1191 1042 751 2984 A partir de estas cantidades básicas calculamos las Sumas de Cuadrados: SC(total) = 2984 - 2940 = 44 SC(intra) = 2984 – 2966,8 = 17,2 SC(entre) = 2966,8 – 2940 = 26,8 Los cuadrados medios serán: CM(entre) = 26,8/2 = 13,4 CM(intra) = 17,2/12 = 1,43 Por consiguiente el estadístico de contraste vale: 2 Problemas de Análisis de Datos. José María Salinas F = 13,4/ 1,43 = 9,37 El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hipótesis nula y se concluye que los tres métodos de entrenamiento producen diferencias significativas. 2.- Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados: Procdmt. I 5 7 6 3 9 7 4 2 Procdmt. II Procdmt. III 9 6 8 5 7 4 4 11 7 7 8 Procdmt. IV 1 3 9 4 5 1 4 ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de significación del 5%? Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el número de observaciones: 2 Suma Sum2/n Proc. I Proc. II Proc. III Proc. IV Total Sum /n 43 231,1 42 352,8 43 264,1 18 54 146 902 819,8 A continuación calculamos los cuadrados de las observaciones y su total: Procdmt. I Procdmt. II Procdmt. III Procdmt. IV 25 81 64 1 49 121 36 9 36 9 81 49 64 49 49 16 81 25 49 16 16 25 1 16 16 4 269 364 287 68 988 A partir de estas cantidades básicas calculamos las Sumas de Cuadrados: Tema 14 Análisis de Varianza. 3 SC(total) = 988 – 819,8 = 168,2 SC(intra) = 988 – 902 = 86 SC(entre) = 902 – 819,8 = 82,2 Los cuadrados medios serán: CM(entre) = 82,2/3 = 27,4 CM(intra) = 86/22 = 3,9 Por consiguiente el estadístico de contraste vale: F = 27,4/ 3,9 = 7,03 El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05. Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de presentación producen diferencias significativas. En un experimento se compararon tres métodos de enseñar un idioma e xtranjero; para evaluar la instrucción, se administró una prueba de vocabulario de 50 preguntas a l os 24 estudiantes del experimento repartidos de a ocho por grupo. a) ¿Cuál es la variable respuesta y la explicativa en este estudio? Respuesta: La variable respuesta es el puntaje en la prueba de vo cabulario La variable explicativa son los métodos de enseñanza (au ditivo, traducción y combinado). Es un factor con 3 niveles. b) Complete la tabla de ANOVA: Tabla de análisis de varianza (ANOVA) Suma de cuadrados Gl Media cuadrática F Sig. Inter-grupos 323.792 .002 Intra-grupos 21 Total 1460.958 Respuesta: Tabla de ANOVA Suma de cuadrados gl Media cuadrática F Sig. Inter-grupos 647.584 2 323.792 8.360 .002 Intra-grupos 813.374 21 38.732 Total 1460.958 23 Pasos para completar la tabla: 1) calculo los grados de libertad, en el total son n-1 y n=24, por lo tanto son 23. Los grupos a comparar son 3 por lo tanto los gl Inter son 2, verifico que (2+21) son los 23 del total. 2) La suma de cuadrados Inter se obtiene multiplicando l a media cuadrática por los gl, i.e. 323.792*2=647.584 3) Teniendo la SC Inter, saco la SC Intra restando 14 60.958-647.584=813.374 4) Con la SC Intra y los gl calculo la media cuadrática Intra =813.374/21=38.732 5) Por último con las dos MC calculo el test F=323.792/38 .732=8.360 c) Qué supuestos debería verificar el investigador, escriba las hipótesis asociadas a ellos. Respuesta: El investigador antes de comparar las medias, debe veri ficar los supuestos de Normalidad y de Homogeneidad de las varianzas (el supuesto de independe ncia se comprueba en el diseño, dividió a 8 estudiantes por cada método). Hipótesis: 1) Normalidad: Necesita realizar 3 pruebas de hipótesi s, una para cada grupo del tipo: . normales son NO grupo del puntajes los : normales son grupo del puntajes los : 1 0 i H i H donde i representará cada método de enseñanza: auditi vo, traducción y combinado. 2) Homocedasticidad: la hipótesis es: 2 3 2 2 2 1 0 : σ σ σ = = H difiere varianza una menos al : 1 H Donde 1=método auditivo, 2=método traducción, 3=métod o combinado. d) Asuma que se cumplen los supuestos y realice la prueba de interés para el investigador. Informe la conclusión del estudio. Respuesta: Si se cumplen los supuestos, entonces podemos comparar las medias de los métodos de enseñanza usando el test F de la ANOVA: Hipótesis: . iguales son no medias dos menos al : : 1 3 2 1 0 H H μ μ μ = = De la tabla de ANOVA sacamos el test F=8,36 al que corr esponde un valor-p de 0,002, este valor-p es menor que el nivel de significación de 0,05, por lo t anto rechazamos la hipótesis nula y concluimos que existen diferencias significativas entre las medias de los métodos de enseñanza al 5%.