Ejercicios resueltos de ANOVA de un factor 1. En un experimento se

Anuncio
Ejercicios resueltos de ANOVA de un factor
1. En un experimento se compararon tres métodos de enseñar un idioma extranjero; para evaluar la
instrucción, se administró una prueba de vocabulario de 50 preguntas a los 24 estudiantes del experimento
repartidos de a ocho por grupo.
a) ¿Cuál es la variable respuesta y la explicativa en este estudio?
Respuesta:
La variable respuesta es el puntaje en la prueba de vocabulario
La variable explicativa son los métodos de enseñanza (auditivo, traducción y combinado). Es un
factor con 3 niveles.
b) Complete la tabla de ANOVA:
Tabla de análisis de varianza (ANOVA)
Suma de
cuadrados
Media
cuadrática
323.792
Gl
Inter-grupos
Intra-grupos
F
Sig.
.002
21
Total
1460.958
Respuesta:
Tabla de ANOVA
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
647.584
2
Media
cuadrática
323.792
813.374
21
38.732
1460.958
23
gl
F
8.360
Sig.
.002
Pasos para completar la tabla:
1) calculo los grados de libertad, en el total son n-1 y n=24, por lo tanto son 23. Los grupos a
comparar son 3 por lo tanto los gl Inter son 2, verifico que (2+21) son los 23 del total.
2) La suma de cuadrados Inter se obtiene multiplicando la media cuadrática por los gl, i.e.
323.792*2=647.584
3) Teniendo la SC Inter, saco la SC Intra restando 1460.958-647.584=813.374
4) Con la SC Intra y los gl calculo la media cuadrática Intra =813.374/21=38.732
5) Por último con las dos MC calculo el test F=323.792/38.732=8.360
c) Qué supuestos debería verificar el investigador, escriba las hipótesis asociadas a ellos.
Respuesta:
El investigador antes de comparar las medias, debe verificar los supuestos de Normalidad y de
Homogeneidad de las varianzas (el supuesto de independencia se comprueba en el diseño, dividió a
8 estudiantes por cada método).
Hipótesis:
1) Normalidad: Necesita realizar 3 pruebas de hipótesis, una para cada grupo del tipo:
H 0 : los puntajes del grupo i son normales
H 1 : los puntajes del grupo i NO son normales.
donde i representará cada método de enseñanza: auditivo, traducción y combinado.
2) Homocedasticidad: la hipótesis es:
H 0 : σ 12 = σ 22 = σ 32
H 1 : al menos una varianza difiere
Donde 1=método auditivo, 2=método traducción, 3=método combinado.
d) Asuma que se cumplen los supuestos y realice la prueba de interés para el investigador. Informe la
conclusión del estudio.
Respuesta:
Si se cumplen los supuestos, entonces podemos comparar las medias de los métodos de enseñanza
usando el test F de la ANOVA:
Hipótesis:
H 0 : µ1 = µ 2 = µ3
H1 : al menos dos medias no son iguales.
De la tabla de ANOVA sacamos el test F=8,36 al que corresponde un valor-p de 0,002, este valor-p
es menor que el nivel de significación de 0,05, por lo tanto rechazamos la hipótesis nula y
concluimos que existen diferencias significativas entre las medias de los métodos de
enseñanza al 5%.
2. Un exceso de ozono es una señal de contaminación. Se tomaron seis muestras de aire de concentraciones de
ozono (en partes por 10 mil) en cuatro ciudades de la séptima región (Curicó, Talca, Linares y Maule) y se
determinó el contenido de ozono. Use las salidas de SPSS para llevar a cabo el Análisis de Varianza
(ANOVA) paso a paso. Al final informe sobre la situación del ozono a las autoridades regionales.
Respuesta:
Pasos, primero describimos los datos:
Tabla: Medidas descriptivas de las mediciones de Ozono en ciudades de la VII región
Ozono
N
Desviación
típica
1.472
Error típico
.601
Curicó
6
Media
8.17
Talca
6
10.00
1.265
.516
Linares
6
13.50
2.429
.992
Maule
6
8.50
2.345
.957
Total
24
10.04
2.820
.576
Si ordenamos los promedios vemos que en Curicó se obtiene el promedio más bajo de ozono, luego
está Maule, Talca y Linares. Llama la atención que en Linares se den promedio mayores que en
Talca que es una ciudad mayor.
Deberíamos mostrar un gráfico de caja, pero no tenemos los datos.
Segundo, verificamos los supuestos, primero el supuesto de independencia se cumple ya que los
datos son de distintas ciudades, hay independencia; seguimos con el de Normalidad (usaremos el
Test de Kolmogorov-Smirnov):
H 0 : la distribución de ozono de Curicó es normal
H 1 : la distribución de ozono de Curicó NO es normal
Estadístico de KS= 0,214, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H 0 : la distribución de ozono de Talca es normal
H 1 : la distribución de ozono de Talca NO es normal
Estadístico de KS= 0,285, valor-p=0,138 mayor que 0,05 por lo tanto acepto normalidad
H 0 : la distribución de ozono de Linares es normal
H 1 : la distribución de ozono de Linares NO es normal
Estadístico de KS= 0,102, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H 0 : la distribuci ón de ozono de Maule es normal
H 1 : la distribución de ozono de Maule NO es normal
Estadístico de KS= 0,190, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
Conclusión general, podemos aceptar el supuesto de Normalidad de estos datos en todas las
ciudades.
Continuamos con el supuesto de homocedasticidad, realizamos el test de Levene para la hipótesis:
H 0 : σ 12 = σ 22 = σ 32 = σ 42
H 1 : al menos una varianza difiere
Donde 1=Curicó, 2=Talca, 3=Linares y 4=Maule
Resultado según tabla: Estadístico= 1,081, valor-p=0,38, es mayor que 0,05, por lo tanto acepto la
hipótesis nula y podemos concluir que las varianzas son homogéneas. Se cumple el supuesto de
homocedasticidad.
En vista que se cumplen todos los supuestos ANOVA, procedemos a comparar las medias de las
mediciones de ozono en las 4 ciudades con el test de ANOVA, la hipótesis es:
H 0 : µ1 = µ 2 = µ 3 = µ 4
H 1 : al menos dos medias no son iguales.
Según la tabla el F observado es 9,418 y el valor-p es menor que 0,001, por lo tanto rechazamo la
hipótesis nula, y concluimos que existen diferencias significativas entre los promedio de ozono en
estas ciudades.
Ahora nos interesa saber qué promedios son diferentes. Para eso hacemos test de comparaciones
múltiples de Tukey, que controla la tasa de error tipo I.
Mirando la tabla de la salida de SPSS podemos construir la siguiente tabla con los promedios
ordenados de menor a mayor:
Ciudades
1
Curicó
2
8.17
Maule
8.50
Talca
10.00
Linares
13.50
Informe:
Después de estudiar los datos, podemos llegar a una conclusión global de que Curicó, Maule y Talca
tienen promedios similares de ozono, en cambio Linares aparece con niveles significativamente
superiores (al 5%).
Descargar