Análisis de la varianza de un factor

Anuncio
Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de un factor
Joaquín Aldás Manzano
Universitat de València
* [email protected]
Doctorado Interuniversitario en Marketing
1
Construcción de un modelo multivariante
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
■ 
■ 
■ 
■ 
■ 
Definir el problema y decidir la técnica
Desarrollo del plan de análisis
►  Tamaños muestrales mínimos
►  Escalas adecuadas
Condiciones de aplicabilidad
►  Comprobación de hipótesis subyacentes a los modelos
Estimación del modelo y ajuste global
Interpretación de los resultados
Validación (resultados generalizables a la población)
Doctorado Interuniversitario en Marketing
2
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis de la varianza (tabaco1.sav)
►  Sirve para determinar si una variable determinada toma valores medios
iguales o distintos en los grupos que forma otra variable.
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien?
►  VARIABLE DEPENDIENTE (impuesto), es la que queremos saber si toma
valores medios iguales o distintos.
▬  ¿Deben subirse los impuestos sobre el tabaco? 1=Totalmente en
desacuerdo a 5=Totalmente de acuerdo
►  FACTOR (fuma) es la variable que supuestamente ejerce una influencia
sobre la variable dependiente (establece los grupos)
▬  ¿Fuma usted? 1=No, nunca he fumado, 2=No, lo he dejado; 3=Sí
►  Se analizará también el análisis de la varianza de dos factores, donde se
considera la influencia conjunta sobre la dependiente de dos variables
independientes (factores).
Doctorado Interuniversitario en Marketing
3
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis de la varianza
►  Cómo deben estar medidas las variables?
▬  El factor debe ser una variable nominal
▬  La variable dependiente debe ser métrica
►  Formulación de la hipótesis nula:
H 0 : x f = xnf = xd
► 
► 
► 
¿Cuál es la hipótesis alternativa? Importancia para las pruebas post hoc
Cálculo del estadístico F (veremos su lógica… solo esta vez!)
Rechazo o no de la hipótesis nula
▬  Significatividad p
Doctorado Interuniversitario en Marketing
4
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Lógica del estadístico F
►  Cada individuo, fumador o no, tendrá una opinión que diferirá en mayor o
menor medida de la opinión del conjunto de la muestra:
Ygi − Y
► 
Esa diferencia puede escribirse:
Ygi − Y = (Yg − Y ) + (Ygi − Yg )
Desviación residual
Desviación explicada por el factor
► 
Elevamos al cuadrado:
(Ygi − Y ) = (Yg − Y ) + (Ygi − Yg ) + 2 (Yg − Y )(Ygi − Y )
2
Doctorado Interuniversitario en Marketing
2
2
5
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Lógica del estadístico F
►  Como no tenemos un solo grupo sino G y en cada uno de ellos no hay un
solo individuo, sino ng sumamos para todos ellos:
SCT
Variabilidad total
SCF
Variabilidad explicada por el factor
Between groups
SCR
Variabilidad residual
Within groups
Doctorado Interuniversitario en Marketing
6
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Lógica del estadístico F
►  Cuanto más parte de la variabilidad total la explique pertenecer a un grupo
u otro (factor) y menos la variabilidad interna de cada grupo, más seguros
estaremos de que el efecto del factor es relevante. Por eso parece lógico
construir el estadístico de este modo:
SCF
MCF G − 1
F=
=
MCR SCR
n−G
► 
► 
Es decir cuanto más importante sea el efecto del factor, más grande será
el estadístico.
La división por de las sumas de cuadrados por sus grados de libertad, lo
que las convierte en lo que llamamos media cuadrática, solo pretende
ajustar el hecho de que no hay el mismo número de elementos
generadores de variabilidad en numerador y denominador
Doctorado Interuniversitario en Marketing
7
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Lógica del estadístico F
SCF
171,37
MCF G − 1
F=
=
= 3 − 1 = 59,16
MCR SCR 344, 72
n − G 241 − 3
Doctorado Interuniversitario en Marketing
8
Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Homoscedasticidad
►  La varianza de la variable dependiente no debe ser significativamente
distinta en los grupos que hace el factor
►  Algunos autores afirman que el que no se cumpla no afecta mucho al
estadístico F si las muestras de cada grupo son del mismo o similar
tamaño (Stevens, 1996).
►  Ver siempre los descriptivos
►  Test de Levene (recordar que la H0 es igualdad de las varianzas)
►  ¿Y si no?...
▬  Transformación de la variable dependiente, aunque hoy en día hay
alternativas…
▬  Estadísticos robustos ante la ausencia de homoscedasticidad (BrownForsythe, Welch)
Doctorado Interuniversitario en Marketing
9
Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Doctorado Interuniversitario en Marketing
10
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Significatividad del estadístico F
►  Con base en esta información decidimos si es plausible el rechazo de la
hipótesis nula
► 
► 
Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es
decir, ¿cuál es el tamaño del efecto?
Debemos reportar el R2, que no es sino una medida de qué parte de la
varianza total es explicada por el factor:
R2 =
SCF 171,37
=
= 0,33
SCT 516,10
Doctorado Interuniversitario en Marketing
11
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
F de Brown-Forsythe (Brown y Forsythe, 1974)
►  Cuando los grupos tienen distintos tamaños muestrales y la varianza más
grande están en los grupos con mayor tamaño, esto sesga el estadístico F
provocando que sea muy conservador:
Si la varianza más
grande está en el
grupo más grande SCR
se hincha
► 
Brown y Forsythe (1984) proponen la siguiente corrección:
La varianza de cada grupo está ahora
multiplicado por un factor que es más pequeño
cuanto más grande es el tamaño del grupo. Este
estadístico se evalúa con un número de grados
de libertad corregido para el denominador
Doctorado Interuniversitario en Marketing
12
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
F de Brown-Forsythe (Brown y Forsythe, 1974)
Grados de libertad del
denominador corregidos
Doctorado Interuniversitario en Marketing
13
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
■ 
¿Pero cuál era la hipótesis alternativa? Pruebas post hoc
►  Sólo podemos decir que la media en algún grupo es diferente a las demás,
pero ¿cuáles son diferentes de cuáles?
►  Para poder concluir algo al respecto tenemos una batería de distintas
pruebas post hoc o pruebas a posteriori
►  También existen pruebas post hoc específicas para situaciones de
ausencia de homoscedasticidad
¿Por qué pruebas específicas? ¿Por qué no comparar las medias dos a dos
mediantes pruebas t?
►  Ejercicios de simulación de Montecarlo demuestran que la probabilidad de
que las pruebas t encadenadas encuentren alguna diferencia significativas
donde no las hay se incrementa con el número de comparaciones (5
grupos, 10 comparaciones, 29%; 10 grupos, 45 comparaciones, 63%)
►  Las pruebas específicas ajustan el nivel de significación necesario en
función del número de comparaciones. Cuanto más comparaciones, mayor
tiene que ser la diferencia para ser considerada significativa.
►  Por ejemplo, Bonferroni, una de las más sencillas, si se realizan c
comparaciones, exige un nivel de significación crítico de a/c para poder
rechazar cada comparación
Doctorado Interuniversitario en Marketing
14
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Pruebas post hoc
Doctorado Interuniversitario en Marketing
15
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
¿qué pruebas post hoc elegir?
►  Puede consultarse Toothaker (1993) o Klockars y Sax (1986) para una
argumentación detallada, pero tengamos en cuenta que SPSS produce
hasta 18 tests
►  Como guía apuntamos la síntesis de las recomendaciones de Field (2005):
▬  Si tenemos muestras iguales por grupo y estamos bastante seguros
de que las varianzas son parecidas:
●  REGWQ o Tukey tienen un buen equilibrio entre poder y control
del error tipo I
●  Bonferroni es conservador pero asegura control sobre el error
tipo I
▬  Si los tamaños muestrales son ligeramente distintos: Gabriel
▬  Si los tamaños muestrales son muy distintos: Hochberg GTD
▬  Si hay dudas sobre la homogeneidad de varianzas: Games-Howell
Doctorado Interuniversitario en Marketing
16
Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Results were analyzed using a one-way ANOVA, between-groups
design. This analysis revealed a significant effect for
smoking habit, F(2,238)=59.16; p <.01. The sample means are
displayed in Figure X. Tukey’s HSD test showed that subjects
who have always been non-smokers or that have given up
smoking are significantly more favorable to increase tobacco
taxes than smokers (p <.05) while there were no significant
differences between them.
Doctorado Interuniversitario en Marketing
17
Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
#VD
Tipo
VD
# VI
Tipo
VI
#
niveles
=o≠
participantes
Paramétrico
TEST
SI
DISTINTOS
NO
2
SI
MISMOS
MET
1
NO
NO
MET
SI
One way ANOVA
DISTINTOS
1
NO
+2
SI
MISMOS
NO
SI
MET
MISMOS
NO
NO
MET
1
NO
MET
Doctorado Interuniversitario en Marketing
DISTINTOS
18
Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de un factor no paramétrico
Test de Kruskal-Wallis
Joaquín Aldás Manzano
Universitat de València
* [email protected]
Doctorado Interuniversitario en Marketing
19
Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
■ 
Normalidad
►  Ante violaciones de la homoscedasticidad hemos visto que tenemos
alternativas bastante robustas para el estadístico F (Brown-Forsythe,
Welch), pero ¿y si se viola el supuesto de normalidad?
►  La alternativa es una Anova no paramétrico llamado Anova de KruskalWallis o simplemente test de Kruskall-Wallis (Kruskall y Wallis, 1952).
Ejemplo (soya1.sav). Ilustraremos el procedimiento de cálculo con un ejemplo,
una vez más simpático, de Field (2005) porque está basado en pocos casos, y
es más sencillo explicar los pasos uno a uno.
►  Este autor leyó que los menores niveles de esperma en los varones
occidentales está asociado al escaso consumo de soja.
►  Diseñó un experimento (datos ficticios, claro) con cuatro grupos de 20
individuos cada uno en función de su nivel de consumo de soja (ningún
consumo-control, una comida a la semana, cuatro a la semana y todos los
días). Al final del año se efectuó un recuento de esperma (variable
dependiente).
►  ¿Es la media de esperma significativamente distinta en cada grupo?
Doctorado Interuniversitario en Marketing
20
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Rango para el total de casos n=80
Doctorado Interuniversitario en Marketing
21
Estimación
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Cálculo del estadístico
►  Los datos de toda la muestra se ordenan simultáneamente y se les asigna
un orden (ranking), en nuestro caso 1-80, pues n=80.
►  Después de ordenados se separan por grupos.
►  Se suma los rangos de cada grupo (Ri).
►  Se calcula el estadístico H equivalente al F del Anova:
k
12
Ri2
H=
" ! 3( N + 1)
N ( N + 1) i =1 ni
► 
En nuestro ejemplo:
12 " 927 2 8832 8832 547 2 %
H=
+
+
+
( 3 ! 81 = 8.65
80 ! 81 $# 20
20
20
20 '&
► 
Estadístico que se distribuye según una X2 con k-1 grados de libertad
Doctorado Interuniversitario en Marketing
22
Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
¿Tiene sentido hacer un test de Kruskal-Wallis?
Doctorado Interuniversitario en Marketing
23
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Resultados
El método asintótico es
exacto con muestras
grandes, pero con
muestras pequeñas o
con datos muy poco
normales, es mejor
Monte Carlo, que
genera una muestra
similar a la nuestra y
extrae muchas
submuestras (10.000)
con las que calcula el
valor medio de la
significatividad y del
intervalo de confianza
Doctorado Interuniversitario en Marketing
24
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis post hoc
►  No existen pruebas específicas
►  Podemos comparar los grupos de dos en dos con pruebas de Mann-Whitney, pero esto
incrementa el error tipo I
►  Por ello, si lo hacemos, tendremos que hacer alguna corrección, como la de Bonferroni
(utilizar como significatividad 0.05/número de tests)
►  Esto obliga a hacer solo los contrastes imprescindibles, puesto que si no el nivel crítico para
la significatividad sería muy pequeño
►  Otra alternativa es la propuesta por Siegel y Castellan (1988)
Los descriptivos parece mostrar
medias muy similares, salvo para
el último grupo, pero para estar
seguros de esta apreciación
necesitamos las pruebas a
posteriori
Doctorado Interuniversitario en Marketing
25
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis post hoc
►  Veamos Mann-Whitney con corrección de Bonferroni
►  Limitaremos las pruebas a:
▬  3: grupo de control frente a los otros tres
▬  αcrítico =0.05/3=0.0167
0 vs 1 comida
0 vs 4 comidas
0 vs 7 comidas
Parece que comer soja no
aumenta la cantidad de
esperma, pero comer mucho sí
que la reduce
Doctorado Interuniversitario en Marketing
26
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis post hoc
►  Veamos la propuesta de Siegel y Castellan (1988)
►  El estadístico para cada comparación es la diferencia en valor absoluto entre la media de los
rangos
►  El valor crítico de comparación es un z-score corregido por el número de comparaciones que
se hacen y una constante basada en el tamaño muestral total y el tamaño muestral de los
grupos que se comparan:
Ru ! Rv " z# / k ( k !1)
! = 0.05
k=4
!
0.05
=
= 0.00417
k ( k " 1) 4 # 3
z0.00417 = 2.64
N ( N + 1) $ 1 1 '
&% n + n )(
12
u
v
z
Larger
Portion
Smaller
Portion
y
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70
.99560
.99573
.99585
.99598
.99609
.99621
.99632
.99643
.99653
.00440
.00427
.00415
.00402
.00391
.00379
.00368
.00357
.00347
.0129
.0126
.0122
.0119
.0116
.0113
.0110
.0107
.0104
Sin complicarse, en Excel
=INV.NORM.ESTAND(0,00417)
=2,6379
z
Test Statistic
Doctorado Interuniversitario en Marketing
27
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Ru
Análisis post hoc
►  Veamos la propuesta de Siegel y Castellan (1988)
Rv de datos:
Ru de la tabla
►  Los rangos de todas las comparaciones salen
Ru ! Rv
Ru
Rv
Ru
Rv
Ru ! Rv Ru ! Rv
Rv
Ru ! RvRu ! Rv
Ru ! Rv
Ru ! Rv
Ru ! Rv
► 
Y el valor crítico con el que hay que comparar las diferencias de rangos es:
Ru ! Rv
critica
= z" / k ( k !1)
= 2.64
N ( N + 1) # 1 1 &
%$ n + n (' =
12
u
v
80 ) 81 # 1
1&
+ (
%$
12
20 20 '
= 2.64 540 ( 0.1)
= 19.40
Doctorado Interuniversitario en Marketing
Solo hay un valor crítico para todas las
comparaciones porque los tamaños
muestrales de todos los grupos son iguales.
Todas las diferencias son inferiores al valor
crítico, luego ninguna es significativa, aquí se
ve la ventaja de ser selectivo con el número de
comparaciones, si se compara el resultado
con el de Mann-Whitney
28
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Testando tendencias: El test de Jonckheere-Terpstra
►  Este test (Jonckheere, 1954; Terpstra, 1952) hace lo mismo que el test de Kruskal-Wallis,
pero, además evalúa si hay un patrón ordenado en las medianas, es decir, si el orden de los
grupos aporta algún patrón significativo al orden de las medianas
►  Parte de la base de que el orden en el que se codifican los grupos, implica el orden en que se
espera la ordenación de medianas (aunque puede ser positivo o negativo indicando +/+ o +/-)
►  No entraremos en los cálculos, pero para más de 8 casos por grupo el estadístico se
distribuye como una normal y se puede obtener fácilmente su z-score.
El estadístico muestra una tendencia
significativa para las medianas y su signo es
negativo, es decir, cuando se pasa de no
tomar a tomar cada vez más soja, el recuento
de espermatozoides cae
Doctorado Interuniversitario en Marketing
29
Resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Tamaño del efecto
►  El estadístico de Kruskal-Wallis, se distribuye como una chi cuadrado y, desafortunadamente, no
es fácil convertir una chi cuadrado de más de un grado de libertad a un tamaño de efecto r.
►  Por eso, recomendamos seguir a Field (2005) cuando sugiere calcular los tamaños de efecto
para cada uno de los test de Mann-Whitney que se realizaron en las pruebas post hoc.
►  Recordemos que el tamaño del efecto se calculaba:
r=
► 
z
N
Solo tener cuidado con que N hace referencia a la suma de los dos grupos comparados (40)
!0.243
= !.04
40
-2
!0.476
r=
= !.28
80
r=
Doctorado Interuniversitario en Marketing
r=
!0.325
= !.05
40
r=
!2.597
= !.41
40
Para el test de Jonckheere, téngase en
cuenta que usa todos los datos (N=80)
30
Presentando resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Escribiendo los resultados en un artículo
►  Alternativa 1: Kruskal-Wallis + análisis post hoc
Sperm counts were significantly affected by eating soya meals (H(3)=8.66, p<.05).
Mann-Whitney tests were used to follow up this finding. A Bonferroni correction
was applied so all effects are reported at a .0167 level of significance. It
appeared that sperm counts were no different when one soya meal (U=191, r=-.04)
or four soya meals (U=188, r=-.05) were eaten per week compared to none. However,
when seven soys meals were eaten per week, sperm counts were significanly lower
than when no soya was eaten (U=104, r=-.41). We can conclude that is soya is
eaten every day it significantly reduces sperm counts compared to eating none;
however eating soya less than every day has no significant impact on sperm
counts.
► 
Alternativa 2: Test de Jonckheere
All effects reported at p<.05. Sperm counts were significantly affected by eating
soya meals (H(3)=8.66). Jonckheere’s test revealed a significant trend in the
data: as more soya was eaten, the median sperm count decreased, J=912, z=-2.48,
r=-.28
Doctorado Interuniversitario en Marketing
31
Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
#VD
Tipo
VD
# VI
Tipo
VI
#
niveles
=o≠
participantes
Paramétrico
TEST
SI
DISTINTOS
NO
2
SI
MISMOS
MET
1
NO
NO
MET
SI
DISTINTOS
1
NO
+2
Kruskall-Wallis Anova
SI
MISMOS
NO
SI
MET
MISMOS
NO
NO
MET
1
NO
MET
Doctorado Interuniversitario en Marketing
DISTINTOS
32
Análisis de Datos Avanzados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Análisis de la varianza de dos factores
Joaquín Aldás Manzano
Universitat de València
* [email protected]
Doctorado Interuniversitario en Marketing
33
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Análisis de la varianza de dos factores
►  Pretendemos ahora analizar el efecto de dos variables independientes (no
métricas) sobre una dependiente (métrica)
▬  Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar
o no el ser más o menos favorable a que se suban los impuestos
sobre este bien? ¿Lo condiciona el género? ¿Puede existir un efecto
interacción entre ambos factores?
►  Efectos principales y efecto interacción.
▬  Diremos que hay un efecto principal significativo de un factor cuando
las medias de la variable dependiente sean significativamente distintas
en los grupos que conforma ese factor (igual que en el ANOVA de un
factor)
▬  Diremos que hay un efector interacción significativo entre los factores
cuando la relación entre la variable dependiente y un factor es distinta
para los distintos niveles del otro factor
Doctorado Interuniversitario en Marketing
34
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Acuerdo
l Hombres
n Mujeres
Acuerdo
l
l
Hombres
n
n
n
Mujeres
Fumador
Dejado
No fumador
Opinión
Opinión
l
n
l
l
n
Desacuerdo
Desacuerdo
Fumador
Dejado
No fumador
Factor 1: Fumar
Efecto principal hábito: significativo
Efecto principal sexo: no significativo
Doctorado Interuniversitario en Marketing
Factor 1: Fumar
Efecto principal hábito: no significativo
Efecto principal sexo: significativo
35
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
l Hombres
Acuerdo
Acuerdo
n Mujeres
Opinión
Opinión
l
n
l
n
l
n
l
n
Hombres
Mujeres
l
Desacuerdo
Desacuerdo
n
Fumador
Dejado
No fumador
Factor 1: Fumar
Efecto principal hábito: significativo
Efecto principal sexo: significativo
No hay efecto interacción
Doctorado Interuniversitario en Marketing
Fumador
Dejado
No fumador
Factor 1: Fumar
Efecto principal hábito: no significativo
Efecto principal sexo: no significativo
36
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Acuerdo
Opinión
l Hombres
l
n Mujeres
n
Desacuerdo
l
n
Fumador
Dejado
No fumador
Factor 1: Fumar
Efecto principal hábito: significativo
Efecto principal sexo: significativo
Efecto interacción significativo
Doctorado Interuniversitario en Marketing
37
Establecimiento de objetivos
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Lógica del estadístico F
►  Es absolutamente análoga a la del ANOVA de un factor
Fuente de
variación
Suma de
cuadrados
Grados de
libertad
Factor A
SCF A
G-1
Factor B
SCF B
J-1
Media
cuadrática
Estadístico
F
SCFA
G-1
SCFB
MCFB=
J-1
MCFA
F= MCR
MCFA=
SCF AxB
MCFAx B=
(G-1)(J-1)
SCFAxB
(G-1)(J-1)
Residual
SCR
n-GJ
MCR=
SCR
n-GJ
Total
SCT
n-1
MCT=
SCT
n-1
Interacción
Doctorado Interuniversitario en Marketing
F=
MCFB
MCR
MCFAxB
F=
MCR
38
Condiciones de aplicabilidad
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Homoscedasticidad
Doctorado Interuniversitario en Marketing
39
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Examinar siempre los descriptivos
Doctorado Interuniversitario en Marketing
40
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Significatividad de los efectos
► 
Comenzaremos siempre por el efecto interacción pues condiciona la forma
de evaluar los efectos principales
Doctorado Interuniversitario en Marketing
41
Estimación del modelo
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
■ 
Pruebas post hoc
Doctorado Interuniversitario en Marketing
42
Interpretación de los resultados
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
Results were analyzed using a two-way ANOVA, with two
between-groups design. This analysis revealed a significant
effect for smoking habit, F(2,235)=57.90; p <.01. The sample
means are displayed in Figure X. Tukey’s HSD test showed that
subjects who have always been non-smokers or that have given
up smoking are significantly more favorable to increase
tobacco taxes than smokers (p <.05) while there were no
significant differences between them. The main effect for sex
proved to be nonsignificant, F(1,235)=1,82; p=.178. The
interaction between sex and habit also proved to be
nonsignificant F(2,235)=0.862; p=.424
Doctorado Interuniversitario en Marketing
43
Guía para la elección del test más adecuado
■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
#VD
Tipo
VD
# VI
Tipo
VI
#
niveles
=o≠
participantes
Paramétrico
TEST
SI
Independent t-test
NO
Mann-Whitney /Wilcoxon rank
SI
Related samples t-test
NO
Wilcoxon matched-pairs test
SI
One way ANOVA
NO
Kruskall-Wallis Anova
SI
One way repeated measures anova
NO
Friedman’s Anova
SI
Pearson correlation
NO
Spearman o Kendall’s tau
DISTINTOS
2
MISMOS
MET
1
NO
MET
DISTINTOS
1
+2
MISMOS
MET
NO
MET
1
NO
MET
Doctorado Interuniversitario en Marketing
MISMOS
DISTINTOS
Pearson Chi Square
44
Descargar