Análisis de Datos Avanzados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza de un factor Joaquín Aldás Manzano Universitat de València * [email protected] Doctorado Interuniversitario en Marketing 1 Construcción de un modelo multivariante ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Definir el problema y decidir la técnica Desarrollo del plan de análisis ► Tamaños muestrales mínimos ► Escalas adecuadas Condiciones de aplicabilidad ► Comprobación de hipótesis subyacentes a los modelos Estimación del modelo y ajuste global Interpretación de los resultados Validación (resultados generalizables a la población) Doctorado Interuniversitario en Marketing 2 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza (tabaco1.sav) ► Sirve para determinar si una variable determinada toma valores medios iguales o distintos en los grupos que forma otra variable. ▬ Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar o no el ser más o menos favorable a que se suban los impuestos sobre este bien? ► VARIABLE DEPENDIENTE (impuesto), es la que queremos saber si toma valores medios iguales o distintos. ▬ ¿Deben subirse los impuestos sobre el tabaco? 1=Totalmente en desacuerdo a 5=Totalmente de acuerdo ► FACTOR (fuma) es la variable que supuestamente ejerce una influencia sobre la variable dependiente (establece los grupos) ▬ ¿Fuma usted? 1=No, nunca he fumado, 2=No, lo he dejado; 3=Sí ► Se analizará también el análisis de la varianza de dos factores, donde se considera la influencia conjunta sobre la dependiente de dos variables independientes (factores). Doctorado Interuniversitario en Marketing 3 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza ► Cómo deben estar medidas las variables? ▬ El factor debe ser una variable nominal ▬ La variable dependiente debe ser métrica ► Formulación de la hipótesis nula: H 0 : x f = xnf = xd ► ► ► ¿Cuál es la hipótesis alternativa? Importancia para las pruebas post hoc Cálculo del estadístico F (veremos su lógica… solo esta vez!) Rechazo o no de la hipótesis nula ▬ Significatividad p Doctorado Interuniversitario en Marketing 4 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lógica del estadístico F ► Cada individuo, fumador o no, tendrá una opinión que diferirá en mayor o menor medida de la opinión del conjunto de la muestra: Ygi − Y ► Esa diferencia puede escribirse: Ygi − Y = (Yg − Y ) + (Ygi − Yg ) Desviación residual Desviación explicada por el factor ► Elevamos al cuadrado: (Ygi − Y ) = (Yg − Y ) + (Ygi − Yg ) + 2 (Yg − Y )(Ygi − Y ) 2 Doctorado Interuniversitario en Marketing 2 2 5 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lógica del estadístico F ► Como no tenemos un solo grupo sino G y en cada uno de ellos no hay un solo individuo, sino ng sumamos para todos ellos: SCT Variabilidad total SCF Variabilidad explicada por el factor Between groups SCR Variabilidad residual Within groups Doctorado Interuniversitario en Marketing 6 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lógica del estadístico F ► Cuanto más parte de la variabilidad total la explique pertenecer a un grupo u otro (factor) y menos la variabilidad interna de cada grupo, más seguros estaremos de que el efecto del factor es relevante. Por eso parece lógico construir el estadístico de este modo: SCF MCF G − 1 F= = MCR SCR n−G ► ► Es decir cuanto más importante sea el efecto del factor, más grande será el estadístico. La división por de las sumas de cuadrados por sus grados de libertad, lo que las convierte en lo que llamamos media cuadrática, solo pretende ajustar el hecho de que no hay el mismo número de elementos generadores de variabilidad en numerador y denominador Doctorado Interuniversitario en Marketing 7 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lógica del estadístico F SCF 171,37 MCF G − 1 F= = = 3 − 1 = 59,16 MCR SCR 344, 72 n − G 241 − 3 Doctorado Interuniversitario en Marketing 8 Condiciones de aplicabilidad ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Homoscedasticidad ► La varianza de la variable dependiente no debe ser significativamente distinta en los grupos que hace el factor ► Algunos autores afirman que el que no se cumpla no afecta mucho al estadístico F si las muestras de cada grupo son del mismo o similar tamaño (Stevens, 1996). ► Ver siempre los descriptivos ► Test de Levene (recordar que la H0 es igualdad de las varianzas) ► ¿Y si no?... ▬ Transformación de la variable dependiente, aunque hoy en día hay alternativas… ▬ Estadísticos robustos ante la ausencia de homoscedasticidad (BrownForsythe, Welch) Doctorado Interuniversitario en Marketing 9 Condiciones de aplicabilidad ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Doctorado Interuniversitario en Marketing 10 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Significatividad del estadístico F ► Con base en esta información decidimos si es plausible el rechazo de la hipótesis nula ► ► Concluimos que el efecto del factor es significativo, pero ¿es intenso?, es decir, ¿cuál es el tamaño del efecto? Debemos reportar el R2, que no es sino una medida de qué parte de la varianza total es explicada por el factor: R2 = SCF 171,37 = = 0,33 SCT 516,10 Doctorado Interuniversitario en Marketing 11 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ F de Brown-Forsythe (Brown y Forsythe, 1974) ► Cuando los grupos tienen distintos tamaños muestrales y la varianza más grande están en los grupos con mayor tamaño, esto sesga el estadístico F provocando que sea muy conservador: Si la varianza más grande está en el grupo más grande SCR se hincha ► Brown y Forsythe (1984) proponen la siguiente corrección: La varianza de cada grupo está ahora multiplicado por un factor que es más pequeño cuanto más grande es el tamaño del grupo. Este estadístico se evalúa con un número de grados de libertad corregido para el denominador Doctorado Interuniversitario en Marketing 12 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ F de Brown-Forsythe (Brown y Forsythe, 1974) Grados de libertad del denominador corregidos Doctorado Interuniversitario en Marketing 13 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ¿Pero cuál era la hipótesis alternativa? Pruebas post hoc ► Sólo podemos decir que la media en algún grupo es diferente a las demás, pero ¿cuáles son diferentes de cuáles? ► Para poder concluir algo al respecto tenemos una batería de distintas pruebas post hoc o pruebas a posteriori ► También existen pruebas post hoc específicas para situaciones de ausencia de homoscedasticidad ¿Por qué pruebas específicas? ¿Por qué no comparar las medias dos a dos mediantes pruebas t? ► Ejercicios de simulación de Montecarlo demuestran que la probabilidad de que las pruebas t encadenadas encuentren alguna diferencia significativas donde no las hay se incrementa con el número de comparaciones (5 grupos, 10 comparaciones, 29%; 10 grupos, 45 comparaciones, 63%) ► Las pruebas específicas ajustan el nivel de significación necesario en función del número de comparaciones. Cuanto más comparaciones, mayor tiene que ser la diferencia para ser considerada significativa. ► Por ejemplo, Bonferroni, una de las más sencillas, si se realizan c comparaciones, exige un nivel de significación crítico de a/c para poder rechazar cada comparación Doctorado Interuniversitario en Marketing 14 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Pruebas post hoc Doctorado Interuniversitario en Marketing 15 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ¿qué pruebas post hoc elegir? ► Puede consultarse Toothaker (1993) o Klockars y Sax (1986) para una argumentación detallada, pero tengamos en cuenta que SPSS produce hasta 18 tests ► Como guía apuntamos la síntesis de las recomendaciones de Field (2005): ▬ Si tenemos muestras iguales por grupo y estamos bastante seguros de que las varianzas son parecidas: ● REGWQ o Tukey tienen un buen equilibrio entre poder y control del error tipo I ● Bonferroni es conservador pero asegura control sobre el error tipo I ▬ Si los tamaños muestrales son ligeramente distintos: Gabriel ▬ Si los tamaños muestrales son muy distintos: Hochberg GTD ▬ Si hay dudas sobre la homogeneidad de varianzas: Games-Howell Doctorado Interuniversitario en Marketing 16 Interpretación de los resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Results were analyzed using a one-way ANOVA, between-groups design. This analysis revealed a significant effect for smoking habit, F(2,238)=59.16; p <.01. The sample means are displayed in Figure X. Tukey’s HSD test showed that subjects who have always been non-smokers or that have given up smoking are significantly more favorable to increase tobacco taxes than smokers (p <.05) while there were no significant differences between them. Doctorado Interuniversitario en Marketing 17 Guía para la elección del test más adecuado ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ #VD Tipo VD # VI Tipo VI # niveles =o≠ participantes Paramétrico TEST SI DISTINTOS NO 2 SI MISMOS MET 1 NO NO MET SI One way ANOVA DISTINTOS 1 NO +2 SI MISMOS NO SI MET MISMOS NO NO MET 1 NO MET Doctorado Interuniversitario en Marketing DISTINTOS 18 Análisis de Datos Avanzados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza de un factor no paramétrico Test de Kruskal-Wallis Joaquín Aldás Manzano Universitat de València * [email protected] Doctorado Interuniversitario en Marketing 19 Condiciones de aplicabilidad ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Normalidad ► Ante violaciones de la homoscedasticidad hemos visto que tenemos alternativas bastante robustas para el estadístico F (Brown-Forsythe, Welch), pero ¿y si se viola el supuesto de normalidad? ► La alternativa es una Anova no paramétrico llamado Anova de KruskalWallis o simplemente test de Kruskall-Wallis (Kruskall y Wallis, 1952). Ejemplo (soya1.sav). Ilustraremos el procedimiento de cálculo con un ejemplo, una vez más simpático, de Field (2005) porque está basado en pocos casos, y es más sencillo explicar los pasos uno a uno. ► Este autor leyó que los menores niveles de esperma en los varones occidentales está asociado al escaso consumo de soja. ► Diseñó un experimento (datos ficticios, claro) con cuatro grupos de 20 individuos cada uno en función de su nivel de consumo de soja (ningún consumo-control, una comida a la semana, cuatro a la semana y todos los días). Al final del año se efectuó un recuento de esperma (variable dependiente). ► ¿Es la media de esperma significativamente distinta en cada grupo? Doctorado Interuniversitario en Marketing 20 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Rango para el total de casos n=80 Doctorado Interuniversitario en Marketing 21 Estimación ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Cálculo del estadístico ► Los datos de toda la muestra se ordenan simultáneamente y se les asigna un orden (ranking), en nuestro caso 1-80, pues n=80. ► Después de ordenados se separan por grupos. ► Se suma los rangos de cada grupo (Ri). ► Se calcula el estadístico H equivalente al F del Anova: k 12 Ri2 H= " ! 3( N + 1) N ( N + 1) i =1 ni ► En nuestro ejemplo: 12 " 927 2 8832 8832 547 2 % H= + + + ( 3 ! 81 = 8.65 80 ! 81 $# 20 20 20 20 '& ► Estadístico que se distribuye según una X2 con k-1 grados de libertad Doctorado Interuniversitario en Marketing 22 Condiciones de aplicabilidad ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ¿Tiene sentido hacer un test de Kruskal-Wallis? Doctorado Interuniversitario en Marketing 23 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Resultados El método asintótico es exacto con muestras grandes, pero con muestras pequeñas o con datos muy poco normales, es mejor Monte Carlo, que genera una muestra similar a la nuestra y extrae muchas submuestras (10.000) con las que calcula el valor medio de la significatividad y del intervalo de confianza Doctorado Interuniversitario en Marketing 24 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis post hoc ► No existen pruebas específicas ► Podemos comparar los grupos de dos en dos con pruebas de Mann-Whitney, pero esto incrementa el error tipo I ► Por ello, si lo hacemos, tendremos que hacer alguna corrección, como la de Bonferroni (utilizar como significatividad 0.05/número de tests) ► Esto obliga a hacer solo los contrastes imprescindibles, puesto que si no el nivel crítico para la significatividad sería muy pequeño ► Otra alternativa es la propuesta por Siegel y Castellan (1988) Los descriptivos parece mostrar medias muy similares, salvo para el último grupo, pero para estar seguros de esta apreciación necesitamos las pruebas a posteriori Doctorado Interuniversitario en Marketing 25 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis post hoc ► Veamos Mann-Whitney con corrección de Bonferroni ► Limitaremos las pruebas a: ▬ 3: grupo de control frente a los otros tres ▬ αcrítico =0.05/3=0.0167 0 vs 1 comida 0 vs 4 comidas 0 vs 7 comidas Parece que comer soja no aumenta la cantidad de esperma, pero comer mucho sí que la reduce Doctorado Interuniversitario en Marketing 26 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis post hoc ► Veamos la propuesta de Siegel y Castellan (1988) ► El estadístico para cada comparación es la diferencia en valor absoluto entre la media de los rangos ► El valor crítico de comparación es un z-score corregido por el número de comparaciones que se hacen y una constante basada en el tamaño muestral total y el tamaño muestral de los grupos que se comparan: Ru ! Rv " z# / k ( k !1) ! = 0.05 k=4 ! 0.05 = = 0.00417 k ( k " 1) 4 # 3 z0.00417 = 2.64 N ( N + 1) $ 1 1 ' &% n + n )( 12 u v z Larger Portion Smaller Portion y 2.62 2.63 2.64 2.65 2.66 2.67 2.68 2.69 2.70 .99560 .99573 .99585 .99598 .99609 .99621 .99632 .99643 .99653 .00440 .00427 .00415 .00402 .00391 .00379 .00368 .00357 .00347 .0129 .0126 .0122 .0119 .0116 .0113 .0110 .0107 .0104 Sin complicarse, en Excel =INV.NORM.ESTAND(0,00417) =2,6379 z Test Statistic Doctorado Interuniversitario en Marketing 27 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Ru Análisis post hoc ► Veamos la propuesta de Siegel y Castellan (1988) Rv de datos: Ru de la tabla ► Los rangos de todas las comparaciones salen Ru ! Rv Ru Rv Ru Rv Ru ! Rv Ru ! Rv Rv Ru ! RvRu ! Rv Ru ! Rv Ru ! Rv Ru ! Rv ► Y el valor crítico con el que hay que comparar las diferencias de rangos es: Ru ! Rv critica = z" / k ( k !1) = 2.64 N ( N + 1) # 1 1 & %$ n + n (' = 12 u v 80 ) 81 # 1 1& + ( %$ 12 20 20 ' = 2.64 540 ( 0.1) = 19.40 Doctorado Interuniversitario en Marketing Solo hay un valor crítico para todas las comparaciones porque los tamaños muestrales de todos los grupos son iguales. Todas las diferencias son inferiores al valor crítico, luego ninguna es significativa, aquí se ve la ventaja de ser selectivo con el número de comparaciones, si se compara el resultado con el de Mann-Whitney 28 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Testando tendencias: El test de Jonckheere-Terpstra ► Este test (Jonckheere, 1954; Terpstra, 1952) hace lo mismo que el test de Kruskal-Wallis, pero, además evalúa si hay un patrón ordenado en las medianas, es decir, si el orden de los grupos aporta algún patrón significativo al orden de las medianas ► Parte de la base de que el orden en el que se codifican los grupos, implica el orden en que se espera la ordenación de medianas (aunque puede ser positivo o negativo indicando +/+ o +/-) ► No entraremos en los cálculos, pero para más de 8 casos por grupo el estadístico se distribuye como una normal y se puede obtener fácilmente su z-score. El estadístico muestra una tendencia significativa para las medianas y su signo es negativo, es decir, cuando se pasa de no tomar a tomar cada vez más soja, el recuento de espermatozoides cae Doctorado Interuniversitario en Marketing 29 Resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Tamaño del efecto ► El estadístico de Kruskal-Wallis, se distribuye como una chi cuadrado y, desafortunadamente, no es fácil convertir una chi cuadrado de más de un grado de libertad a un tamaño de efecto r. ► Por eso, recomendamos seguir a Field (2005) cuando sugiere calcular los tamaños de efecto para cada uno de los test de Mann-Whitney que se realizaron en las pruebas post hoc. ► Recordemos que el tamaño del efecto se calculaba: r= ► z N Solo tener cuidado con que N hace referencia a la suma de los dos grupos comparados (40) !0.243 = !.04 40 -2 !0.476 r= = !.28 80 r= Doctorado Interuniversitario en Marketing r= !0.325 = !.05 40 r= !2.597 = !.41 40 Para el test de Jonckheere, téngase en cuenta que usa todos los datos (N=80) 30 Presentando resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Escribiendo los resultados en un artículo ► Alternativa 1: Kruskal-Wallis + análisis post hoc Sperm counts were significantly affected by eating soya meals (H(3)=8.66, p<.05). Mann-Whitney tests were used to follow up this finding. A Bonferroni correction was applied so all effects are reported at a .0167 level of significance. It appeared that sperm counts were no different when one soya meal (U=191, r=-.04) or four soya meals (U=188, r=-.05) were eaten per week compared to none. However, when seven soys meals were eaten per week, sperm counts were significanly lower than when no soya was eaten (U=104, r=-.41). We can conclude that is soya is eaten every day it significantly reduces sperm counts compared to eating none; however eating soya less than every day has no significant impact on sperm counts. ► Alternativa 2: Test de Jonckheere All effects reported at p<.05. Sperm counts were significantly affected by eating soya meals (H(3)=8.66). Jonckheere’s test revealed a significant trend in the data: as more soya was eaten, the median sperm count decreased, J=912, z=-2.48, r=-.28 Doctorado Interuniversitario en Marketing 31 Guía para la elección del test más adecuado ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ #VD Tipo VD # VI Tipo VI # niveles =o≠ participantes Paramétrico TEST SI DISTINTOS NO 2 SI MISMOS MET 1 NO NO MET SI DISTINTOS 1 NO +2 Kruskall-Wallis Anova SI MISMOS NO SI MET MISMOS NO NO MET 1 NO MET Doctorado Interuniversitario en Marketing DISTINTOS 32 Análisis de Datos Avanzados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza de dos factores Joaquín Aldás Manzano Universitat de València * [email protected] Doctorado Interuniversitario en Marketing 33 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Análisis de la varianza de dos factores ► Pretendemos ahora analizar el efecto de dos variables independientes (no métricas) sobre una dependiente (métrica) ▬ Retomando el ejemplo sobre el tabaco, ¿condiciona el hábito de fumar o no el ser más o menos favorable a que se suban los impuestos sobre este bien? ¿Lo condiciona el género? ¿Puede existir un efecto interacción entre ambos factores? ► Efectos principales y efecto interacción. ▬ Diremos que hay un efecto principal significativo de un factor cuando las medias de la variable dependiente sean significativamente distintas en los grupos que conforma ese factor (igual que en el ANOVA de un factor) ▬ Diremos que hay un efector interacción significativo entre los factores cuando la relación entre la variable dependiente y un factor es distinta para los distintos niveles del otro factor Doctorado Interuniversitario en Marketing 34 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Acuerdo l Hombres n Mujeres Acuerdo l l Hombres n n n Mujeres Fumador Dejado No fumador Opinión Opinión l n l l n Desacuerdo Desacuerdo Fumador Dejado No fumador Factor 1: Fumar Efecto principal hábito: significativo Efecto principal sexo: no significativo Doctorado Interuniversitario en Marketing Factor 1: Fumar Efecto principal hábito: no significativo Efecto principal sexo: significativo 35 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ l Hombres Acuerdo Acuerdo n Mujeres Opinión Opinión l n l n l n l n Hombres Mujeres l Desacuerdo Desacuerdo n Fumador Dejado No fumador Factor 1: Fumar Efecto principal hábito: significativo Efecto principal sexo: significativo No hay efecto interacción Doctorado Interuniversitario en Marketing Fumador Dejado No fumador Factor 1: Fumar Efecto principal hábito: no significativo Efecto principal sexo: no significativo 36 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Acuerdo Opinión l Hombres l n Mujeres n Desacuerdo l n Fumador Dejado No fumador Factor 1: Fumar Efecto principal hábito: significativo Efecto principal sexo: significativo Efecto interacción significativo Doctorado Interuniversitario en Marketing 37 Establecimiento de objetivos ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lógica del estadístico F ► Es absolutamente análoga a la del ANOVA de un factor Fuente de variación Suma de cuadrados Grados de libertad Factor A SCF A G-1 Factor B SCF B J-1 Media cuadrática Estadístico F SCFA G-1 SCFB MCFB= J-1 MCFA F= MCR MCFA= SCF AxB MCFAx B= (G-1)(J-1) SCFAxB (G-1)(J-1) Residual SCR n-GJ MCR= SCR n-GJ Total SCT n-1 MCT= SCT n-1 Interacción Doctorado Interuniversitario en Marketing F= MCFB MCR MCFAxB F= MCR 38 Condiciones de aplicabilidad ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Homoscedasticidad Doctorado Interuniversitario en Marketing 39 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Examinar siempre los descriptivos Doctorado Interuniversitario en Marketing 40 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Significatividad de los efectos ► Comenzaremos siempre por el efecto interacción pues condiciona la forma de evaluar los efectos principales Doctorado Interuniversitario en Marketing 41 Estimación del modelo ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Pruebas post hoc Doctorado Interuniversitario en Marketing 42 Interpretación de los resultados ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Results were analyzed using a two-way ANOVA, with two between-groups design. This analysis revealed a significant effect for smoking habit, F(2,235)=57.90; p <.01. The sample means are displayed in Figure X. Tukey’s HSD test showed that subjects who have always been non-smokers or that have given up smoking are significantly more favorable to increase tobacco taxes than smokers (p <.05) while there were no significant differences between them. The main effect for sex proved to be nonsignificant, F(1,235)=1,82; p=.178. The interaction between sex and habit also proved to be nonsignificant F(2,235)=0.862; p=.424 Doctorado Interuniversitario en Marketing 43 Guía para la elección del test más adecuado ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ #VD Tipo VD # VI Tipo VI # niveles =o≠ participantes Paramétrico TEST SI Independent t-test NO Mann-Whitney /Wilcoxon rank SI Related samples t-test NO Wilcoxon matched-pairs test SI One way ANOVA NO Kruskall-Wallis Anova SI One way repeated measures anova NO Friedman’s Anova SI Pearson correlation NO Spearman o Kendall’s tau DISTINTOS 2 MISMOS MET 1 NO MET DISTINTOS 1 +2 MISMOS MET NO MET 1 NO MET Doctorado Interuniversitario en Marketing MISMOS DISTINTOS Pearson Chi Square 44