Análisis de Datos I Análisis bivariante en el SPSS Estadística descriptiva bivariada en el SPSS 1. 2. 3. 4. ÍNDICES DE ASOCIACIÓN LINEAL COMBINACIONES LINEALES REGRESIÓN LINEAL SIMPLE 2 VARIABLES CUALITATIVAS, 1 CUANTITATIVA y 1 ó 2 CUALTITATIVAS ___________________________ Bibliografía: Tema 3 (pág. 33-51) del cuaderno de prácticas de SPSS (Ximénez y Revuelta, 2011) Ejercicios: Todos los de la página 52 del cuaderno de prácticas de SPSS (con el archivo practicas.sav) En este esquema resumiremos cómo llevar a cabo los análisis descriptivos con dos variables revisados en la segunda parte de la asignatura con el SPSS. Para realizar análisis descriptivos bivariantes pueden usarse los procedimientos del SPSS: ‘Correlaciones’, ‘Regresión lineal’ y ‘Tablas de contingencia’. 1. ÍNDICES DE ASOCIACIÓN LINEAL Para obtener la covarianza y la correlación de Pearson se utiliza EL PROCEDIMIENTO CORRELACIONES del SPSS: Analizar -> Correlaciones -> Bivariadas Lo primero es trasladar a este cuadro las variables para las que se desee obtener un coeficiente de correlación lineal. Por ejemplo, edad, peso y estatura Seleccionar si se desea obtener la matriz de varianzas-covarianzas Desde este menú se pueden obtener tres: el de Pearson (rxy), el de Kendall y el de Spearman. Los dos últimos sirven para variables ordinales. Con estas selecciones se obtiene el siguiente resultado: Correlaciones Edad Edad Peso Estatura 1.000 -.050 -.018 . .482 .803 2991.500 -399.650 -1.152 15.033 200 -2.008 200 -.006 200 Correlación de Pearson -.050 1.000 Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N .482 . .000 -399.650 21325.595 148.490 -2.008 200 107.164 200 .746 200 1.000 Correlación de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Peso Estatura .857** Correlación de Pearson -.018 .857** Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N .803 .000 . -1.152 148.490 1.408 -.006 200 .746 200 .007 200 En esta tabla aparecen resumidas las matrices de varianzas-covarianzas (S) y de correlaciones (R). Cada casilla contiene la correlación (señalada en negrita) y la covarianza (señalada en cursiva) entre el cruce de cada 2 variables (edad con edad, edad con peso, edad con estatura, etc.). De esta tabla podemos deducir que: redad, peso = -0,050; redad, estatura = -0,018; rpeso, estatura = 0,857; Sedad, peso = -2,008 Sedad, estatura = -0,006 S peso, estatura = 0,746 S2edad = 15,033 S2 peso = 107,164 S2 estatura = 0,007 Es decir, a partir de esta tabla podemos conocer las covarianzas, las correlaciones y las varianzas para todas las variables incluidas (en este caso tres variables). **. La correlación es significativa al nivel 0,01 (bilateral). Carmen Ximénez 1 Análisis de Datos I Análisis bivariante en el SPSS La representación gráfica de la relación lineal entre variables se hace desde el menú Gráficos -> Dispersión: Con estas selecciones el resultado es: 2.00 1.90 Estatura Pulsar para definir los ejes del diagrama 1.80 1.70 1.60 1.50 30 40 50 60 70 80 90 100 Peso 2. COMBINACIONES LINEALES Para obtener combinaciones lineales del tipo T = X + Y; T = AX + BY; puede usarse el menú Transformar -> Calcular (ya visto anteriormente). Veamos un ejemplo para la variable X = respon + emocio: Calculando los descriptivos para las tres variables se observa como se cumplen las propiedades T X Y ; ST2 S2X SY2 2 SXY : Analizar -> Estadísticos descriptivos -> Descriptivos Respon Emocio X Media 46.1250 48.6250 94.7500 Desv. típ. 4.6882 4.9747 8.1480 Varianza 21.979 24.748 66.389 3. REGRESIÓN LINEAL SIMPLE Para obtener la regresión de Y sobre X, se utiliza EL PROCEDIMIENTO REGRESIÓN del SPSS: Analizar -> Regresión -> Lineal Primero se definen las variables que hacen de CRITERIO y PREDICTORA: Desde aquí se pueden guardar los valores pronosticados por el modelo (las Y’i) y los residuos (las Yi -Y’i) para cada sujeto del fichero. Con estas selecciones el resultado que ofrece el Visor del SPSS es el siguiente: Carmen Ximénez 2 Análisis de Datos I Análisis bivariante en el SPSS b Variables introducidas/eliminadas Modelo 1 Variables introducidas Estatura a Variables eliminadas Método Introducir . a. Todas las variables solicitadas introducidas b. Variable dependiente: Peso Resumen del modelo Modelo 1 R .857 a b R cuadrado corregida .733 R cuadrado .734 Esto es el coeficiente de determinación, r2XY o la proporción de varianza en común entre peso y estatura. Error típ. de la estimación 5.3510 a. Variables predictoras: (Constante), Estatura b. Variable dependiente: Peso ANOVAb Modelo 1 Regresión Residual Total Suma de cuadrados 15656.269 5669.326 21325.595 gl 1 198 199 Media cuadrática 15656.269 28.633 F 546.792 Esto se verá en la asignatura de segundo curso Análisis de Datos II Sig. .000a a. Variables predictoras: (Constante), Estatura b. Variable dependiente: Peso Los coeficientes A y B del modelo pronosticado en directas se ven en esta columna: siendo A = -118,375 y B = 105,437. Luego: Peso’i = -118,375 + 105,437 estaturai a Coeficientes Coeficientes no Coeficientes estandarizados estandarizados Modelo B Error típ. Beta 1 (Constante) -118.375 7.565 Estatura 105.437 4.509 .857 t -15.648 23.384 Sig. .000 .000 a. Variable dependiente: Peso En esta columna aparece el modelo en típicas: z peso’ = 0,857 zestatura Estadísticos descriptivos Unstandardized Predicted Value Unstandardized Residual Peso N 200 200 200 Media 58.295 .000 58.295 Varianza 78.675 28.489 107.164 Estos son los descriptivos para el criterio, Y (peso), los pronósticos (Y’) y los residuos (Y – Y’). 2 = S2Y’ + S2Y-Y’; es decir: 107,164 = 78,675 + 28,489 Puede comprobarse que: S Y Para obtener una representación gráfica del ajuste del modelo: Gráficos -> Interactivos -> Diagramas de dispersión: Con estas selecciones el resultado es: W 90 1Peso = -118.37 + 105.44 * estatura W W R-cuadrado = 0.73 W W W Peso 80 70 60 50 40 W W W W W WWW W W W W W WW W W W W W WW WWW W W W W W WW W W W WWW W WW W W W WWWW W W W W WW W W WW W W W W W W WWW WW W WW W W W W W W W WWWW WW W W W W W W W W WW W W W W W W W WWW W W W W WW W W W W W W W W WW W WW WW W WWW W WW W WW WW W W 1.60 1.70 W W W W W W 1.80 1.90 Estatura Carmen Ximénez 3 Análisis de Datos I Análisis bivariante en el SPSS 4. Dos variables cualitativas: PROCEDIMIENTO TABLAS DE CONTINGENCIA Para elaborar una tabla de contingencia: Analizar -> Estadísticos descriptivos -> Tablas de contingencia: Desde aquí pueden obtenerse las frecuencias conjuntas relativas (en porcentajes) para las filas, las columnas y para el total: Seleccionar para obtener un diagrama de barras para las variables El resultado obtenido es el siguiente: INTERPRETACIÓN: Tabla de contingencia Sexo * Tabaquismo Total Globalmente, los resultados indican que la mayor parte de los sujetos son varones y no fuman (el 50%). Total 81 100.0% 40.5% 40.5% 119 100.0% 59.5% 59.5% 200 100.0% 100.0% 100.0% Las distribuciones condicionales indican que, hay un 27,5% de los no fumadores que son mujeres (frente al 53,1% de las fumadoras); y de los varones el 84% son no fumadores. En cuanto a las mujeres, el 46,9% son no fumadoras y dentro de los fumadores el 69,4% son mujeres. 100 80 Recuento Sexo Tabaquismo No fumador Fumador Mujer Recuento 38 43 % de Sexo 46.9% 53.1% % de Tabaquismo 27.5% 69.4% % del total 19.0% 21.5% Varón Recuento 100 19 % de Sexo 84.0% 16.0% % de Tabaquismo 72.5% 30.6% % del total 50.0% 9.5% Recuento 138 62 % de Sexo 69.0% 31.0% % de Tabaquismo 100.0% 100.0% % del total 69.0% 31.0% 60 40 Tabaquismo 20 No fumador Fumador 0 Mujer Varón Sexo Una variable cualitativa y otra cuantitativa Gráficos -> Líneas -> Simple (Resúmenes para grupos de casos): Este gráfico representa la media de la variable peso para fumadores y no fumadores. Se ve que los no fumadores tienen un peso medio mayor que los fumadores. 59 Media Peso 59 58 58 57 57 No fumador Fumador Tabaquismo Una variable cuantitativa y dos cualitativas Gráficos -> Líneas -> Múltiple (Resúmenes para grupos de casos): 80 Este gráfico es igual al anterior pero segmentando por Sexo. Media Peso 70 60 Sexo 50 Mujer 40 No fumador Varón Fumador Tabaquismo Carmen Ximénez 4