Esquema del manejo de los menús de SPSS sobre estadística

Anuncio
Análisis de Datos I
Análisis bivariante en el SPSS
Estadística descriptiva bivariada en el SPSS
1.
2.
3.
4.
ÍNDICES DE ASOCIACIÓN LINEAL
COMBINACIONES LINEALES
REGRESIÓN LINEAL SIMPLE
2 VARIABLES CUALITATIVAS, 1 CUANTITATIVA y 1 ó 2 CUALTITATIVAS
___________________________
Bibliografía: Tema 3 (pág. 33-51) del cuaderno de prácticas de SPSS (Ximénez y Revuelta, 2011)
Ejercicios: Todos los de la página 52 del cuaderno de prácticas de SPSS (con el archivo practicas.sav)
En este esquema resumiremos cómo llevar a cabo los análisis descriptivos con dos variables revisados en la
segunda parte de la asignatura con el SPSS. Para realizar análisis descriptivos bivariantes pueden usarse los
procedimientos del SPSS: ‘Correlaciones’, ‘Regresión lineal’ y ‘Tablas de contingencia’.
1. ÍNDICES DE ASOCIACIÓN LINEAL
Para obtener la covarianza y la correlación de Pearson se utiliza EL PROCEDIMIENTO CORRELACIONES
del SPSS:
Analizar -> Correlaciones -> Bivariadas
Lo primero es
trasladar a este
cuadro las variables
para las que se
desee obtener un
coeficiente de
correlación lineal.
Por ejemplo, edad,
peso y estatura
Seleccionar si se desea
obtener la matriz de
varianzas-covarianzas
Desde este menú se
pueden obtener tres:
el de Pearson (rxy),
el de Kendall y el de
Spearman. Los dos
últimos sirven para
variables ordinales.
Con estas selecciones se obtiene el siguiente resultado:
Correlaciones
Edad
Edad
Peso
Estatura
1.000
-.050
-.018
.
.482
.803
2991.500
-399.650
-1.152
15.033
200
-2.008
200
-.006
200
Correlación de Pearson
-.050
1.000
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
.482
.
.000
-399.650
21325.595
148.490
-2.008
200
107.164
200
.746
200
1.000
Correlación de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Peso
Estatura
.857**
Correlación de Pearson
-.018
.857**
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
.803
.000
.
-1.152
148.490
1.408
-.006
200
.746
200
.007
200
En esta tabla aparecen resumidas las matrices de
varianzas-covarianzas (S) y de correlaciones (R).
Cada casilla contiene la correlación (señalada en
negrita) y la covarianza (señalada en cursiva) entre
el cruce de cada 2 variables (edad con edad, edad
con peso, edad con estatura, etc.).
De esta tabla podemos deducir que:
redad, peso = -0,050;
redad, estatura = -0,018;
rpeso, estatura = 0,857;
Sedad, peso = -2,008
Sedad, estatura = -0,006
S peso, estatura = 0,746
S2edad = 15,033
S2 peso = 107,164
S2 estatura = 0,007
Es decir, a partir de esta tabla podemos conocer las
covarianzas, las correlaciones y las varianzas para
todas las variables incluidas (en este caso tres
variables).
**. La correlación es significativa al nivel 0,01 (bilateral).
Carmen Ximénez
1
Análisis de Datos I
Análisis bivariante en el SPSS
La representación gráfica de la relación lineal entre variables se hace desde el menú Gráficos -> Dispersión:
Con estas selecciones el resultado es:
2.00
1.90
Estatura
Pulsar para definir los ejes del
diagrama
1.80
1.70
1.60
1.50
30 40 50 60 70 80 90 100
Peso
2. COMBINACIONES LINEALES
Para obtener combinaciones lineales del tipo T = X + Y; T = AX + BY; puede usarse el menú Transformar
-> Calcular (ya visto anteriormente). Veamos un ejemplo para la variable X = respon + emocio:
Calculando los descriptivos para las tres variables se observa como se
cumplen las propiedades
T  X  Y ; ST2  S2X  SY2  2 SXY :
Analizar -> Estadísticos descriptivos -> Descriptivos
Respon
Emocio
X
Media
46.1250
48.6250
94.7500
Desv. típ.
4.6882
4.9747
8.1480
Varianza
21.979
24.748
66.389
3. REGRESIÓN LINEAL SIMPLE
Para obtener la regresión de Y sobre X, se utiliza EL PROCEDIMIENTO REGRESIÓN del SPSS:
Analizar -> Regresión -> Lineal
Primero se definen las variables que hacen de CRITERIO y PREDICTORA:
Desde aquí se
pueden guardar los
valores
pronosticados por
el modelo (las Y’i)
y los residuos (las
Yi -Y’i) para cada
sujeto del fichero.
Con estas selecciones el resultado que ofrece el Visor del SPSS es el siguiente:
Carmen Ximénez
2
Análisis de Datos I
Análisis bivariante en el SPSS
b
Variables introducidas/eliminadas
Modelo
1
Variables
introducidas
Estatura a
Variables
eliminadas
Método
Introducir
.
a. Todas las variables solicitadas introducidas
b. Variable dependiente: Peso
Resumen del modelo
Modelo
1
R
.857 a
b
R cuadrado
corregida
.733
R cuadrado
.734
Esto es el coeficiente de
determinación, r2XY o la
proporción de varianza en
común entre peso y estatura.
Error típ. de la
estimación
5.3510
a. Variables predictoras: (Constante), Estatura
b. Variable dependiente: Peso
ANOVAb
Modelo
1
Regresión
Residual
Total
Suma de
cuadrados
15656.269
5669.326
21325.595
gl
1
198
199
Media
cuadrática
15656.269
28.633
F
546.792
Esto se verá en la asignatura de
segundo curso Análisis de Datos II
Sig.
.000a
a. Variables predictoras: (Constante), Estatura
b. Variable dependiente: Peso
Los coeficientes A y B del modelo pronosticado en
directas se ven en esta columna: siendo A = -118,375
y B = 105,437. Luego:
Peso’i = -118,375 + 105,437 estaturai
a
Coeficientes
Coeficientes no
Coeficientes
estandarizados
estandarizados
Modelo
B
Error típ.
Beta
1
(Constante) -118.375
7.565
Estatura
105.437
4.509
.857
t
-15.648
23.384
Sig.
.000
.000
a. Variable dependiente: Peso
En esta columna aparece el modelo
en típicas: z peso’ = 0,857 zestatura
Estadísticos descriptivos
Unstandardized Predicted Value
Unstandardized Residual
Peso
N
200
200
200
Media
58.295
.000
58.295
Varianza
78.675
28.489
107.164
Estos son los descriptivos para el criterio, Y (peso),
los pronósticos (Y’) y los residuos (Y – Y’).
2
= S2Y’ + S2Y-Y’; es
decir: 107,164 = 78,675 + 28,489
Puede comprobarse que: S
Y
Para obtener una representación gráfica del ajuste del modelo: Gráficos -> Interactivos -> Diagramas de dispersión:
Con estas selecciones el resultado es:
W
90
1Peso = -118.37 + 105.44 * estatura
W
W
R-cuadrado = 0.73
W W
W
Peso
80
70
60
50
40
W
W
W
W
W
WWW
W W
W
W W
WW W
W
W
W W WW WWW W
W
W
W
W
WW W
W
W WWW
W
WW
W W
W
WWWW
W
W W W WW W W WW
W W
W
W
W W
WWW WW
W
WW
W W W W
W
W W WWWW
WW W W W W
W
W
W W WW
W
W
W
W W W
W
WWW W
W W W WW
W W
W
W
W W W W
WW
W
WW WW W WWW
W
WW
W
WW
WW
W W
1.60
1.70
W
W
W
W
W
W
1.80
1.90
Estatura
Carmen Ximénez
3
Análisis de Datos I
Análisis bivariante en el SPSS
4. Dos variables cualitativas: PROCEDIMIENTO TABLAS DE CONTINGENCIA
Para elaborar una tabla de contingencia: Analizar -> Estadísticos descriptivos -> Tablas de contingencia:
Desde aquí pueden obtenerse las
frecuencias conjuntas relativas (en
porcentajes) para las filas, las
columnas y para el total:
Seleccionar para
obtener un
diagrama de
barras para
las variables
El resultado obtenido es el siguiente:
INTERPRETACIÓN:
Tabla de contingencia Sexo * Tabaquismo
Total
Globalmente, los resultados indican que la mayor parte de los sujetos
son varones y no fuman (el 50%).
Total
81
100.0%
40.5%
40.5%
119
100.0%
59.5%
59.5%
200
100.0%
100.0%
100.0%
Las distribuciones condicionales indican que, hay un 27,5% de los no
fumadores que son mujeres (frente al 53,1% de las fumadoras); y de los
varones el 84% son no fumadores. En cuanto a las mujeres, el 46,9%
son no fumadoras y dentro de los fumadores el 69,4% son mujeres.
100
80
Recuento
Sexo
Tabaquismo
No fumador Fumador
Mujer Recuento
38
43
% de Sexo
46.9%
53.1%
% de Tabaquismo 27.5%
69.4%
% del total
19.0%
21.5%
Varón Recuento
100
19
% de Sexo
84.0%
16.0%
% de Tabaquismo 72.5%
30.6%
% del total
50.0%
9.5%
Recuento
138
62
% de Sexo
69.0%
31.0%
% de Tabaquismo 100.0%
100.0%
% del total
69.0%
31.0%
60
40
Tabaquismo
20
No fumador
Fumador
0
Mujer
Varón
Sexo
Una variable cualitativa y otra cuantitativa
Gráficos -> Líneas -> Simple (Resúmenes para grupos de casos):
Este gráfico representa la media de la variable
peso para fumadores y no fumadores. Se ve que
los no fumadores tienen un peso medio mayor
que los fumadores.
59
Media Peso
59
58
58
57
57
No fumador
Fumador
Tabaquismo
Una variable cuantitativa y dos cualitativas
Gráficos -> Líneas -> Múltiple (Resúmenes para grupos de casos):
80
Este gráfico es igual al
anterior pero
segmentando por Sexo.
Media Peso
70
60
Sexo
50
Mujer
40
No fumador
Varón
Fumador
Tabaquismo
Carmen Ximénez
4
Descargar