1 Análisis de datos con SPSS ESTADÍSTICA 1

Anuncio
ESTADÍSTICA 1
CONTENIDO 1
Introducción al SPSS
Organización del SPSS
Análisis de datos con SPSS
Ventanas
Barra de herramientas
l Cuadros diálogo
l
l
Lectura de ficheros en SPSS
Máster en Salud Respiratoria 2007-2008
¿Qué es un fichero/matriz de datos?
Creación de un fichero de datos
l Lectura de un fichero de datos
l
l
INTRODUCCIÓN AL SPSS
SPSS: Statistical Package for the Social Sciences
INTRODUCCIÓN AL SPSS
l
l
l
Dispone de:
Tutorial
Página web : www.spss.com
l Manual de sintaxis
.....
l
Programa (software) estadístico :
l
Gestionar bases de datos
Describir y resumir los datos
Medidas de tendencia central, dispersión,
localización,...
l Representaciones gráficas
l
l
Análisis estadístico
Existen otros:
l
SAS, S-Plus, Stata, Epi-info, Minitab,...
INTRODUCCIÓN AL SPSS
l
TUTORIAL
ORGANIZACIÓN DEL SPSS
Ventanas
Ventana de datos (variables y casos) (*.sav)
Ventana de resultados (*.spo)
l Ventana de sintaxis (programación) (*.sps)
l
l
Barra de herramientas
Cuadros de diálogo
1
VENTANA DE DATOS: nombre.SAV
VENTANA DE DATOS: nombre.SAV
Valores
Nombre
Nombre fichero
Variables
Casos
Etiqueta
Identificadores
de valores
missing
Información
sobre las
variables
Datos
VENTANA DE RESULTADOS: nombre.SPO
VENTANA DE RESULTADOS: nombre.SPO
Memoriza los
últimos análisis
realizados
Se edita f ácilmente
con muchas
opciones:
Objetos
• gráficas
Navegador
• estilo
• impresión
• etc...
VENTANA DE COMANDOS: nombre.SPS
EJECUTAR !!!!!
BARRA DE HERRAMIENTAS
Existe una barra en cada ventana
Datos
Añadir comentarios con *
Programar anàlisis:
las sentencias se finalizan con
.
Resultados
• Es aconsejable, una vez se ha comprobado que el análisis es correcto, crear la
sintaxis de los análisis realizados,
• Permite más análisis no disponibles entre las ventanas de Windows visibles
Sintaxis
• Permite realizar fácilmente análisis parecidos, o modificar rápidamente una
sintaxis ya programada anteriormente
2
BARRA DE HERRAMIENTAS
CUADROS DIÁLOGO
l
Ventana de datos
ModifIcar,
cortar, copiar,
pegar,
encontrar texto
y datos
Definir,
ordenar,
seleccionar
datos. juntar
archivos
Ayuda
(F1),
tutorial
Análisis
estadístico:
descriptivos,
modelos…
Para la selección de variables y
especificaciones opcionales
Información
sobre la base
de datos
Archivo Edición Ver Datos Transformar Analizar Graficos Util. Ventanas ?
Abrir,
salvar,
imprimir
datos,
resultados y
gráficos
Menus y
botones de
estado, tamaño,
fuentes, vista
general
Transformar,
calcular,
crear
variables y
valores
usando
expresiones
y funciones
Crear
gráficos
Administrador
de ventanas
¿QUÉ ES UN FICHERO DE DATOS?
Contiene la información recogida para
todos los casos
l
Filas: unidad de análisis (casos)
encuesta de satisfacción de un hospital: pacientes
l encuesta de gasto hospitalario: hospital
l
l
Columnas: características que quiero medir
(variables)
l
l
sexo, edad, tiempo de espera, calidad de la comida
número de camas, número de médicos, gasto de luz
¿QUÉ ES UN FICHERO DE DATOS?
Fichero de datos en SPSS: tabaco.sav
Variables
¿QUÉ ES UN FICHERO DE DATOS?
El sujeto 1007 tenía 16 a ños en el
momento de la entrevista
NUMID SEXO
1001
1
1002
1
1003
1
1004
2
1005
1
1006
2
1007
1
1008
1
1009
1
1010
1
EDAD CLASE REGION SALUD FUMAR
67
3
6
2
1
53
3
2
1
1
28
2
1
3
1
74
2
1
4
1
24
3
1
4
1
78
2
1
4
1
16
3
1
3
1
16
2
1
3
1
82
2
1
4
1
44
3
1
1
1
CREACIÓN DE UN FICHERO DE DATOS
Creación de un fichero de datos en SPSS:
entrada manual de datos
Click 2 veces e insertar el
nombre de la variable
Nombre
fichero
Teclear directamente
el valor en la casilla
Casos
(sujetos)
Datos
Entrada
de datos
Definición de
las variables
3
CREACIÓN DE UN FICHERO DE DATOS
Definición de variables
Medida de
Valores
Nombre
CREACIÓN DE UN FICHERO DE DATOS
la variable
SPSS no ha sido creado con este
propósito y no tiene ni las ventajas ni la
flexibilidad de un programa específico para
la creación y manejo de bases de datos
Información
sobre las
variables
Tipo
Etiqueta
identificadores
de valores
‘missing’
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Ficheros de datos ya creados
Ficheros de datos ya creados:
SPSS (*.sav)
ASCII (*.dat, *.txt)
l Excel (*. xls)
l Lotus (*.wk*)
l dBase (*.dbf)
l
l
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Ficheros de datos ya creados
Excel
Seleccionar
tipo de fichero
Si en la 1ª fila del fichero Excel
se encuentra el nombre de las
variables marcar la opción
4
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Lectura de datos texto (ASCII)
Lectura de datos de texto (ASCII)
Marcar sólo si
existe un formato
Visualización previa
de los datos
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Datos de texto
Si en la 1ª fila del fichero
se encuentra el nombre de las
variables marcar la opción
Organización
de las variables
En qué línea se
sitúa el 1r caso
Número de casos
que se desea leer
Qué representa
cada línea
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Datos de texto
Separador de variables en
el fichero de texto original
Especificaciones
de variables
5
LECTURA DE UN FICHERO DE DATOS
LECTURA DE UN FICHERO DE DATOS
Datos de texto
Datos de texto (opción alternativa)
Copiar sintaxis
en fichero *.sps
Marcar finalizar
EJERCICIO
CONTENIDO 2
Abrir el fichero ‘tabaco.xls’ y guardarlo
como ‘smoke_xls.sav’
Definición de variables en SPSS
Etiquetas de variables y valores
Tipo de variables
l Datos faltantes (missing)
l
Abrir el fichero ‘tabaco.dat’ y guardarlo
como ‘smoke_dat.sav’
l
Abrir el fichero ‘smoke.sav’
Creación y Transformación de variables
en SPSS
DEFINICIÓN DE VARIABLES EN SPSS
Nombre
Etiquetas para
los valores
DEFINICIÓN DE VARIABLES EN SPSS
Medida de
la variable
Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.
l
Sexo (Cualit: Códigos arbitrarios)
l
Raza (Cualit: Códigos arbitrarios)
l
l
Scale: cuantitativa
Nominal: cual. nominal
Ordinal: cual. ordinal
l
l
l
Felicidad Ordinal: Respetar un orden al
codificar.
l
l
Informaci ón
sobre las
variables
Etiqueta de
la variable
Identificadores
de valores
missing
1 = Hombre
2 = Mujer
1 = Blanca
2 = Negra,...
l
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
Se pueden asignar c ódigos a
respuestas especiales como
l
l
0 = No sabe
99 = No contesta...
Estas situaciones deber án ser tenidas
en cuentas en el análisis. Datos
perdidos (‘missing data’)
6
EJERCICIOS con fichero tabaco.sav
Identificar qué variables tienen valores
missing y listarlos.
EJERCICIOS con fichero tabaco.sav
Utilizando el manual de codificación:
Definir el valor 9 de la variable ‘sexo’ como
missing
Definir las etiquetas de los valores de las
variables ‘sexo’ y ‘fumfin’.
Cambiar el nombre de la variable ‘numid’
por ‘identificador’, ¿qué ocurre y porqué?
Definir la etiqueta de la variable ‘sexo’
Sustituir la etiqueta del valor 1 de la
variable ‘región’ por ‘Lerida’
TRANSFORMACIÓN /CREACIÓN DE VARIABLES
TRANSFORMACIÓN /CREACIÓN DE VARIABLES
Calcular una nueva variable:
imc=peso(kg)/altura2 (m)
Categorizar una variable continua según
número de categorías:
Recodificar los valores de una variable
l
Recodificar en la misma variable
l
Crear una variable nueva con un número
específico de categorías.
l
Las categorías tienen un porcentage de
casos igual o similar (percentiles)
Cambiar los valores existentes por otros
Sexo: 1=hombre, 2=mujer ⇒ Sexo: 1= mujer, 2= hombre
Peso: continua ⇒ Peso: 1= ‘<60kg’, 2=’60-70kg’, 3=‘>70kg’
l
Recodificar en una nueva variable
Crear una variable nueva usando los valores de otra
Sexo: 1=hombre, 2=mujer ⇒ Sexo2: 1= mujer, 2= hombre
Peso:continua ⇒ Weight: 1=‘<60kg’, 2=’60-70kg’, 3=‘>70kg’
Contar las apariciones del mismo valor, o
valores, en una lista de variables
TRANSFORMACIÓN /CREACIÓN DE VARIABLES
CALCULAR VARIABLES
Transformar → Calcular
IMC
PESO/(ALTURA**2)
7
RECODIFICAR VARIABLES
Transformar → Recodificar
RECODIFICAR VARIABLES
Recodificar en la misma variable
Transformar → Recodificar
• Es aconsejable recodificar en nuevas variables para no perder los valores
originales de las variables
• Todos los valores de la variable original deben ir a parar a una categoría de la
nueva variable, es importante conocer la distribución de los valores variable
original
RECODIFICAR VARIABLES
CATEGORIZAR VARIABLES
Categorización de una variable contínua
Recodificar en una nueva variable
Transformar → Recodificar
Transformar → Categorizar
Indicar el número de categorias
estas se construyen según percentiles
ej: 4 categorias → <Q1, Q1-Q2, Q2-Q3 y > Q3
CATEGORIZAR VARIABLES
Nueva variable que representa el orden de una
variable continua
Variable
original
CATEGORIZAR VARIABLES
Categorización automática
Variable
nueva
Asigna el orden de la variable continua
Convierte los valores de una variable númerica
o alfanumérica en números enteros consecutivos
8
EJERCICIO
CONTAR APARICIONES
Transformar → Contar
1)
Recodificación de la variable edad en las
siguientes categorías:
l
l
l
l
l
2)
(30 , 50] años
(50 , 60] años
(60 , 70] años
(70 , 75] años
Más de 75 años
Definir la variable creada
EJERCICIO
3)
Cálculo de nuevas variables:
l
Exposición a tabaco (tiempo que hace que
fuma en años):
fumafin – fumaini
l
l
Definir la variable ‘exposición a tabaco en
años’
CONTENIDO 3
Tratamiento de DATOS
l
Ordenar casos
l
Selección de casos
l
Ponderar casos
Segmentar/estratificar archivo
l
Manipulación de ARCHIVOS
l
Transformación el tiempo en años a días:
(fumafin – fumaini) * 365,25
ORDENAR ARCHIVO
Datos → Ordenar casos
l
Fusión de archivos
l
por variables
l
por casos
Reestructuración de datos
SELECCIÓN DE CASOS
Datos → Seleccionar casos
Selecci ón
temporal
Selecci ón
permanente
9
FUSIÓN DE FICHEROS
Existen dos tipos de fusiones:
l
FUSIÓN DE FICHEROS - VARIABLES
Se quiere evaluar el estado de salud según
el sexo.
Añadir variables
Var 1 ..Var 10
Var 11 .. Var 20
l
Las variables estan en ficheros distintos
+
l
Añadir casos
Ind 1
...
Ind 5
l
Tabaco_demo.sav: datos demográficos
l
Tabaco_salud.sav: datos de salud
+
Fusión añadiendo variables
Ind 6
...
Ind 10
FUSIÓN DE FICHEROS - VARIABLES
Es necesario que ambos ficheros contengan
la misma variable identificadora del caso
l
FUSIÓN DE FICHEROS - VARIABLES
Datos → Ordenar casos → Ordenar por variable
identificadora
La variable identificadora debe reconocer
inequivocamente un caso, no pueden existir
repeticiones
Previamente ambos ficheros se deben
Salvar el fichero!!
ordenar de forma ascendente según la
variable identificadora
FUSIÓN DE FICHEROS - VARIABLES
FUSIÓN DE FICHEROS - VARIABLES
Datos → Fusionar → Añadir variables →
Seleccionar fichero 2
Variables excluidas
la var id siempre está
Opción:
- los dos ficheros pueden aportar casos
- sólo usará los casos del fichero 1
- sólo usará los casos del fichero 2
Variables que contendrá
el fichero resultante
Variable identificadora
10
FUSIÓN DE FICHEROS - CASOS
FUSIÓN DE FICHEROS - CASOS
Se quiere evaluar el estado de salud de
Si ambos ficheros contienen las mismas
toda la muestra.
variables → OK
l
La región sanitaria ‘Lleida’ está en un fichero
aparte del resto
Si aportan alguna/s variable/s distintas,
l
Tabaco_lleida.sav: datos de Lleida
l
Tabaco_region7.sav: datos del resto de 8 regiones sanitarias
Fusión añadiendo casos
FUSIÓN DE FICHEROS - CASOS
estas seran missing para los casos que
provienen del fichero donde no estan las
variables
FUSIÓN DE FICHEROS - CASOS
Datos → Fusionar → Añadir casos → Seleccionar
fichero 2
Variables desapareadas
Variables que contendrá
el fichero resultante
Variable que identifica
el fichero origen. Opcional
EJERCICIO
REESTRUCCTURACION DE DATOS
1) Crear un fichero de datos global
(tabaco_hombres.sav + tabaco_mujeres.sav)
VARIABLES A REGISTROS
id
sbp1
sbp2
sbp3
1
140
120
130
2
155
2) Crear un fichero de datos global
(tabaco_sexo.sav + tabaco_nosexo.sav)
REGISTROS A
VARIABLES
id
time
sbp
1
1
140
1
2
120
1
3
130
2
1
155
11
Descargar