ESTADÍSTICA 1 CONTENIDO 1 Introducción al SPSS Organización del SPSS Análisis de datos con SPSS Ventanas Barra de herramientas l Cuadros diálogo l l Lectura de ficheros en SPSS Máster en Salud Respiratoria 2007-2008 ¿Qué es un fichero/matriz de datos? Creación de un fichero de datos l Lectura de un fichero de datos l l INTRODUCCIÓN AL SPSS SPSS: Statistical Package for the Social Sciences INTRODUCCIÓN AL SPSS l l l Dispone de: Tutorial Página web : www.spss.com l Manual de sintaxis ..... l Programa (software) estadístico : l Gestionar bases de datos Describir y resumir los datos Medidas de tendencia central, dispersión, localización,... l Representaciones gráficas l l Análisis estadístico Existen otros: l SAS, S-Plus, Stata, Epi-info, Minitab,... INTRODUCCIÓN AL SPSS l TUTORIAL ORGANIZACIÓN DEL SPSS Ventanas Ventana de datos (variables y casos) (*.sav) Ventana de resultados (*.spo) l Ventana de sintaxis (programación) (*.sps) l l Barra de herramientas Cuadros de diálogo 1 VENTANA DE DATOS: nombre.SAV VENTANA DE DATOS: nombre.SAV Valores Nombre Nombre fichero Variables Casos Etiqueta Identificadores de valores missing Información sobre las variables Datos VENTANA DE RESULTADOS: nombre.SPO VENTANA DE RESULTADOS: nombre.SPO Memoriza los últimos análisis realizados Se edita f ácilmente con muchas opciones: Objetos • gráficas Navegador • estilo • impresión • etc... VENTANA DE COMANDOS: nombre.SPS EJECUTAR !!!!! BARRA DE HERRAMIENTAS Existe una barra en cada ventana Datos Añadir comentarios con * Programar anàlisis: las sentencias se finalizan con . Resultados • Es aconsejable, una vez se ha comprobado que el análisis es correcto, crear la sintaxis de los análisis realizados, • Permite más análisis no disponibles entre las ventanas de Windows visibles Sintaxis • Permite realizar fácilmente análisis parecidos, o modificar rápidamente una sintaxis ya programada anteriormente 2 BARRA DE HERRAMIENTAS CUADROS DIÁLOGO l Ventana de datos ModifIcar, cortar, copiar, pegar, encontrar texto y datos Definir, ordenar, seleccionar datos. juntar archivos Ayuda (F1), tutorial Análisis estadístico: descriptivos, modelos… Para la selección de variables y especificaciones opcionales Información sobre la base de datos Archivo Edición Ver Datos Transformar Analizar Graficos Util. Ventanas ? Abrir, salvar, imprimir datos, resultados y gráficos Menus y botones de estado, tamaño, fuentes, vista general Transformar, calcular, crear variables y valores usando expresiones y funciones Crear gráficos Administrador de ventanas ¿QUÉ ES UN FICHERO DE DATOS? Contiene la información recogida para todos los casos l Filas: unidad de análisis (casos) encuesta de satisfacción de un hospital: pacientes l encuesta de gasto hospitalario: hospital l l Columnas: características que quiero medir (variables) l l sexo, edad, tiempo de espera, calidad de la comida número de camas, número de médicos, gasto de luz ¿QUÉ ES UN FICHERO DE DATOS? Fichero de datos en SPSS: tabaco.sav Variables ¿QUÉ ES UN FICHERO DE DATOS? El sujeto 1007 tenía 16 a ños en el momento de la entrevista NUMID SEXO 1001 1 1002 1 1003 1 1004 2 1005 1 1006 2 1007 1 1008 1 1009 1 1010 1 EDAD CLASE REGION SALUD FUMAR 67 3 6 2 1 53 3 2 1 1 28 2 1 3 1 74 2 1 4 1 24 3 1 4 1 78 2 1 4 1 16 3 1 3 1 16 2 1 3 1 82 2 1 4 1 44 3 1 1 1 CREACIÓN DE UN FICHERO DE DATOS Creación de un fichero de datos en SPSS: entrada manual de datos Click 2 veces e insertar el nombre de la variable Nombre fichero Teclear directamente el valor en la casilla Casos (sujetos) Datos Entrada de datos Definición de las variables 3 CREACIÓN DE UN FICHERO DE DATOS Definición de variables Medida de Valores Nombre CREACIÓN DE UN FICHERO DE DATOS la variable SPSS no ha sido creado con este propósito y no tiene ni las ventajas ni la flexibilidad de un programa específico para la creación y manejo de bases de datos Información sobre las variables Tipo Etiqueta identificadores de valores ‘missing’ LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Ficheros de datos ya creados Ficheros de datos ya creados: SPSS (*.sav) ASCII (*.dat, *.txt) l Excel (*. xls) l Lotus (*.wk*) l dBase (*.dbf) l l LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Ficheros de datos ya creados Excel Seleccionar tipo de fichero Si en la 1ª fila del fichero Excel se encuentra el nombre de las variables marcar la opción 4 LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Lectura de datos texto (ASCII) Lectura de datos de texto (ASCII) Marcar sólo si existe un formato Visualización previa de los datos LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Datos de texto Datos de texto Si en la 1ª fila del fichero se encuentra el nombre de las variables marcar la opción Organización de las variables En qué línea se sitúa el 1r caso Número de casos que se desea leer Qué representa cada línea LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Datos de texto Datos de texto Separador de variables en el fichero de texto original Especificaciones de variables 5 LECTURA DE UN FICHERO DE DATOS LECTURA DE UN FICHERO DE DATOS Datos de texto Datos de texto (opción alternativa) Copiar sintaxis en fichero *.sps Marcar finalizar EJERCICIO CONTENIDO 2 Abrir el fichero ‘tabaco.xls’ y guardarlo como ‘smoke_xls.sav’ Definición de variables en SPSS Etiquetas de variables y valores Tipo de variables l Datos faltantes (missing) l Abrir el fichero ‘tabaco.dat’ y guardarlo como ‘smoke_dat.sav’ l Abrir el fichero ‘smoke.sav’ Creación y Transformación de variables en SPSS DEFINICIÓN DE VARIABLES EN SPSS Nombre Etiquetas para los valores DEFINICIÓN DE VARIABLES EN SPSS Medida de la variable Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos. l Sexo (Cualit: Códigos arbitrarios) l Raza (Cualit: Códigos arbitrarios) l l Scale: cuantitativa Nominal: cual. nominal Ordinal: cual. ordinal l l l Felicidad Ordinal: Respetar un orden al codificar. l l Informaci ón sobre las variables Etiqueta de la variable Identificadores de valores missing 1 = Hombre 2 = Mujer 1 = Blanca 2 = Negra,... l 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar c ódigos a respuestas especiales como l l 0 = No sabe 99 = No contesta... Estas situaciones deber án ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’) 6 EJERCICIOS con fichero tabaco.sav Identificar qué variables tienen valores missing y listarlos. EJERCICIOS con fichero tabaco.sav Utilizando el manual de codificación: Definir el valor 9 de la variable ‘sexo’ como missing Definir las etiquetas de los valores de las variables ‘sexo’ y ‘fumfin’. Cambiar el nombre de la variable ‘numid’ por ‘identificador’, ¿qué ocurre y porqué? Definir la etiqueta de la variable ‘sexo’ Sustituir la etiqueta del valor 1 de la variable ‘región’ por ‘Lerida’ TRANSFORMACIÓN /CREACIÓN DE VARIABLES TRANSFORMACIÓN /CREACIÓN DE VARIABLES Calcular una nueva variable: imc=peso(kg)/altura2 (m) Categorizar una variable continua según número de categorías: Recodificar los valores de una variable l Recodificar en la misma variable l Crear una variable nueva con un número específico de categorías. l Las categorías tienen un porcentage de casos igual o similar (percentiles) Cambiar los valores existentes por otros Sexo: 1=hombre, 2=mujer ⇒ Sexo: 1= mujer, 2= hombre Peso: continua ⇒ Peso: 1= ‘<60kg’, 2=’60-70kg’, 3=‘>70kg’ l Recodificar en una nueva variable Crear una variable nueva usando los valores de otra Sexo: 1=hombre, 2=mujer ⇒ Sexo2: 1= mujer, 2= hombre Peso:continua ⇒ Weight: 1=‘<60kg’, 2=’60-70kg’, 3=‘>70kg’ Contar las apariciones del mismo valor, o valores, en una lista de variables TRANSFORMACIÓN /CREACIÓN DE VARIABLES CALCULAR VARIABLES Transformar → Calcular IMC PESO/(ALTURA**2) 7 RECODIFICAR VARIABLES Transformar → Recodificar RECODIFICAR VARIABLES Recodificar en la misma variable Transformar → Recodificar • Es aconsejable recodificar en nuevas variables para no perder los valores originales de las variables • Todos los valores de la variable original deben ir a parar a una categoría de la nueva variable, es importante conocer la distribución de los valores variable original RECODIFICAR VARIABLES CATEGORIZAR VARIABLES Categorización de una variable contínua Recodificar en una nueva variable Transformar → Recodificar Transformar → Categorizar Indicar el número de categorias estas se construyen según percentiles ej: 4 categorias → <Q1, Q1-Q2, Q2-Q3 y > Q3 CATEGORIZAR VARIABLES Nueva variable que representa el orden de una variable continua Variable original CATEGORIZAR VARIABLES Categorización automática Variable nueva Asigna el orden de la variable continua Convierte los valores de una variable númerica o alfanumérica en números enteros consecutivos 8 EJERCICIO CONTAR APARICIONES Transformar → Contar 1) Recodificación de la variable edad en las siguientes categorías: l l l l l 2) (30 , 50] años (50 , 60] años (60 , 70] años (70 , 75] años Más de 75 años Definir la variable creada EJERCICIO 3) Cálculo de nuevas variables: l Exposición a tabaco (tiempo que hace que fuma en años): fumafin – fumaini l l Definir la variable ‘exposición a tabaco en años’ CONTENIDO 3 Tratamiento de DATOS l Ordenar casos l Selección de casos l Ponderar casos Segmentar/estratificar archivo l Manipulación de ARCHIVOS l Transformación el tiempo en años a días: (fumafin – fumaini) * 365,25 ORDENAR ARCHIVO Datos → Ordenar casos l Fusión de archivos l por variables l por casos Reestructuración de datos SELECCIÓN DE CASOS Datos → Seleccionar casos Selecci ón temporal Selecci ón permanente 9 FUSIÓN DE FICHEROS Existen dos tipos de fusiones: l FUSIÓN DE FICHEROS - VARIABLES Se quiere evaluar el estado de salud según el sexo. Añadir variables Var 1 ..Var 10 Var 11 .. Var 20 l Las variables estan en ficheros distintos + l Añadir casos Ind 1 ... Ind 5 l Tabaco_demo.sav: datos demográficos l Tabaco_salud.sav: datos de salud + Fusión añadiendo variables Ind 6 ... Ind 10 FUSIÓN DE FICHEROS - VARIABLES Es necesario que ambos ficheros contengan la misma variable identificadora del caso l FUSIÓN DE FICHEROS - VARIABLES Datos → Ordenar casos → Ordenar por variable identificadora La variable identificadora debe reconocer inequivocamente un caso, no pueden existir repeticiones Previamente ambos ficheros se deben Salvar el fichero!! ordenar de forma ascendente según la variable identificadora FUSIÓN DE FICHEROS - VARIABLES FUSIÓN DE FICHEROS - VARIABLES Datos → Fusionar → Añadir variables → Seleccionar fichero 2 Variables excluidas la var id siempre está Opción: - los dos ficheros pueden aportar casos - sólo usará los casos del fichero 1 - sólo usará los casos del fichero 2 Variables que contendrá el fichero resultante Variable identificadora 10 FUSIÓN DE FICHEROS - CASOS FUSIÓN DE FICHEROS - CASOS Se quiere evaluar el estado de salud de Si ambos ficheros contienen las mismas toda la muestra. variables → OK l La región sanitaria ‘Lleida’ está en un fichero aparte del resto Si aportan alguna/s variable/s distintas, l Tabaco_lleida.sav: datos de Lleida l Tabaco_region7.sav: datos del resto de 8 regiones sanitarias Fusión añadiendo casos FUSIÓN DE FICHEROS - CASOS estas seran missing para los casos que provienen del fichero donde no estan las variables FUSIÓN DE FICHEROS - CASOS Datos → Fusionar → Añadir casos → Seleccionar fichero 2 Variables desapareadas Variables que contendrá el fichero resultante Variable que identifica el fichero origen. Opcional EJERCICIO REESTRUCCTURACION DE DATOS 1) Crear un fichero de datos global (tabaco_hombres.sav + tabaco_mujeres.sav) VARIABLES A REGISTROS id sbp1 sbp2 sbp3 1 140 120 130 2 155 2) Crear un fichero de datos global (tabaco_sexo.sav + tabaco_nosexo.sav) REGISTROS A VARIABLES id time sbp 1 1 140 1 2 120 1 3 130 2 1 155 11