Cambios en un archivo de datos

Anuncio
Planeación y manejo de la informática médica
Introducción
El curso tiene como objetivo el facilitar la comprensión, a un nivel general, del método
epidemiológico a modo de sustento para estudios o artículos con carácter científico. Con
este propósito se pretende:
1. Dar a conocer el paquete estadístico para computo SPSS1 con el propósito de
aprender a interactuar con él.
2. Contribuir con una cultura general relacionada con la estadística descriptiva y los
diseños epidemiológicos, para construir un panorama aproximado de las
herramientas metodológicas usadas en el proceso de generación de información a
partir de propuestas o estudios con carácter científico.
I- Sensibilización al paquete estadístico SPSS.
Pantallas básicas y sus extensiones.
Las pantallas básicas son la de datos y la de productos de trabajo o “output” o visor,
con las extensiones: .sav y .spo, respectivamente. Existen más tipos de pantallas pero
nos enfocaremos a estas dos.
La de datos (.sav) se puede entender como una hoja de calculo, las columnas
corresponden a las variables y las filas a los individuos u observaciones realizadas.
La de productos (.spo) es útil para llevar el registro de las respuestas de cálculos y
gráficos que da la máquina y puede ser ocupada como pagina de texto.
1. Menú y submenú
Existen diferentes ofertas de menú en SPSS las cuales describiremos:
Editor de datos: este menú muestra los contenidos del archivo de datos. Como el editor
de datos puede crear nuevos archivos de datos o modificar los existentes. La ventana del
Editor de datos se abre automáticamente cuando se inicia una sesión de SPSS. No se
puede tener más de un archivo de datos abierto al mismo tiempo. (extensión .sav )
Visor: Todas las tablas, los gráficos, y los resultados estadísticos se muestran en el
visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La
ventana del visor se abre automáticamente la primera vez que se ejecuta un
procedimiento para generar datos. (extensión .spo)
1
Statistical Package for Social Sciences.
Visor de borrador: Los resultados pueden mostrarse como texto normal
Editor de tablas pivote: Es posible modificar los resultados mostrados en este tipo de
tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las filas y las
columnas, añadir colores, crear tablas multidimensionales y ocultar o mostrar los
resultados de manera selectiva.
Editor de gráficos: Puede modificar los gráficos y diagramas de alta resolución en las
ventanas de los gráficos. Es posible cambiar los colores, seleccionar diferentes tipos de
fuente y tamaños, intercambiar los ejes horizontal y vertical, rotar diagramas de
dispersión 3 -D e incluso cambiar el tipo de gráfico.
Editor de resultados de texto: Los resultados de texto que no aparecen en las tablas
pivote pueden modificarse con el editor de resultados de texto. Puede editar los
resultados y cambiar las características de las fuentes (tipo, estilo, color y tamaño).
Editor de sintaxis: Puede pegar las selecciones del cuadro de dialogó en una ventana de
sintaxis, donde aparecerán en forma de sintaxis de comandos. También puede guardar
los comandos en archivo para utilizarlos en sesiones posteriores.
Editor de procesos: El procesamiento y la autorización OLE permiten personalizar y
automatizar muchas tareas en SPSS. Utilice el Editor de procesos para crear y modificar
los procesos en Basic.
2. Abrir, cerrar, copiar, pegar y guardar un archivo
Es posible cortar y pegar valores de casilla individuales o grupos de valores en el Editor
de datos. Puede hacer todo esto:
 Mover o copiar un único valor de casilla a otra casilla
 Mover o copiar un único valor de casilla a un grupo de casillas
 Mover o copiar los valores para un único caso (fila) en casos múltiples
 Mover o copiar los valores de una única variables (columna) en variables múltiples
 Mover o copiar un grupo de valores de casilla en otro grupo de casillas
Almacenamiento de datos: Tipos de archivos de datos
Puede guardar en los siguientes formatos:
SPSS (*.sav ). Formato SPSS: Los archivos de datos guardados con formato SPSS para
Windows, pero no incluyen los conjuntos de respuestas múltiples definidos ni
información sobre la introducción de datos para Windows.
SPSS/PC+ (*.sys ). Formato SPSS/PC+. Si el archivo de datos contiene más de 500
variables, sólo se guardaran las primeras. Para las variables con más de un valor perdido
definido por el usuario, los valores perdidos definidos por el usuario adicionales se
recodificarán en el primero de estos valores.
SPSS portátil (*.por). El formato portátil de SPSS puede leerse en versiones de SPSS
para otros sistemas operativos (por ejemplo, Macitosh y UNIX)
Cambios en un archivo de datos
Cualquier cambio que realice en un archivo de datos se mantendrá solamente durante la
sesión actual, a menos que guarde los cambios de manera explícita.
Para guardar los cambios de un archivo de datos
 Active la ventana del editor de datos (pulse en cualquier parte de la ventana para
activarla).
 Elija en los menús
archivo
guardar como…
 Seleccione un tipo de archivo de la lista desplegable.
 Introduzca un nombre de archivo para el nuevo archivo de datos.
para escribir nombres de variables en la primera fila de una hoja de cálculo o de
archivos de datos delimitados por tabuladores:
 Pulse en Escribir nombres de variables en el cuadro de dialogo de opciones para
guardar archivos.
3.- Información sobre el archivo
Un archivo de datos contiene mucho más que datos sin formato. También contiene
información sobre la definición de las variables, incluyendo:
 Los nombres de las variables.
 Los formatos de las variables.
 Las etiquetas descriptivas de variable y de valor.
Esta información se almacena en la parte del diccionario sobre el archivo de datos. El
Editor de datos proporciona una forma de presentar la información sobre la definición
de la variable. También se puede mostrar la información completa del diccionario para
el archivo de datos de trabajo o para cualquier otro archivo de datos.
Para obtener información sobre un archivo de datos:
 Para el archivo de datos elija en los menús:
utilidades
información del archivo…
 Para otros archivos de datos, elija en los menús:
Archivo
mostrar información de datos…
 Seleccione un archivo del cuadro de dialogo Mostrar información de datos.
La información sobre el archivo de datos se muestra en el visor.
Para remplazar o modificar un valor de datos
Para eliminar el valor anterior e introducir un valor nuevo:
 Pulse en la casilla ( el valor de la casilla se muestra en el editor de casillas)
 Introduzca el nuevo valor, el cual remplazara el anterior
 Pulse intro (o desplácese a otra casilla) para registrar el nuevo valor
Para modificar un valor de dato



Pulse la casilla
Pulse el editor de datos como lo haría con cualquier otro texto
Pulse intro ( o desplácese a otra casilla) para registrar el nuevo valor
II.- Introducción al método estadístico
1. - Conceptos básicos del método estadístico.
1.1 Dato - variable
1.2 Muestra – universo
1.3 Masa informativa
2- Conceptos y práctica en el paquete estadístico.
Una recomendación importante es tener siempre un respaldo de la base de datos
antes de cualquier manipulación.
Como se define, una variable asigna información sobre las definiciones de datos alas
variables. Se pueden definir variables nuevas o ya existentes. La información sobre la
definición de datos incluye:
 Nombre de variable
 Tipo de datos (numérico, de cadena, fecha, etc.)
 Etiquetas descriptivas de variable y de valor
 Códigos especiales para valores perdidos
 Nivel de medida
Definir tipo de variable: especifica la escala de datos de cada variable. Por defecto el
paquete estadístico SPSS asume que todas las variables nuevas son numéricas. Se
puede utilizar Definir tipo de variable para seleccionar el tipo de datos. El contenido del
cuadro de diálogo depende del tipo de datos seleccionados. Para algunos tipos de datos,
hay cuadros de texto para el ancho y el número de decimales; para otros simplemente
pueden seleccionar un formato de una lista despegable de ejemplos. Los tipos de datos
disponibles son numéricos, de coma, de punto, notación científica, fecha, dólar, moneda
personalizada y cadena.
Ejercicio 1 definir tipo de variable “define variable”
 ir a la base de datos neumonía.sav
 mantener pulsado control junto con 
 en el nombre de la primera columna vacía V0001 o pulse en cualquier parte de la
columna vacía, pulse dos veces y elija en el menú
Dato “date”
definir variable… “define variable”
 aparecerá el cuadro de dialogo Definir variable
 escribir el nombre de la variable talla
 pulsar una vez en tipo “type” aparecerá un cuadro de dialogo Definir tipo de variable
 seleccionar numérico “numeric”
 definir ancho y decimales (ver ejercicio 3) pulsar continuar “contin”
Definir etiquetas: esta función proporciona la posibilidad de describir la variable y el
valor de está, aunque el nombre de las variables solo pueden ser de 8 caracteres, las
etiquetas de la variable pueden ser hasta de 256 caracteres, y estas etiquetas son visibles
en los resultados. Se pueden asignar etiquetas descriptivas de valor a cada valor de una
variable Esto es particularmente útil si el archivo de datos utiliza códigos numéricos
para representar categorías no numéricas (por ejemplo, los códigos 1 y 2 para hombre y
mujer ) Las etiquetas de valor pueden tener una longitud máxima de 60 caracteres. Estas
etiquetas están disponibles para variables de cadena larga (variables e cadena con más
de 8 caracteres).
Continuación del ejercicio 1 definir etiquetas “define labels”
 pulsar una vez en etiquetas “label” aparecerá un cuadro de dialogo definir etiquetas,
en el cual podrán describir detalladamente la variable y su valor “value labels”
 en el espacio de etiqueta de variable escribir “talla en centímetros”
 pulsar continuar Contin”
 pulsar valores perdidos “missing values”
Valores perdidos: esta función permite definir los valores de los datos perdidos por el
usuario. La utilidad de esta función radica en el poder distinguir cuantos datos se han
omitido por el encuestador, a estos datos se les da un tratamiento especial ya que
aparecerán marcados y se excluirán de la mayoría de los cálculos.
Continuación del ejercicio 1 definir valores perdidos “missing values”

Aparecerá la pantalla de dialogo Definir valores perdidos, en el cual encontraran las
opciones sin valores perdidos “ no missing values”, valores perdidos discretos
“range plus one discrete missing value”

Seleccionar valores perdidos discretos, lo cual automáticamente los colocara en el
espacio del valor
Definir formato de columna: esta función controla el ancho de las columnas del Editor
de datos y la alineación de los valores de datos.
Los formatos de columna afectan sólo a la presentación de valores en el editor de datos.
Al cambiar el ancho de columna no se cambia el ancho definido de la variable. Si el
ancho real y definido de un valor es más ancho que la columna, aparecerán asteriscos
(**) en la ventana del editor de datos.
Continuación del ejercicio 1 definir ancho de columna “define column format”
 Definir ancho de columna con 6 en “column width”
 Pulsar continuar
 Pulsar aceptar “ok”
La variable está creada
Introducción de datos
Es posible introducir datos directamente en el Editor de datos. Es posible introducir
datos en cualquier orden. Asimismo se pueden introducir datos por caso o por variable.
La casilla activa se resalta con un borde grueso.
El nombre de la variable y el número de la fila de la casilla activa se muestra en la
esquina superior izquierda del editor de datos.
Una recomendación importante cree primero todas sus variables antes de introducir los
datos
A continuación se les proporcionara una lista de datos correspondientes a los primeros
20 casos de la variable talla que ustedes crearon
Ejercicio 2

Introducir los 20 datos dentro de la variable talla
1. - 60
2. - 50
3. - 94
4. - 53
5. - 57
6. - 55
7. - 54
8. - 60
9. - 63
10 .- 106
11. - 50
12. - 51
13. - 67
14. - 54
15. - 63
16. - 56
17. - 50
18. - 71
19. - 62
20. -69
Ejercicio 3
 ir a la base de datos neumonía.sav
 buscar la variable peso en kg.
 pulse dos veces en el nombre de la variable situado en la parte superior de la
columna o pulse en cualquier parte de la columna de la variable y elija en los
menús:
Datos
Definir variable… “define variable”
En este momento aparecerá una pantalla la cual contiene la descripción de la variable
 Observen como esta construida la variable
Tipo “type”
Etiqueta “label”
Valores perdidos “missing values”
Alineación “column format”
Ejercicio 4
En este ejercicio aprenderemos a transformar una variable cuantitativa discreta en una
cuantitativa continua
 buscar la variable peso en gramos
 acceder a ella como en el ejercicio anterior
una vez obtenido el cuadro de diálogo Definir variable “define variable”
 pulse una vez en Tipo “type”
 aparecerá el cuadro de diálogo Definir tipo de variable, el cual se encuentra definido
como numérico en los espacios de ancho “ width” y decimales “decimal places” 5 y
0 respectivamente
 cambiar el ancho por 6 ya que este corresponde a todos los caracteres del dato, el cual
incluye números enteros, el punto decimal y los números decimales.
 Cambiar decimales a 3
 pulsar una vez en continuar y esto los llevara de vuelta al cuadro de dialogo Definir
variable pulsar una vez en Aceptar “ok”
 la variable ya esta transformada
Ejercicio 5
En este ejercicio trabajaremos con variables cuantitativas discretas
 buscar la variable ncuarto
 acceder a ella como en los ejercicios anteriores
 una vez obtenido el cuadro de dialogo definir variable “define variable”
 pulse una vez en Tipo “type”
 aparecerá el cuadro de dialogo Definir tipo de variable en el cual podrán observar
como esta construida la variable (numérica, ancho 1, decimales 0)
 pulse una vez en continuar
 pulse una vez en Aceptar
Frecuencias y medidas de resumen
1. – Tablas y gráficas
1. - Criterios de clasificación
2. - Tipos de estudios
III.- Diseños epidemiológicos
Descargar