2.5 preparación de los datos

Anuncio
2.5 PREPARACIÓN DE LOS DATOS
Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear
informes, gráficos y análisis sin ningún trabajo preliminar adicional.
Sin embargo, hay algunas funciones de preparación adicional de los datos que pueden resultarle
útiles, entre las que se incluyen:

Asignar propiedades de las variables que describan los datos y determinen cómo se deben
tratar ciertos valores.
 Identificar los casos que pueden contener información duplicada y excluir dichos casos de los
análisis o eliminarlos del archivo de datos.

Crear nuevas variables con algunas categorías distintas que representen rangos de valores
de variables que tengan un mayor número de valores posibles.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o leídos
desde un formato de archivos externo (como una hoja de cálculo de
Excel o un archivo de datos de texto) carecen de ciertas propiedades de
variables que pueden resultar muy útiles, como:

Definición de etiquetas de valor descriptivas para códigos
numéricos (por ejemplo, 0 = Hombre y 1 = Mujer).

Identificación de códigos de valores perdidos (por ejemplo, 99 =
No procede).

Asignación del nivel de medida (nominal, ordinal o de escala).
TODAS ESTAS PROPIEDADES DE VARIABLES (Y OTRAS) SE PUEDEN ASIGNAR EN LA
VISTA DE VARIABLES DEL EDITOR DE DATOS. TAMBIÉN HAY ALGUNAS UTILIDADES QUE
LE PUEDEN OFRECER ASISTENCIA EN ESTE PROCESO.
 Definir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y
valores perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos
utilizados para valores de categorías.
 Definir nivel de medición para desconocido identifica las variables (campos) que no tengan un
nivel de medición definido y permite definir el nivel de medición de esas variables. Es
importante para los procedimientos en los que el nivel de medición puede afectar a los
resultados o determinar qué funciones estarán disponibles.
 Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM®
SPSS® Statistics como plantilla para definir las propiedades de variables y archivos en el
archivo de datos actual. Esto es particularmente útil si utiliza frecuentemente archivos de
datos con un formato externo que tenga un contenido similar, como puedan ser informes
mensuales en formato Excel.
Definición de propiedades de variables
Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a
variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas
(nominales u ordinales). Definir propiedades de variables:
 Explora los datos reales y enumera todos valores de datos únicos para cada variable
seleccionada.

Identifica valores sin etiquetas y ofrece una función de “etiquetas automáticas”.

Permite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable
seleccionada o de la variable seleccionada a varias variables adicionales.
PARA DEFINIR PROPIEDADES DE VARIABLES
Elija en los menús:
Datos > Definir propiedades de variables...
La Vista de variables contiene descripciones de las propiedades de cada variable del archivo de
datos. En la Vista de variables:

Las filas son variables.

Las columnas son las características de las variables.
PARA VISUALIZAR O DEFINIR LOS ATRIBUTOS DE LAS VARIABLES
Desde la Vista de Variables, para definir variables nuevas, introduzca un nombre de variable en
cualquier fila vacía y seleccione los atributos que desea definir o modificar.
NOMBRES DE VARIABLE
Para los nombres de variable se aplican las siguientes normas:

El nombre debe comenzar por una letra.

Los nombres de variable no pueden terminar en punto.

No se pueden utilizar espacios en blanco ni caracteres especiales.
 Cada nombre de variable debe ser único; no se permiten duplicados.
TIPO DE VARIABLE
La propiedad del tipo de variable especifica los tipos de datos de cada variable. Por defecto se
asume que todas las variables nuevas son numéricas.
Los tipos de variable disponibles son los siguientes:
 Numérico. Una variable cuyos valores son números, se muestran en formato numérico
estándar.
 Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres
posiciones y con el punto como delimitador decimal.
 Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal.
 Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada
y un exponente con signo que representa una potencia de base diez. El Editor de datos
acepta para estas variables valores numéricos con o sin el exponente.
 Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos
de fecha-calendario u hora-reloj. Es necesario seleccionar un formato de la lista. Para
introducir la fecha se pueden utilizar: barras, guiones, puntos, comas o espacios.
 Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que
delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir
valores de datos con o sin el signo dólar inicial.
 Moneda personalizada. Una variable numérica cuyos valores se muestran en uno de los
formatos de moneda personalizados que se hayan definido previamente en la pestaña
Moneda del cuadro de diálogo Opciones.
 Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los
cálculos. Las mayúsculas y las minúsculas se consideran diferentes. Este tipo también se
conoce como variable alfanumérica.
ETIQUETAS DE VARIABLE
Puede asignar etiquetas de variable descriptivas, pueden contener espacios y caracteres reservados
que no se admiten en los nombres de variable.
Etiquetas de valor (Valores)
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es
especialmente útil si el archivo de datos utiliza códigos numéricos para representar categorías que no
son numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer).
Para especificar etiquetas de valor
Pulse en el botón de la casilla Valores de la variable que se quiere definir.
 Para cada valor, escriba el valor y una etiqueta.
 Pulse en Añadir para introducir la etiqueta de valor.
 Pulse en Aceptar.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por
ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a
responder. Los valores de datos que se especifican como perdidos por el usuario aparecen
marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos.
Para definir los valores perdidos

Introduzca los valores o el rango de valores que representen los datos perdidos. Se
considera que son válidos todos los valores de cadena, incluidos los valores vacíos o nulos, a
no ser que se definan explícitamente como perdidos.
DEFINICIÓN DE ETIQUETAS DE VALOR Y OTRAS PROPIEDADES DE LAS VARIABLES
El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información
para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación
en la columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor
asignadas.
Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en
la parte superior de la lista:
Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas.
También puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de
columna correspondiente debajo de la Lista de variables exploradas.
REJILLA, ETIQUETA, VALORES
Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede añadir o cambiar las
etiquetas de esta columna.
Valor. Valores únicos para cada variable seleccionada. Esta lista de valores únicos se basa en el
número de casos explorados
Recuento. Número de veces que aparece cada valor en los casos explorados.
Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la
categoría de los valores perdidos pulsando en la casilla de verificación
Cambiado. Indica que ha añadido o cambiado una etiqueta de valor.
Nivel de medida.
Las etiquetas de valor son especialmente útiles para las variables categóricas (nominales u
ordinales),
Algunos procedimientos tratan a las variables categóricas y de escala de manera diferente, por lo
que a veces es importante asignar el nivel de medida correcto.
Sin embargo, por defecto, todas las nuevas variables numéricas se asignan al nivel de medida de
escala.
Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como
variables de escala.
Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de
papeles definidos.
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de
otra variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese
momento a una o varias otras variables.
Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en:
Etiquetas automáticas.
Etiqueta de variable y formato de presentación
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación.
•
No puede cambiar el tipo fundamental de la variable (numérica o de cadena).
•
Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de
presentación.
•
Para las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o
moneda personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores
decimales y/o de agrupación) y el número de posiciones decimales.
•
Para el formato de fecha numérica, puede seleccionar un formato de fecha específico (como
dd-mm-aaaa, mm/dd/aa, aaaaddd)
•
Para formato numérico personalizado, puede seleccionar uno de los cinco formatos de
moneda personalizados (de CCA a CCE).
•
Aparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los
valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o
categorías de valores perdidos.
•
Aparece un período (.) si los valores explorados o los valores mostrados para etiquetas de
valor definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de
formato de presentación seleccionado. Por ejemplo, un valor numérico interno inferior a
86.400 no es válido para una variable de formato de fecha.
Descargar