2.5 PREPARACIÓN DE LOS DATOS Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear informes, gráficos y análisis sin ningún trabajo preliminar adicional. Sin embargo, hay algunas funciones de preparación adicional de los datos que pueden resultarle útiles, entre las que se incluyen: Asignar propiedades de las variables que describan los datos y determinen cómo se deben tratar ciertos valores. Identificar los casos que pueden contener información duplicada y excluir dichos casos de los análisis o eliminarlos del archivo de datos. Crear nuevas variables con algunas categorías distintas que representen rangos de valores de variables que tengan un mayor número de valores posibles. Propiedades de variables Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de archivos externo (como una hoja de cálculo de Excel o un archivo de datos de texto) carecen de ciertas propiedades de variables que pueden resultar muy útiles, como: Definición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo, 0 = Hombre y 1 = Mujer). Identificación de códigos de valores perdidos (por ejemplo, 99 = No procede). Asignación del nivel de medida (nominal, ordinal o de escala). TODAS ESTAS PROPIEDADES DE VARIABLES (Y OTRAS) SE PUEDEN ASIGNAR EN LA VISTA DE VARIABLES DEL EDITOR DE DATOS. TAMBIÉN HAY ALGUNAS UTILIDADES QUE LE PUEDEN OFRECER ASISTENCIA EN ESTE PROCESO. Definir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y valores perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos utilizados para valores de categorías. Definir nivel de medición para desconocido identifica las variables (campos) que no tengan un nivel de medición definido y permite definir el nivel de medición de esas variables. Es importante para los procedimientos en los que el nivel de medición puede afectar a los resultados o determinar qué funciones estarán disponibles. Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM® SPSS® Statistics como plantilla para definir las propiedades de variables y archivos en el archivo de datos actual. Esto es particularmente útil si utiliza frecuentemente archivos de datos con un formato externo que tenga un contenido similar, como puedan ser informes mensuales en formato Excel. Definición de propiedades de variables Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas (nominales u ordinales). Definir propiedades de variables: Explora los datos reales y enumera todos valores de datos únicos para cada variable seleccionada. Identifica valores sin etiquetas y ofrece una función de “etiquetas automáticas”. Permite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable seleccionada o de la variable seleccionada a varias variables adicionales. PARA DEFINIR PROPIEDADES DE VARIABLES Elija en los menús: Datos > Definir propiedades de variables... La Vista de variables contiene descripciones de las propiedades de cada variable del archivo de datos. En la Vista de variables: Las filas son variables. Las columnas son las características de las variables. PARA VISUALIZAR O DEFINIR LOS ATRIBUTOS DE LAS VARIABLES Desde la Vista de Variables, para definir variables nuevas, introduzca un nombre de variable en cualquier fila vacía y seleccione los atributos que desea definir o modificar. NOMBRES DE VARIABLE Para los nombres de variable se aplican las siguientes normas: El nombre debe comenzar por una letra. Los nombres de variable no pueden terminar en punto. No se pueden utilizar espacios en blanco ni caracteres especiales. Cada nombre de variable debe ser único; no se permiten duplicados. TIPO DE VARIABLE La propiedad del tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume que todas las variables nuevas son numéricas. Los tipos de variable disponibles son los siguientes: Numérico. Una variable cuyos valores son números, se muestran en formato numérico estándar. Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal. Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal. Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base diez. El Editor de datos acepta para estas variables valores numéricos con o sin el exponente. Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Es necesario seleccionar un formato de la lista. Para introducir la fecha se pueden utilizar: barras, guiones, puntos, comas o espacios. Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el signo dólar inicial. Moneda personalizada. Una variable numérica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo Opciones. Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los cálculos. Las mayúsculas y las minúsculas se consideran diferentes. Este tipo también se conoce como variable alfanumérica. ETIQUETAS DE VARIABLE Puede asignar etiquetas de variable descriptivas, pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. Etiquetas de valor (Valores) Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer). Para especificar etiquetas de valor Pulse en el botón de la casilla Valores de la variable que se quiere definir. Para cada valor, escriba el valor y una etiqueta. Pulse en Añadir para introducir la etiqueta de valor. Pulse en Aceptar. Valores perdidos Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos. Para definir los valores perdidos Introduzca los valores o el rango de valores que representen los datos perdidos. Se considera que son válidos todos los valores de cadena, incluidos los valores vacíos o nulos, a no ser que se definan explícitamente como perdidos. DEFINICIÓN DE ETIQUETAS DE VALOR Y OTRAS PROPIEDADES DE LAS VARIABLES El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información para las variables exploradas: Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación en la columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor asignadas. Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la parte superior de la lista: Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas. También puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de columna correspondiente debajo de la Lista de variables exploradas. REJILLA, ETIQUETA, VALORES Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede añadir o cambiar las etiquetas de esta columna. Valor. Valores únicos para cada variable seleccionada. Esta lista de valores únicos se basa en el número de casos explorados Recuento. Número de veces que aparece cada valor en los casos explorados. Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la categoría de los valores perdidos pulsando en la casilla de verificación Cambiado. Indica que ha añadido o cambiado una etiqueta de valor. Nivel de medida. Las etiquetas de valor son especialmente útiles para las variables categóricas (nominales u ordinales), Algunos procedimientos tratan a las variables categóricas y de escala de manera diferente, por lo que a veces es importante asignar el nivel de medida correcto. Sin embargo, por defecto, todas las nuevas variables numéricas se asignan al nivel de medida de escala. Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como variables de escala. Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de papeles definidos. Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a una o varias otras variables. Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en: Etiquetas automáticas. Etiqueta de variable y formato de presentación Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación. • No puede cambiar el tipo fundamental de la variable (numérica o de cadena). • Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de presentación. • Para las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o moneda personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores decimales y/o de agrupación) y el número de posiciones decimales. • Para el formato de fecha numérica, puede seleccionar un formato de fecha específico (como dd-mm-aaaa, mm/dd/aa, aaaaddd) • Para formato numérico personalizado, puede seleccionar uno de los cinco formatos de moneda personalizados (de CCA a CCE). • Aparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de valores perdidos. • Aparece un período (.) si los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de formato de presentación seleccionado. Por ejemplo, un valor numérico interno inferior a 86.400 no es válido para una variable de formato de fecha.