Introducción a la Estadística Práctica 1: Análisis de Datos Univariantes Objetivos: Conocer el manejo básico del Statgraphics. Reconocer los tipos de datos. Hacer distribuciones de frecuencias y análisis descriptivos numéricos y gráficos. Trabajar con variables cuantitativas y variables cualitativas. a) Entrada-salida del sistema Para entrar en STATGRAPHICS Plus debemos elegir el programa SGWIN.EXE, bien ejecutándolo explícitamente o haciendo doble click sobre el icono correspondiente. Para salir, seleccionar File… Exit Statgraphics en la Barra de Menú del Statgraphics o, sencillamente, cerrar la ventana principal de la aplicación. Al abrir el programa aparece un asistente para ayudarnos con su manejo. Lo cerramos, no queremos utilizarlo; para ello pulsamos Cancel y confirmamos que queremos cerrarlo. En la ventana principal del Statgraphics se pueden destacar, como en la mayoría de los entornos gráficos de los programas: una serie de menús en la parte superior y debajo hay algunas barras de herramientas con botones que representan los apartados de los menús antes mencionados que más se utilizan. 1 La Barra de Menú siempre estará disponible para seleccionar la función o análisis deseados. Este menú consta de diez palabras clave: Cada palabra de esté menú da acceso a las siguientes opciones: • File: Las opciones de este menú permiten realizar operaciones de carácter general como abrir (Open), cerrar (Close) o grabar (Save, Save as) ficheros, imprimir (Print) o salir del sistema (Exit Statgraphics). • Edit: Como en otras aplicaciones en entorno Windows, este menú da acceso a diferentes opciones de edición: deshacer la última acción (Undo), copiar, cortar y pegar (Copy, Cut y Paste) y otras. • Plot, Describe, Compare, Relate y Special: Dan acceso a los diferentes análisis estadísticos gráficos incorporados en STATGRAPHICS. • View, Window y Help: Proporcionan funciones de formato y ayuda de manera similar a otras aplicaciones en este entorno. Entrada de datos El Statgraphics sólo trabaja con columnas de variables. Cada variable es una columna de datos con una palabra que le sirva de etiqueta. Cada fila de esa columna es la información de un elemento. Al Statgraphics hay que suministrarle por tanto esas columnas de datos. Hay dos formas de introducir los datos en Stagraphics: • Leyendo un fichero que contenga los datos por columnas. El Statgraphics admite ficheros en varios formatos: ascii, excel, etc. • Tecleando los datos directamente, usando la hoja de cálculo que muestra el Statgraphics. En esta hoja de cálculo cada columna es una variable. b) Ejercicios para resolver en clase 1. Creación de un fichero de datos (Data File). Introducción de variables. Los siguientes datos representan la altura de 50 niños y niñas, los tecleamos en la primera columna de la hoja de cálculo como variables numéricas con nombre: altura y guardamos el fichero de datos. 1,56 1,61 1,53 1,59 1,55 1,47 1,50 1,68 1,65 1,58 1,59 1,59 1,49 1,58 1,59 1,57 1,62 1,52 1,53 1,52 1,63 1,51 1,57 1,53 1,60 1,59 1,62 1,59 1,63 1,62 1,62 1,54 1,47 1,56 1,54 1,62 1,59 1,56 1,56 1,65 1,62 1,53 1,64 1,53 1,56 1,54 1,49 1,54 1,62 1,63 2 Podemos etiquetar cada columna para asignarles un nombre que nos convenga. Así cambiaremos el nombre genérico que tiene cada columna (Col_1, Col_2 y Col_3) por el que elijamos, en nuestro caso altura. Seleccionamos la cabecera de la columna haciendo click en la celda superior, y pulsando el botón derecho del ratón. Sale entonces una ventana auxiliar que permite poner nombre a la variable, añadir comentarios, y especificar el tipo de dato: numérico, carácter, fecha... Pulsando en Help obtenemos más detalles sobre esta ventana Para Guardar los datos El Statgraphics permite varias opciones para salvar los resultados, las dos más importantes son: Salvar el fichero de datos y Salvar el conjunto de análisis realizados Para salvar el fichero de datos usamos la opción File…Save…Save Data File). La opción Save As es similar a Save. Con Save lo que hacemos es actualizar el fichero, mientras que con Save As creamos un fichero nuevo. Al guardar los datos tenemos la opción de elegir el formato propio de Statgraphics – recomendado- (extensión sf3 o sf) o un fichero de texto. Para realizar el Análisis descriptivo de variables cuantitativas y sus correspondientes Opciones gráficas, seguimos los siguientes pasos: (1) Análisis descriptivo numérico: DESCRIBE/ NUMERIC DATA / ONE VARIABLE ANALYSIS / OPTIONS / SUMMARY STATISTICS TABULAR (2) Tabla de frecuencias: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS / OPTIONS / FRECUENCY TABULATION TABULAR (3) Diagrama de Tallo y Hojas: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS / TABULAR OPTIONS / STEM AND LEAF DISPLAY (4) Análisis descriptivo gráfico. Histograma: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS / GRAPHICAL OPTIONS / FRECUENCY HISTOGRAM (5) Diagrama de dispersión: PLOT / SCATTERPLOT / UNIVARIATE PLOT Seleccionar la variable altura. Una vez obtenidos los resultados podemos guardar toda la información generada en los análisis utilizando la opción File…Save (as)…Save Statfolio (as) de la barra de menú. Llamamos StatFolio al conjunto formado por todos los elementos que crea el Statgraphics (fichero de datos, StatAdvisor, StatGallery, comentarios personales y resultados de los análisis) que aparecerán en todo momento diferenciados en la barra de tareas. 2. Apertura de fichero de datos existente. Ahora vamos a trabajar con el fichero de datos alumnos1.sf. Para dar lectura desde un fichero de datos utilizamos la opción File…Open…Open Data File. Es aconsejable abrir desde este menú todos los formatos de archivos, incluso el formato propio que utiliza Statgraphics; porque si intentamos hacer doble click con el ratón en el archivo de datos hay veces en que el programa no se carga bien. 3 Este fichero contiene 2 variables cualitativas referentes a los estudiantes de Ingeniería. Variable DEPORTE: 1 → Nada de Deporte 2 → Poco Deporte 3 → Mucho Deporte Y la variable SEXO 1 → Hombre 2 → Mujer Análisis descriptivo de variables cualitativas. (a) Análisis numérico. DESCRIBE / CATEGORICAL DATA / CROSSTABULATION Se introducen las variables y en TABULAR OPTIONS seleccionar / SUMMARY STATISTICS y FRECUENCY TABLE seleccionar Diagrama de barras bidimensional (BARCHART), Diagrama de (b) Análisis gráfico. En barras tridimensional (SKYCHART) y Diagrama Pastel (MOSAIC CHART). (c) Calcular el porcentaje de mujeres que hacen mucho deporte. (d) Calcular el porcentaje de la variable deporte, para cada uno de los valores que puede tomar. c) Ejercicios Propuestos Introducir los siguientes datos de la variable sexo y de la variable edad y realizar los correspondientes análisis estadísticos descriptivos. Edad de 50 niños y niñas: 14 15 12 13 11 11 13 12 14 11 12 13 15 12 14 12 13 11 14 12 15 13 12 11 9 12 13 12 14 9 8 12 12 11 14 15 13 11 10 12 10 14 13 12 11 14 13 12 11 12 Sexo de 50 niños y niñas: M H H M H M H H M M M H M H M H M H M H M M M H H M H M H M HM H M M H H M H H M H H H M H M M H M d) Bibliografía STATGRAPHICS Plus Versión 5.0, Curso Básico 4