Introducción a la Estadística

Anuncio
Introducción a la Estadística
Práctica 1: Análisis de Datos Univariantes
Objetivos: Conocer el manejo básico del Statgraphics. Reconocer los tipos de datos. Hacer distribuciones de
frecuencias y análisis descriptivos numéricos y gráficos. Trabajar con variables cuantitativas y variables
cualitativas.
a) Entrada-salida del sistema
Para entrar en STATGRAPHICS Plus debemos elegir el programa SGWIN.EXE, bien ejecutándolo explícitamente
o haciendo doble click sobre el icono correspondiente. Para salir, seleccionar File… Exit Statgraphics en la Barra
de Menú del Statgraphics o, sencillamente, cerrar la ventana principal de la aplicación.
Al abrir el programa aparece un asistente para ayudarnos con su manejo. Lo cerramos, no queremos utilizarlo;
para ello pulsamos Cancel y confirmamos que queremos cerrarlo.
En la ventana principal del Statgraphics se pueden destacar, como en la mayoría de los entornos gráficos de los
programas: una serie de menús en la parte superior y debajo hay algunas barras de herramientas con botones
que representan los apartados de los menús antes mencionados que más se utilizan.
1
La Barra de Menú siempre estará disponible para seleccionar la función o análisis deseados. Este menú consta
de diez palabras clave:
Cada palabra de esté menú da acceso a las siguientes opciones:
• File: Las opciones de este menú permiten realizar operaciones de carácter general como abrir (Open), cerrar
(Close) o grabar (Save, Save as) ficheros, imprimir (Print) o salir del sistema (Exit Statgraphics).
• Edit: Como en otras aplicaciones en entorno Windows, este menú da acceso a diferentes opciones de edición:
deshacer la última acción (Undo), copiar, cortar y pegar (Copy, Cut y Paste) y otras.
• Plot, Describe, Compare, Relate y Special: Dan acceso a los diferentes análisis estadísticos gráficos
incorporados en STATGRAPHICS.
• View, Window y Help: Proporcionan funciones de formato y ayuda de manera similar a otras aplicaciones en este
entorno.
Entrada de datos
El Statgraphics sólo trabaja con columnas de variables. Cada variable es una columna de datos con una palabra
que le sirva de etiqueta. Cada fila de esa columna es la información de un elemento. Al Statgraphics hay que
suministrarle por tanto esas columnas de datos. Hay dos formas de introducir los datos en Stagraphics:
• Leyendo un fichero que contenga los datos por columnas. El Statgraphics admite ficheros en varios formatos:
ascii, excel, etc.
• Tecleando los datos directamente, usando la hoja de cálculo que muestra el Statgraphics. En esta hoja de
cálculo cada columna es una variable.
b) Ejercicios para resolver en clase
1. Creación de un fichero de datos (Data File). Introducción de variables.
Los siguientes datos representan la altura de 50 niños y niñas, los tecleamos en la primera columna de la hoja de
cálculo como variables numéricas con nombre: altura y guardamos el fichero de datos.
1,56 1,61 1,53 1,59 1,55 1,47 1,50 1,68 1,65 1,58 1,59 1,59 1,49 1,58 1,59 1,57 1,62 1,52 1,53 1,52
1,63 1,51 1,57 1,53 1,60 1,59 1,62 1,59 1,63 1,62 1,62 1,54 1,47 1,56 1,54 1,62 1,59 1,56 1,56 1,65
1,62 1,53 1,64 1,53 1,56 1,54 1,49 1,54 1,62 1,63
2
Podemos etiquetar cada columna para asignarles un nombre que nos convenga. Así cambiaremos el
nombre genérico que tiene cada columna (Col_1, Col_2 y Col_3) por el que elijamos, en nuestro caso altura.
Seleccionamos la cabecera de la columna haciendo click en la celda superior, y pulsando el botón derecho del
ratón. Sale entonces una ventana auxiliar que permite poner nombre a la variable, añadir comentarios, y
especificar el tipo de dato: numérico, carácter, fecha... Pulsando en Help obtenemos más detalles sobre esta
ventana
Para Guardar los datos El Statgraphics permite varias opciones para salvar los resultados, las dos más
importantes son: Salvar el fichero de datos y Salvar el conjunto de análisis realizados
Para salvar el fichero de datos usamos la opción File…Save…Save Data File).
La opción Save As es similar a Save. Con Save lo que hacemos es actualizar el fichero, mientras que con Save As
creamos un fichero nuevo. Al guardar los datos tenemos la opción de elegir el formato propio de Statgraphics –
recomendado- (extensión sf3 o sf) o un fichero de texto.
Para realizar el Análisis descriptivo de variables cuantitativas y sus correspondientes Opciones gráficas,
seguimos los siguientes pasos:
(1) Análisis descriptivo numérico: DESCRIBE/ NUMERIC DATA / ONE VARIABLE ANALYSIS /
OPTIONS / SUMMARY STATISTICS
TABULAR
(2) Tabla de frecuencias: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS /
OPTIONS / FRECUENCY TABULATION
TABULAR
(3) Diagrama de Tallo y Hojas: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS /
TABULAR
OPTIONS / STEM AND LEAF DISPLAY
(4) Análisis descriptivo gráfico. Histograma: DESCRIBE / NUMERIC DATA / ONE VARIABLE ANALYSIS /
GRAPHICAL OPTIONS / FRECUENCY HISTOGRAM
(5) Diagrama de dispersión: PLOT / SCATTERPLOT / UNIVARIATE PLOT Seleccionar la variable altura.
Una vez obtenidos los resultados podemos guardar toda la información generada en los análisis utilizando la
opción File…Save (as)…Save Statfolio (as) de la barra de menú. Llamamos StatFolio al conjunto formado por
todos los elementos que crea el Statgraphics (fichero de datos, StatAdvisor, StatGallery, comentarios personales y
resultados de los análisis) que aparecerán en todo momento diferenciados en la barra de tareas.
2. Apertura de fichero de datos existente. Ahora vamos a trabajar con el fichero de datos alumnos1.sf. Para dar
lectura desde un fichero de datos utilizamos la opción File…Open…Open Data File. Es aconsejable abrir desde
este menú todos los formatos de archivos, incluso el formato propio que utiliza Statgraphics; porque si intentamos
hacer doble click con el ratón en el archivo de datos hay veces en que el programa no se carga bien.
3
Este fichero contiene 2 variables cualitativas referentes a los estudiantes de Ingeniería. Variable DEPORTE:
1 → Nada de Deporte
2 → Poco Deporte
3 → Mucho Deporte
Y la variable SEXO
1 → Hombre
2 → Mujer
Análisis descriptivo de variables cualitativas.
(a) Análisis numérico. DESCRIBE / CATEGORICAL DATA / CROSSTABULATION Se introducen las
variables y en
TABULAR OPTIONS seleccionar / SUMMARY STATISTICS y FRECUENCY TABLE
seleccionar Diagrama de barras bidimensional (BARCHART), Diagrama de
(b) Análisis gráfico. En
barras tridimensional (SKYCHART) y Diagrama Pastel (MOSAIC CHART).
(c) Calcular el porcentaje de mujeres que hacen mucho deporte.
(d) Calcular el porcentaje de la variable deporte, para cada uno de los valores que puede tomar.
c) Ejercicios Propuestos
Introducir los siguientes datos de la variable sexo y de la variable edad y realizar los correspondientes análisis
estadísticos descriptivos.
Edad de 50 niños y niñas:
14 15 12 13 11 11 13 12 14 11 12 13 15 12 14 12 13 11 14 12 15 13 12 11 9 12 13 12 14 9 8
12 12 11 14 15 13 11 10 12 10 14 13 12 11 14 13 12 11 12
Sexo de 50 niños y niñas:
M H H M H M H H M M M H M H M H M H M H M M M H H M H M H M HM H M M H H M
H H M H H H M H M M H M
d) Bibliografía
STATGRAPHICS Plus Versión 5.0, Curso Básico
4
Descargar