1 Práctica 2 de SPSS por Rina Familia Quantitative Research II EDU741 UNAD/Florida 2015 2 Ejercicio propuesto 1. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua para consumo, en términos de colonias de bacterias tróficas, en un acuífero próximo a la ciudad. Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (número de colonias por 1000 mm de agua) Zona 1: Zona 2: 194 158 199 161 191 143 202 174 215 220 214 156 197 156 204 156 199 198 202 161 230 188 193 139 Se pide: Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas estadísticas y gráficos. Para ello realizar los siguientes apartados: a. Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas. b. Representar gráficamente los datos con un histograma para cada variable. c. Representar gráficamente los datos con un diagrama de caja simple (donde los datos del gráfico son resúmenes para distintas variables). 194 147 209 116 3 Solución del Ejercicio 1 a) Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas. Iniciamos introduciendo los datos de cada una de las variables Se procede a calcular la media, varianza, moda, mediana, máximo y mínimo de ambas zonas. Después de dirigirse al menú principal del SPSS en la ficha “Analizar” se ingresa por Estadísticos descriptivos y luego allí se selecciona “Frecuencias”, así: 4 Ahora se envían con la flecha hacia la derecha las dos variables a analizar: Zona 1 y Zona 2. Luego, se da clic en la ficha “Estadísticos..” con lo cual se despliega ua ventana para que selecione los estadísticos que quiere calcular. Se dejan activas las casillas de: Media, Mediana, Moda, Varianza, Mínimo y Máximo: Se da clic en “Continuar” en la ventana de las estadísticas (der) y en la ventana de Frecuencias (izq) se pulsa en “Aceptar”. Y se va abrir el visor de resultados con lo siguiente: Ventana del Visor de Resultados 5 Tabla 1. Frecuencias Zona 1 Válido Porcentaje válido Porcentaje acumulado Frecuencia Porcentaje 191 1 7.1 7.1 7.1 193 1 7.1 7.1 14.3 194 2 14.3 14.3 28.6 197 1 7.1 7.1 35.7 199 2 14.3 14.3 50.0 2 14.3 14.3 64.3 204 1 7.1 7.1 71.4 209 1 7.1 7.1 78.6 214 1 7.1 7.1 85.7 215 1 7.1 7.1 92.9 230 1 7.1 7.1 100.0 Total 14 100.0 100.0 202 Tabla 2. Frecuencias Zona 2 Válido Porcentaje válido Porcentaje acumulado Frecuencia Porcentaje 116 1 7.1 7.1 7.1 139 1 7.1 7.1 14.3 143 1 7.1 7.1 21.4 147 1 7.1 7.1 28.6 156 3 21.4 21.4 50.0 158 1 7.1 7.1 57.1 161 2 14.3 14.3 71.4 174 1 7.1 7.1 78.6 188 1 7.1 7.1 85.7 198 1 7.1 7.1 92.9 220 1 7.1 7.1 100.0 Total 14 100.0 100.0 6 Análisis de los resultados A partir de las tablas 1 y 2 se puede observar que los valores de la media, mediana y moda, para el nº de colonias de la Zona 2 son inferiores a los obtenidos para el nº de colonias de la Zona 1, por lo que se deduce que la calidad del agua en la Zona 2 es claramente superior. Con respecto a los valores obtenidos para la varianza en ambas variables, se puede ver que la variabilidad es superior para el nº de colonias de la Zona 2. Si se desea conocer en que zona hay mayor dispersión se debe de calcular el Coeficiente de Variación de Pearson ó CV, (cociente entre la desviación típica y la media) que representa el número de veces que la desviación típica contiene a la media, por tanto, cuanto mayor sea el Coeficiente de variación de Pearson se deduce que mayor número de veces contiene la desviación típica a la media y por tanto la media aritmética, es menos representativa. CV(Zona1) = 10.77 / 203.07 = 0.053 CV(Zona2) = 26.07 / 162.36 = 0.161 Los resultados muestran que hay mayor dispersión en la Zona 2 ya que el coeficiente de variación es mayor que el de la Zona 1 b) Representar gráficamente los datos con un histograma para cada variable. En el menu principal, se selecciona la ficha “Gráficos” y allí en “generador de gráficos” 7 Aparece el siguiente cuadro de dialogo y se le da clic en “Aceptar” Se selecciona el tipo de gráfico, en este ocasión se escoge el de barras por el tipo de variable (cuantitativa) y se arrastra la variable “Zona 1” a la caja punteada horizontal. Y se puede dar clic en la caja “Propiedades de los elementos” para agregar la línea de tendencia de la normal, si se hace esto se abe una segunda ventana (der) y se debe activar la casilla “Mostrar curva normal” 8 Finalmente en la ventana de resultados aparecerá: 9 Se procede de igual modo para la Zona 2: Análisis de los Resultados En las gráficas anteriores se hace evidente las diferencias existentes entre los valores de las variables. Se observa como para el caso de nº de colonias de la Zona 1, gran parte de las observaciones se encuentran entre los valores 190 y 210, y para el nº de colonias de la Zona 2, entre 140 y 180. Estos resultados están en consonancia con los resultados obtenidos anteriormente, esto es, los valores de la media, mediana y moda para el nº de colonias de la Zona 2 son inferiores a los obtenidos para el nº de colonias de la Zona 1. 10 c) Representar gráficamente los datos con un diagrama de caja simple (donde los datos del gráfico son resúmenes para distintas variables). Para obtener el diagrama de caja, seleccionamos en el Menú principal Gráficos/ Cuadros de diálogo antiguos/Diagramas de caja del siguiente modo: En el Cuadro de diálogo resultante se marca la opción Simple y en Los datos del gráfico son se marca la opción Resúmenes para distintas variables Diagramas de caja simple (Resúmenes para distintas variables) 11 Visor de resultados Diagramas de caja (Resúmenes de distintas variables) 12 Ejercicio propuesto 2 Un agrónomo mide el contenido de humedad en una variedad de trigo tras ser secados especialmente. Para ello, hace las mediciones en 56 muestras de una tonelada de trigo. Los resultados se muestran en la tabla adjunta Contenido humedad Número 7.2 7.1 7.3 7.4 6.8 3 6 13 4 5 6.7 6.9 2 7 7.6 7.5 9 8 Se pide: a. Resumen estadístico: Tabla de frecuencias, estadísticos de tendencia central, de dispersión, de posición (Percentil 60) b. Gráfico de tallo y hojas c. Gráfico de cajas d. Estratificar la población en tres grupos de Contenido de humedad e. Determinar la media, mediana y desviación típica del Contenido de humedad en cada grupo f. Construir el gráfico de barras y de sectores para la variable de agrupación. Solución del Ejercicio 2 a) Resumen estadístico: Tabla de frecuencias, estadísticos de tendencia central, de dispersión, de posición (Percentil 60) Primero se va al menú principal y allí en la ficha datos se selecciona “Ponderar casos” 13 Luego se escoge la opción “ponderar casos mediante” y se selecciona la variable Número y con la flecha azul se envía al recuadro en blanco: 14 En la ventana que se despliega aparece percentiles, se activa esa opción y se coloca (escribe) 60 en la casilla al frente, luego se da clic en aplicar: A continuación se activan todas las casillas de los elementos estadísticos y se pulsa en continuar en la ventana de la derecha y luego se selecciona “Aceptar” en la ventana de la izquierda. 15 A continuación se genera esta es la tabla en el visor de resultados: Contenido humedad N Válido Perdidos Media Error estándar de la media Mediana Moda Desviación estándar Varianza Asimetría Error estándar de asimetría Curtosis Error estándar de curtosis Rango Mínimo Máximo Percentiles 60 Número 57 57 0 7.2421 .03687 7.3000 7.30 .27835 .077 -.412 0 7.95 .441 8.00 13 3.330 11.086 .240 .316 .316 -1.023 .623 .90 6.70 7.60 7.3000 -.867 .623 11 2 13 8.00 b) Gráfico de tallo y hojas c) Gráfico de cajas Se procede activando la opción del menú principal “Analizar”, luego se pulsa en “Estadísticos descriptivos” y finalmente en “Explorar”: 16 Luego se procede a enviar las dos variables a la derecha a la lista con la flecha azul, seguido pulsa en el cuadro de “Gráficos” se deja activa la casilla “ De tallo y hojas”, en esa ventana (der) se da clic en continuar y luego en la ventana de la izquierda en “Aceptar”. El software (SPSS) muestra los dos gráficos a la vez, tanto el “De tallo y hojas” como el gráfico “de caja”. Salida en el visor de resultados gráfico de tallo y hojas y gráfico de cajas 17 d) Estratificar la población en tres grupos de Contenido de humedad. Se debe ir al menú principal y seleccionar la opción “Transformar”. Una vez allí, seleccionar “Recodificar en distintas variables”: Se forma una nueva variable con el nombre Contenido1 que se obtiene recodificando la variable Contenido en tres categorías: Valor 1: Contenido de humedad menor que 6.9 Valor 2: Contenido de humedad entre 6.9 y 7.4 Valor 3: Contenido de humedad mayor que 7.4 18 19 Finalmente se pueden ordenar los datos por la variable Contenido. Para ello en el menú principal en la ficha Datos se selecciona ordenar casos y luego se selecciona con la flecha azul la variable “contenido de humedad”; se procede a envíar la variable a la derecha al espacio ordenar por, para que queden ordenados de menor a mayor. 20 e) Determinar la media, mediana y desviación típica del Contenido de humedad en cada grupo Procedemos a seleccionar Analizar/Estadísticos descriptivos/Frecuencias (o Descriptivos o Explorar). Descriptivos de la variable contenido1(transformada) 21 f) Construir el gráfico de barras y de sectores para la variable de agrupación. Los gráficos se pueden generar seleccionando la opción de Gráficos en Analizar/Estadísticos descriptivos/Frecuencias (o Descriptivos Explorar) o bien Gráficos/Cuadro de diálogos antiguos/Barras.Selecciona Simple y activar Resúmenes para grupos de casos. 22 23