1 Práctica 2 de SPSS por

Anuncio
1
Práctica 2 de SPSS
por
Rina Familia
Quantitative Research II
EDU741
UNAD/Florida
2015
2
Ejercicio propuesto 1.
Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua
para consumo, en términos de colonias de bacterias tróficas, en un acuífero próximo a la ciudad.
Se consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (número de
colonias por 1000 mm de agua)
Zona 1:
Zona 2:
194
158
199
161
191
143
202
174
215
220
214
156
197
156
204
156
199
198
202
161
230
188
193
139
Se pide: Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas
estadísticas y gráficos. Para ello realizar los siguientes apartados:
a. Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
b. Representar gráficamente los datos con un histograma para cada variable.
c. Representar gráficamente los datos con un diagrama de caja simple (donde los datos del
gráfico son resúmenes para distintas variables).
194
147
209
116
3
Solución del Ejercicio 1
a)
Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
Iniciamos introduciendo los datos de cada una de las variables
Se procede a calcular la media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
Después de dirigirse al menú principal del SPSS en la ficha “Analizar” se ingresa por Estadísticos
descriptivos y luego allí se selecciona “Frecuencias”, así:
4
Ahora se envían con la flecha hacia la derecha las dos variables a analizar: Zona 1 y Zona 2.
Luego, se da clic en la ficha “Estadísticos..” con lo cual se despliega ua ventana para que selecione
los estadísticos que quiere calcular. Se dejan activas las casillas de: Media, Mediana, Moda,
Varianza, Mínimo y Máximo:
Se da clic en “Continuar” en la ventana de las estadísticas (der) y en la ventana de
Frecuencias (izq) se pulsa en “Aceptar”. Y se va abrir el visor de resultados con lo siguiente:
Ventana del Visor de Resultados
5
Tabla 1. Frecuencias Zona 1
Válido
Porcentaje
válido
Porcentaje
acumulado
Frecuencia
Porcentaje
191
1
7.1
7.1
7.1
193
1
7.1
7.1
14.3
194
2
14.3
14.3
28.6
197
1
7.1
7.1
35.7
199
2
14.3
14.3
50.0
2
14.3
14.3
64.3
204
1
7.1
7.1
71.4
209
1
7.1
7.1
78.6
214
1
7.1
7.1
85.7
215
1
7.1
7.1
92.9
230
1
7.1
7.1
100.0
Total
14
100.0
100.0
202
Tabla 2. Frecuencias Zona 2
Válido
Porcentaje
válido
Porcentaje
acumulado
Frecuencia
Porcentaje
116
1
7.1
7.1
7.1
139
1
7.1
7.1
14.3
143
1
7.1
7.1
21.4
147
1
7.1
7.1
28.6
156
3
21.4
21.4
50.0
158
1
7.1
7.1
57.1
161
2
14.3
14.3
71.4
174
1
7.1
7.1
78.6
188
1
7.1
7.1
85.7
198
1
7.1
7.1
92.9
220
1
7.1
7.1
100.0
Total
14
100.0
100.0
6
Análisis de los resultados
A partir de las tablas 1 y 2 se puede observar que los valores de la media, mediana y moda, para el
nº de colonias de la Zona 2 son inferiores a los obtenidos para el nº de colonias de la Zona 1, por lo
que se deduce que la calidad del agua en la Zona 2 es claramente superior. Con respecto a los
valores obtenidos para la varianza en ambas variables, se puede ver que la variabilidad es superior
para el nº de colonias de la Zona 2. Si se desea conocer en que zona hay mayor dispersión se
debe de calcular el Coeficiente de Variación de Pearson ó CV, (cociente entre la desviación típica y
la media) que representa el número de veces que la desviación típica contiene a la media, por
tanto, cuanto mayor sea el Coeficiente de variación de Pearson se deduce que mayor número de
veces contiene la desviación típica a la media y por tanto la media aritmética, es menos
representativa.
CV(Zona1) = 10.77 / 203.07 = 0.053
CV(Zona2) = 26.07 / 162.36 = 0.161
Los resultados muestran que hay mayor dispersión en la Zona 2 ya que el coeficiente de variación
es mayor que el de la Zona 1
b) Representar gráficamente los datos con un histograma para cada variable.
En el menu principal, se selecciona la ficha “Gráficos” y allí en “generador de gráficos”
7
Aparece el siguiente cuadro de dialogo y se le da clic en “Aceptar”
Se selecciona el tipo de gráfico, en este ocasión se escoge el de barras por el tipo de variable
(cuantitativa) y se arrastra la variable “Zona 1” a la caja punteada horizontal. Y se puede dar clic
en la caja “Propiedades de los elementos” para agregar la línea de tendencia de la normal, si se
hace esto se abe una segunda ventana (der) y se debe activar la casilla “Mostrar curva normal”
8
Finalmente en la ventana de resultados aparecerá:
9
Se procede de igual modo para la Zona 2:
Análisis de los Resultados
En las gráficas anteriores se hace evidente las diferencias existentes entre los valores de las
variables. Se observa como para el caso de nº de colonias de la Zona 1, gran parte de las
observaciones se encuentran entre los valores 190 y 210, y para el nº de colonias de la Zona 2,
entre 140 y 180. Estos resultados están en consonancia con los resultados obtenidos
anteriormente, esto es, los valores de la media, mediana y moda para el nº de colonias de la Zona
2 son inferiores a los obtenidos para el nº de colonias de la Zona 1.
10
c) Representar gráficamente los datos con un diagrama de caja simple (donde los datos del
gráfico son resúmenes para distintas variables).
Para obtener el diagrama de caja, seleccionamos en el Menú principal Gráficos/ Cuadros de
diálogo antiguos/Diagramas de caja del siguiente modo:
En el Cuadro de diálogo resultante se marca la opción Simple y en Los datos del gráfico son se
marca la opción Resúmenes para distintas variables
Diagramas de caja simple (Resúmenes para distintas variables)
11
Visor de resultados Diagramas de caja (Resúmenes de distintas variables)
12
Ejercicio propuesto 2
Un agrónomo mide el contenido de humedad en una variedad de trigo tras ser secados
especialmente. Para ello, hace las mediciones en 56 muestras de una tonelada de trigo. Los
resultados se muestran en la tabla adjunta
Contenido humedad
Número
7.2
7.1
7.3
7.4
6.8
3
6
13
4
5
6.7 6.9
2
7
7.6
7.5
9
8
Se pide:
a. Resumen estadístico: Tabla de frecuencias, estadísticos de tendencia central, de dispersión,
de posición (Percentil 60)
b. Gráfico de tallo y hojas
c. Gráfico de cajas
d. Estratificar la población en tres grupos de Contenido de humedad
e. Determinar la media, mediana y desviación típica del Contenido de humedad en cada grupo
f.
Construir el gráfico de barras y de sectores para la variable de agrupación.
Solución del Ejercicio 2
a)
Resumen estadístico: Tabla de frecuencias, estadísticos de tendencia central, de
dispersión, de posición (Percentil 60)
Primero se va al menú principal y allí en la ficha datos se selecciona “Ponderar casos”
13
Luego se escoge la opción “ponderar casos mediante” y se selecciona la variable Número y
con la flecha azul se envía al recuadro en blanco:
14
En la ventana que se despliega aparece percentiles, se activa esa opción y se coloca (escribe) 60 en
la casilla al frente, luego se da clic en aplicar:
A continuación se activan todas las casillas de los elementos estadísticos y se pulsa en
continuar en la ventana de la derecha y luego se selecciona “Aceptar” en la ventana de la
izquierda.
15
A continuación se genera esta es la tabla en el visor de resultados:
Contenido
humedad
N
Válido
Perdidos
Media
Error estándar de la media
Mediana
Moda
Desviación estándar
Varianza
Asimetría
Error estándar de
asimetría
Curtosis
Error estándar de curtosis
Rango
Mínimo
Máximo
Percentiles 60
Número
57
57
0
7.2421
.03687
7.3000
7.30
.27835
.077
-.412
0
7.95
.441
8.00
13
3.330
11.086
.240
.316
.316
-1.023
.623
.90
6.70
7.60
7.3000
-.867
.623
11
2
13
8.00
b) Gráfico de tallo y hojas c) Gráfico de cajas
Se procede activando la opción del menú principal “Analizar”, luego se pulsa en “Estadísticos
descriptivos” y finalmente en “Explorar”:
16
Luego se procede a enviar las dos variables a la derecha a la lista con la flecha azul, seguido pulsa
en el cuadro de “Gráficos” se deja activa la casilla “ De tallo y hojas”, en esa ventana (der) se da
clic en continuar y luego en la ventana de la izquierda en “Aceptar”. El software (SPSS) muestra
los dos gráficos a la vez, tanto el “De tallo y hojas” como el gráfico “de caja”.
Salida en el visor de resultados gráfico de tallo y hojas y gráfico de cajas
17
d) Estratificar la población en tres grupos de Contenido de humedad.
Se debe ir al menú principal y seleccionar la opción “Transformar”. Una vez allí, seleccionar
“Recodificar en distintas variables”:
Se forma una nueva variable con el nombre Contenido1 que se obtiene recodificando la
variable Contenido en tres categorías:

Valor 1: Contenido de humedad menor que 6.9

Valor 2: Contenido de humedad entre 6.9 y 7.4

Valor 3: Contenido de humedad mayor que 7.4
18
19
Finalmente se pueden ordenar los datos por la variable Contenido. Para ello en el menú
principal en la ficha Datos se selecciona ordenar casos y luego se selecciona con la flecha azul la
variable “contenido de humedad”; se procede a envíar la variable a la derecha al espacio ordenar
por, para que queden ordenados de menor a mayor.
20
e) Determinar la media, mediana y desviación típica del Contenido de humedad en cada
grupo
Procedemos a seleccionar Analizar/Estadísticos descriptivos/Frecuencias (o Descriptivos o
Explorar).
Descriptivos de la variable contenido1(transformada)
21
f)
Construir el gráfico de barras y de sectores para la variable de agrupación.
Los gráficos se pueden generar seleccionando la opción de Gráficos en Analizar/Estadísticos
descriptivos/Frecuencias (o Descriptivos Explorar) o bien Gráficos/Cuadro de diálogos
antiguos/Barras.Selecciona Simple y activar Resúmenes para grupos de casos.
22
23
Documentos relacionados
Descargar