Práctica 1a resuelta

Anuncio
PRÁCTICA 1a: ESTADÍSTICA DESCRIPTICA UNIDIMENSIONAL
Los datos que aparecen en el fichero robles.sf3 se refieren a un estudio realizado sobre un robledal cercano a una
planta industrial, parte de los cuales se visualizan en la tabla. Se han seleccionado robles de dos variedades (A y B)
y ubicados en cuatro zonas distintas. Además la mitad de ellos han sido sometidos a cierto tratamiento y se han
codificados con 1, los no tratados se han codificado con 0. Sobre cada árbol se han medido las concentraciones de
ocho elementos químicos en sus hojas: hierro, manganeso y zinc (metales pesados); calcio y magnesio (metales
alcalinotérreos); potasio (metal alcalino); y fósforo y nitrógeno (no metales).
Hierro Manganeso Zinc Calcio Magnesio Potasio Fosforo Nitrogeno Zona Variedad Tratamiento
0,058
0,0303
0,0089 2,365
0,4
2,632
0,145
2,776
1
A
0
0,06
0,0294
0,0109 2,745
0,432
2,495
0,161
2,918
1
A
0

0,009
0,01

0,0046
0,0048


0,0026 2,483
0,0022 2,7

0,417
0,317

1,783
2,566

0,177
0,177

3,34
3,917

4
4

B
B

1
1
Responda de forma concisa y razonadamente a las siguientes preguntas para la variable X = Hierro:
1. Dibuje e interprete la nube de puntos (Gráfico de Dispersión), localizando los robles con más y menos valor en X.
¿Dónde se encuentra el roble 34? ¿Cómo se comporta la variedad A?
Para visualizar la nube de puntos, Descripción + Datos Numéricos + Análisis Unidimensional; el gráfico de
dispersión aparece arriba, a la derecha. Se observan dos grupos claramente diferenciados (con niveles altos y bajos
de Hierro, respectivamente). Los robles con mayor y menor valor en X son los más situados a la derecha y la
izquierda, respectivamente.
Gráfico de dispersión
0
0,02
0,04
0,06
0,08
Hierro
Para localizar el roble número 34, introducimos el número de fila (34) junto al icono “localizar por fila” (prismáticos).
Para visualizar el comportamiento de la variedad A, botón colorear + colorear con Variedad = “A”. Obsérvese que de
forma homogénea los robles de la variedad A tienen un contenido en Hierro muy elevado; de hecho, la variable Hierro
permite separar muy bien las variedades.
2. Visualiza el sumario estadístico, e indica el valor y la interpretación de: media, mediana, moda, varianza, desviación
típica, mínimo, máximo, rango, cuartil inferior, cuartil superior, rango intercuartílico, coeficiente de asimetría
estandarizada, coeficiente de curtosis estandarizada.
Resumen Estadístico para Hierro
Frecuencia = 38
Media = 0,0298947
Mediana = 0,0145
Moda = 0,009
Media geométrica = 0,0214233
Varianza = 0,000554205
Desviación típica = 0,0235416
Error estándar = 0,00381894
Mínimo = 0,007
Máximo = 0,063
Rango = 0,056
Primer cuartil = 0,011
Segundo cuartil = 0,059
Rango intercuar. = 0,048
Asimetría = 0,509906
Asimetría tipi. = 1,28324
Curtosis = -1,75389
Curtosis típificada = -2,20693
Coef. de variación = 78,7482%
Suma = 1,136
3. Descríbase el comportamiento de la tendencia central de la variable X.
Media, moda y mediana muy alejadas entre sí; la explicación está en la dispersión de la variable.
4. Descríbase la dispersión de la variable X.
Se aprecian dos grupos de comportamiento muy diferentes entre sí; la variable, en consecuencia, está muy dispersa. El
coeficiente de variación es del 78’74%, avalando esta observación.
5. ¿Son más dispersos los robles de la variedad A, o los de la B?
Para realizar un análisis descriptivo sobre la primera variedad, Descripción + Datos Numéricos + Análisis
Unidimensional + Datos: Hierro; Selección: Variedad = “A”. Se obtiene un coeficiente de variación de 3’03%. Sobre
la segunda variedad (B), se obtiene un coeficiente de variación de 36’43%. Por lo tanto, la variedad B es más dispersa
(mayor coeficiente de variación).
6. Supongamos que deseamos colorear de verde el 10% de los robles que tienen menor contenido de la variable X
¿Qué robles irían de verde? (Idem de rojo el 10% de los robles con mayor contenido).
Los robles que constituyen el 10% con menor contenido en Hierro, son los que tienen un contenido en Hierro por
dejado del percentil 10. Para averiguar el valor del percentil 10, desde la ventana de Análisis Unidimensional, botón
amarillo + percentiles. El percentil 10 se muestra directamente (si se deseara el valor de uno que no se mostrara, por
ejemplo el 15, se introduce con botón derecho + opciones de ventana), y su valor es 0,009. Si utilizamos la opción
colorear, con la condición Hierro<=0,009, se colorean los robles buscados; después, activando la opción Localizar
(botón derecho + localizar), podemos situar la barra localizadora para separar esos robles (quedan a la izquierda).
Finalmente, pasamos de la opción Localizar a Seleccionar (de nuevo botón derecho + seleccionar) y pinchando sobre
cada uno de los puntos sabremos en qué filas se encuentran. Análogamente para el 10% de robles con mayor contenido
en Hierro: aparecen cuatro robles con un contenido en Hierro mayor o igual de 0,062.
7. ¿Cómo es la forma de la variable? ¿Se la podría considerar normal, a partir de los coeficientes de asimetría y curtosis
estandarizados?
Los datos se agrupan en los extremos (de hecho en dos grupos bien diferenciados, lo cuál puede apreciarse tanto en el
diagrama de dispersión como en el histograma), luego difícilmente podrían ser normales. El coeficiente de curtosis
tipificado está fuera del rango (-2,2), identificando correctamente datos que no son normales.
8. Constrúyase la tabla, histogramas y polígonos de frecuencias (absolutas, relativas, acumuladas absolutas y
acumuladas relativas).
La tabla se construye con botón de opciones tabulares (amarillo) + tabla de frecuencias. Se puede modificar el número
de clases con botón derecho + opciones de ventana. Los histogramas y polígonos de frecuencias aparecen al activar el
botón de opciones gráficas (por defecto aparece el histograma con frecuencias absolutas; si se desea cambiar a
polígono de frecuencias, en vez de histograma, y/o utilizar frecuencias relativas o acumuladas, botón derecho +
opciones de ventana).
9. Dibújese el diagrama de tallos y hojas, y compárese con el histograma de frecuencias absolutas del apartado
anterior.
En Opciones tabulares + diagrama de tallo y hojas. Obsérvese que al girar el diagrama noventa grados, se obtiene el
diagrama de frecuencias.
10. Dibújese el gráfico de caja e interprétese la información contenida en él. ¿Hay robles de comportamiento
anómalo? ¿Y si consideramos sólo la variedad B?
Gráfico de Caja y Bigotes
0
0,02
0,04
0,06
0,08
Hierro
En los datos originales no aparecen datos anómalos (éstos se manifiestan como puntos fuera del diagrama). En el
diagrama se observa que el tercer cuartil está mucho más alejado de la mediana que el primero; por lo tanto, se pone
de manifiesto la asimetría a la derecha que presentan los datos. Sobre la variedad B, obtenemos
Gráfico de Caja y Bigotes
7
11
15
19
Hierro
23
27
(X 0,001)
Observamos que los datos son bastante simétricos, y que aparecen dos atípicos.
11. Descríbase la variable cualitativa zona, dando su tabla de frecuencias (absolutas y relativas) y diagramas de barras
y de sectores.
Descripción + datos cualitativos + tabulación. Se observa que en todas las zonas se han observado 10 robles, excepto
en la 3 (8 robles).
12. Realícese el análisis descriptivo excluyendo los robles de la zona 4.
En Selección, escribimos Zona< >4. Se siguen observando dos grupos bien diferenciados, pero la variable es más
simétrica.
13. Compárese el comportamiento de los robles en su contenido de la variable X según la zona.
Utilizamos la opción colorear, según el valor de la zona. En la zona 1 el contenido en Hierro es alto; en la zona 2, bajo;
en la zona 3 encontramos niveles tanto altos como bajos; en la zona 4, bajo.
14. Ídem según el tratamiento.
No se observa un comportamiento claro (es decir, se observan niveles tanto altos como bajos en Hierro, en robles
tratados y no tratados).
15. Considera ahora la variable Calcio. A partir del sumario estadístico, el gráfico de caja y bigotes y el histograma,
indica qué diferencias encuentras entre el comportamiento del Hierro y el Calcio:
a.- En cuanto a la tendencia central.
b.- En cuanto a la dispersión.
c.- En cuanto a la forma.
Se aprecia un comportamiento mucho más homogéneo que en el caso de Hierro. La media y la mediana están
próximas, el coeficiente de variación es bajo. Aparece asimetría a la izquierda (puede observarse tanto en el diagrama
de cajas como en el histograma, y también en el valor del coeficiente de asimetría, que es negativo), debido a la
existencia de un roble de comportamiento anómalo. Los datos no pueden considerarse normales, a partir de los
coeficientes de asimetría y curtosis tipificados; sin embargo, de los gráficos se deduce que, probablemente, sin el dato
anómalo se tendría normalidad.
17. Observa que hay un roble anómalo en cuanto al contenido en Calcio. ¿Cuál es? Utilizando apropiadamente la
Selección, visualiza el sumario estadístico, el gráfico de caja y bigotes y el histograma, excluyendo ese dato anómalo.
Indica las variaciones que observas al excluir ese dato en la tendencia central, en la dispersión, y en la forma.
El roble anómalo es el número 34 (su contenido en Ca es anormalmente pequeño, 0.9); si realizamos el análisis con
Selección: Calcio >0,9 (otra posibilidad sería también introducir Num<>34, para excluir el roble anómalo), la media
aumenta ligeramente (no así la mediana; obsérvese que al ser un estadístico robusto, resulta poco afectado por la
presencia de atípicos), y los datos pueden considerarse normales (coeficientes de asimetría y curtosis estandarizados en
el rango -2, 2).
Descargar