Diagrama de tallo y hoja. Una forma muy adecuada de

Anuncio
27
Diagrama de tallo y hoja.
Una forma muy adecuada de organizar un número moderado de datos individuales consiste
en dividir cada dato en dos parte, su tallo y su hoja. Si por ejemplo el conjunto de datos son
números de dos dígitos, ya sea decenas y unidades o entero y decimal, entonces las decenas
o el entero es el tallo y las unidades o el decimal es la hoja.
Ejemplo 5.1
Los valores 42; 32; 13; 18; 23; 44; 41;18; 15; 25; 35; 28; 17; 28; 42; 51; 50; 21; 27; 36
corresponden a las altura de 20 plantas regeneradas de coigüe medidas en una cuadrícula en
un bosque nativo y cuya representación en un diagrama de tallo y hoja queda como sigue.
El diagrama del ejemplo se obtuvo digitando los 20 datos en una columna con la
siguiente secuencia de comandos:
Graph Ä Steam-and-Leaf (opcional Trim outliers) Ä Increment = 10,
porque los datos corresponden a decenas.
En el cuadro la columna del centro, el tallo, indica la cifra de las decenas, y los de la
derecha, las hojas, indica la cifra de las unidades. En la columna de la izquierda el ( ) indica la
"moda"de las hojas y los números hacia arriba y abajo es el número de datos acumulados
alrededor de la "moda". En este ejemplo la moda es (6) que indica que existen 6 valores entre
20 y 29. La primera fila indica que los valores entre 10 y 19 son 13 15 17 18 18; el 5 indica el
número de datos acumulado hasta la moda. En la tercera fila el tallo es 3 que corresponde a
los datos 32 35 36; el 9 indica cuantos datos hay acumulado desde abajo hasta la moda.
Diagrama de caja.
Se usa para graficar algunos estadísticos de orden y dispersión que describen un conjunto
de datos. Consiste en dibujar en eje horizontal (o vertical) un segmento de línea que va del
dato menor al mayor (Rango de los datos). Entre ellos se dibujan dos rectángulos adyacentes
(caja) que empieza en el valor Q" , le sigue una línea que indica la mediana (Q# ) de los datos y
termina en el valor Q$ . La longitud de la caja ( Q$ - Q" ) se llama rango intercuartil y es otra
medida de dispersión de los datos.
Otra forma de este diagrama, lo que depende del programa estadístico utilizado, indican los
valores que se alejan más de lo "razonable" de la masa de datos (Outliers), que pueden servir
como diagnóstico de situaciones irregulares o anormales de los datos. MINITAB utiliza como
Descargar