Formas de representar los datos

Anuncio
Material elaborado en el marco de la Convocatoria de
Innovación de 2010 del Vicerectorat de Convergència
Europea i Qualitat de la Universitat de València
Formas de representar los datos
A la hora de analizar las frecuencias, puede ser interesante representar las tablas de una
manera más visual, para lo que se dispone de diferentes tipos de representaciones gráficas.
El diagrama de barras se suele utilizar para presentar las frecuencias de variables cualitativas.
Para cada valor que puede tomar la variable, se construye una barra o columna de altura
proporcional a la frecuencia con la que ha aparecido. Se puede hacer a partir de una tabla de
frecuencias, tanto relativas o porcentuales como absolutas. Aunque no es muy común, se
pueden usar también frecuencias acumuladas.
Análogamente, el diagrama de sectores (más popularmente conocido como tarta) representa
la frecuencia observada mediante el área de los sectores de un círculo.
Para variables cuantitativas, resulta más interesante utilizar un histograma. A partir de una
tabla de frecuencias simple (para cuantitativas discretas) o agrupada (para cuantitativas
discretas y continuas), se elabora una representación gráfica en forma de columnas, cuyas
superficies son proporcionales a la frecuencia (relativa o absoluta) de los valores
representados. La diferencia respecto al diagrama de barras reside en el eje horizontal, donde
se representan los valores de las variables (señalando la mitad del intervalo para continuas). Se
le puede añadir una línea (en azul en el ejemplo) para formar lo que se conoce como el
polígono de frecuencias.
Análogamente se pueden elaborar histogramas y polígonos de frecuencias acumuladas. A
partir de la tabla de frecuencias agrupadas de las puntaciones de los alumnos, se obtendrían
los histogramas (y polígonos) que aparecen a continuación.
1
Si en un histograma se hacen los intervalos cada vez más y más pequeños, se acabaría
teniendo un histograma ‘continuo’ en vez de por intervalos, lo que se conoce como una
distribución de frecuencias continuas. Para poder hacer este tipo de gráfico, además de
variables continuas (o discretas con un rango considerable), se necesitan grandes tamaños de
muestra.
Suponiendo que se hace nuevamente el examen de estadística a un grupo muy grande de
alumnos, el histograma de frecuencias (esta vez relativas) con intervalos muy pequeños
quedaría tal como se aprecia en la figura siguiente. Su polígono de frecuencias sería casi una
línea continua.
Cuando la curva es realmente continua, se llama distribución de densidad de frecuencias o
distribución de probabilidad, y representa la proporción con que aparece cada valor, al igual
que en el histograma, pero en continuo.
2
Cuando la curva es realmente continua, se llama distribución de densidad de frecuencias o
distribución de probabilidad, y representa la proporción con que aparece cada valor, al igual
que en el histograma, pero en continuo.
En una distribución, el eje horizontal representa los distintos valores que toma la variable X y el
eje vertical representa la frecuencia porcentual con que aparece en la muestra.
Las distribuciones permiten visualizar rápidamente cómo se reparten los distintos valores en la
muestra. Además, hay distintos modelos teóricos de distribuciones que son útiles para
calcular, por ejemplo, el tamaño de muestra sobre la que se quiera realizar un estudio.
La distribución del ejemplo anterior es una distribución simétrica, más concretamente una
distribución normal. Esta distribución es muy común en la vida real y, al realizar histogramas o
distribuciones de probabilidad a partir de una muestra, en muchas ocasiones tendrán una
forma parecida a la distribución normal. Las notas de un examen, el peso de personas de una
misma edad son ejemplos de variables con distribución normal.
Sin embargo, otras variables pueden dar otro tipo de distribuciones.
Por ejemplo, al representar los ingresos suelen salir distribuciones asimétricas positivas, donde
gran parte de la muestra tiene unos ingresos bajos (cima de la curva en el lado izquierdo) y una
pequeña parte tiene ingresos muy altos (cola alargada hacia la derecha).
Hay también distribuciones asimétricas negativas, distribuciones simétricas que no son
normales, como la apuntada, y muchas otras más.
3
Descargar