Material elaborado en el marco de la Convocatoria de Innovación de 2010 del Vicerectorat de Convergència Europea i Qualitat de la Universitat de València Formas de representar los datos A la hora de analizar las frecuencias, puede ser interesante representar las tablas de una manera más visual, para lo que se dispone de diferentes tipos de representaciones gráficas. El diagrama de barras se suele utilizar para presentar las frecuencias de variables cualitativas. Para cada valor que puede tomar la variable, se construye una barra o columna de altura proporcional a la frecuencia con la que ha aparecido. Se puede hacer a partir de una tabla de frecuencias, tanto relativas o porcentuales como absolutas. Aunque no es muy común, se pueden usar también frecuencias acumuladas. Análogamente, el diagrama de sectores (más popularmente conocido como tarta) representa la frecuencia observada mediante el área de los sectores de un círculo. Para variables cuantitativas, resulta más interesante utilizar un histograma. A partir de una tabla de frecuencias simple (para cuantitativas discretas) o agrupada (para cuantitativas discretas y continuas), se elabora una representación gráfica en forma de columnas, cuyas superficies son proporcionales a la frecuencia (relativa o absoluta) de los valores representados. La diferencia respecto al diagrama de barras reside en el eje horizontal, donde se representan los valores de las variables (señalando la mitad del intervalo para continuas). Se le puede añadir una línea (en azul en el ejemplo) para formar lo que se conoce como el polígono de frecuencias. Análogamente se pueden elaborar histogramas y polígonos de frecuencias acumuladas. A partir de la tabla de frecuencias agrupadas de las puntaciones de los alumnos, se obtendrían los histogramas (y polígonos) que aparecen a continuación. 1 Si en un histograma se hacen los intervalos cada vez más y más pequeños, se acabaría teniendo un histograma ‘continuo’ en vez de por intervalos, lo que se conoce como una distribución de frecuencias continuas. Para poder hacer este tipo de gráfico, además de variables continuas (o discretas con un rango considerable), se necesitan grandes tamaños de muestra. Suponiendo que se hace nuevamente el examen de estadística a un grupo muy grande de alumnos, el histograma de frecuencias (esta vez relativas) con intervalos muy pequeños quedaría tal como se aprecia en la figura siguiente. Su polígono de frecuencias sería casi una línea continua. Cuando la curva es realmente continua, se llama distribución de densidad de frecuencias o distribución de probabilidad, y representa la proporción con que aparece cada valor, al igual que en el histograma, pero en continuo. 2 Cuando la curva es realmente continua, se llama distribución de densidad de frecuencias o distribución de probabilidad, y representa la proporción con que aparece cada valor, al igual que en el histograma, pero en continuo. En una distribución, el eje horizontal representa los distintos valores que toma la variable X y el eje vertical representa la frecuencia porcentual con que aparece en la muestra. Las distribuciones permiten visualizar rápidamente cómo se reparten los distintos valores en la muestra. Además, hay distintos modelos teóricos de distribuciones que son útiles para calcular, por ejemplo, el tamaño de muestra sobre la que se quiera realizar un estudio. La distribución del ejemplo anterior es una distribución simétrica, más concretamente una distribución normal. Esta distribución es muy común en la vida real y, al realizar histogramas o distribuciones de probabilidad a partir de una muestra, en muchas ocasiones tendrán una forma parecida a la distribución normal. Las notas de un examen, el peso de personas de una misma edad son ejemplos de variables con distribución normal. Sin embargo, otras variables pueden dar otro tipo de distribuciones. Por ejemplo, al representar los ingresos suelen salir distribuciones asimétricas positivas, donde gran parte de la muestra tiene unos ingresos bajos (cima de la curva en el lado izquierdo) y una pequeña parte tiene ingresos muy altos (cola alargada hacia la derecha). Hay también distribuciones asimétricas negativas, distribuciones simétricas que no son normales, como la apuntada, y muchas otras más. 3