FIABILIDAD DE LA MEDIA ARITMÉTICA Al analizar una variable estadística, después de recoger una serie de datos y llegar a la confección de una tabla estadística y a su representación gráfica, es conveniente resumir la complejidad de todos esos datos en unos pocos valores numéricos que nos den una idea de cómo es dicha distribución. Llamamos medidas de centralización a los valores numéricos o parámetros estadísticos en torno a los cuales se concentran los datos de una distribución y que nos indican las tendencias predominantes en la variable estadística. La medida de centralización más utilizada es la media aritmética, aunque también se usan la moda y la mediana. La media aritmética de una variable estadística cuantitativa es un valor numérico que se obtiene al dividir la suma de todos los valores de dicha variable entre el número de valores. Como ejemplo vamos a exponer uno relacionado con la encuesta sobre valoración de líderes políticos que suele publicar cada cierto tiempo el Centro de Investigaciones Sociológicas. Por razones de espacio, supongamos aquí una pequeña muestra de 10 personas consultadas sobre cómo valoran a tres líderes A, B y C. Líderes A B C 1ª 9 5 2 2ª 7 3 1 3ª 1 6 8 Personas consultadas 4ª 5ª 6ª 7ª 8ª 1 2 8 10 3 5 9 4 6 5 10 6 3 2 9 9ª 1 6 8 10ª 9 5 3 Las medias aritméticas de las valoraciones de cada líder político serían: A= 9 + 7 + 1 + 1 + 2 + 8 + 10 + 3 + 1 + 9 = 5,1 10 B= 5+3+ 6+5+9+ 4+ 6+5+ 6+5 = 5,4 10 C= 2 + 1 + 8 + 10 + 6 + 3 + 2 + +9 + 8 + 3 = 5,2 10 Según las preferencias observadas, si tuviesen que votar esas personas consultadas, habría: Cinco que votarían a A: 1ª, 2ª, 6ª, 7ª y 10ª . Cuatro que votarían a C: 3ª, 4ª, 8ª y 9ª . Sólo una que votaría a B: 5ª . Suponiendo que esta muestra sea similar a otra con más datos y dando por hecho la representatividad de las mismas, haciendo una proyección tendríamos que si hubiese elecciones en ese momento se podría suponer que A obtendría aproximadamente el 50% de los votos, C el 40% y B el 10%, lo que supone una clara y evidente contradicción con las valoraciones medias. Esto nos lleva a la conclusión de que la media aritmética proporciona con frecuencia una descripción incompleta e irreal de la distribución, por lo que son necesarios otros indicadores que nos informen del grado de separación o dispersión de los valores. En el ejemplo expuesto se observa que los líderes A y C tienen unas valoraciones bastante extremas, quizás por ser personas muy controvertidas, lo que no ocurre con las de B. Esto nos lleva a tener que recurrir a las medidas de dispersión con objeto de no extraer conclusiones erróneas de esos datos. Acabaremos citando una anécdota sobre la media aritmética relatada por el científico británico Francis Galton (1822-1911), cuyos intereses de estudio fueron muy variados y que contribuyó a diferentes áreas de la ciencia, entre las que se encontraba la estadística. Nos cuenta Galton que en un concurso de peso de ganado había sido seleccionado un buey muy corpulento para la competición. Más de quinientas personas que asistían al evento apostaron para acertar el peso del animal, escribiendo el número de libras que creían que podía pesar el buey. Una vez que se comprobó que el peso era de algo menos de 1198 libras (una libra inglesa equivale a 453 gramos), Galton recogió todas las papeletas y calculó la media aritmética de todos los pesos apostados por los participantes, con la sorpresa de que el resultado que obtuvo sobrepasaba muy poco las 1997 libras, muy próximo al valor real. De esto se deducía que la media de la opinión general era extraordinariamente precisa en este caso. Experiencias similares se pueden hacer con grupos de alumnos sobre cuestiones como, por ejemplo, acertar la edad del profesor, la anchura de la pizarra, etc., aunque al no ser el número de opiniones tan numeroso como en el caso anterior, el grado de precisión no debería ser tan elevado.