Teorema de Límite Central “Valoración estadística en la investigación” Ignacio Méndez Ramírez (de las páginas 31 a la 33) Un estadístico (o estimador) es una variable aleatoria cuyos valores pueden ser determinados a partir de la observación de los datos aportados por una muestra. El conocer la distribución de probabilidad de los estadísticos, permite obtener conclusiones a partir de una muestra hacia la población en general, proporcionar una medida del error que se puede cometer en dichas conclusiones y también permite dar una medida de confianza de que ese sea el error y no otro más grande. Existe un teorema de mucha importancia práctica, que especifica la regularidad estadística de los promedios (medias aritméticas) obtenidos de las mediciones numéricas en las unidades experimentales analizadas en muestras de tamaño n. Es el teorema de límite central, que dice: En muestras de tamaño n, tomadas de una población en la que la regularidad estadística no sigue una distribución normal (puede ser de cualquier forma), que tiene una media poblacional m y varianza poblacional s2 , entonces si n es grande, el proceso de tomar muchas muestras y en cada una de ellas tomar su media, el promedio muestral produce una regularidad estadística de los valores de la media que se modela con la distribución normal con media m y varianza s2 / n (ver Figura 1). Se podría preguntar en el teorema ¿qué tan grande debe ser el tamaño n de la muestra ? La respuesta es que depende del grado de alejamiento de la distribución de “muchas medias muestrales”. Si el alejamiento es muy fuerte, distribuciones asimétricas con mayores probabilidades en los extremos, o con varias modas, una tamaño de muestra de 30 o más ya probabilidades en los extremos, o con varias modas, una tamaño de muestra de 30 o más ya produce la distribución normal. Sin embargo, si la distribución de la población es normal con muestras de tamaño 10 o más se tiene la normalidad. Si la distribución de población no es normal, pero no se aleja mucho de ella, es simétrica o casi, con la media casi igual a la moda y la mediana, entonces con muestras de tamaño 15 ó 20 dependiendo de que tan cercana es la distribución de la población a la distribución normal. Es importante recordar que no se puede decir que una variable dada o sus promedios siguen estrictamente una distribución normal. Esta distribución es una idealización que no se da en realidad, lo que importa es que la distribución real esté cercana a la normal y este supuesto produzca conclusiones correctas. Frecuentemente en muchas mediciones no pueden ocurrir valores negativos, pesos áreas, concentraciones de sustancias, etc.; sin embargo, la normal asigna probabilidad mayor que cero a valores negativos. En la medida que dicha posibilidad sea muy pequeña, esa inconsistencia del modelo con la realidad no es grave. A la desviación estándar s2 / n de la distribución de las medias muestrales, se le llama error estándar de la media ya que provee una medida del grado de dispersión de los errores de las medias alrededor de m . Si se quiere conocer m el error estándar da una idea del grado de error que se comete. Frecuentemente en las investigaciones al reportar promedios se da el valor promedio, seguido de un ± otro número que es el error estándar del promedio (vg. 25.3 ± 4.2). el error estándar se denota como: σ __ x