Aproximación a la distribución normal: el Teorema del Límite Central El teorema del límite central establece que si se tienen n variables aleatorias, X1, X2, ..., Xn, independientes y con idéntica distribución de media µ y varianza σ2, a medida que crece n, la suma (y la media) de estas variables tiende a seguir una distribución normal. El teorema del límite central, explicado de forma intuitiva, afirma que cualquiera que sea la distribución común de un conjunto de variables aleatorias, suponiendo que su varianza sea finita, la suma y la media de un número elevado de estas variables tenderá a distribuirse de manera similar a una variable normal. Distribución de una variable que consiste en la suma de las puntuaciones obtenidas en n lanzamientos de un dado con: (a) n=1, (b) n=2, (c) n=4 y (d) n=30. (a) 1 2 3 (b) 4 5 6 (c) 4 6 8 10 12 14 16 2 3 4 5 6 7 8 9 10 11 12 (d) 18 20 22 24 30 43 56 69 82 95 108 121 134 147 160 173 xi E [xi ] = µ i = 1,2,L n Si n → ∞ ∑ xi ~ N (nµ , n A VAR[xi ] = σ 2 nσ 2 i =1 Si n → ∞ ) σ 2 x ~ N µ, n A Distribución de una variable que consiste en la media de lanzar una moneda al aire (cara 1, cruz 0) obtenidas en n lanzamientos: (a) n=2, (b) n=10, (c) n=20 y (d) n=40. 25 18 16 20 14 12 15 10 8 10 6 4 5 2 0,5 1 8 0 0,1 0,2 0,3 0, 3 0, 35 0 0 0, 2 0, 25 0 0,4 0,5 0,6 0,7 0,8 0,9 12 7 10 6 8 5 4 6 3 4 2 2 1 0, 9 0, 95 0, 7 0, 75 0, 8 0, 85 0, 5 0, 55 0, 6 0, 65 0, 4 0, 45 0, 1 0, 15 0 0, 05 0, 9 0, 95 0, 7 0, 75 0, 8 0, 85 0, 6 0, 65 0, 3 0, 35 0, 4 0, 45 0, 5 0, 55 0, 1 0, 15 0, 2 0, 25 0 0 0, 05 0 ESTIMACIÓN DE PARÁMETROS POBLACIONALES La estimación consiste en asignar valores a los parámetros problacionales utiliando la información muestral. Parámetro: Un parámetro se puede definir como una medida de la característica que interesa estudiar en la población. El cálculo del valor exacto del parámetro sólo es posible si pueden analizarse todos los elementos poblacionales, situación que no es la habitual. Alternativamente, se puede obtener una estimación del valor del parámetro, es decir, una aproximación a su valor calculada a partir de una muestra. Para ello se utiliza un estimador, que es una función de las observaciones muestrales, f(x1, x2,...xn), el cual permite obtener estimaciones de un determinado parámetro poblacional. Estimador: Es una función de los elementos de la muestra utilizada para aproximar el valor de un parámetro poblacional desconocido. Estimación: Valor de un estimador para una muerstra dada. Un estimador es una función de v.a. (elementos de la muestra) por lo tanto tendrá una distribución de probabilidad y un determinado valor esperado y varianza. Tipos de inferencia Cuando se hace inferencia se debe tener presente que la estimación realizada es sólo una aproximación del parámetro poblacional, algo que se tendrá que tener en cuenta a la hora de extraer cualquier conclusión sobre la población. Además, hay que tener presente que muestras distintas estarán formadas por distintos elementos que presentarán valores diferentes, de manera que en función de la muestra escogida, el estimador puede tomar distintos valores proporcionando diferentes estimaciones del valor poblacional. Esto significa que un estimador es una variable aleatoria y, por tanto, tiene una distribución de probabilidad. ESTIMACIÓN PUNTUAL DE LA MEDIA POBLACIONAL Cuando la muestra ha sido obtenida de una población cuyos elementos tienen la misma media y varianza poblacional. Partimos de E [xi ] = µ y VAR[xi ] = σ 2 ∀i = 1,2,L, n . Entonces 1 n la media muestral x = ∑ xi se suele utilizar como estimador de n i =1 la media poblacional ( µ ) dado que se cumple: 1 n E [x ] = E ∑ xi = µ n i =1 1 n σ 2 VAR[x ] = VAR ∑ xi = n i =1 n Cuando la muestra ha sido obtenida de una población Normal cuyos elementos tienen la misma media y varianza poblacional. Si en la población la variable X sigue una distribución normal con media µ y varianza σ2, el estimador x también es una variable aleatoria normal, es decir, si la variable poblacional X es normal la distribución de x es: σ 2 x ∼N µ , n Si la variable X no es normal pero se dispone de una muestra grande, la distribución de x se puede aproximar a la distribución normal gracias a la aplicación del Teorema delLímite Central: σ 2 x →N µ , n ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL Se supone una población de la que interesa analizar la proporción, p, de elementos que presentan una determinada característica. Puede definirse una variable X, que toma valor uno si el elemento presenta la característica en cuestión y valor cero si no la presenta. De esta forma la proporción poblacional, p, es el número de elementos que presentan la característica entre el total de elementos de la población. Si no se puede analizar la presencia de la característica de interés para cada uno de los elementos de la población se puede utilizar la proporción muestral, p̂ , como estimador de la proporción poblacional. pˆ = nA n Donde: n A : es el número de elementos que poseen la característica de interes. n : es el número de elementos totales. Por tanto, la proporción muestral es el cociente entre el número de elementos de la muestra que presentan la característica y el total de observaciones muestrales si la variables toman los valores 0 y 1 es igual que calcular la media muestral. Para cualquiera que sea la distribución de la variable X y para cualquier tamaño muestral, la esperanza y la varianza de p̂ son: E [ pˆ ] = p p(1 − p ) n Por la aplicación del Teorema del Límite Central, si se dispone de una muestra grande, la distribución de p̂ se puede aproximar por: VAR[ pˆ ] = A p(1 − p ) pˆ ~ N p, n