3-1 Inferencia estadistica III (Intervalos de confianza) 1. Conceptos Tal y como hemos visto anteriormente, una de las ramas de la inferencia paramétrica consiste en estimar los parámetros asociados a una muestra. No siempre es posible conocer una población, por lo que se hace necesario inferir información sobre la población a partir de una muestra. Para ello utilizaremos dos métodos: estimación de parámetros y contraste de hipótesis. 1.1 Definiciones Parámetro: valor numérico que describe una característica de la población. Estadistico: Valor numérico que describe una característica de la muestra. Estimador puntual: Estadistico que se usa para estimar un parámetro poblacional. Es una variable aleatoria en el muestreo que tiene su correspondiente distribución muestral. Estimación puntual: Valor numérico que toma el estimador puntual para una muestra determinada. 1.2. Propiedades de los estimadores Cuando el estadístico se utiliza con el fin de estimar algún parámetro de una población se llama estimador. Aunque es posible que c cualquier estadistico sea un estimador, en la práctica se utilizan estadisticos con las propiedades adecuadas para que la estimación que se pretende sea llevada a cabo de una manera aceptable. • Decimos que un estimador es insesgado o centrado si su esperanza matemática es igual al valor del parámetro que estima, es decir, si su media se concentra alrededor del parámetro a estimar. • Decimos que un estimador es eficiente si su varianza es mínima. Un estimador insesgado y eficiente de la media poblacional es la media muestral Un estimador insesgado y eficiente de la varianza poblacional es la cuasivarianza muestral. Un estimador insesgado y eficiente de la proporción poblacional es la proporción muestral Mat. Aplic. CC.SS. II – Curso 2011-2012 Angel Vallelado – www.angelv.es 3-2 Un estimador insesgado y eficiente de la diferencia de las medias poblacionales es la diferencia de las medias muestrales. Los estimadores anteriores son tanto más eficaces cuanto mayor sea el tamaño de la muestra. Cada uno de los valores de un estimador es una estimación puntual del parámetro correspondiente. La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que tratamos de estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que se encuentre el parámetro que tratamos de estimar. A este procedimiento lo denominaremos estimación por intervalo de confianza. 2. Estimación por intervalo La determinación de un intervalo de confianza supone el conocimiento de la distribución del estimador para poder calcular probabilidades asociadas a él. Un intervalo de confianza al nivel de confianza p es un rango de valores obtenido de tal manera que se puede asegurar que, a priori, la probabilidad de que vaya a contener al parámetro que se estima es igual a p. Este procedimiento de estimación nos permite calcular dos valores (a, b) entre los que esperamos que esté el parámetro buscado con un cierto nivel de confianza (1- α )y un nivel de riesgo α fijado de antemano. Los límites inferior y superior del intervalo de confianza se llaman límite de confianza inferior y superior. P(a ≤ parámetro ≤ b) = 1- α Nivel de confianza: 1- α Nivel de riesgo: α Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza. 2.1. Intervalo de confianza para la media poblacional Media desconocida: µ → Parámetro a estimar Desviación típica conocida: σ Distribución muestral de las medias X se aproxima a una distribución normal N( µ , Distribución muestral tipificada a una normal N(0,1): Z = σ n ) X −µ σ n Mat. Aplic. CC.SS. II – Curso 2011-2012 Angel Vallelado – www.angelv.es 3-3 Valores para los que existe un nivel de confianza 1-α: P(-Zα/2 ≤ Z ≤ Zα/2)= 1-α P(-Zα/2 ≤ X −µ σ ≤ Zα/2)= 1-α Buscamos Zα/2 en la tabla de N(0,1): n P(Z ≤ Zα/2)=(1- α )+ α/2 Si x es una media muestral, como es un valor de X , sabemos que, al menos en el (1- α)% de los casos se cumple que: x−µ -Zα/2 ≤ -Zα/2 σ n σ n - x -Zα/2 x -Zα/2 ≤ Zα/2 ≤ x − µ ≤ Zα/2 σ σ n σ n ≤ − µ ≤ - x + Zα/2 ≤ µ ≤ x + Zα/2 σ n σ n n Intervalo de confianza con un nivel de confianza de (1-α) es: σ σ x -Zα/2 , x + Zα/2 n n Si σ es desconocida y n ≥ 30, se puede sustituir por la desviación típica de la muestra. Ejemplo 1: Sabemos que la desviación típica de una población es σ =2. Considerada una muestra de 100 individuos obtenemos que x =8. ¿Cuál es el intervalo de confianza para la media poblacional a un nivel de confianza 1-α = 0,95 Solución (7,608; 8,392) Ejemplo 2: A fin de estimar el número medio de hijos de las familias españolas, consideramos una muestra de 1000 personas y encontramos que esta muestra tiene una media de 2,1 hijos y una desviación típica de 0,5. Hallar el intervalo de confianza del número medio de hijos por familia, con un nivel de confianza del 0,99. Solución: (2,0592; 2,1408) 2.2. Intervalo de confianza para la proporción Proporción poblacional desconocida: p → Parámetro a estimar. p(1 − p ) Distribución muestral de la proporción P se aproxima a una distribución normal N p, n $−p p Distribución muestral tipificada a una normal N(0,1): Z = $(1 − p $) p Mat. Aplic. CC.SS. II – Curso 2011-2012 n Angel Vallelado – www.angelv.es 3-4 $ (proporción muestral) La tipificación se realiza de forma similar al caso anterior. Utilizando p como estimador de la proporción poblacional, el intervalo de confianza quedará de la siguiente manera: $ $ $ $ $ -Zα/2 p(1 − p ) , p $ + Zα/2 p(1 − p ) p n n 2.3. Intervalo de confianza para la diferencia de medias → Parámetro a estimar. Diferencia de medias poblacionales desconocida: µ -µ 1 2 − Distribución muestral de la diferencia de medias − + , se aproxima a una distribución normal = Distribución muestral tipificada a una normal N(0,1): ( 1 − 2 )−( ) La tipificación se realiza de forma similar al caso anterior. Utilizando − (diferencia de medias muestral) como estimador de la diferencia de medias poblacional, el intervalo de confianza quedará de la siguiente manera: − + -Zα/2 , − + + Zα/2 3. Tamaño de la muestra Según aumenta el tamaño de la muestra, la estimación de parámetros es más fiable. Sin embargo, este aumento encarece el coste del estudio a realizar. Cuando estimamos un intervalo de confianza, estamos cometiendo un error máximo que es igual al radio del intervalo de confianza, con un nivel de riesgo α previamente establecido. La cuestión a resolver, en este caso, es determinar el tamaño mínimo de la muestra para un nivel de confianza y un error máximo determinados previamente. 3.1. Media poblacional En el caso de la media poblacional, el intervalo de confianza obtenido para un nivel 1- α era x -Zα/2 σ n , x + Zα/2 σ n El error máximo que cometemos en esta estimación vendrá dado por el radio de este intervalo Mat. Aplic. CC.SS. II – Curso 2011-2012 Angel Vallelado – www.angelv.es 3-5 E = Zα/2 σ n Si conocemos o predeterminamos el error máximo E que queremos cometer y el nivel de confianza, podemos calcular el tamaño de la muestra: zα ⋅ σ n= 2 E 2 Ejemplo: Se quiere estimar la producción media de leche al día de un determinado tipo de vacas con un error menor que 0,5 litros y un nivel de confianza del 95%. Si de estudios anteriores sabemos que la desviación típica típica es de 1,5 litros. ¿Qué tamaño de muestra debemos tomar? Solución: 35 individuos 3.2. Proporción poblacional En el caso de la proporción poblacional, el intervalo de confianza obtenido para un nivel 11 α era $(1 − p $) p $ + Zα/2 , p n $ -Zα/2 p $(1 − p $) p n El error máximo que cometemos en esta estimación vendrá dado por el radio de este intervalo E = zα 2 $(1 − p $) p n Si conocemos o predeterminamos el error máximo E que queremos cometer y el nivel de confianza, podemos calcular el tamaño de la muestra: z $ ⋅ (1 − p $) ⋅ α 2 n=p E 2 Inferencia estadistica 3/4 - Curso 2011-2012 2011 por Angel Vallelado se encuentra bajo una Licencia Creative Commons Reconocimiento-NoComercial-CompartirIgual Reconocimiento CompartirIgual 3.0 Unported. Unported Basada en una obra en www.angelv.es. Mat. Aplic. CC.SS. II – Curso 2011 1-2012 Angel Vallelado – www.angelv.es