www.angelv.es

Anuncio
3-1
Inferencia estadistica III (Intervalos de
confianza)
1. Conceptos
Tal y como hemos visto anteriormente, una de las ramas de la inferencia paramétrica consiste
en estimar los parámetros asociados a una muestra. No siempre es posible conocer una
población, por lo que se hace necesario inferir información sobre la población a partir de una
muestra. Para ello utilizaremos dos métodos: estimación de parámetros y contraste de
hipótesis.
1.1 Definiciones
Parámetro: valor numérico que describe una característica de la población.
Estadistico: Valor numérico que describe una característica de la muestra.
Estimador puntual: Estadistico que se usa para estimar un parámetro poblacional. Es una
variable aleatoria en el muestreo que tiene su correspondiente distribución muestral.
Estimación puntual: Valor numérico que toma el estimador puntual para una muestra
determinada.
1.2. Propiedades de los estimadores
Cuando el estadístico se utiliza con el fin de estimar algún parámetro de una población se llama
estimador.
Aunque es posible que c cualquier estadistico sea un estimador, en la práctica se utilizan
estadisticos con las propiedades adecuadas para que la estimación que se pretende sea
llevada a cabo de una manera aceptable.
•
Decimos que un estimador es insesgado o centrado si su esperanza matemática es
igual al valor del parámetro que estima, es decir, si su media se concentra alrededor del
parámetro a estimar.
•
Decimos que un estimador es eficiente si su varianza es mínima.
Un estimador insesgado y eficiente de la media poblacional es la media muestral
Un estimador insesgado y eficiente de la varianza poblacional es la cuasivarianza muestral.
Un estimador insesgado y eficiente de la proporción poblacional es la proporción muestral
Mat. Aplic. CC.SS. II – Curso 2011-2012
Angel Vallelado – www.angelv.es
3-2
Un estimador insesgado y eficiente de la diferencia de las medias poblacionales es la diferencia
de las medias muestrales.
Los estimadores anteriores son tanto más eficaces cuanto mayor sea el tamaño de la muestra.
Cada uno de los valores de un estimador es una estimación puntual del parámetro
correspondiente.
La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que
tratamos de estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene
una cierta confianza de que se encuentre el parámetro que tratamos de estimar. A este
procedimiento lo denominaremos estimación por intervalo de confianza.
2. Estimación por intervalo
La determinación de un intervalo de confianza supone el conocimiento de la distribución del
estimador para poder calcular probabilidades asociadas a él.
Un intervalo de confianza al nivel de confianza p es un rango de valores obtenido de tal
manera que se puede asegurar que, a priori, la probabilidad de que vaya a contener al
parámetro que se estima es igual a p.
Este procedimiento de estimación nos permite calcular dos valores (a, b) entre los que
esperamos que esté el parámetro buscado con un cierto nivel de confianza (1- α )y un nivel de
riesgo α fijado de antemano. Los límites inferior y superior del intervalo de confianza se llaman
límite de confianza inferior y superior.
P(a ≤ parámetro ≤ b) = 1- α
Nivel de confianza: 1- α
Nivel de riesgo: α
Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución
que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
2.1. Intervalo de confianza para la media poblacional
Media desconocida: µ 
→ Parámetro a estimar
Desviación típica conocida: σ
Distribución muestral de las medias X se aproxima a una distribución normal N( µ ,
Distribución muestral tipificada a una normal N(0,1): Z =
σ
n
)
X −µ
σ
n
Mat. Aplic. CC.SS. II – Curso 2011-2012
Angel Vallelado – www.angelv.es
3-3
Valores para los que existe un nivel de confianza 1-α: P(-Zα/2 ≤ Z ≤ Zα/2)= 1-α
P(-Zα/2 ≤
X −µ
σ
≤ Zα/2)= 1-α
Buscamos Zα/2 en la tabla de N(0,1):
n
P(Z ≤ Zα/2)=(1- α )+ α/2
Si x es una media muestral, como es un valor de X , sabemos que, al menos en el (1- α)% de
los casos se cumple que:
x−µ
-Zα/2 ≤
-Zα/2
σ
n
σ
n
- x -Zα/2
x -Zα/2
≤ Zα/2
≤ x − µ ≤ Zα/2
σ
σ
n
σ
n
≤ − µ ≤ - x + Zα/2
≤ µ ≤ x + Zα/2
σ
n
σ
n
n
Intervalo de confianza con un nivel de confianza de (1-α) es:

σ
σ
 x -Zα/2
, x + Zα/2

n
n





Si σ es desconocida y n ≥ 30, se puede sustituir por la desviación típica de la muestra.
Ejemplo 1: Sabemos que la desviación típica de una población es σ =2. Considerada una
muestra de 100 individuos obtenemos que x =8. ¿Cuál es el intervalo de confianza para la
media poblacional a un nivel de confianza 1-α = 0,95
Solución (7,608; 8,392)
Ejemplo 2: A fin de estimar el número medio de hijos de las familias españolas, consideramos
una muestra de 1000 personas y encontramos que esta muestra tiene una media de 2,1 hijos y
una desviación típica de 0,5. Hallar el intervalo de confianza del número medio de hijos por
familia, con un nivel de confianza del 0,99.
Solución: (2,0592; 2,1408)
2.2. Intervalo de confianza para la proporción
Proporción poblacional desconocida: p 
→ Parámetro a estimar.

p(1 − p ) 
Distribución muestral de la proporción P se aproxima a una distribución normal N  p,

n


$−p
p
Distribución muestral tipificada a una normal N(0,1): Z =
$(1 − p
$)
p
Mat. Aplic. CC.SS. II – Curso 2011-2012
n
Angel Vallelado – www.angelv.es
3-4
$ (proporción muestral)
La tipificación se realiza de forma similar al caso anterior. Utilizando p
como estimador de la proporción poblacional, el intervalo de confianza quedará de la siguiente
manera:

$
$
$
$

$ -Zα/2 p(1 − p ) , p
$ + Zα/2 p(1 − p ) 
 p


n
n


2.3. Intervalo de confianza para la diferencia de medias
→ Parámetro a estimar.
Diferencia de medias poblacionales desconocida: µ -µ 
1 2
−
Distribución muestral de la diferencia de medias
−
+
,
se aproxima a una distribución normal
=
Distribución muestral tipificada a una normal N(0,1):
( 1 − 2 )−(
)
La tipificación se realiza de forma similar al caso anterior. Utilizando
−
(diferencia de
medias muestral) como estimador de la diferencia de medias poblacional, el intervalo de
confianza quedará de la siguiente manera:




−
+
-Zα/2
,
−
+
+ Zα/2




3. Tamaño de la muestra
Según aumenta el tamaño de la muestra, la estimación de parámetros es más fiable. Sin
embargo, este aumento encarece el coste del estudio a realizar. Cuando estimamos un
intervalo de confianza, estamos cometiendo un error máximo que es igual al radio del intervalo
de confianza, con un nivel de riesgo α previamente establecido. La cuestión a resolver, en este
caso, es determinar el tamaño mínimo de la muestra para un nivel de confianza y un error
máximo determinados previamente.
3.1. Media poblacional
En el caso de la media poblacional, el intervalo de confianza obtenido para un nivel 1- α era




x -Zα/2
σ
n
, x + Zα/2
σ
n




El error máximo que cometemos en esta estimación vendrá dado por el radio de este intervalo
Mat. Aplic. CC.SS. II – Curso 2011-2012
Angel Vallelado – www.angelv.es
3-5
E = Zα/2
σ
n
Si conocemos o predeterminamos el error máximo E que queremos cometer y el nivel de
confianza, podemos calcular el tamaño de la muestra:
 zα ⋅ σ
n= 2
 E





2
Ejemplo: Se quiere estimar la producción media de leche al día de un determinado tipo de
vacas con un error menor que 0,5 litros y un nivel de confianza del 95%. Si de estudios
anteriores sabemos que la desviación típica
típica es de 1,5 litros. ¿Qué tamaño de muestra debemos
tomar?
Solución: 35 individuos
3.2. Proporción poblacional
En el caso de la proporción poblacional, el intervalo de confianza obtenido para un nivel 11 α
era




$(1 − p
$)
p
$ + Zα/2
, p
n
$ -Zα/2
p
$(1 − p
$)
p
n




El error máximo que cometemos en esta estimación vendrá dado por el radio de este intervalo
E = zα
2
$(1 − p
$)
p
n
Si conocemos o predeterminamos el error máximo E que queremos cometer y el nivel de
confianza, podemos calcular el tamaño de la muestra:
z 
$ ⋅ (1 − p
$) ⋅  α 2 
n=p
 E 


2
Inferencia estadistica 3/4 - Curso 2011-2012
2011
por Angel Vallelado se encuentra bajo una
Licencia Creative Commons Reconocimiento-NoComercial-CompartirIgual
Reconocimiento
CompartirIgual 3.0 Unported.
Unported
Basada en una obra en www.angelv.es.
Mat. Aplic. CC.SS. II – Curso 2011
1-2012
Angel Vallelado – www.angelv.es
Descargar