Distribuciones Muestrales

Anuncio
Estimacion puntual y por Intervalo
•El objetivo es efectuar una generalización de los resultados de la muestra
a la población. Inferir o adivinar el comportamiento de la población a partir
del conocimiento de una muestra. En general nos interesará conocer algún
parámetro determinado de la población (media, varianza, proporción, etc.)
•Para ello es necesario conocer las distribuciones de probabilidad de ciertas
funciones de las muestras que constituyen variables aleatorias asociadas
al experimento aleatorio, selección de una muestra al azar de una población.
•Esta variable aleatoria es un estadístico muestral, y su distribución
es la distribución muestral
•Podemos distinguir entre estimación puntual y por intervalo
•Estimación puntual: se proporciona un solo valor numérico del parámetro
desconocido.
Estimación por intervalo: se proporciona un intervalo dentro del cual se afirma
que se encuentra el parámetro desconocido con una confianza dada. El nivel
de confianza expresa en términos de probabilidad el grado de seguridad que
tenemos al afirmar que el intervalo incluirá al parámetro.
Estimacion puntual y por Intervalo
Definición de estimador
Dado un parámetro θ un estimador del parámetro, que notaremos con
estadístico muestral que se emplea para conocer el parámetro
θˆ , es un
El valor concreto que tome para la muestra seleccionada se denomina
estimación puntual de θ
Es deseable que los estimadores presenten ciertas propiedades tales como
insesgadez (la esperanza o media del estimador coincide con el parámetro
estimado); eficiencia (dados dos estimadores insesgados es más eficiente el
de menor varianza), entre otras.
La elección del estimador adecuado dependerá de estas propiedades
A veces se usa como estimador el mismo resumen estadístico que define el
parámetro. Por ejemplo, como estimador de la media de la población se usa la
media de la muestra; de la proporción en la población, la de la muestra; de la
varianza en la población, la de la muestra. Pero no siempre es esta la mejor
elección. Por ejemplo, la cuasivarianza muestral es mejor estimador de la varianza
de la población desde el punto de vista de la insesgadez.
Ejemplo: Estimador de la media de una población
Población: X variable aleatoria
Estimador:
Estadístico muestral media muestral
Distribución de X en la Población
µ
e
Inf
X
Xmuestra
X
Distribución muestral de medias
cia
n
re
Valor de la
variable
Muestra seleccionada
x1,x2,x3,…,xn
Estimación:
Media de la muestra Xmuestra
Estimacion puntual y por Intervalo
Intervalo de confianza para la media µ
con
σ
conocida
Sea una población sobre la que se observa una variable aleatoria X con distribución
X → N (µ ,σ )
Usaremos como estimador de la media poblacional la media muestral. Sabemos que
X → N (µ ,
σ
n
)
Por tanto, la variable estandarizada sigue un modelo N(0,1):
Z=
X −µ
σ
→ N (0, 1)
n
Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en
el centro de la distribución un área (probabilidad) igual (1 − α )
α /2
α /2
(1 − α )
− zα / 2
zα / 2
1 − α = P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤
Z
X −µ
σ
n
≤ zα / 2 ) =
Estimacion puntual y por Intervalo
Intervalo de confianza para la media µ
α /2
con
α /2
n
≤ X − µ ≤ zα / 2
σ
n
Z
zα / 2
1 − α = P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤
= P (− zα / 2
conocida (continúa)
(1 − α )
− zα / 2
σ
σ
X −µ
σ
n
) = P ( − X − zα / 2
= P ( X − zα / 2
σ
n
≤ zα / 2 ) =
σ
n
≤ µ ≤ X + zα / 2
≤ − µ ≤ − X + zα / 2
σ
n
El intervalo de confianza para la media al nivel (1 − α )
σ
⎡
,
X
−
z
α /2
⎢
n
⎣
X + zα / 2
σ ⎤
n ⎥⎦
)
σ
n
)=
Estimacion puntual y por Intervalo
Ejemplo: Intervalo de confianza para la media µ con
σ
conocida
Se ha seleccionado una muestra de 25 viviendas de un barrio. Se sabe que la superficie de
éstas se distribuye normalmente con media desconocida y varianza 49. Estime el valor
medio de la superficie por vivienda en dicho barrio a un nivel de confianza del 95%,
sabiendo que la media observada en las 25 viviendas de la muestra fue de 102,5m2.
El intervalo de confianza para la media al nivel (1 − α )
σ
⎡
,
X
−
z
α /2
⎢
n
⎣
X + zα / 2
σ ⎤
⎥
n⎦
7
7 ⎤
⎡
102
,
5
−
1
,
96
,
102
,
5
+
1
,
96
⎢
25
25 ⎥⎦
⎣
Estimacion puntual y por Intervalo
Intervalo de confianza para la media µ
con
σ
desconocida
Sea una población sobre la que se observa una variable aleatoria X con distribución
X → N (µ ,σ )
Usaremos como estimador de la media poblacional la media muestral. Sabemos que
el estadístico muestral Ut,v sigue un modelo t de Student con n-1 grados de libertad
U t ,υ =
(X − µ)
→ t n −1
S
n
Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en
el centro de la distribución un área (probabilidad) igual (1 − α )
α /2
α /2
(1 − α )
− tα / 2
1 − α = P (−tα / 2 ≤ t n −1 ≤ tα / 2 ) = P ( −tα / 2 ≤
tα / 2
t de Studen con n-1 g.l
X −µ
≤ tα / 2 ) =
s
n
Estimacion puntual y por Intervalo
Intervalo de confianza para la media µ
α /2
con
σ
α /2
(1 − α )
− tα / 2
desconocida (continúa)
tα / 2
t de Studen con n-1 g.l
X −µ
≤ tα / 2 ) =
s
n
s
s
s
) = P (− X − tα / 2
≤ − µ ≤ − X + tα / 2
)=
n
n
n
1 − α = P (−tα / 2 ≤ t n −1 ≤ tα / 2 ) = P ( −tα / 2 ≤
= P (−tα / 2
s
≤ X − µ ≤ tα / 2
n
= P ( X − tα / 2
s
s
≤ µ ≤ X + tα / 2
)
n
n
El intervalo de confianza para la media al nivel (1 − α )
n
s
⎡
X
−
t
,
α
/
2
⎢
n
⎣
X + tα / 2
s ⎤
n ⎥⎦
Donde s es la cuasivarianza muestral
s=
∑ (x − X )
i =1
i
n −1
Nota: cuando el tamaño muestral es grande la t de Student se aproxima a una normal
2
Estimacion puntual y por Intervalo
Ejemplo: Intervalo de confianza para la media µ con
σ
desconocida
Se ha seleccionado una muestra de 25 viviendas de un barrio. Se sabe que la superficie de
éstas se distribuye normalmente con media y varianza desconocidas. Estime el valor
medio de la superficie por vivienda en dicho barrio a un nivel de confianza del 95%,
sabiendo que la media y la varianza observadas en la muestra fueron de 102,5 y 64,
respectivamente.
El intervalo de confianza para la media al nivel (1 − α )
s
⎡
X
−
t
,
α /2
⎢
n
⎣
S2 =
X + tα / 2
s ⎤
n ⎥⎦
n
25
Var (muestra) =
64 = 66,667
n −1
24
S=
25
64 = 66,667 = 8,165
24
8,165
8,165 ⎤
⎡
102
,
5
−
2
,
064
,
102
,
5
+
2
,
064
⎢
⎥
25
25 ⎦
⎣
Estimacion puntual y por Intervalo
Intervalo de confianza para la proporción p
Sea una población sobre la que se observa una variable aleatoria X con distribución
X → B (1, p )
Usaremos como estimador de la proporción poblacional la proporción muestral. Sabemos que
el estadístico muestral Up sigue un modelo normal para muestras suficientemente grandes
Up → N ( p,
pq
)
n
De modo equivalente
Z=
Up − p
pq
n
→ N (0, 1)
Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en
el centro de la distribución un área (probabilidad) igual (1 − α )
α /2
α /2
(1 − α )
− zα / 2
zα / 2
1 − α = P (− zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤
Z
Up − p
pq
n
≤ zα / 2 ) =
Estimacion puntual y por Intervalo
Intervalo de confianza para la proporción
α /2
− zα / 2
pq
≤ U p − p ≤ zα / 2
n
Up − p
pq
n
pq
) = P (−U p − zα / 2
n
= P(U p − zα / 2
Z
zα / 2
1 − α = P (− zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤
= P (− zα / 2
α /2
(1 − α )
≤ zα / 2 ) =
pq
≤ − p ≤ −U p + zα / 2
n
pq
≤ p ≤ U p + zα / 2
n
pq
)=
n
pq
)
n
El intervalo de confianza para p al nivel (1 − α )
⎡
U p (1 − U p )
U p (1 − U p ) ⎤
, U p + zα / 2
⎢U p − zα / 2
⎥
n
n
⎣⎢
⎦⎥
Observa que se ha sustituido p por
su estimador, dado que este es
desconocido
Estimacion puntual y por Intervalo
Ejemplo: Intervalo de confianza para la proporción
En un centro escolar se ha seleccionado una muestra al azar de 120 padres de alumnos para
estimar la proporción de éstos que ayudan en las tareas escolares a sus hijos. De entre los 120
seleccionados 97 respondieron afirmativamente. Obtenga un intervalo de confianza del 80%
para estimar la proporción de padres del centro que ayudan a sus hijos.
El intervalo de confianza para p al nivel (1 − α )
⎡
U p (1 − U p )
U p (1 − U p ) ⎤
, U p + zα / 2
⎢U p − zα / 2
⎥
n
n
⎢⎣
⎥⎦
97
= 0,803
120
1 − u p = 0,197
up =
⎡
0,803(1 − 0,803)
0,803(1 − 0,803) ⎤
, 0,803 + 1,28
⎢0,803 − 1,28
⎥
120
120
⎣
⎦
[0,803 − 0,046,
0,803 + 0,046] = (0,757, 0,849)
Estimacion puntual y por Intervalo
Intervalo de confianza para la varianza de una población
Sea una población sobre la que se observa una variable aleatoria X con distribución
X → N (µ ,σ )
Usaremos como estimador de la varianza poblacional la cuasivarianza muestral. Sabemos que
el estadístico muestral Uchi sigue un modelo Chi-cuadrado con n-1 grados de libertad
n
U chi =
(n − 1) S 2
σ2
→χ
2
n −1
S2 =
donde
∑(X
i =1
i
− X )2
n −1
Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en
el centro de la distribución un área (probabilidad) igual (1 − α )
α /2
χ
1 − α = P( χ
2
1−α / 2
α /2
(1 − α )
≤ U chi ≤ χα / 2 ) = P ( χ
2
Chi-cuadrado con n-1 g.l
χα / 2
2
1−α / 2
2
2
1−α / 2
≤
(n − 1) S 2
σ
2
≤ χα2 / 2 ) =
Estimacion puntual y por Intervalo
Intervalo de confianza para la varianza
α /2
α /2
(1 − α )
χ12−α / 2
1 − α = P( χ
= P(
2
1−α / 2
1
χ12−α / 2
≥
≤ U chi ≤ χα / 2 ) = P ( χ
2
σ2
(n − 1) S 2
≥
1
χα2 / 2
Chi-cuadrado con n-1 g.l
χα2 / 2
) = P(
2
1−α / 2
≤
(n − 1) S 2
(n − 1) S 2
χ12−α / 2
σ
2
≥σ ≥
2
≤ χα2 / 2 ) =
(n − 1) S 2
χα2 / 2
)
El intervalo de confianza para la varianza al nivel (1 − α )
⎡ (n − 1) S 2
,
⎢
2
⎣ χα / 2
(n − 1) S 2 ⎤
χ12−α / 2 ⎥⎦
Estimacion puntual y por Intervalo
Ejemplo: Intervalo de confianza para la varianza
Se desea estimar la variabilidad resultante en los pesos de una máquina de empaquetado.
Se ha seleccionado una muestra de 15 paquetes cuyos pesos presentan una varianza igual
a 25 gramos. Estime la varianza con la que trabaja la máquina a un nivel de confianza del
a) 90%
b) 95%
⎡ (n − 1) S 2
(n − 1) S 2 ⎤
,
⎢
⎥
2
2
El intervalo de confianza para la varianza al nivel
⎣ χα / 2 (1 − αχ)1−α / 2 ⎦
s2 =
n
15
var = 25 = 26,786
n −1
14
⎡ (15 − 1)26,786
,
⎢
23,8
⎣
⎡ (15 − 1)26,786
,
⎢
26,3
⎣
(15 − 1)26,786 ⎤
= (15,756, 56,991)
⎥
6,58
⎦
(15 − 1)26,786 ⎤
= (14,259, 66,608)
⎥
5,63
⎦
Descargar