Distribuciones muestrales.

Anuncio
Matemáticas aplicadas a las CCSS II
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 38004 – Santa Cruz de Tenerife
 +34 922 276 056 -- Fax: +34 922 278 477
[email protected]
Distribuciones muestrales.
Recuerda:
Población: conjunto de todos los elementos que poseen una determinada característica.
Muestra: parte de la población que se observa (para extraer información de la población).
-
Representativa: - Debe tener un tamaño adecuado.
- Sus elementos son elegidos de forma aleatoria.
-
Sesgada: - Si sus elementos no son elegidos de forma aleatoria.
Muestreo: selección de la muestra.
Teorema Central del Límite:
El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la
suma de ellas se distribuye según una distribución normal.
Si se seleccionan muestras aleatorias de n observaciones de una población con media µ y
desviación típica σ , entonces, cuando n es grande, la distribución muestral de medias tendrá
σ
aproximadamente una distribución normal con una media igual a µ y una desviación típica de
.
n
La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.
€
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife
 +34 922 276 056 - Fax: +34 922 278 477
[email protected]
Distribuciones en el muestreo más importantes:
-
Distribución en el muestreo de una proporción (o distribución muestral de proporciones):
Cada una de las distintas muestras elegidas tendrán una proporción pˆ , el conjunto de todas
ellas darán lugar a una variable aleatoria que se representa por Pˆ y se llama estadístico. La
distribución de los valores de Pˆ se llama distribución en el muestreo de la proporción, para la cual
la variable aleatoria Pˆ tiene las siguientes características:
€
€
1º Media: µ = p (proporción
de la población).
€
€
p(1 − p)
2º Desviación típica: σ =
n
⎛
p(1 − p) ⎞
3º Cuando n crece la distribución Pˆ se aproxima a la normal N ⎜ p,
⎟ siempre que p no se
n ⎠
⎝
€
acerque a 0 ó 1.
€
Ejemplo:
€
El 46% de la población de una ciudad está descontento con la gestión realizada por el
ayuntamiento. Si extraemos una muestra aleatoria de tamaño 200, ¿cuál es la probabilidad de que
al menos 100 de ellos estén descontentos?
Por un lado, p = 0,46, y nos piden calcular la probabilidad de que el total muestral de descontentos
T200 sea mayor o igual que 100, o lo que es lo mismo, que
pˆ ≥
⎛
100
p(1 − p) ⎞
→ pˆ ≥ 0,5 como cuando n ∞ Pˆ →N ⎜ p,
⎟
200
n ⎠
⎝
Por lo que podemos aproximar la probabilidad pedida por:
€
€
€
para convertirla en N (0,1)
P( pˆ ≥ 0,5) → tipificando la variable
⎛
⎞
⎜
⎟
0,5 − 0,46 ⎟
⎜
ˆ
P( p ≥ 0,5) ≈ P Z ≥
= P ( Z ≥1,14 )€= 1 − P(Z < 1,14) = 0,1271
0,46⋅ 0,54 ⎟
⎜
⎜
⎟
⎝
⎠
200
-
€
-2/6-
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife
 +34 922 276 056 - Fax: +34 922 278 477
[email protected]
-
Distribución en el muestreo de la media:
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria X podemos
estudiar su distribución que llamaremos distribución muestral de medias o distribución en el
muestreo de la media.
€
1º Media: tiene la misma que la población, µ .
2º Desviación típica:
σ
n
3º Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la
distribución muestral de medias sigue también una distribución normal
€
⎛ σ ⎞
N ⎜ µ,
⎟
⎝
n ⎠
• Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema
central del límite la distribución muestral de medias se aproxima también a la normal anterior.
€
Ejemplo:
Los niveles de colesterol en la sangre de una población de trabajadores tiene media 202 y
desviación típica 14. Se selecciona una muestra de 36 trabajadores y queremos aproximar la
probabilidad de que la media muestral de sus niveles de colesterol esté comprendida entre 198 y
206. Según el TCL, X se distribuye aproximadamente como una
⎛
⎛
σ
14 ⎞
7 ⎞
N ⎜ µ = 202,
=
⎟  N ⎜ 202, ⎟ que podemos convertir en N (0,1) tipificando la variable, de
⎝
⎝
3 ⎠
36 ⎠
€ n
este modo,
€
⎛
⎞
€
€ ⎜
⎟
198 − 202
206 − 202
P(198 ≤ X ≤ 206) = P⎜
≤Z≤
⎟ ≈ P ( −1,71 ≤ Z ≤ 1,71)
7
7
⎜
⎟
⎝
⎠
3
3
P ( −1,71 ≤ Z ≤ 1,71) = P ( Z ≤ 1,71) − [1 − P ( Z ≤ 1,71)] = 0,9128
€
€
-3/6-
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife
 +34 922 276 056 - Fax: +34 922 278 477
[email protected]
Intervalos de confianza.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro,
con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo
construido se denomina nivel de confianza o coeficiente d confianza, y se denota 1-α. La
probabilidad de equivocarnos se llama nivel de significancia o de riesgo y se simboliza α.
Llamaremos valor crítico al valor de la abcisa que dja a su derecha un área igual a
siendo 1-α el coeficiente de confianza. Se representa por Zα .
α
,
2
2
El margen de error es la diferencia entre los extremos superior e inferrior del intervalo de
confianza.
€
-
€
Intervalo de confianza para para el parámetro
p de una binomial B(n,p):
⎛
IC = ⎜⎜ pˆ ± Zα
2
⎝
⎛
pˆ (1 − pˆ ) ⎞
⎟ , es decir, IC = ⎜ pˆ − Zα
⎜
n ⎟⎠
2
⎝
pˆ (1 − pˆ )
, pˆ + Zα
n
2
pˆ (1 − pˆ ) ⎞
⎟
n ⎟⎠
donde:
€
muestra.
pˆ es la proporción de la €
Zα es el vallor crítico para el nivel de confianza α.
2
€
⎛
p(1 − p) ⎞
n es muy grande, es decir, np>5 y n(1-p)>5  Pˆ se aproxima a la normal N ⎜ p,
⎟ .
n ⎠
⎝
€
€
€
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15
años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Halla, con un nivel
de confianza del 95% un intervalo para la proporción de mujeres hipertensas en la Región
Metropolitana.
pˆ = 0,176 → (1 − pˆ ) = 0,824
1 − α = 0,95 → α = 1 − 0,95 = 0,05 →
€
α
= 0,025
2
-4/6-
€
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife
 +34 922 276 056 - Fax: +34 922 278 477
[email protected]
1 − 0,025 = 0,975 esto es para Z=1,96  Zα = 1,96 (buscado en la tabla)
2
luego:
€
⎛
IC = ⎜⎜ pˆ ± Zα
2
⎝
€
pˆ (1 − pˆ ) ⎞ ⎛
⎟ = ⎜ 0,176 ± 1,96⋅
n ⎟⎠ ⎝
0,176⋅ 0,824 ⎞
⎟ = (0,176 ± 0,037) = (0.139,0.213)
412
⎠
€
-
Intervalo de confianza para para el parámetro media µ de una N(µ,σ):
Co un nivel de confianza 1-α viene dado por:
⎛
⎛
σ ⎞
σ
σ ⎞
⎟ , es decir, IC = ⎜ x − Zα
⎟
IC = ⎜ x ± Zα
, x + Zα
n
n
n
⎝
⎠
⎝
⎠
2
2
2
Generalmente, cuando se quiere construir un intervalo de confianza para la media
poblacional , la varianza poblacional σ es desconocida, por lo que el intervalo para µ construido
€ anteriormente es muy poco
€ práctico.
Si en el intervalo se reemplaza la desviación típica poblacional por la desviación típica muestral s
(cuasidesviación típica), el intervalo de confianza toma la forma:
⎛
⎛
s ⎞
s
s ⎞
⎟ , es decir, IC = ⎜ x − Zα
⎟
IC = ⎜ x ± Zα
, x + Zα
n
n
n
⎝
⎠
⎝
⎠
2
2
2
€
Ejemplo:
€
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión
(mayor puntaje significa mayor depresión)
2
11
14
16
19
5
11
15
16
19
6
13
15
17
19
8
13
16
17
19
8
14
16
17
19
Halla un intervalo de confianza al 95%.
-5/6-
9
14
16
18
19
9
14
16
18
19
10
14
16
18
20
11
14
16
19
20
COLEGIO HISPANO INGLÉS
Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife
 +34 922 276 056 - Fax: +34 922 278 477
[email protected]
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que
los datos tienen distribución normal, con desviación típica poblacional σ desconocida. Como
σ es desconocido, lo estimamos por s = 4,3. La media la calculamos y es x = 14,5 .
1 − α = 0,95 → α = 1 − 0,95 = 0,05 →
€
α
= 0,025
2
€
1 − 0,025 = 0,975 esto es para Z=1,96  Zα = 1,96 (buscado en la tabla)
2
€
⎛
s ⎞ ⎛
4,3 ⎞
⎟ = ⎜14,5 ± 1,96⋅
IC = ⎜ x ± Zα
⎟ = (14,5 ± 1,3) = (13.2,15.8)
⎝
⎠
n
45
⎝
⎠
€
2
€
Luego, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio
poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
-6/6-
Descargar