ES0902 Distribución Muestral de la Media

Anuncio
Análisis de Datos I
Esquema del Tema 21
Tema 21: Distribución muestral de un
estadístico
1. INTRODUCCIÓN
2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
3. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
__________________
Bibliografía*: Tema 15 (pág. 341-348)
Ejercicios recomendados: 1, 2 y 5.
Tema 16 (recoger en reprografía o bajar de la página)
Ejercicios recomendados: 2, 3, 4, 6 y 7.
*
Véase también el tema 1 del libro Análisis de Datos en Psicología II
de Pardo y San Martín (1999; pág. 58-77)
Carmen Ximénez
1
Análisis de Datos I
Esquema del Tema 21
1. INTRODUCCIÓN
La estadística inferencial trata sobre las inferencias con respecto a poblaciones (sus
parámetros, µ y σ2) a partir de la información contenida en las muestras (los estadísticos,
2
X y S ).
Para poder llevar a cabo esas inferencias es necesario conocer la relación que se establece
entre estadísticos y parámetros. El concepto que permite poner en relación ambas cosas es
“La distribución muestral de un estadístico”.
Ejemplo: Tenemos una población con los siguientes N = 3 elementos: X = {1, 2 y 3}.
Donde µ = 2 σ2 = 0,67.
Se extraen muestras de n = 2 elementos:
Con reposición, tenemos 9 posibles muestras:
(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); y (3, 3).
Sin reposición, tenemos 6 posibles muestras:
(1, 2); (1, 3); (2, 1); (2, 3); (3, 1); y (3, 2).
En cada una de las muestras pueden calcularse los correspondientes estadísticos descriptivos:
Por ejemplo, con reposición:
Las medias serían:
1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; y 3, respectivamente.
Las varianzas serían: 0; 0,25; 1; 0,25; 0; 0,25; 1; 0,25; y 0, respectivamente.
Por tanto, los estadísticos descriptivos son variables aleatorias que pueden adoptar
diferentes valores y que tienen su propia distribución de probabilidad.
En el ejemplo vemos que X puede tomar 5 posibles valores y que la probabilidad que
corresponde a cada uno de ellos (f ( X i), su distribución) es:
f
Xi
( X i)
1
1/ 9
1,5
2/ 9
2
3/ 9
2,5
2/ 9
3
1/ 9
Total:
1
Donde E( X ) = Σ Xi · f ( Xi ) = (1)(1/ 9) + (1,5)(2/ 9) + … + (3)(1/ 9) = 2
σ 2 ( X ) = Σ [ Xi 2 · f ( Xi )] – [ E( X )] 2 = [(12)(1/ 9) + … + (32)(1/ 9)] - 22 = 0,33
No es necesario construir la distribución de un estadístico (p.e. de X ) en todos los casos ya
que cada estadístico tiene su propia distribución muestral conocida.
En este tema nos ocuparemos de la distribución muestral de la media: X y de la proporción: P.
Carmen Ximénez
2
Análisis de Datos I
Esquema del Tema 21
2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
I. Si la variable de partida es normal: X → N (µ, σ)
1. Valor esperado: E( X ) = µ
2
2. Varianza: σ ( X ) =
σ2
n
3. Modelo de distribución: X → N (µ ,
σ
n
).
Para obtener valores en tablas hay que convertir las puntuaciones X i en típicas. Es decir:
z =
Xi − µ
σ /
→ N (0,1)
n
EJEMPLO (resuelto)
El CI de los alumnos de un centro especial de se distribuye normalmente con media 80 y
desviación típica 10. Si extraemos una muestra aleatoria simple de 25 alumnos:
a) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga como mínimo
una puntuación en CI de 75?
b) ¿Cuál es la probabilidad de que su media aritmética sea mayor de 75?
c) ¿Cuál es la probabilidad de que su media aritmética sea como máximo 83?
d) ¿Qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en
esa muestra sea como máximo 0,85?
X → N(80,10)
X → N(80, 2)
a) P (X ≥ 75) = P (z ≥
X −µ
b) P ( X ≥ 75) = P (z ≥
c) P ( X ≤ 83) = P (z ≤
d)
σ
) = P (z ≥
X−µ
σ/ n
X−µ
σ/ n
75 - 80
) = P (z ≥ -0,50) = 0,6915
10
) = P (z ≥
75 - 80
) = P (z ≥ -2,50) = 0,9938
10/5
) = P (z ≤
83 - 80
) = P (z ≤ 1,50) = 0,9332
10/5
P ( X ≤ X i) = 0,85 …. z 0,85 = 1,04 …. 1,04 =
Carmen Ximénez
X i − 80
10/5
→
X i = 82,08
3
Análisis de Datos I
Esquema del Tema 21
II. Si la variable de partida no es normal
Cuando la variable X con media µ y desviación típica σ2, no sigue un modelo de
distribución conocido, la distribución muestral de X se parece más a la de la distribución
normal a medida que crece el tamaño de las muestras sobre las que se calcula.
Teorema del Límite Central,
Independientemente de cómo sea la distribución de X, la distribución muestral de
X tiende a la normal cuando el tamaño de las muestras tiende a infinito.
Mediante este teorema podemos calcular probabilidades asociadas a los valores de las
medias cuando se desconoce la forma de la distribución muestral de partida, siempre y
cuando las muestras sean lo suficientemente grandes. Algunos autores plantean que el
parecido con la distribución normal empieza a ocurrir desde tamaños muestrales de 30
observaciones.
El valor de n afecta al error típico de la media, σ( X )
Si
X → N(50, 20)
Con n1 = 4
→ σ ( X ) = 20/ 4 = 10
Con n2 = 25 → σ ( X ) = 20/ 25 = 5
Con n3 = 100 → σ (X) = 20/ 100 = 2
30
50
70
EJERCICIO
La variable X se distribuye normalmente con media 50 y desviación típica 12. Si extraemos
una muestra aleatoria simple de 16 alumnos:
1) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga al menos una
puntuación de 45?
2) ¿Cuál es la probabilidad de que su media aritmética sea menor de 58?
3) ¿Cuál es la probabilidad de que su media aritmética sea como mínimo 45?
4) ¿Qué valores debería tomar la media aritmética para que exista una probabilidad de 0,38
de encontrar valores entre ellos?
5) ¿Qué tamaño tendría que tener la muestra para que la probabilidad de encontrar medias
superiores a 52 fuese 0,2578?
Solución
1) 0,6628
2) 0,9962
3) 0,9525
4) X i = 48,50 y X i = 51,50
5) n = 15 sujetos
Carmen Ximénez
4
Análisis de Datos I
Esquema del Tema 21
3. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
Si tenemos n observaciones (X1, X2, ..., Xn) dicotómicas y definimos:
Xi : “Número de aciertos con probabilidad π”
Entonces: X → B (x, n, π)
E(X) = n · π
σ (X) = nπ ⋅ (1 − π )
EJEMPLO:
Distribución del número de aciertos en un test de 5 ítems con π = 0,50
0
0,031
Xi
f(xi)
1
0,156
2
0,312
3
0,312
4
0,156
5
0,031
Donde: E(X) = (5) (0,50) = 2,5
σ (X) =
2,5 ⋅ (0,50) = 1,12
Si ahora definimos la variable
Pi =
Xi
… “Proporción de aciertos con probabilidad π”
n
El estadístico proporción (P) se distribuye mediante el modelo Binomial: B (x, n, π).
Donde: E(P) = π
σ (P) = π ⋅ (1 − π )/ n … Error típico de la proporción
Las probabilidades asociadas al estadístico P pueden obtenerse mediante la tabla de la
Binomial con parámetros n y π.
En el ejemplo:
Distribución de la propoción de aciertos en un test de 5 ítems con π = 0,50
Xi
Pi
f(xi)
0
0
0,031
1
0,20
0,156
2
0,40
0,312
3
0,60
0,312
4
0,80
0,156
5
1,00
0,031
Donde: E(P) = 0,50
σ (P) = 0,50 ⋅ (0,50)/5 = 0,2236
Por tanto:
1) Probabilidad de que se acierten el 40% de los ítems:
P(Pi = 0,40) = P(Xi = 2) = 0,312
2) Probabilidad de que se acierten como máximo el 60% de los ítems:
P(Pi ≤ 0,60) = P(Xi ≤ 3) = 0,811
Carmen Ximénez
5
Análisis de Datos I
Esquema del Tema 21
EJEMPLO (resuelto)
Un psicólogo clínico afirma que con su terapia para tratar “el miedo a volar en avión” se recupera
el 80% de los pacientes. Si seleccionamos al azar 16 pacientes que han acudido a su consulta
durante los últimos 3 meses por este tema, ¿cuál es la probabilidad de que al menos el 75% se
hayan recuperado y puedan tomar aviones?
X: Nº de pacientes recuperados .... X → B (x, n = 16, π = 0,80)
P: Proporción de pacientes recuperados .... P → B (x, n = 16, π = 0,80)
El 75% son 12 sujetos
P(Pi ≥ 0,75) = P(X i ≥ 12) = 1 – F(11) = 1 – (0 + 0 + 0 + 0 + 0 + 0 + 0 + 0,001 + 0,006 +
+ 0,020 + 0,055 + 0,120) = 0,798 (según tablas de la binomial)
Aproximación a la normal
Si
n es suficientemente grande
0,20 ≤ π ≤ 0,80
Entonces la probabilidad de P se puede aproximar mediante el modelo normal
Con
X: “Número de aciertos”
n π (1 − π ) )
X i − nπ
→ N (0,1)
En puntuaciones típicas: z =
n π (1 − π )
Vimos que ... X → N(nπ,
Con corrección por continuidad: z =
( X i ± 0,5) − E(X)
σ (X)
Ahora tenemos P: “Proporción de aciertos”
Entonces
P → N(π, π (1 − π )/ n )
En puntuaciones típicas: z =
Pi − π
π (1 − π )/n
Con corrección por continuidad: z =
→ N (0,1)
( Pi ± 0,5/ n ) − E(P)
σ (P)
EJERCICIOS
1). Un partido político cree que el 60% del electorado está a favor de su programa. Como su
líder encuentra que esta predicción es demasiado optimista decide hacer un sondeo con una
muestra de 90 personas. ¿Cuál será la probabilidad de que como máximo 60 personas estén
a favor de su partido?
2). Disponemos de los datos del I.N.E. (Instituto Nacional de Estadística) sobre el aumento del
empleo durante el año 98, el cual se encuentra en un 45%. Si tomamos una muestra
aleatoria de 200 ciudadanos. ¿Cuál es la probabilidad de que más del 50% tenga empleo?
Soluciones: 1). 0,9192 2). 0,0869 (con corrección por continuidad).
Carmen Ximénez
6
Descargar