Distribución muestral de proporciones

Anuncio
Distribución muestral de
proporciones
Algunas secciones han sido tomadas de:
Apuntes de Estadística Inferencial
Instituto Tecnológico de Chiuhuahua
Distribución muestral de Proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporción de artículos
defectuosos o la proporción de personas con teléfono, etc en la
muestra. La distribución muestral de proporciones es la adecuada para
dar respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral
de medias, a excepción de que al extraer las muestras de la población se
calcula el estadístico proporción (p=x/n en donde “x” es el número de
éxitos u observaciones de interés y “n” el tamaño de la muestra) en
lugar de la media de cada muestra que era lo que calculamos antes.
El siguiente diagrama sirve para explicar el concepto de distribución
muestral de proporciones.
La distribución muestral de proporciones está estrechamente
relacionada con la distribución binomial; una distribución binomial es una
distribución del total de éxitos en las muestras, mientras que una
distribución de proporciones es la distribución de un promedio (media)
de los éxitos.
Como consecuencia de esta relación, las afirmaciones probabilísticas
referentes a la proporción muestral pueden
evaluarse usando la aproximación normal a la binomial, siempre que:
np ≥ 5 y
n(1-p) ≥ 5
Una distribución binomial es, por ejemplo, si echamos una moneda al aire
y observamos el lado que cae. Está claro que sólo hay dos posibilidades.
Ahora bien, la probabilidad de que caiga la moneda de cualquier lado es
la misma siempre que ésta no esté cargada. Como cada caso tiene igual
probabilidad de ocurrir, y siendo la suma de probabilidades siempre
igual a 1, entonces la probabilidad de que caiga la moneda de algún lado
es 0.5.
Si realizamos el experimento n veces y queremos saber la probabilidad
de que salga águila o sol x veces, entonces usamos una distribución
binomial.
Generación de la Distribución Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos
defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin
reemplazo. Vamos a generar la distribución muestral de proporciones
para el número de piezas defectuosas. Como se puede observar en este
ejercicio la proporción de artículos defectuosos de esta población es
P = 4/12=1/3.
Por lo que podemos decir que el 33% de las piezas de este lote están
defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población
de 12 elementos es 12C5=792, las cuales se pueden desglosar de la
siguiente manera:
Para calcular la media de la distribución muestral de proporciones se
tendría que hacer la sumatoria de la frecuencia por el valor de la
proporción muestral y dividirla entre el número total de muestras. Esto
es:
μp =
(0.8 ⋅ 8) + (0.6 ⋅112) + (0.4 ⋅ 336) + (0.2 ⋅ 280) + (0 ⋅ 56) 1
= = 0.333
792
3
Como podemos observar la media de la distribución muestral de
proporciones es igual a la proporción de la población.
μp = P
La desviación estándar de la distribución muestral de proporciones del
ejemplo se puede calcular directamente con los datos:
σp
(0.8 − 0.33) 2 ⋅ 8 + (0.6 − 0.33) 2 ⋅112 + (0.4 − 0.33) 2 ⋅ 336 + (0.2 − 0.33) 2 ⋅ 280 + (0 − 0.33) 2 ⋅ 56
=
= 0.168
792
Sin embargo, podemos usar la distribución binomial lo cual nos da la
siguiente fórmula para la desviación estándar de la distribución
muestral de proporciones:
σp =
P (1 − P )
n
Notar que P es la
proporción de la población
pero n es el tamaño de la
muestra
Como vimos antes, si contamos con una población finita y un muestreo
sin reemplazo, para calcular la desviación estándar usamos la corrección
(Como regla aproximada, si el muestreo se hace sin reemplazo y el
tamaño de la población es 20 veces el tamaño de la muestra o menor,
entonces se puede usar la fórmula):
σp =
P (1 − P ) N − n
n
N −1
Para el ejemplo anterior tendríamos la siguiente distribución de
probabilidades:
Usando la fórmula tendríamos entonces:
σp =
P (1 − P ) N − n
=
n
N −1
0.333(0.666) 12 − 5
= 0.168
5
12 − 1
Lo cual es igual al valor de la desviación estándar obtenido antes
La fórmula que se utilizará para el cálculo de probabilidad en una
distribución muestral de proporciones está basada en la aproximación
de la distribución binomial a la normal . Esta fórmula nos servirá para
calcular la probabilidad del comportamiento de la proporción en la
muestra.
z=
p− P
P (1 − P )
n
Esta fórmula se puede comparar a las anteriores si pensamos en que
estamos calculando una diferencia entre la proporción de la muestra y la
de la población en unidades de desviación estándar, como era el caso de
la distribución de medias:
z=
x−μ
σ
n
A la fórmula anterior se le puede agregar el factor de corrección (en el
denominador):
z=
p− P
P (1 − P ) N − n
n
N −1
si se cumplen con las condiciones mencionadas anteriormente de que sea
una población finita (N/n < 20) y sin reemplazo.
Ejemplo:
Se ha determinado que 85.1% de los estudiantes de una universidad
fuman cigarrillos. Se toma una muestra aleatoria de 200 estudiantes.
Calcular la probabilidad de que no más de 80% de alumnos de la muestra
fume.
Solución:
La media o valor esperado de la distribución muestral es de P=0.851 (la
proporción de la población), por lo que:
z=
p− P
P (1 − P )
n
=
0.800 − 0.851
0.851(1 − 0.851)
200
= −2.0255
Usando las tablas de valor z, para z = -2.02 encontramos que la
probabilidad de que no más de (es decir, menos de) 80% de los alumnos
de la muestra fumen es de 0.0214 o sea 2.14%
0.0214
Actividad 1.
Suponer que de la gente que solicita ingresar a una compañía, 40%
pueden aprobar un examen de artimética para obtener el trabajo. Si
se tomara una muestra de 20 solicitantes, ¿Cuál sería la probabilidad
de que 50% o más de ellos aprobaran?
Datos:
P = 0.40, n = 20,
z=
p = 0.50
p− P
P (1 − P )
n
=
0.50 − 0.40
0.40(1 − 0.40)
20
= 0.9129
Usando tablas de valor o calificación z, o un programa para
distribución normal estándar (como Minitab, etc.), encontramos que el
área bajo la curva hasta un valor de z = 0.9129 es de 0.81935, o sea
que
(1- 0.81935) = 0.1806,
por lo que la probabilidad de que 50% o más aprobaran es de 18.06% .
El área desde es de 0.81935
∞ hasta z= 0.9129
Cómo calcular probabilidades normales usando MINITAB (versión en
inglés):
•
•
•
•
•
•
En el menú superior: Calc > Probability Distributions > Normal
Tenemos 3 opciones:
– Probability density – Esta nos da el valor de la función de densidad,
f(x) para un valor específico de x. Esto no nos es muy útil en esta
clase.
– Cumulative Probability – Esta nos da el área bajo la curva hasta un
valor z específico. Usamos esto para encontrar probabilidades.
– Inverse Cumulative Probability – Esto nos da el valor z para una área
específica bajo la curva. Esto lo usamos para encontrar valores
críticos.
Hacer Click en la opción que queremos.
Se introduce la media y la desviación estándar de la distribución
normal que estamos usando.
En el caso de la estándar normal (Z) introducimos N(0,1).
Hacemos Click en “input constant” e introducimos el valor de x (xvalue) para la opción 1, el valor z para la opción 2, o la probabilidad
para la opción 3.
Ejemplo: ¿Cuál es la probabilidad de que tengamos un valor mayor a 60 si
tenemos datos con una distribución normal con media 55 y deviación
estándar de 4?
Esto es, encontrar P(x > 60).
Como puede verse en la figura, el resultado que se obtiene es que P(X <
60) = 0.8964. Notar que nos da los valores de la probabilidad de que X
sea menor al valor dado, por lo que para nuestro problema:
P(X > 60) = 1 - 0.8964 = 0.1036
Si lo que queremos es el área para una calificación Z (normal estándar)
entonces, como se explicó, podemos introducir una media igual a 0 y una
desviación estándar de 1.0, e introducir el valor de Z para el cual
queremos encontrar la probabilidad.
Poner media = 0
Poner σ = 1.0
Poner z = valor de
interés
Descargar