ES1102 DISTRIBUCION MUESTRAL DE DIFERENCIAS Y SUMAS (Separata REVISADO)

Anuncio
LUIS J. CASTILLO VÁSQUEZ
-------------------------------------------------------------
DISTRIBUCION MUESTRAL DE DIFERENCIAS Y SUMAS
Se nos dan dos poblaciones. Por cada muestra de tamaño n 1 extraída de la
primera población computemos un estadístico S1. Esto resulta en una distribución
muestral para S1 cuya media y desviación típica denotamos por µ s1 , y σ s1 ,
respectivamente. En forma semejante por cada muestra de tamaño n 2 extraída de
la segunda población computamos un estadístico S2 cuya media y desviación
típica son µ s 2 y σ S 2 respectivamente.
Tomando las posibles combinaciones de estas muestras de las dos poblaciones
podemos obtener una distribución de las diferencias, S 1 - S2, que se llama la
distribución muestral de la diferencia de estadísticos. La media y la desviación
típica
de
esta
distribución
muestral,
denotada,
respectivamente
por
, están
dadas por:
Dado que las muestras escogidas en ninguna forma dependan entre sí, es decir
las muestras son independientes (en otras palabras, las variables aleatorias S1 y
S2 son independientes).
Si, por ejemplo S1 y S2 son las medias muestrales de dos poblaciones, denotadas
por X1, X 2 respectivamente, entonces la distribución muestral de la diferencia de
las medias está dada para poblaciones infinitas con media, y desviación típica
1, 1, 2 ,  2 respectivamente por:
Este resultado también es válido para poblaciones finitas si el muestreo es con
remplazamiento. La variable tipificada
En tal caso tiene casi una distribución normal si n1 y n2, son grandes (n1, n2 ≥ 30).
Resultados semejantes pueden obtenerse para poblaciones finitas en las que el
muestreo es sin remplazamiento
1
LUIS J. CASTILLO VÁSQUEZ
------------------------------------------------------------Resultados correspondientes pueden obtenerse para distribuciones muestrales de
diferencias de proporciones de dos poblaciones distribuidas binomialmente con
parámetros p1, q 1 y p2, q2 respectivamente. En este caso S1 y S2 corresponden a
las proporciones de éxitos P1, y P2 y las ecuaciones resultan ser:
En cambio de tomar diferencias de estadísticos algunas veces estamos
interesados en la suma de estadísticos. En tal caso la distribución muestral de la
suma de estadísticos S1 y S2 tiene media y desviación típica dada por
Suponiendo que las muestras son independientes.
PROBLEMAS DESARROLLADOS
1. Se identificaron dos poblaciones de alumnos del último ciclo de la Universidad
de Lima. La variable de interés en la investigación consistía en los puntajes
obtenidos en una prueba de rendimiento en Seminario de tesis que hicieron
los estudiantes de las dos poblaciones. Los investigadores suponían que los
puntajes de las dos poblaciones estaban distribuidos normalmente con las
siguientes medias y varianzas.
1  50 ,  12  40 ;
 2  40 ;  22  60
una m.a. de tamaño n1 = 10 se extrae de la población 1, y una de tamaño 12
de la población 2. ¿Cuál es la probabilidad de que la diferencia entre las
medias muestrales esté entre 5 y 15?
Solución: Datos
1  50
 2  40
 12  40
 22  60
n1  10
n2  12
2
LUIS J. CASTILLO VÁSQUEZ
-------------------------------------------------------------
P5  X 1  X 2  15




5  (50  40)  X 1  X 2   1   2  15  (50  40) 

P


2
2
40 60
40 60 


1




 2
10 12 
 10 12
n1 n2
P 1.67  Z  1.67  PZ  1.67  PZ  1.67
= 0.95257 – 0.04746
= 0.90508
2. Una muestra de 520 de los 5,000 empleados de una Compañía ha sido
tomada con el fin de determinar el tiempo empleado en ir y venir del trabajo.
Supóngase que la desviación estándar de esos tiempos es igual a 15 para
hombres y para mujeres. ¿Cuál es la probabilidad de que una diferencia de
más de 8 minutos, haya sido observada en las medias muestrales
X M  X m , si  M  m  5 y la muestra contiene 320 hombres y 200 mujeres
empleados?
Solución: Datos
 M2  (15) 2 ,  M  15 ,
nM  320 ,
 m2  (15) 2 ,
nm  200
P X M  X m
 m  15 ,


X M  X m    M   m  
 8  P 
 M2  m2



n M nm
M  m  5


85
  PZ  2.22
2
2 
15
15 

320 200 
= 1 – P[Z<2.22] = 1 – 0.98679 = 0.01321
3. La distribución de los salarios (en salarios mínimos) de obreros de sexo
masculino de una fábrica es N(5.4, 1.692), y del sexo femenino es N(4.5,
3
LUIS J. CASTILLO VÁSQUEZ
------------------------------------------------------------2.252).Se seleccionan dos muestras, una con 16 hombres y otra con 16
mujeres. Si D es la diferencia entre el salario medio de los hombres y de las
mujeres.
a) Calcule: P[| D |  0.5]
b) ¿Cuál es el valor de d tal que P[|D| > d
 = 0.05?
c) ¿Qué tamaño común debería tener ambas muestras para que
P[|D| > 0.4] = 0.05?
Solución:
a) P D  0.5
=
1  P D  0.5
=
1  P 0.5  D  0.5
=


 0.5  0.9
0.5  0.9
1  P
Z
2
2
 1.69
2.25
1.69 2 2.25 2



16
16
16
 16
=
1  P 1.99  Z  0.57
=
1  P(Z  0.57)  P(Z  1.99)
=
1  0.28434  0.0233
=
1  0.26104  0.73896
b) P[|D|>d]= 0.05
=1 – P[|D| < d] = 0.05
P[|D| < d] = 0.95
P[- d < D < d] = 0.95
4






LUIS J. CASTILLO VÁSQUEZ
-------------------------------------------------------------


 d  0.9
d  0.9
P
Z
 1.69 2 2.25 2
1.69 2 2.25 2



16
16
16
 16


d  0.9
P Z 

1.69 2 2.25 2


16
16

d  0.9
2
1.69
2.25

16
16
2


  0.95







 d  0.9
  P Z 


1.68 2 2  25 2



16
16


 1.96
 d  0.9
;
1.692 2.252

16
16


  0.95



 1.96
d - 0.9 = 1.3788  d = 2.2788
c)
P[-0.4 < D < 0.4] = 0.95


0.4  0.9
P Z 

1.69 2 2.25 2


n
n


0.4  0.9
1.692  2.252
n




  P  Z   0.4  0.9


1.89 2 2.25 2



n
n




  0.95



 1.96
 n = 121.68 = 122
4. Un antropólogo estima que los habitantes de la
Sierra tienen un índice cefálico
promedio de 80 con una desviación estándar de 3 y que los habitantes de la Costa
tienen un índice cefálico promedio y una desviación estándar de 75 y 2,
respectivamente. Supongamos que el antropólogo está en lo cierto. ¿Cuál es la
probabilidad entonces de que con una m. a. de 40 habitantes de la Sierra y con una
m. a. independiente de 50 habitantes de la costa se obtenga una diferencia entre las
dos medias muestrales superior o igual a 6?
5
LUIS J. CASTILLO VÁSQUEZ
-------------------------------------------------------------
Solución
µ s = 80
µc = 75
s = 3
σc = 2
ns = 40
nc 0 50




 ( X s  X c) 6  (80  75) 
P X s  X c   P 

 P( Z  1.81)  1  P( Z  1.81)  1  0.96485  0.03515
2
2
2
2 


3
2
s
c




 ns
40 50 
nc
5.
Los “ratings” de la televisión se basan en muestras que comúnmente
comprenden 500 televidentes, más o menos. Supongamos que los programas
A y B que trasmiten el canal 20 y el canal 30, tienen los ratings verdaderos de
30% y 35%, respectivamente. Se hace una encuesta sobre una m.a. de 500
casas con TV durante la transmisión del programa A y otra para el programa
B, de 500 casas también. ¿Cuál es la probabilidad de que los resultados
muestren que el programa B obtenga un rating más alto en este experimento?
SOLUCION
Datos:
n1=500
n2=500



P p 1 - p 20=1-P 



p1=0,35
p2=0,35
p1  p 2  ( p1  p2 )

p1 (1  p1 ) p2 (1  p2 )

n1
n2


0  0,05

0,3(0,7)  0,35(0,65) 


500

=1-P(z<-1,69)=1-0,04551=0,95449
6
LUIS J. CASTILLO VÁSQUEZ
------------------------------------------------------------6. Un antropólogo estima que los habitantes de la sierra tienen un índice cefálico
promedio de 80 con una desviación estándar de 3 y que los habitantes de la
costa tienen un índice cefálico promedio y una desviación estándar de 75 y 2,
respectivamente. Supongamos que el antropólogo esta en lo cierto. ¿Cuál es
la probabilidad entonces de que con una m.a. de 40 habitantes de la sierra y
con una m.a. independiente de 50 habitantes de la costa se obtenga una
diferencia entre las dos medias muéstralas superior o igual a 6.
SOLUCION
Datos:
1=80
1=3
2=75
2=2
n1=40
n2=50
PX1-X26=?
 X  X      

65
1
2
1
2


2
2

9 / 40  4 / 50 
1 / n 1   2 / n 2

PX1-X26=1-p 
PX1-X26=1-p(z1,81)=1-0,96485=0,03215
7.
Una muestra de 520 de los 5,000 empleados de una compañía ha sido
tomada con el, fin de determinar el tiempo empleado en ir y venir del
trabajo. Supóngase que la desviación estándar de esos tiempos es igual a
15 para hombres y para mujeres. ¿Cuál es la probabilidad de que una
diferencia de más de 8 minutos haya sido observada en las medias
muestrales X H - X M , si H-M=5 y la muestra contiene 320 hombres y 200
mujeres empleados?.
SOLUCION
Datos:
H-M=5
H=M=15
a)
P X H  X M 8=1-
nH=320
nM=200
 X H  X M      

85
H
M

P

2
2
2
2

 H / n H   M / nM
15 / 320  15 / 200 

P X H- X M8=1-P(Z2,22)=1-0,98679=0,01321
7
LUIS J. CASTILLO VÁSQUEZ
------------------------------------------------------------d  (5,4  4,5) 

pZ 
 =0,95
0,4962



d  0,4
=1,645
0,4962
d=1,216
b)
PXH-XM0,4=0,05
 X  X      
0,4  (5,4  4,5) 
2
1
2

1-0,5=p  1

12 / n 1   22 / n 2
1,3 2 / n  1,5 2 / n 

n =1,645
0,05
8.
 n=1082
Supongamos que X1 y X2 son medias de dos muestras de tamaño n
extraída de una población con varianza 2. Determine n de modo que con
probabilidad de 0,01, las dos medias muestrales difieren en mas de .
SOLUCION
Datos:
a)
1=X1
12 =2
2=X2
 22 =2
n1=n
n2=n
P X 1- X 2=0,01
 X 1  X 2   1   2 


 =0,01
= 1-P 

2
2
 2 / n 
 / n  / n

n=2,342(2)11
8
Descargar