1. DISTRIBUCIONES CONOCIDAS PARA MUESTRAS PEQUEÑAS

Anuncio
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
1. DISTRIBUCIONES CONOCIDAS PARA MUESTRAS PEQUEÑAS
La estadística dispone de otras variables aleatorias con distribuciones conocidas
cuando el tamaño de muestra es pequeña; es decir, cuando no se puede aplicar el TLC.
Estas distribuciones son:
χ² : La distribución Chi – cuadrado
t : La distribución t de Student
F : La distribución F de Fisher
Haremos un estudio muy breve de cada una de ellas y emplearemos el Minitab para
resolver problemas de probabilidad; y más tarde volveremos a tratarlas en más detalle.
PROPIEDADES DE ESTAS VARIABLES
Distribución Chi – Cuadrado: χ²
P1. Si X  χ² (n) entonces µ = n
y σ = 2n ; donde n representa grados de libertad
P2. Si Z1, Z2, …, Zn son tales que Z1  N(0, 1) entonces T =
 X  X 
V
2
(n  1)s ²
P3. Si V 
²
o
²
Z 2
i
 χ² (n)
entonces V  
2
( n 1)
Distribución t de Student
P1. Si X  t(n) entonces µ = 0
libertad
P2. Si Z  N (0,1);V 
P3. Z 
X 

Ilmer Cóndor
2
( n)
X 
s
n
donde n representa grados de
entonces la variable T definida como T 
 N (0,1) y V 
n
P4. Si T 

y σ = n/(n-2)
2
(n  1) s ²

entonces T 
( n 1)
²
Z
  (n)
V
n
Z
  (n  1)
V
n 1
entonces T   (n  1)
Página 1 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Distribución F de Fisher
P1. Si X  F(m, n) entonces µ = n /(n-2) y σ = [2n(n+m-2)] /[ m(n-2)²(n-4)]
donde n representa los grados de librertad del numerador y m los grados de libertad
del denominador.
P2. Si U  
2
(m )
y
Si V  
P3. X i  N (  , 1 )
2
1
y
2
(n )
entonces F 
U /m
 F (m, n)
V /n
Yi  N (  , 2) entonces F 
2
2
s12 /  12
 F (n1  1, n2  1)
s 23 /  22
A continuación resolveremos algunos EJERCICIOS referidos a estas variables:
NOTA:
DESARROLLE LOS EJERCICIOS QUE ESTÁN EN AZUL
01. Para una variable aleatoria X, con distribución Chi-Cuadrado con 15 gl, encuentre:
a) P(X < 3.89)
b) P(X > 12.495 )
c) P( 1.58 < X < 10 )
02. Para una distribución Chi-Cuadrado, encuentre el valor de a, en cada caso:
a) P( 
2
(8)
 a)  0.95
b) P(

2
(10 )
 a)  0.5 c) P( 
2
(18)
 a)  0.99
03. Para una v.a. X con distribución t de Student con 20 grados de libertad, encuentre:
a) P(X < -1.594)
b) P(X > 2.49)
c) P(-1.58<X<1)
d) P(|X| > 1.89 )
04. Para una distribución t de Student, encuentre el valor de a en cada caso:
a) P(t(10) > a) = 0.025 b) P( t(15) > a ) = 0.10
c) P(1.476 < t(5) < a ) = 0.075
05. Para una v.a. X con distribución F, con 5 grados de libertad en el numerador y 8
grados de libertad en el denominador, encuentre
a) P(X < 2.86)
b) P(X > 0.875)
c) P(0.25<X<3.84) d) P(|X|<5)
06. Para una distribución F, encuentre el valor de a, en cada caso:
a) P(F(12,9) < a)= 0.4785 b) P(F(14,16) > a)=0.2475 c)P(2< F(21,19) < a)=0.9584
07. Para cada uno de los siguientes casos, hallar la probabilidad correspondiente:

2
a)
Si X 
b)
c)
Si X  t(9), hallar P(X  1.1), P(-0.703  X  4.297 ) , P( X  -2.398)
Si X  t(6), hallar c tal que P(X > c) = 0.10
Ilmer Cóndor
(17 )
, hallara a y b tal que P( a < X < b ) = 0.88 y P( X > b ) = 0.02
Página 2 de 18
UNIVERSIDAD DE LIMA
d)
e)
ESCUELA DE NEGOCIOS
Si X  F(4,5), hallar P(X  5.19 ) , P( 3.52  X  15.56) , P(X  7.39)
Si X  F(2,3), hallar c de tal manera que P( X  c ) = 0.05
08. Si X es una variable aleatoria con distribución Chi – Cuadrado con 23 grados de
libertad, calcular a y b tal que P(a < X < b ) = 0.95 y P(X < a) = 0.05
09. Abra el archivo Grafica de Chi-t-F.xls. Observe la forma de la gráfica de cada una de
las distribuciones. Modifique el valor de los parámetros de las distribuciones Chi –
Cuadrado y t de Student y observe cuándo su comportamiento es aproximadamente
normal.
Modifique los valores de los grados de libertad y observe la gráfica resultante
Tarea 01
Escriba en la hoja que se les ha distribuido su comentario respecto a las gráficas.
10. Tomando en cuenta las gráficas que se muestran en el archivo del ejercicio anterior,
¿cuál de estas distribuciones es simétrica respecto al eje Y? ¿En cuál de estas
distribuciones se puede aplicar las propiedades de la distribución acumulada:
a) F(-k) = P(Z ≤ -k ) = P(Z > k) = 1- P(Z ≤ k ) = 1 – F(k)
b) P(-k ≤ Z ≤ z ) = 2 F(k) -1
11. Sean X, Y, W, U variables aleatorias independientes tales que X  N(40, 25);
Y  χ² (10); W  χ² (5); U  t(7). Hallar el valor de k tal que:
a)
P[ (X-40)² > k ] = 0.10
Como X  N(40, 25), al dividir la expresión entre 25 obtenemos
( X  40)² k
k
 X  40 
P[
 ]  0.10 de donde P[
  ]  0.10
25
25
25
 5 
2
La expresión del primer miembro es Z² lo cual, según la propiedad 2 de χ² se
distribuye χ² con un grado de libertad. Por tanto P(χ² (1) > k/25 ) =.10
De donde P(χ² ≤ k/25 ) = 0.90
Usando Inverse de Minitab encontramos: k = ……….
b) P(k < W + Y < 27.488 ) = 0.95
En este caso las W e Y tienen distribución χ² y como son dos variables, el número
de grados es de libertad es 2. Luego P( k < χ² (2) < 27.488 ) = 0.95
Usando Minitab, encontramos k = ………..
Ilmer Cóndor
Página 3 de 18
UNIVERSIDAD DE LIMA
c)
P(
ESCUELA DE NEGOCIOS
W
 k ) = 0.90
Y
Qué variable se genera al dividir dos variables χ² ? ………………
d)
P( | U | > k ) = 0.20
2. DISTRIBUCIÓN MUESTRAL DE MEDIAS
TEOREMA DE LA MEDIA MUESTRAL DE MEDIAS ( X )
Sea X1, X2, ..., Xn es un conjunto de variables aleatorias independientes que
conforman una muestra aleatoria de tamaño n , tomadas con reposición, a partir de
una población X con   E[X ] y V [ X ]   2 y donde todas las Xi tienen la misma
distribución, por provenir de la misma población, es decir E[Xi] = i =  y V[Xi] =
 i2 = ².
Si X es el estadístico denominado Media Muestral de Medias Muestrales,
entonces su distribución es aproximadamente normal con
E[X ]  
V[X ] 
2
n
Y si, aplicando el Teorema del Limite Central, definimos
Z
una nueva variable
X  E[ X ]
, entonces Z  N(0, 1).
V[ X ]
Comentarios
1. Otra forma de definir Z, la forma usual o práctica es Z 
X 

n
2. Se puede verificar que
  Xi  1
1
1
1
  E  X i    E[ X i ]     n  
E[ X ]  E 

n
n
n
 n  n
Ilmer Cóndor
Página 4 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Igualmente
  Xi 
1
1
n 2  2
]  2  V [ X i ]  2   2  2 
V [ X ]  V [

n
n
n
n
 n 
3. Si la distribución de X es normal, por la propiedad reproductiva de la normal 1,
S  X tendrá también distribución normal N(   ,
i

2
i
).
4. Si la distribución de X no es normal, deberemos aplicar el Teorema del Limite
Central, mediante el cual, X tendrá distribución normal N(, ²/n).
5. Finalmente, será suficiente que n  30 para aplicar el Teorema del Limite Central y
resolver el problema usando la tabla de la distribución normal N(0, 1).
Teorema
Sea X1, X2, ..., Xn es un conjunto de variables aleatorias independientes que
conforman una muestra aleatoria de tamaño n , tomadas sin reposición, a partir de una
población X con   E[X ] y V [ X ]   2 y donde todas las Xi tienen la misma
distribución por provenir de la misma población, es decir E[Xi] = i =  y V[Xi] =
 i2 = ². Si X es el estadístico denominado Media Muestral de Medias Muestrales,
entonces su distribución es aproximadamente normal con
E[X ]  
V[X ] 
2 N n
n N 1
Y cuando n ≥ 30, podemos aplicar el TLC anterior.
Comentarios:
1. Esto quiere decir que, toda vez que el muestreo se realice sin reposición, deberá
usarse este Teorema del Limite Central.
2. Si el tamaño poblacional no fuera conocido, se asumirá infinito, en cuyo caso, se
aplicará el modelo de muestreo con reposición.
1
Esta propiedad afirma que si un conjunto de variables Xi tienen una determinada distribución de
probabilidad conocida, y se define a otra variable, digamos T tal que T = X1 + X2 + ...+ Xn entonces la nueva
variable T, tendrá también la misma distribución con T=  1 +  2+ ...+  n y ² T = ² 1 +  2² + ... +  n²
Ilmer Cóndor
Página 5 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Ejemplo 1
Una empresa de inversiones coloca diariamente importantes sumas de dinero en
acciones de bolsa, las cuales siguen una distribución normal. Si el monto promedio de
colocación diaria es de $ 7012, con una desviación estándar de $ 540, y
a) si se elige aleatoriamente una determinada colocación de dinero, ¿cuál es la
probabilidad de que el monto colocado en la bolsa en un día, sea superior a $ 6911?
b) si se elige al azar una muestra de 36 colocaciones, ¿cuál es la probabilidad de que la
media de la muestra, sea superior a $ 6911?
c) ¿Por qué la probabilidad en b) es mayor que en a)?
Solución
Sea X la variable aleatoria poblacional definida como “Monto de dinero que
representa una colocación”.
Según el problema:  = 7012 y  = 540; igualmente X  N(7012, 532²)
a) Usando la distribución normal N(0, 1), tenemos
P( X  6911)  1  P( X  6911)  1  P(Z  ...............)  1  (0.187)  0.5732
Ahora use Minitab para encontrar esta probabilidad sin pasar a N(0, 1).
b) Si X es la media muestral de medias en una muestra de tamaño n = 36, entonces
E[ X ]= …………
y X 
X
n
 .............
P( X  6911)  1  P( X  6911)  ................  0.8686
En Minitab encuentre esta probabilidad sin pasar a N(0, 1).
En Excel use
P( X  6911)  1  P( X  6911)  1  Distr.Norm(6911,7012,90,1)  .................
c) La siguiente figura muestra la gráfica de las dos variables X y X .
Ilmer Cóndor
Página 6 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Se puede apreciar que el área naranja es la probabilidad P( X  6911) que, cubre casi
toda la campana de Gauss, muy próximo a uno; en cambio la P(X > 6911) cubre
menor área bajo la curva del otro color. Por otro lado, siendo la varianza poblacional
mayor que el de la media, los datos están más dispersos.
Ejemplo 2
Una máquina que produce empaques de leche está regulada para producir paquetes
cuyo peso se distribuye normalmente con una media de 500 gramos y una desviación
estándar de 10 gramos. Se sabe también que a veces la máquina se desajusta, y cuando
ello sucede lo único que se altera es el peso promedio, manteniéndose constante su
variabilidad. Para mantener la producción bajo control, se selecciona una muestra de
110 bolsas y luego se pesa. Cuál será la probabilidad de que el peso promedio difiera
del promedio de la producción en menos de 2 gramos?
Solución
Según los datos: X: Peso de los paquetes de leche. X  N(……, ……); n = ………
Cómo se puede expresar: El peso promedio de la muestra difiera del peso promedio de
la producción en menos de 2 gramos?: …………………………………….
Según esto debemos hallar: P( | …………… | > …….)
P( | …………… | > …….) = ……………………………
Ilmer Cóndor
Página 7 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Ejercicio 1
Calcular la media y varianza de la variable aleatoria X que se distribuye como una
normal, si se sabe que P( X < 6 ) = 0.0228
y
P( X > 8 ) = 0.8413
y además
que la media muestral corresponde a una muestra de tamaño 4.
Sugerencia:
Estás obligado a pasar a N(0, 1) en ambos casos. Cómo así? Restas la media µ a
ambos miembros y divides entre σ; así obtendrás P(
significa que se tiene P( Z 
6

X 


6

)  0.0228 esto
)  0.0228
Ahora usando la opción <Inverse> de Minitab obtendrás una ecuación con µ y σ.
Usando el otro dato, obtendrás la segunda ecuación, que al resolverlo obtendrás µ y σ.
Ejemplo 3
Un investigador de mercado desea estimar la media poblacional utilizando muestras
extraídas aleatoriamente, suficientemente grandes de tal manera que la probabilidad de
que la media muestral no difiera de la media poblacional en más del 25% de la
desviación estándar, sea de 0.95. Qué tamaño de muestra debe adoptar para
seleccionar la muestra, si ésta se hace sin reposición sobre poblaciones muy grandes?.
Solución
Sea X la variable definida sobre la población, de tamaño N cuya distribución se define
por  y ² como su media y varianza poblacional, respectivamente.
Sea X la media muestral de medias en una muestra de tamaño n, donde
X  X
y X 
X
n
.
De acuerdo a los datos del problema tenemos
P( | X   X |  0.25 X )  0.95
P( ................. X   X  ............. )  0.95
Ilmer Cóndor
Página 8 de 18
UNIVERSIDAD DE LIMA
Dividiendo entre
P(

n
ESCUELA DE NEGOCIOS
, que es la desviación de X , para obtener Z, tenemos
 0.25 X   X 0.25


)  P(0.25 n  Z  0.25 n )  0.95
1
1
1
n
n
n
Usando la tabla N(0, 1) tenemos 2(0.25 n )  1  0.95 de donde n = 61.4656.
Ejemplo 4
En la inspección de cierto tipo de piezas con fallas se sabe que el costo de inspección
de cada una es equivalente a 100 veces su longitud. Si la longitud de una pieza tiene
una distribución normal con una media de 12 mm y una desviación estándar de 0.2
mm, ¿cuál es la probabilidad de que el costo promedio diario de la inspección sea
mayor que $ 1220, si al día se inspecciona 4 piezas?
Solución
Sea X la longitud de una pieza. X  N( 12, 0.2² )
Como el costo es 100 veces la longitud, si Y es el costo, entonces Y = 100X
Según esto, el costo promedio Y lo obtenemos dividiendo a la ecuación Y = 100X
entre 4 (n = 4) obtenemos Y = 100 X
Luego P( Y > 1220) = P( 100 X > 1220) = P( X > 12.20) = 1- P( X ≤ 12.20) = ……..
Ejercicio 2
La gerencia general de una cadena de supermercados contempla la posibilidad de abrir
una tienda en cierta zona de la ciudad. Para esto realiza un muestreo y decide que
abrirá la tienda si el gasto promedio muestral de consumo por hogar es superior a S/.
1000. La decisión se tomará en base a una encuesta aplicada a 200 hogares de la zona.
Si como resultado de la encuesta se obtiene que el gasto de consumo por hogar tiene
una desviación estándar de S/. 520, ¿Cuál será la probabilidad de que se decida abrir la
Ilmer Cóndor
Página 9 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
tienda, si se sabe de estudios anteriores que el gasto promedio de consumo por hogar
de la ciudad es de S/. 1100?
Nota:
Resuelva los siguientes problemas y compare su solución con lo que se da en la página
55 del archivo Teoría de muestreo y distribuciones muestrales.doc.
TAREA 2
El promedio de las notas de los estudiantes de un Instituto de Idiomas es una variable
aleatoria con  = 62 y  = 60. Si se desea tomar una muestra, ¿qué tan grande debe
ser su tamaño si la probabilidad de que el promedio de las notas sea inferior a 60, debe
ser 0.1?
Ejercicio 3
Un agente de bolsa dispone de 5 acciones a ser negociadas en un día determinada.
Cada acción tiene igual probabilidad de ser seleccionada para su venta; es decir, la
función de probabilidad es p(x) = 1/5. Construya una distribución muestral de medias
tomando como muestras aleatorias de tamaño 2. con y sin reposición. Luego compare
los resultados con la media y varianzas poblacionales.
a) Use el mismo procedimiento expuesto en la página 214 del Libro Distribuciones y
Estadística Inferencial de Celestino García Oré (519.2 / G25D / 1988).
3. DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
DEFINICION
Sea X una variable población que representa el número de éxitos en la ocurrencia de
un evento determinado. Supongamos que se extrae una muestra aleatoria de tamaño n.
Ilmer Cóndor
Página 10 de 18
UNIVERSIDAD DE LIMA
Diremos que
p
X
n
ESCUELA DE NEGOCIOS
es la proporción de éxitos (proporción de veces que ocurre
un evento determinado) en la muestra, la que representa una proporción muestral.
Usando los
mismos criterios analizados para concluir que X
es una variable
aleatoria muestral, podemos decir que p es una variable aleatoria muestral definida
como la proporción muestral de proporciones cuya distribución de probabilidades
viene expresada por E[ p ] = p
y V[ p ] =
p (1  p ) 2
.
p
Por otro lado, si el muestreo se realiza sin reposición, la población ya no es Binomial;
en este caso X se dice que tiene una distribución Hipergeométrica con parámetros ( N,
r, n) donde E[ X ]  np
y V [ X ]  np (1  p)
N n
N 1
En este caso
E[ p]  p y
V [ p]  V [
X
1
1
N  n p(1  p) N  n
]  2 V [ X ]  2 np (1  p)

n
n
n
N 1
n
N 1
En consecuencia podemos plantear el siguiente teorema
2
Evaluemos E[ p ] y V[ p ].
E[ p]  E[
X
1
np
]  E[ X ] 
 p
n
n
n
(Recuerde que X es binomial con E[X] = np )
Del mismo modo
V [ p]  V [
Ilmer Cóndor
X
1
1
p(1  p)
]  2 V [ X ]  2 np (1  p) 
n
n
n
n
Página 11 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
TEOREMA DE LA PROPORCION MUESTRAL DE PROPORCIONES (
p)
Supongamos que se tiene una muestra aleatoria de tamaño n, extraída de una
población de tamaño N, con reposición, en donde cada elemento se clasifica como
éxito o fracaso. Si se define a X como el número de éxitos en la muestra y
p
representa la proporción de éxitos en la muestra, entonces p es una variable muestral
cuya distribución de probabilidad viene definida mediante
E[ p]  p
y
V [ p] 
p(1  p)
donde “p” representa la proporción de éxitos en la
n
población.
Si el tamaño de la muestra es suficientemente grande, entonces
Z
p  E[ p]
es tal que Z  N(0, 1).
V [ p]
Comentarios
1. Muchas veces se usa  en lugar de p para representar la proporción de éxitos en la
población.
2. Otra forma de definir Z, la forma usual o práctica, es Z 
p p
p(1. p)
n
3. Si el tamaño de muestra es pequeño se debe usar el factor de corrección por
continuidad
FCC 
1
, la cual se deriva a partir del factor de corrección en la aproximación
2n
binomial por normal, que es ½.
4. De manera que usando el factor de corrección, tendremos
P( P ( p  p0 )  P ( Z 
Ilmer Cóndor
1
p
2n
)
p (1  p )
n
p0 
Página 12 de 18
UNIVERSIDAD DE LIMA
P ( p  p0 )  P ( Z 
P ( p0  p  p1 )  P(
ESCUELA DE NEGOCIOS
1
p
2n
)
p (1  p )
n
p0 
1
p
2n
p (1  p )
n
p0 
 Z

1
p
2n
)
p (1  p )
n
p1 
5. Si se desconoce el tamaño poblacional, se asumirá que es infinita.
Nota:
No se olvide de usar E[ X ]  np
y V [ X ]  np (1  p)
N n
si el muestreo se hace
N 1
sin reposición.
Ejemplo 5
Al reparar un cierto tipo de máquina empacadora ocasionalmente ocurre una
complicación que requiere asistencia técnica exterior. Se desea estimar la proporción
de trabajos de reparación que requieren asistencia técnica exterior, basándose en una
muestra aleatoria simple de 100 trabajos de reparación terminada recientemente.
Suponga que en realidad se requiere asistencia técnica exterior en un 15% de los
trabajos de reparación; esto es, que la proporción del proceso es de 0.15.
a) ¿Cuál es la media y desviación estándar de la distribución muestral de p ?
b) ¿Cuál es la probabilidad de que p esté en un intervalo (-0.05, 0.05) centrado en la
proporción del proceso? ¿Qué p esté entre 0.12 y 0.20?
c) Dentro de qué intervalo caerá la proporción de la muestra el 90% de las veces?. Use
límites simétricos alrededor de la proporción del proceso.
d) ¿Cuál es el intervalo que le corresponde a la parte c) para una muestra aleatoria
simple de 400 trabajos? Qué efecto tiene el incremento en el tamaño de la muestra?
Ilmer Cóndor
Página 13 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
e) Para una muestra de tamaño dado, ¿es la distribución muestral de p más variable si
p está cerca de 0? Si p está cerca de 0.5? Si estuviera cerca de 1?
Solución
Si p = 0.15 representa la proporción de veces que se requiere asistencia técnica y
Sea n = 100, tamaño de la muestra.
Defina a p : .................................................
Entonces
 p  E[ p]  ...........
a)
p 
V [ p] 
................  ........................
b) “estar p en (-0.05, 0.05), centrado en la p” significa que | p - p |  0.05
Luego
P(| p  p |  0.05)  P(0.05  p  p  0.05)
Usando el factor de corrección por continuidad y pasando a Z, tenemos
P(
 0.05  1200
0.035707
Z
0.05  1200
)  (1.54)  (1.54)  0.8764
0.035707
En cuanto a la segunda parte de la pregunta tenemos
P(0.12  p  p  0.20) 
P(
0.12  1200
0.20  1200
Z
)  (1.54)  (0.98)  0.7747
0.035707
0.035707
c) Supongamos que el intervalo donde debe caer p es (-r, r), supuesto simétrico y
que esté centrado alrededor de la proporción del proceso, p (sin considerar el FCC).
Entonces
P(r  p  p  r )  P(
r
r
r
Z
)  2(
)  1  0.90 3
0.035707
0.035707
0.035707
Usando <Inverse> en Normal de Minitab, obtenemos Z = 1.645 e igualando a
r/0.035707, tenemos
3
Aquí hemos usado la propiedad P(-K ≤ X ≤ K ) = 2 F(K) – 1 cuando X  N(μ, σ² ).
Ilmer Cóndor
Página 14 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
r = 0.035707x(1.645) = 0.058738
Esto significa que
- 0.058738  p - p  0.058738 por lo que al despejar p y
reemplazamos a p con su valor, encontramos el intervalo de variación de p que es
( .............., ................)
d) Si ahora el tamaño de la muestra es de 400 entonces sólo se modificará la
desviación estándar de p ; esto es,  p 
V [ p] 
0.15(0.85)
 0.01785
400
Luego r = 0.01785x(1.645) = 0.02937
Con lo cual el intervalo pedido será ( 0.1206, 0.1794)
Comentario:
La longitud del intervalo en c) es 0.1175. La longitud del intervalo en d) es 0.0588.
Esto indica que cuanto mayor sea el tamaño de muestra menor será la dispersión de
los datos; es decir, la proporción muestral, p , estará más cerca de p.
e) La variabilidad de una variable aleatoria se mide analizando el valor de su varianza,
entre otras formas. Cuanto mayor sea su varianza, mayor variación(o dispersión)
presentará la variable respecto a su valor central. Por otro lado, como la varianza de
p(1  p)
entonces,
n
p se define por V [ p] 
Si p = 0.1

V [ p] 
(0.1)( 0.9)
 0.09
n
Si p = 0.3

V [ p] 
(0.3)( 0.7)
 0.21
n
Si p = 0.8 
Si p = 0.5

V [ p] 
(0.8)( 0.2)
 0.16
n
V [ p] 
(0.5)( 0.5)
 0.25
n
De manera que p tendrá mayor variabilidad cuando p = 0.5. Es este valor que se
deberá usar cuando no se conozca la proporcional poblacional.
Ilmer Cóndor
Página 15 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Ejemplo 6
En la facultad de Administración de la Universidad, el 40% de los estudiantes son
mujeres. Se desea hacer un estudio sobre la participación de los estudiantes en las
actividades académicas y culturales de la facultad. ¿Cuál será la probabilidad de que
en una muestra de 100 alumnos se encuentre más de 35% pero menos de 45% de
mujeres?
Solución
Según el problema: π = …….; n = ………..;
Al hablar de muestra, el porcentaje al que se hace referencia es p , la proporción de la
muestra.
Qué se pide? P(……………………….)
Encuentre primero

p
y

p
Luego usando Minitab encuentre P( 0.35 ≤ p ≤ 0.45 )
TAREA 3
Un proceso para llenar botellas de cerveza presenta una producción promedio en la
que el 10% no están completamente llenas. Si mediante este proceso de selección al
azar se toma una muestra de 225 botellas de un lote de 625 envases llenos, ¿Cuál será
la probabilidad de que la proporción muestral de botellas parcialmente llenas se
encuentre entre 9% y 11%?
Ejemplo 7
Una agencia de publicidad realiza una encuesta a los agentes de compras de 250
compañías industriales. Los resultados indican que el 25% de los compradores
reportaron niveles más altos de nuevos pedidos en Enero de 1998, que en los dos
Ilmer Cóndor
Página 16 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
meses anteriores. Suponga que los 250 agentes de la muestra representan una muestra
aleatoria de los agentes de compras de las compañías del país.
a) Describa la distribución muestral de
p , definida como la distribución de
compradores del país con niveles más elevados de nuevos pedidos en Enero de
1998.
b) ¿Cuál es la probabilidad de que p difiera de p en más de 0.01?
Solución
a) Si se define a p , como la proporción muestral de compradores del país con niveles
más elevados de nuevos pedidos en Enero de 1998, entonces su distribución se
expresa mediante
 p  E[ p]  ...........
y
 p2  ........................  .............
b) La pregunta planteada la podemos expresar como
P( | ........... | > 0.01). Luego
P(| .............  0.01)  1  P(0.01  ................ 0.01)
 1  P(
 0.01  1 / 500
0.01  1 / 500
Z
)
3
3
4000
4000
 1  P(0.438  Z  0.292)  1  (0.6141 0.3308)  0.7167
Ejercicio 4
El presidente de Distribuidores S.A. cree que el 30% de los pedidos a su empresa
provienen de clientes nuevos. Se va a usar una muestra aleatoria simple de 100
empleados para comprobar lo que dice.
a) Suponga que el presidente está en lo correcto y que p = 0.30. ¿Cuál es la
distribución muestral de p para este estudio?
b) ¿Cuál es la probabilidad de que la proporción muestral esté a  0.5 o menos de la
proporción poblacional?
Ilmer Cóndor
Página 17 de 18
UNIVERSIDAD DE LIMA
ESCUELA DE NEGOCIOS
Ejercicio 5
Si bien la mayoría de las personas cree que el desayuno es el alimento más importante
del día, el 25% de los adultos no desayunan. Si para comprobar esta afirmación se
toma una muestra de 200 adultos,
a) ¿cuál es la probabilidad de que la proporción muestral quede a  0.03 o menos de la
proporción poblacional?
b) ¿cuál es la probabilidad si la proporción muestral difiere de la proporción
poblacional en a lo más 0.05?
TAREA 4
El gerente financiero de una gran empresa comercial desea contar con información
sobre la proporción de clientes a los que no les agrada su nueva política de gestión,
respecto al tratamiento de los cheques girados con cantidades por debajo de $ 500.
¿Cuántos clientes tendrá que incluir en una muestra si desea que la proporción de la
muestra se desvíe a lo más en 0.15 de la verdadera proporción, con una probabilidad
de 98%. Considere que para el gerente un cliente al que no le agrada la política
implementada posee las mismas características que un cliente al que sí le agrada
dichas políticas.
Ilmer Cóndor
Página 18 de 18
Descargar