Ejercicios de Modelos de Probabilidad

Anuncio
Ejercicios de Modelos de Probabilidad
Elisa M. Molanes-López, Depto. Estadı́stica, UC3M
Binomial, Geométrica, Exponencial, Uniforme y Normal
Ejercicio 1. En un canal de comunicación la probabilidad de error en la transmisión de un bit es
del 0,8 %. Sabiendo que los bits se empaquetan en bloques de información y la transmisión de cada
bit dentro del bloque es independiente del resto, se pide:
a) Calcule la probabilidad de que se produzca algún error en la transmisión de un bloque formado
por 1000 bits.
b) Calcule la probabilidad de que se produzcan menos de 15 errores en la transmisión de un
bloque de 1000 bits si sabemos que se observó algún error en la transmisión del bloque.
Solución: Sabemos que Pr(E) = 0,008, donde E denota el suceso ‘error en la transmisión de un
bit’.
a) Sea X la v.a. que cuenta el número de bits de un bloque de 1000 bits que se transmiten
erróneamente. Se tiene entonces que X sigue un modelo Binomial con parámetros n = 1000 y
p = 0,008.
Nos piden Pr(X ≥ 1). Por la propiedad del suceso contrario y usando la función de probabilidad del modelo binomial se concluye que:
1000
Pr(X ≥ 1) = 1 − Pr(X = 0) = 1 −
(0,008)0 (1 − 0,008)1000 = 1 − 0,000325 = 0,9997.
0
b) Nos piden la probabilidad condicionada siguiente Pr(X < 15|X ≥ 1). Se verifica que
Pr(X < 15|X ≥ 1) =
Pr(1 ≤ X ≤ 14)
Pr(1 ≤ X < 15)
=
.
Pr(X ≥ 1)
0,9997
Además,
Pr(1 ≤ X ≤ 14)
Pr(0,5 ≤ N (µ, σ) ≤ 14,5)
14,5 − µ
0,5 − µ
= Pr
≤ N (0, 1) ≤
,
σ
σ
=
donde estamos utilizando el hecho de que X al ser Binomial con n = 1000 > 30 y npq =
1000 × 0,008 × 0,992 = 7,936 > 5 se puede aproximar por un modelo Normal con media
µ = E[X] = np = 1000 × 0,008 = 8 y varianza σ 2 = V ar[X] = npq = 7,936. En consecuencia
se tiene que,
Pr(1 ≤ X ≤ 14)
=
Pr (−2,66 ≤ N (0, 1) ≤ 2,31) = FN (0,1) (2,31) − FN (0,1) (−2,66)
=
0,9896 − (1 − FN (0,1) (2,66)) = 0,9896 − 1 + 0,9961
=
0,9857 = 98,57 %.
De modo que Pr(X < 15|X ≥ 1) =
0,9857
0,9997
= 0,9860.
1
Ejercicio 2. Sea T la variable aleatoria ‘horas que un operario necesita para realizar una actividad
especı́fica en una cadena de producción’, que sigue un modelo exponencial con función de densidad
dada por
f (t) = 1,5 exp(−1,5t), t ∈ (0, ∞).
a) Suponiendo que el operario repite dicha actividad de forma independiente, determine el número medio de veces que consigue realizar dicha actividad en 2 horas y la probabilidad de que
en 2 horas consiga realizarla al menos 1 vez.
b) Calcule la función de distribución de T y el tiempo t0 que necesita invertir en dicha actividad
si sólo el 10 % de las veces que realiza dicha actividad necesita invertir más tiempo.
c) Calcule la probabilidad de que el tiempo empleado en realizar dicha actividad no supere la
hora y media.
d) Suponiendo que los operarios trabajan de forma independiente unos de otros, ¿cuál es la
probabilidad de que exactamente 2 de 10 operarios, inviertan más de hora y media en realizar
la actividad en cuestión?
Solución:
a) Sea X la v.a. que cuenta el número de veces que un operario consigue realizar dicha actividad
en 1 hora, y sea Y la v.a. que cuenta el número de veces que un operario consigue realizar
dicha actividad en 2 horas.
Se sabe que X se distribuye según una Poisson con parámetro λ1 = 1,5 actividades/h.
Por la reproductividad de la Poisson, entonces Y sigue un modelo de Poisson con parámetro
λ2 = 2λ1 = 3 actividades cada 2 horas.
Dado que en un modelo de Poisson su parámetro coincide con su media, se tiene que E[Y ] = 3.
Por otra parte, nos piden Pr(Y ≥ 1). Por la propiedad del suceso contrario y la función de
probabilidad de una Poisson se concluye que:
Pr(Y ≥ 1)
1 − Pr(Y < 1) = 1 − Pr(Y = 0)
exp(−λ)λ0
= 1 − e−3 = 0,9502 = 95,02 %.
= 1−
0!
=
b) Calculemos la distribución del tiempo exponencial T .
Z
FT (t)
=
t
Z
t
fT (y)dy =
1,5 exp(−1,5y)dy
0
=
0
y=t
− exp(−15y)]y=0
=
− exp(−1,5t) + exp(0) = 1 − exp(−1,5t),
t > 0.
Por otra parte, también nos piden el tiempo en horas t0 que verifica que FT (t0 ) = Pr(T ≤
t0 ) = 0,90 (equivalentemente, se tiene que Pr(T > t0 ) = 0,10).
De modo que, despejando t0 en 1 − exp(−1,5t0 ) = 0,90, se obtiene que:
exp(−1,5t0 ) = 0,10 ⇒ −1,5t0 = ln(0,10) ⇒ t0 =
2
− ln(0,10)
= 1,5351 horas.
1,5
c) Nos piden Pr(T ≤ 1,5), es decir, FT (1,5). Utilizando el apartado b) se obtiene que Pr(T ≤
1,5) = 1 − exp(−1,5 × 1,5) = 0,8946 = 89,46 %.
d) Sea Z la v.a. que cuenta el número de operarios, de un total de 10, que invierten más de 1,5
horas en realizar dicha actividad individualmente. Nos piden, Pr(Z = 2), donde Z sigue un
modelo Binomial con parámetros n = 10 (los diez operarios) y p = Pr(T > 1,5) = 1−0,8946 =
0,1054, la probabilidad de que un operario en concreto necesite más de hora y media para
realizar dicha actividad.
2
8
Entonces, se tiene que: Pr(Z = 2) = 10
2 (0,1054) (1 − 0,1054) = 0,2051 = 20,51 %.
Ejercicio 3. La v.a. T representa el tiempo en horas de las conexiones que un empleado realiza
a lo largo de una jornada laboral desde su puesto de trabajo a dominios de la red que no están
relacionados directamente con su trabajo, y tiene como función de densidad la función fT (t) =
3 exp(−3t), si t > 0. Si un empleado es ‘pillado’, según la polı́tica de la empresa se le sanciona con
una cantidad que asciende a Z = exp(T ) euros. Con estos datos, se pide:
a) Determine la densidad de la v.a. Z.
b) Calcule la probabilidad de que un sancionado tenga que pagar menos de 5 euros.
c) ¿Cuál es la probabilidad de que un empleado se encuentre más de media hora conectado a la
red ‘sin trabajar’ ?
d) Para evitar que los empleados se dediquen a malgastar sus horas de trabajo, el director de la
empresa decide controlar los accesos de 10 empleados elegidos al azar. ¿Cuál es la probabilidad
de que exactamente 7 de ellos dediquen más de media hora al dı́a a estar conectados a la red
‘sin trabajar’ ?
Solución:
a) Sea T las horas que dedica al ocio un empleado durante una jornada laboral, y sea Z la
sanción en euros que debe pagar dicho empleado si es pillado, v.a. que viene dada como una
transformación de la v.a. T de partida según la expresión Z = exp(T ).
Entonces se tiene que, z(t) = exp(t), t(z) = ln(z) y
dt(z)
dz
= z1 .
Además, dado que T toma valores en (0, ∞) se tiene que Z toma valores entre exp(0) = 1 y
exp(∞) = ∞, es decir Z toma valores en (1, ∞).
Dado que la transformación exponencial es derivable en inyectiva en (0, ∞), sabemos que la
función de densidad de Z viene dada por
dt(z) fZ (z) = fT (t(z)) dz 1
= 3 exp(−3 ln(z)) = 3(exp(ln(z)))−3 z −1 = 3z −4 , z ∈ (1, ∞).
z
b) Nos piden Pr(Z < 5 euros). Dado que Z es v.a. continua de la cual sabemos su densidad (por
el apartado anterior), se tiene que:
Z 5
Z 5
z=5
3
Pr(Z < 5) =
fZ (z)dz =
dz = − z −3 z=1
4
1
1 z
1
= −(5)−3 + (1)−3 = 1 − 3 = 0,9920.
5
3
c) Nos piden Pr(T > 0,5) = 1 − Pr(T ≤ 0,5). Dado que T es v.a. continua con densidad dada
por fT se tiene que:
Z 0,5
fT (t)dt
Pr(T ≤ 0,5) =
0
Z
=
0
=
0,5
t=0,5
3 exp(−3t)dt = − exp(−3t)]t=0
− exp(−3/2) + 1 = 0,7769.
Por lo tanto, la probabilidad pedida es Pr(T > 0,5) = 1 − 0,7769 = 0,2231.
d) Sea Y la v.a. que cuenta el número de empleados (de un total de n = 10) que dedican más de
media hora al ocio (es decir, T > 0,5h) durante la jornada laboral.
Se verifica que Y se distribuye según un modelo Binomial con parámetros n = 10 y p =
Pr(T > 0,5) = 0,2231.
Utilizando la función de probabilidad de este modelo, la probabilidad que nos piden Pr(Y = 7)
viene dada por:
10
(0,2231)7 (1 − 0,2231)3 = 0,0015 = 0,15 %.
Pr(Y = 7) =
7
Ejercicio 4. En unos grandes almacenes, el número X de devoluciones por hora que se producen en
una determinada sección sigue una Poisson. Sin embargo, se sabe que de 10h a 16h el número medio
de devoluciones a la hora es de 2 mientras que de 16h a 21h el número medio de devoluciones a la
hora es de 4. Nótese que se supone que el establecimiento permanece abierto ininterrumpidamente
desde las 10h a las 21h y que las devoluciones se producen de manera independiente a lo largo del
dı́a.
a) Calcule la probabilidad de que no se produzca ninguna devolución de 10h a 11h.
b) Calcule la probabilidad de que se produzcan no más de 30 devoluciones a lo largo de un dı́a
de trabajo.
Solución: Denotemos por X1 la v.a. que contabiliza el número de devoluciones por hora que se
producen en una determinada hora en la franja de 10h a 16h y denotemos por X2 la v.a. que
contabiliza el número de devoluciones por hora que se producen en una determinada hora en la
franja de 16h a 21h.
Dado que en un modelo de Poisson, su media y su parámetro coinciden, se tiene que X1 es Poisson
con λ1 = 2 y X2 es Poisson con λ2 = 4.
a) Nos piden Pr(X1 = 0). Utilizando la función de probabilidad de una Poisson con parámetro
2, se concluye que.
Pr(X1 = 0) =
exp(−λ)λk
e−2 20
=
= e−2 = 0,1353 = 13,53 %.
k!
0!
b) Sea Y la v.a. que cuenta el número de devoluciones que se producen a lo largo de un dı́a (es
decir, de 10h a 21h, durante el horario de apertura de dicho establecimiento).
Por la propiedad de independencia y la reproductividad de la Poisson se sabe que Y sigue una
Poisson con parámetro λ = 6 × 2 + 5 × 4 = 32, es decir, se producen por término medio 32
devoluciones al dı́a.
4
Nos piden la probabilidad del suceso {Y ≤ 30}, es decir, Pr(Y ≤ 30). Para calcular este valor
y dado que λ = 32, utilizaremos el hecho de que una v.a. de Poisson se puede aproximar por
un modelo Normal cuando el parámetro λ > 5. En concreto, Y ∼ N (µ, σ) donde µ = E[Y ] =
p
√
√
λ = 32 y σ = V ar(Y ) = λ = 32.
Utilizando el factor de correción de 0,5 unidades (dado que estamos aproximando un modelo
discreto a través de un modelo continuo), y estandarizando para expresar el suceso de interés
en términos de una Normal estándar (con media 0 y desviación tı́pica 1), se tiene que,
Pr(0 ≤ Y ≤ 30)
Pr(−0,5 ≤ N (µ, σ) ≤ 30,5)
−0,5 − 32
30,5 − 32
√
= Pr
N (0, 1) ≤ √
32
32
= Pr(−5,75 ≤ N (0, 1) ≤ −0,27)
=
=
Pr(N (0, 1) ≥ 0,27) − P r(N (0, 1) ≥ 5,75)
=
1 − Pr(N (0, 1) ≤ 0,27) − (1 − Pr(N (0, 1) ≤ 5,75))
=
1 − 0,6064 − (1 − 1) = 0,3936 = 39,36 %.
Ejercicio 5. Indique si las siguientes afirmaciones son verdaderas o falsas. Razone su respuesta.
a) El siguiente código en MATLAB/Octave devuelve para a un valor muy cercano a cero:
n=1000;
x=poissrnd(8,n,1);
y=(x>4);
a=sum(y)/n
b) El siguiente código en MATLAB/Octave aproxima por simulación el valor de E[exp(−X)],
siendo X un modelo Uniforme en (−1, 1):
n=1000;
u=rand(n,1);
x=2*u-1;
mux=sum(x)/n;
muy=exp(-mux)
Solución:
a) Esta afirmación es falsa.
Este código aproxima Pr(X > 4), siendo X una Poisson de parámetro λ = 8. Se sabe que el
valor teórico de esta probabilidad es igual a 1 − Pr(X = 0) − Pr(X = 1) − Pr(X = 2) − Pr(X =
3) − Pr(X = 4) = 0,9004.
b) Esta afirmación es falsa.
Este código devuelve exp(−E[X]) que no coincide con E[exp(−X)].
Ejercicio 6.
a) Complete el siguiente código en MATLAB/Octave para aproximar Pr(X > 0,1), donde X
denota una v.a. continua con densidad fX (x) = 3x2 , si x ∈ (0, 1).
5
n = 10000;
u = rand(n,1);
x = ........... ;
cond = (x ........... );
p = sum(cond)/n
b) Indique la veracidad o falsedad de la siguiente afirmación y razone su respuesta.
‘Sea X una v.a. que se distribuye según un modelo uniforme continuo en el intervalo (0, 1)
y sea Y = exp(X 2 ) una transformación de X, entonces Y es una v.a. continua con densidad
√
dada por fY (y) = (2y ln y)−1 si y ∈ (1, e).’
Solución:
a) Dado que X tiene densidad dada por fX (x) = 3x2 , si x ∈ (0, 1), entonces su función de
distribución viene dada por:
Z x
Z x
FX (x) =
fX (y)dy =
3y 2 dy = x3 , x ∈ (0, 1).
0
0
Utilizando el método de la transformación inversa para generar valores de X, debemos resolver
en x la ecuación FX (x) = u, donde u denota un número uniformemente distribuido entre (0, 1).
De modo que, x = u1/3 .
Por lo tanto las dos lineas de código que faltan serı́an:
x = u.^(1/3);
cond = (x > 0.1);
b) Esta afirmación es verdadera. Veámoslo a continuación.
Dado que X se distribuye según un modelo uniforme continuo en (0, 1) se tiene que fX (x) = 1,
si x ∈ (0, 1).
Consideremos la transformación g(x) = exp(x2 ). Se verifica que g(x) es derivable en (0, 1)
por tratarse de una composición de funciones derivables en (0, 1) (la exponencial y la función
cuadrática) e inyectiva en (0, 1).
De modo que la función de densidad de Y = g(X) viene dada por la expresión:
dx(y) ,
fY (y) = fX (x(y)) dy p
−0,5 −1
y y, dado que X toma valores entre 0 y 1, la
donde x(y) = ln(y), dx(y)
dy = 0,5(ln(y))
v.a. Y toma valores en el intervalo (g(0) = 1, g(1) = e).
En conclusión se tiene que:
fY (y) =
1
p
,
2y ln(y)
y ∈ (1, e).
Ejercicio 7. Una empresa de telefonı́a móvil cobra a sus clientes 0,25 euros por cada minuto
de conversación. Si X denota ‘el tiempo (en minutos) que una persona invierte en cada llamada
realizada desde su móvil’, la compañı́a le cobrará lo mismo (1,25 euros) si habla 5 minutos que 4,15
minutos. Se sabe además que X se puede modelizar a través de una exponencial con media 125
segundos.
6
a) Considere la v.a. Y = [X] + 1, donde [x] denota la parte entera de x ∈ <. Compruebe que
dicha variable sigue una distribución Geométrica e identifique su parámetro p.
b) Escriba el coste en función de Y y determine el coste medio por llamada.
c) Ante la queja de algunos clientes, el director de la compañı́a se plantea cobrar por el tiempo
exacto X que dure la llamada. Con esta estrategia se pretende ser más justo, pero sin que eso
conlleve el tener una ganancia media por llamada inferior a la de antes. Determine cuál debe
ser el coste por minuto que el encargado deberá cobrar para que esto ası́ suceda.
d) Indique qué devuelve el siguiente código en MATLAB/Octave:
n=100000;
lambda=0.48;
u=rand(n,1);
t=-log(1-u)/lambda;
prob=sum(0<t & t<1)/n
Solución: Se sabe que X sigue un modelo Exponencial con media E[X] = 125/60 min. De modo
que su parámetro será:
1
= 60/125 = 0,48 min−1 .
λ=
E[X]
Además, se sabe que el coste es una v.a. discreta porque los valores que toma son {0,25, 0,50, 0,75, . . .},
un conjunto infinito numerable.
a) Dado que Y = [X] + 1, para comprobar que sigue un modelo Geométrico, lo primero que
debemos hacer es comprobar que sus posibles valores coinciden con los de dicho modelo. En
efecto ası́ sucede puesto que cuando X ∈ (0, 1) entonces Y = 0 + 1 = 1, cuando X ∈ [1, 2)
entonces Y = 1 + 1 = 2, y ası́ sucesivamente. Por lo tanto se ve que Y toma valores en
{1, 2, 3, . . .}.
En segundo lugar debemos tratar de demostrar que la función de probabilidad de Y se puede
escribir como la de un modelo Geométrico, es decir, que Pr(Y = k) = p(1 − p)k−1 , para un
determinado p, con k ∈ {1, 2, 3, . . .}. En efecto, esto también se verifica porque cuando Y = k
eso significa que X ∈ [k − 1, k) y entonces se tiene que:
Z
Pr(Y = k)
k
=
Z
k
f (x)dx =
k−1
λ exp(−λx)dx
k−1
−0,48(k−1)
= − exp(−λx)]x=k
− e−0,48k = e−0,48(k−1) (1 − e−0,48 )
x=k−1 = e
=
(e−0,48 )k−1 × (1 − e−0,48 ) = (1 − e−0,48 ) × (1 − (1 − e−0,48 ))k−1 .
De modo que denotando p = 1 − e−0,48 = 0,3812 se puede concluir que Y sigue un modelo
Geométrico con parámetro p = 0,3812.
b) El coste C se puede escribir en función de Y como C = 0,25 × Y . Además E[C] = 0,25E[Y ].
Como Y es Geométrica de parámetro p = 0,3812, sabemos que su media es E[Y ] = 1/p =
1/0,3812. En consecuencia se concluye que:
E[C] = 0,25E[Y ] = 0,25/0,3812 = 0,6558 euros.
7
c) Debemos buscar la tarifa t0 de modo que el nuevo coste D sea tal que D = t0 × X y E[D] ≥
E[C] = 0,6558. Sabiendo que E[X] = 125/60, se puede concluir que:
E[D] = t0 × 125/60 ≥ 0,6558,
lo que implica que t0 ≥ 60×0,6558/125 = 0,3148. Es decir, la tarifa actual debe ser t0 = 0,3148
euros/min, lo que significa que si una persona habla 4.15 minutos ahora se le cobrará por
exactamente ese tiempo y el coste de su llamada será 0,3148 × 4,15 = 1,30645 ≈ 1,31 euros.
En cambio, si una persona habla exactamente 5 minutos ahora se le cobrará 0,3148×5 = 1,574
euros. Como vemos, con el nuevo sistema de tarifas, el coste es más justo, en el sentido de que
se le cobra más a la persona que más habla. Sin embargo, con este nuevo sistema estas dos
personas han salido perdiendo pues antes sólo se les cobraba 1.25 euros. Los usuarios que sı́ se
beneficiarán de la nueva tarifa serán aquellos que hablen menos de 0,25/0,3148 = 0,7942 min.
d) Este código en MATLAB/Octave devuelve la probabilidad de que una llamada dure menos
de 1 minuto (X < 1), lo cual coincide con la probabilidad de que Y = 1, es decir coincide con
p = 0,3812.
8
Descargar