Ejercicios de Modelos de Probabilidad Elisa M. Molanes-López, Depto. Estadı́stica, UC3M Binomial, Geométrica, Exponencial, Uniforme y Normal Ejercicio 1. En un canal de comunicación la probabilidad de error en la transmisión de un bit es del 0,8 %. Sabiendo que los bits se empaquetan en bloques de información y la transmisión de cada bit dentro del bloque es independiente del resto, se pide: a) Calcule la probabilidad de que se produzca algún error en la transmisión de un bloque formado por 1000 bits. b) Calcule la probabilidad de que se produzcan menos de 15 errores en la transmisión de un bloque de 1000 bits si sabemos que se observó algún error en la transmisión del bloque. Solución: Sabemos que Pr(E) = 0,008, donde E denota el suceso ‘error en la transmisión de un bit’. a) Sea X la v.a. que cuenta el número de bits de un bloque de 1000 bits que se transmiten erróneamente. Se tiene entonces que X sigue un modelo Binomial con parámetros n = 1000 y p = 0,008. Nos piden Pr(X ≥ 1). Por la propiedad del suceso contrario y usando la función de probabilidad del modelo binomial se concluye que: 1000 Pr(X ≥ 1) = 1 − Pr(X = 0) = 1 − (0,008)0 (1 − 0,008)1000 = 1 − 0,000325 = 0,9997. 0 b) Nos piden la probabilidad condicionada siguiente Pr(X < 15|X ≥ 1). Se verifica que Pr(X < 15|X ≥ 1) = Pr(1 ≤ X ≤ 14) Pr(1 ≤ X < 15) = . Pr(X ≥ 1) 0,9997 Además, Pr(1 ≤ X ≤ 14) Pr(0,5 ≤ N (µ, σ) ≤ 14,5) 14,5 − µ 0,5 − µ = Pr ≤ N (0, 1) ≤ , σ σ = donde estamos utilizando el hecho de que X al ser Binomial con n = 1000 > 30 y npq = 1000 × 0,008 × 0,992 = 7,936 > 5 se puede aproximar por un modelo Normal con media µ = E[X] = np = 1000 × 0,008 = 8 y varianza σ 2 = V ar[X] = npq = 7,936. En consecuencia se tiene que, Pr(1 ≤ X ≤ 14) = Pr (−2,66 ≤ N (0, 1) ≤ 2,31) = FN (0,1) (2,31) − FN (0,1) (−2,66) = 0,9896 − (1 − FN (0,1) (2,66)) = 0,9896 − 1 + 0,9961 = 0,9857 = 98,57 %. De modo que Pr(X < 15|X ≥ 1) = 0,9857 0,9997 = 0,9860. 1 Ejercicio 2. Sea T la variable aleatoria ‘horas que un operario necesita para realizar una actividad especı́fica en una cadena de producción’, que sigue un modelo exponencial con función de densidad dada por f (t) = 1,5 exp(−1,5t), t ∈ (0, ∞). a) Suponiendo que el operario repite dicha actividad de forma independiente, determine el número medio de veces que consigue realizar dicha actividad en 2 horas y la probabilidad de que en 2 horas consiga realizarla al menos 1 vez. b) Calcule la función de distribución de T y el tiempo t0 que necesita invertir en dicha actividad si sólo el 10 % de las veces que realiza dicha actividad necesita invertir más tiempo. c) Calcule la probabilidad de que el tiempo empleado en realizar dicha actividad no supere la hora y media. d) Suponiendo que los operarios trabajan de forma independiente unos de otros, ¿cuál es la probabilidad de que exactamente 2 de 10 operarios, inviertan más de hora y media en realizar la actividad en cuestión? Solución: a) Sea X la v.a. que cuenta el número de veces que un operario consigue realizar dicha actividad en 1 hora, y sea Y la v.a. que cuenta el número de veces que un operario consigue realizar dicha actividad en 2 horas. Se sabe que X se distribuye según una Poisson con parámetro λ1 = 1,5 actividades/h. Por la reproductividad de la Poisson, entonces Y sigue un modelo de Poisson con parámetro λ2 = 2λ1 = 3 actividades cada 2 horas. Dado que en un modelo de Poisson su parámetro coincide con su media, se tiene que E[Y ] = 3. Por otra parte, nos piden Pr(Y ≥ 1). Por la propiedad del suceso contrario y la función de probabilidad de una Poisson se concluye que: Pr(Y ≥ 1) 1 − Pr(Y < 1) = 1 − Pr(Y = 0) exp(−λ)λ0 = 1 − e−3 = 0,9502 = 95,02 %. = 1− 0! = b) Calculemos la distribución del tiempo exponencial T . Z FT (t) = t Z t fT (y)dy = 1,5 exp(−1,5y)dy 0 = 0 y=t − exp(−15y)]y=0 = − exp(−1,5t) + exp(0) = 1 − exp(−1,5t), t > 0. Por otra parte, también nos piden el tiempo en horas t0 que verifica que FT (t0 ) = Pr(T ≤ t0 ) = 0,90 (equivalentemente, se tiene que Pr(T > t0 ) = 0,10). De modo que, despejando t0 en 1 − exp(−1,5t0 ) = 0,90, se obtiene que: exp(−1,5t0 ) = 0,10 ⇒ −1,5t0 = ln(0,10) ⇒ t0 = 2 − ln(0,10) = 1,5351 horas. 1,5 c) Nos piden Pr(T ≤ 1,5), es decir, FT (1,5). Utilizando el apartado b) se obtiene que Pr(T ≤ 1,5) = 1 − exp(−1,5 × 1,5) = 0,8946 = 89,46 %. d) Sea Z la v.a. que cuenta el número de operarios, de un total de 10, que invierten más de 1,5 horas en realizar dicha actividad individualmente. Nos piden, Pr(Z = 2), donde Z sigue un modelo Binomial con parámetros n = 10 (los diez operarios) y p = Pr(T > 1,5) = 1−0,8946 = 0,1054, la probabilidad de que un operario en concreto necesite más de hora y media para realizar dicha actividad. 2 8 Entonces, se tiene que: Pr(Z = 2) = 10 2 (0,1054) (1 − 0,1054) = 0,2051 = 20,51 %. Ejercicio 3. La v.a. T representa el tiempo en horas de las conexiones que un empleado realiza a lo largo de una jornada laboral desde su puesto de trabajo a dominios de la red que no están relacionados directamente con su trabajo, y tiene como función de densidad la función fT (t) = 3 exp(−3t), si t > 0. Si un empleado es ‘pillado’, según la polı́tica de la empresa se le sanciona con una cantidad que asciende a Z = exp(T ) euros. Con estos datos, se pide: a) Determine la densidad de la v.a. Z. b) Calcule la probabilidad de que un sancionado tenga que pagar menos de 5 euros. c) ¿Cuál es la probabilidad de que un empleado se encuentre más de media hora conectado a la red ‘sin trabajar’ ? d) Para evitar que los empleados se dediquen a malgastar sus horas de trabajo, el director de la empresa decide controlar los accesos de 10 empleados elegidos al azar. ¿Cuál es la probabilidad de que exactamente 7 de ellos dediquen más de media hora al dı́a a estar conectados a la red ‘sin trabajar’ ? Solución: a) Sea T las horas que dedica al ocio un empleado durante una jornada laboral, y sea Z la sanción en euros que debe pagar dicho empleado si es pillado, v.a. que viene dada como una transformación de la v.a. T de partida según la expresión Z = exp(T ). Entonces se tiene que, z(t) = exp(t), t(z) = ln(z) y dt(z) dz = z1 . Además, dado que T toma valores en (0, ∞) se tiene que Z toma valores entre exp(0) = 1 y exp(∞) = ∞, es decir Z toma valores en (1, ∞). Dado que la transformación exponencial es derivable en inyectiva en (0, ∞), sabemos que la función de densidad de Z viene dada por dt(z) fZ (z) = fT (t(z)) dz 1 = 3 exp(−3 ln(z)) = 3(exp(ln(z)))−3 z −1 = 3z −4 , z ∈ (1, ∞). z b) Nos piden Pr(Z < 5 euros). Dado que Z es v.a. continua de la cual sabemos su densidad (por el apartado anterior), se tiene que: Z 5 Z 5 z=5 3 Pr(Z < 5) = fZ (z)dz = dz = − z −3 z=1 4 1 1 z 1 = −(5)−3 + (1)−3 = 1 − 3 = 0,9920. 5 3 c) Nos piden Pr(T > 0,5) = 1 − Pr(T ≤ 0,5). Dado que T es v.a. continua con densidad dada por fT se tiene que: Z 0,5 fT (t)dt Pr(T ≤ 0,5) = 0 Z = 0 = 0,5 t=0,5 3 exp(−3t)dt = − exp(−3t)]t=0 − exp(−3/2) + 1 = 0,7769. Por lo tanto, la probabilidad pedida es Pr(T > 0,5) = 1 − 0,7769 = 0,2231. d) Sea Y la v.a. que cuenta el número de empleados (de un total de n = 10) que dedican más de media hora al ocio (es decir, T > 0,5h) durante la jornada laboral. Se verifica que Y se distribuye según un modelo Binomial con parámetros n = 10 y p = Pr(T > 0,5) = 0,2231. Utilizando la función de probabilidad de este modelo, la probabilidad que nos piden Pr(Y = 7) viene dada por: 10 (0,2231)7 (1 − 0,2231)3 = 0,0015 = 0,15 %. Pr(Y = 7) = 7 Ejercicio 4. En unos grandes almacenes, el número X de devoluciones por hora que se producen en una determinada sección sigue una Poisson. Sin embargo, se sabe que de 10h a 16h el número medio de devoluciones a la hora es de 2 mientras que de 16h a 21h el número medio de devoluciones a la hora es de 4. Nótese que se supone que el establecimiento permanece abierto ininterrumpidamente desde las 10h a las 21h y que las devoluciones se producen de manera independiente a lo largo del dı́a. a) Calcule la probabilidad de que no se produzca ninguna devolución de 10h a 11h. b) Calcule la probabilidad de que se produzcan no más de 30 devoluciones a lo largo de un dı́a de trabajo. Solución: Denotemos por X1 la v.a. que contabiliza el número de devoluciones por hora que se producen en una determinada hora en la franja de 10h a 16h y denotemos por X2 la v.a. que contabiliza el número de devoluciones por hora que se producen en una determinada hora en la franja de 16h a 21h. Dado que en un modelo de Poisson, su media y su parámetro coinciden, se tiene que X1 es Poisson con λ1 = 2 y X2 es Poisson con λ2 = 4. a) Nos piden Pr(X1 = 0). Utilizando la función de probabilidad de una Poisson con parámetro 2, se concluye que. Pr(X1 = 0) = exp(−λ)λk e−2 20 = = e−2 = 0,1353 = 13,53 %. k! 0! b) Sea Y la v.a. que cuenta el número de devoluciones que se producen a lo largo de un dı́a (es decir, de 10h a 21h, durante el horario de apertura de dicho establecimiento). Por la propiedad de independencia y la reproductividad de la Poisson se sabe que Y sigue una Poisson con parámetro λ = 6 × 2 + 5 × 4 = 32, es decir, se producen por término medio 32 devoluciones al dı́a. 4 Nos piden la probabilidad del suceso {Y ≤ 30}, es decir, Pr(Y ≤ 30). Para calcular este valor y dado que λ = 32, utilizaremos el hecho de que una v.a. de Poisson se puede aproximar por un modelo Normal cuando el parámetro λ > 5. En concreto, Y ∼ N (µ, σ) donde µ = E[Y ] = p √ √ λ = 32 y σ = V ar(Y ) = λ = 32. Utilizando el factor de correción de 0,5 unidades (dado que estamos aproximando un modelo discreto a través de un modelo continuo), y estandarizando para expresar el suceso de interés en términos de una Normal estándar (con media 0 y desviación tı́pica 1), se tiene que, Pr(0 ≤ Y ≤ 30) Pr(−0,5 ≤ N (µ, σ) ≤ 30,5) −0,5 − 32 30,5 − 32 √ = Pr N (0, 1) ≤ √ 32 32 = Pr(−5,75 ≤ N (0, 1) ≤ −0,27) = = Pr(N (0, 1) ≥ 0,27) − P r(N (0, 1) ≥ 5,75) = 1 − Pr(N (0, 1) ≤ 0,27) − (1 − Pr(N (0, 1) ≤ 5,75)) = 1 − 0,6064 − (1 − 1) = 0,3936 = 39,36 %. Ejercicio 5. Indique si las siguientes afirmaciones son verdaderas o falsas. Razone su respuesta. a) El siguiente código en MATLAB/Octave devuelve para a un valor muy cercano a cero: n=1000; x=poissrnd(8,n,1); y=(x>4); a=sum(y)/n b) El siguiente código en MATLAB/Octave aproxima por simulación el valor de E[exp(−X)], siendo X un modelo Uniforme en (−1, 1): n=1000; u=rand(n,1); x=2*u-1; mux=sum(x)/n; muy=exp(-mux) Solución: a) Esta afirmación es falsa. Este código aproxima Pr(X > 4), siendo X una Poisson de parámetro λ = 8. Se sabe que el valor teórico de esta probabilidad es igual a 1 − Pr(X = 0) − Pr(X = 1) − Pr(X = 2) − Pr(X = 3) − Pr(X = 4) = 0,9004. b) Esta afirmación es falsa. Este código devuelve exp(−E[X]) que no coincide con E[exp(−X)]. Ejercicio 6. a) Complete el siguiente código en MATLAB/Octave para aproximar Pr(X > 0,1), donde X denota una v.a. continua con densidad fX (x) = 3x2 , si x ∈ (0, 1). 5 n = 10000; u = rand(n,1); x = ........... ; cond = (x ........... ); p = sum(cond)/n b) Indique la veracidad o falsedad de la siguiente afirmación y razone su respuesta. ‘Sea X una v.a. que se distribuye según un modelo uniforme continuo en el intervalo (0, 1) y sea Y = exp(X 2 ) una transformación de X, entonces Y es una v.a. continua con densidad √ dada por fY (y) = (2y ln y)−1 si y ∈ (1, e).’ Solución: a) Dado que X tiene densidad dada por fX (x) = 3x2 , si x ∈ (0, 1), entonces su función de distribución viene dada por: Z x Z x FX (x) = fX (y)dy = 3y 2 dy = x3 , x ∈ (0, 1). 0 0 Utilizando el método de la transformación inversa para generar valores de X, debemos resolver en x la ecuación FX (x) = u, donde u denota un número uniformemente distribuido entre (0, 1). De modo que, x = u1/3 . Por lo tanto las dos lineas de código que faltan serı́an: x = u.^(1/3); cond = (x > 0.1); b) Esta afirmación es verdadera. Veámoslo a continuación. Dado que X se distribuye según un modelo uniforme continuo en (0, 1) se tiene que fX (x) = 1, si x ∈ (0, 1). Consideremos la transformación g(x) = exp(x2 ). Se verifica que g(x) es derivable en (0, 1) por tratarse de una composición de funciones derivables en (0, 1) (la exponencial y la función cuadrática) e inyectiva en (0, 1). De modo que la función de densidad de Y = g(X) viene dada por la expresión: dx(y) , fY (y) = fX (x(y)) dy p −0,5 −1 y y, dado que X toma valores entre 0 y 1, la donde x(y) = ln(y), dx(y) dy = 0,5(ln(y)) v.a. Y toma valores en el intervalo (g(0) = 1, g(1) = e). En conclusión se tiene que: fY (y) = 1 p , 2y ln(y) y ∈ (1, e). Ejercicio 7. Una empresa de telefonı́a móvil cobra a sus clientes 0,25 euros por cada minuto de conversación. Si X denota ‘el tiempo (en minutos) que una persona invierte en cada llamada realizada desde su móvil’, la compañı́a le cobrará lo mismo (1,25 euros) si habla 5 minutos que 4,15 minutos. Se sabe además que X se puede modelizar a través de una exponencial con media 125 segundos. 6 a) Considere la v.a. Y = [X] + 1, donde [x] denota la parte entera de x ∈ <. Compruebe que dicha variable sigue una distribución Geométrica e identifique su parámetro p. b) Escriba el coste en función de Y y determine el coste medio por llamada. c) Ante la queja de algunos clientes, el director de la compañı́a se plantea cobrar por el tiempo exacto X que dure la llamada. Con esta estrategia se pretende ser más justo, pero sin que eso conlleve el tener una ganancia media por llamada inferior a la de antes. Determine cuál debe ser el coste por minuto que el encargado deberá cobrar para que esto ası́ suceda. d) Indique qué devuelve el siguiente código en MATLAB/Octave: n=100000; lambda=0.48; u=rand(n,1); t=-log(1-u)/lambda; prob=sum(0<t & t<1)/n Solución: Se sabe que X sigue un modelo Exponencial con media E[X] = 125/60 min. De modo que su parámetro será: 1 = 60/125 = 0,48 min−1 . λ= E[X] Además, se sabe que el coste es una v.a. discreta porque los valores que toma son {0,25, 0,50, 0,75, . . .}, un conjunto infinito numerable. a) Dado que Y = [X] + 1, para comprobar que sigue un modelo Geométrico, lo primero que debemos hacer es comprobar que sus posibles valores coinciden con los de dicho modelo. En efecto ası́ sucede puesto que cuando X ∈ (0, 1) entonces Y = 0 + 1 = 1, cuando X ∈ [1, 2) entonces Y = 1 + 1 = 2, y ası́ sucesivamente. Por lo tanto se ve que Y toma valores en {1, 2, 3, . . .}. En segundo lugar debemos tratar de demostrar que la función de probabilidad de Y se puede escribir como la de un modelo Geométrico, es decir, que Pr(Y = k) = p(1 − p)k−1 , para un determinado p, con k ∈ {1, 2, 3, . . .}. En efecto, esto también se verifica porque cuando Y = k eso significa que X ∈ [k − 1, k) y entonces se tiene que: Z Pr(Y = k) k = Z k f (x)dx = k−1 λ exp(−λx)dx k−1 −0,48(k−1) = − exp(−λx)]x=k − e−0,48k = e−0,48(k−1) (1 − e−0,48 ) x=k−1 = e = (e−0,48 )k−1 × (1 − e−0,48 ) = (1 − e−0,48 ) × (1 − (1 − e−0,48 ))k−1 . De modo que denotando p = 1 − e−0,48 = 0,3812 se puede concluir que Y sigue un modelo Geométrico con parámetro p = 0,3812. b) El coste C se puede escribir en función de Y como C = 0,25 × Y . Además E[C] = 0,25E[Y ]. Como Y es Geométrica de parámetro p = 0,3812, sabemos que su media es E[Y ] = 1/p = 1/0,3812. En consecuencia se concluye que: E[C] = 0,25E[Y ] = 0,25/0,3812 = 0,6558 euros. 7 c) Debemos buscar la tarifa t0 de modo que el nuevo coste D sea tal que D = t0 × X y E[D] ≥ E[C] = 0,6558. Sabiendo que E[X] = 125/60, se puede concluir que: E[D] = t0 × 125/60 ≥ 0,6558, lo que implica que t0 ≥ 60×0,6558/125 = 0,3148. Es decir, la tarifa actual debe ser t0 = 0,3148 euros/min, lo que significa que si una persona habla 4.15 minutos ahora se le cobrará por exactamente ese tiempo y el coste de su llamada será 0,3148 × 4,15 = 1,30645 ≈ 1,31 euros. En cambio, si una persona habla exactamente 5 minutos ahora se le cobrará 0,3148×5 = 1,574 euros. Como vemos, con el nuevo sistema de tarifas, el coste es más justo, en el sentido de que se le cobra más a la persona que más habla. Sin embargo, con este nuevo sistema estas dos personas han salido perdiendo pues antes sólo se les cobraba 1.25 euros. Los usuarios que sı́ se beneficiarán de la nueva tarifa serán aquellos que hablen menos de 0,25/0,3148 = 0,7942 min. d) Este código en MATLAB/Octave devuelve la probabilidad de que una llamada dure menos de 1 minuto (X < 1), lo cual coincide con la probabilidad de que Y = 1, es decir coincide con p = 0,3812. 8