1 UNIDAD 2 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un intervalo de números reales. Por lo tanto, no es posible conocer su valor exacto. Si la variable aleatoria es discreta, pero el rango es muy amplio, resulta más conveniente utilizar un modelo basado en variables aleatorias continuas. Si la variable es continua, resulta imposible describir su distribución de la manera que se explicó anteriormente; en este caso, es necesario desarrollar una función en donde aparezca X, de tal forma que la probabilidad de que X tome un valor en el intervalo demarcado por su rango sea igual al área bajo f(x) entre esos límites; lo anterior implica una integración. Dicha función es denominada función de densidad de probabilidad de X y cumple lo siguiente: a) f ( x ) dx 1 x2 b) P ( x1 X x 2 ) f ( x ) dx x1 c) f(x) ≥ 0 d) P(X = x) = 0 P ( x1 X x 2 ) P ( x1 X x 2 ) Esta última propiedad podría describirse así: La probabilidad que un modelo de variable continua asigna a la observación de un valor exacto (es decir, medido con infinita precisión) es cero. La función de densidad podría mirarse como un modelo de la curva límite que obtendríamos en el histograma de una población disminuyendo indefinidamente las anchuras de cada clase. f(x) es más general que un histograma. Trata de reflejar no el comportamiento de una muestra concreta, sino la estructura de los valores de la variable a largo plazo; además, es más operativa. 2 EJEMPLO 2.1. El error en la temperatura de reacción, en grados centígrados, para un experimento de laboratorio controlado es una variable aleatoria continua X que tiene la siguiente función de densidad de probabilidad: x 2 / 3, 1 x 2 f ( x) 0 , en otro caso a) Verifique la propiedad a. b) Encuentre la probabilidad de que X tome un valor entre 0 y 1. Solución: 2 a) x 2 2 / 3 dx x / 9 3 1 1 1 1 b) P(0 < x < 1) = x 2 / 3 dx 1 / 9 0 Según la definición de función acumulada dada anteriormente, la función de distribución acumulada de una variable aleatoria continua X es: x F ( x) P ( X x) f ( x ) dx Por lo tanto, la función de densidad de probabilidad de una variable aleatoria continua puede calcularse a partir de la función de distribución acumulada mediante derivación. Es decir, f ( x) dF ( x ) dx EJEMPLO 2.2. El tiempo necesario, en milisegundos, para completar una reacción química está aproximado por la siguiente función de distribución acumulada: 0, x 0 F ( x) 0 . 01 x , x 0 1 e 3 Calcule la función de densidad de probabilidad de X. ¿Qué proporción de las reacciones están completas en 200 milisegundos? Solución: 0, x 0 f ( x) 0 . 01 x , x 0 0 . 01 e Al derivar: P(x < 200) = F(200) = 1 – e-2 = 0.8647 MODELOS DE DISTRIBUCIONES CONTINUAS 1. Distribución uniforme continua: Se caracteriza porque la probabilidad es constante en un intervalo cerrado y, por lo tanto, su función de densidad es plana. Su función de densidad está dada por: f ( x ) b Su media es: x b a dx a b 1 ba , a xb ab 2 2 ab 1 y su varianza es: x dx * 2 ba a (b a ) 2 12 EJEMPLO 2.3. X es una variable aleatoria que representa la corriente, medida en miliamperes, en un alambre delgado de cobre. El rango de X es [0,20 mA] y su función de densidad de probabilidad es f(x) = 0.05. a) ¿Cuál es la probabilidad de que una medición de corriente esté entre 5 y 10 mA? b) ¿Cuáles son su media y desviación estándar? Solución: 4 10 a ) P ( 5 X 10 ) f ( x ) dx 5 ( 0 . 05 ) 0 . 25 5 b) E ( x) 0 20 10 mA 2 20 Desv . est .( x ) 2 5 . 77 mA 12 2. Distribución normal: Es la distribución de probabilidades más empleada para modelar experimentos aleatorios porque describe ajustadamente muchos fenómenos naturales, industriales e investigativos; además, los errores en mediciones científicas se aproximan bien mediante la distribución normal. La ecuación que describe una variable aleatoria normal X, con media µ y desviación estándar σ es: f ( x) 1 2 e (x ) 2 2 2 , x La distribución normal presenta las siguientes características: 1. Su gráfica tiene forma de campana. 2. El punto más alto de la curva normal es la media, que también es la mediana y la moda de la distribución. 3. El área total bajo la curva es 1. 4. La curva es simétrica alrededor de la media; por lo tanto, el área a la izquierda de la media es 0.5 e igual a su derecha. 5. El eje x es una asíntota horizontal, es decir, los extremos de la curva se prolongan al infinito en ambas direcciones. 6. La desviación estándar determina el ancho de la curva. A mayores valores de σ se obtienen curvas más anchas y bajas (mayor dispersión de los datos). La probabilidad de que la variable aleatoria X tome un valor entre a y b es: P (a X b) Que gráficamente sería: 1 2 b e a ( x ) 2 2 2 dx 5 Esta integral no es de fácil solución, pero dicho problema puede obviarse mediante la estandarización de la variable, que consiste en transformar todas las observaciones de cualquier variable aleatoria normal X a un nuevo conjunto de observaciones de una variable aleatoria normal Z con media 0 y varianza 1; todas las distribuciones normales pueden convertirse a “distribuciones normales estándar” restando la media de cada observación y dividiendo por la desviación estándar. Z x Aproximadamente el 68% de las veces, una variable aleatoria normal asume un valor entre más o menos una desviación estándar respecto a su media, aproximadamente 95% en el intervalo µ± 2σ y más del 99% en µ ± 3σ 6 EJEMPLO 2.4. Cierta máquina fabrica resistores eléctricos que tienen una resistencia promedio de 25 ohmios y una desviación estándar de 3.2 ohmios. La resistencia tiene una distribución normal. a) ¿Qué porcentaje de los resistores tendrán una resistencia inferior a 16 ohmios? b) ¿Qué porcentaje de resistores tendrán una resistencia superior a 35 ohmios? c) ¿Qué porcentaje de resistores tendrán una resistencia entre 20 y 32 ohmios? d) ¿Por encima de qué valor está el 10% de los resistores con mayor resistencia? Solución: 16 25 a ) P ( X 16 ) P Z P ( Z 2 . 81 ) 0 . 0025 3 .2 Lo que implica que el 0.25% de los resistores tienen una resistencia inferior a 16 ohmios. 35 25 b ) P ( X 35 ) P Z P ( Z 3 . 13 ) 1 P ( Z 3 . 13 ) 1 0 . 9991 0 . 0009 3 .2 Por lo tanto, el 0.09% de los resistores tienen una resistencia superior a 35 ohmios. 32 25 20 25 c ) P ( 20 X 32 ) P Z P ( 1 . 56 Z 2 . 19 ) 3 .2 3 .2 P ( Z 2 . 19 ) P ( Z 1 . 56 ) 0 . 9857 0 . 0594 0 . 9263 Por lo tanto, el 92.6% de los resistores tiene una resistencia entre 20 y 32 ohmios. d ) P ( Z z ) 1 0 . 1 0 . 9 De la tabla : z 1 . 28 z x x z 25 1 . 28 ( 3 . 2 ) 29 . 10 ohmios EJEMPLO 2.5. El diámetro del eje de una unidad de almacenamiento óptico tiene distribución normal con media 0.2508 pulgadas y desviación estándar 0.0006 pulgadas. Las especificaciones del diámetro del eje son 0.2500 ± 0.0013 pulgadas. ¿Qué proporción de los ejes cumple con el requisito? Solución: 7 0 . 2513 0 . 2508 0 . 2487 0 . 2508 P ( 0 . 2487 X 0 . 2513 ) P Z 0 . 0006 0 . 006 P ( 3 . 5 Z 0 . 83 ) P ( Z 0 . 83 ) P ( Z 3 . 5 ) 0 . 7967 0 . 0000 0 . 7967 Lo que implica que el 79.7% de los ejes cumple con el requisito. EJEMPLO 2.6. Durante los últimos años ha crecido el volumen de acciones negociadas en la Bolsa. Durante las dos primeras semanas de abril, el volumen diario promedio fue de 586000 acciones. La distribución de probabilidad del volumen es aproximadamente normal con desviación estándar de 115000 acciones. a) ¿Cuál es la probabilidad de que el volumen negociado en un día sea menor a 395000 acciones? b) ¿Cuál es la probabilidad de que se negocien más de 800000 acciones en un día? c) ¿Cuál es la probabilidad de que en un día se negocien entre 500000 y 600000 acciones? d) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos, ¿qué volumen activará la publicación? Solución: Sea: X = miles de acciones negociadas. 395 586 a ) P ( X 395 ) P Z P ( Z 1 . 66 ) 0 . 0485 115 800 586 b ) P ( X 800 ) P Z P ( Z 1 . 86 ) 1 P ( Z 1 . 86 ) 1 0 . 9686 0 . 0314 115 600 586 500 586 P ( 500 x 600 ) P Z P ( 0 . 75 Z 0 . 12 ) c) 115 115 0 . 5478 0 . 2266 0 . 3212 d ) P ( Z z ) 0 . 05 P ( Z z ) 0 . 95 De la tabla : z 1 . 645 8 z x x z 586 1 . 645 (115 ) 775 Eso implica que la publicación se sacará los días que se negocien más de 775000 acciones EJERCICIOS PROPUESTOS 1. La duración de un disco magnético empaquetado expuesto a gases corrosivos tiene una distribución aproximadamente normal con una vida media de 600 horas y desviación estándar de 180 horas. a) Calcule la probabilidad de que uno de esos discos dure al menos 500 horas. b) Calcule la probabilidad de que uno de esos discos dure por lo menos 300 horas, pero no más de 1000. c) Si el fabricante está dispuesto a reemplazar el 2% de los discos que primero fallan, ¿de qué duración debe ser la garantía que ofrece? 2. La vida eficaz de un dispositivo utilizado por una máquina industrial es una variable aleatoria con media 15000 horas y desviación estándar de 600 horas; su distribución es muy próxima a una distribución normal. El fabricante del dispositivo introduce una mejora en el proceso de producción que aumenta el tiempo de vida útil promedio a 15550 horas y disminuye la desviación estándar a 450 horas (considere que la distribución sigue siendo normal). El nuevo proceso se considerará satisfactorio si la probabilidad de que la vida del dispositivo sea mayor que 14000 horas supera por lo menos en 10% a la misma probabilidad con el proceso “antiguo”. El costo del proceso mejorado es mucho más alto. ¿Usted recomendaría la inversión? 3. Un fabricante está interesado en el voltaje de salida de una fuente de alimentación utilizada en un computador portátil. Experimentos anteriores han demostrado que el voltaje de salida tiene una distribución normal con media 5.1V y desviación estándar 0.25V. a) ¿Cuál es la probabilidad de que el voltaje sea superior a 5.5V? b) ¿Cuál es la probabilidad de que el voltaje esté entre 4.5 y 5.4V? c) ¿Cuál es el voltaje excedido por el 95% de las fuentes? 4. El diámetro del punto producido por una impresora tiene una distribución normal con media de 0.002 pulgadas y desviación estándar de 0.0004 pulgadas. a) ¿Cuál es la probabilidad de que el diámetro del punto sea mayor de 0.0026 pulgadas? b) ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0.0014 y 0.0026 pulgadas? c) ¿Por encima de que valor estará el 39% de los diámetros? 9 d) ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad del inciso b) sea 0.995? 5. Las mediciones de corriente de una tira de alambre tienen una distribución normal con una media de 5.25 mA y una desviación estándar de 0.42 mA. a) ¿Cuál es la probabilidad de que el resultado de una medición sea mayor de 6 mA? b) ¿Cuál es la probabilidad de que una medición de corriente esté entre 5 y 5.8 mA? c) ¿Cuál es la probabilidad de que una medición sea menor de 5mA o mayor de 6 mA? d) ¿Por encima de que valor estará el 88% de las mediciones? e) ¿Cuál debe ser el valor de la varianza de las mediciones para que la probabilidad de que la corriente esté entre 5 y 5.5 mA sea 0.95? 6. El tiempo entre llegadas de mensajes electrónicos a un computador tiene una distribución exponencial con media de 1.25 horas. a) ¿Cuál es la probabilidad de que el computador reciba un mensaje en un período de 10 minutos? b) Si son las 5 de la tarde y no ha recibido mensajes desde las 10 de la mañana, ¿Cuál es la probabilidad de recibir un mensaje antes de las 10 de la noche? 7. La duración de un láser semiconductor a potencia tiene una distribución normal con media de 10000 horas y una varianza de 422500 hrs2. a) ¿Cuál es la probabilidad de que el láser dure entre 10000 y 12000 horas? b) ¿Cuál es la probabilidad de que el láser falle antes de 8500 horas? c) ¿Cuál es la duración excedida por el 95% de los láseres? 8. El tiempo que transcurre entre las llamadas a cierta empresa tiene una distribución exponencial con un tiempo promedio entre llamadas de 15 minutos. a) ¿Cuál es la probabilidad de que no haya llamadas en un lapso de 30 minutos? b) ¿Cuál es la probabilidad de recibir la primera llamada entre 5 y 10 minutos después de haber abierto la empresa? c) Calcule la dimensión de un intervalo de tiempo, de modo tal que la probabilidad de recibir al menos una llamada en ese lapso sea 0.75 9. En la detección de una señal digital, el ruido de fondo tiene una distribución normal con media de 0 volts y desviación estándar de 0.45 volts. Si el sistema supone que se ha transmitido un uno digital cuando el voltaje es mayor que 0.9 volts. a) ¿Cuál es la probabilidad de detectar un uno digital? b) Determine las cotas simétricas alrededor de 0 que incluyen el 99% de todas las lecturas de ruido. 10. Un artículo electrónico para oficina contiene 200 componentes electrónicos. La probabilidad de que cada componente trabaje sin falla alguna durante el tiempo de vida útil del producto es 0.999. Aproxime la probabilidad de que 5 o más de los 200 componentes fallen durante el tiempo de vida útil del producto. 11. El tiempo de reacción de un conductor a un estímulo visual tiene una distribución normal con media 0.4 segundos y desviación estándar 0.05 segundos. 10 a) ¿Cuál es la probabilidad de que el conductor tarde más de medio segundo para reaccionar? b) ¿Cuál es la probabilidad de que el tiempo de reacción esté entre 0.4 y 0.5 segundos? c) ¿Cuál es el tiempo de reacción que se espera exceder el 75% de las veces? 12. Un proceso de fabricación de chips produce un 2% que son defectuosos. Suponga que los chips son independientes y que un lote contiene 1000 de ellos. a) Encuentre la probabilidad de que el lote contenga más de 25 chips defectuosos. b) Encuentre la probabilidad de que el lote contenga entre 20 y 30 chips defectuosos. 13. La duración de un láser semiconductor a potencia constante tiene una distribución normal con una media de 7000 horas y desviación estándar de 600 horas. a) ¿Cuál es la probabilidad de que el láser falle antes de 5600 horas? b) ¿Cuál es la duración en horas que excede el 90% de todos los láseres? c) Si se hace uso de tres láseres en un producto y se supone que fallan de manera independiente, ¿cuál es la probabilidad de que los tres sigan funcionando después de 7000 horas? 14. El diámetro del eje de una unidad de almacenamiento óptico tiene una distribución normal con media 0.2508 pulgadas y desviación estándar 0.0005 pulgadas. Las especificaciones del diámetro del eje son 0.25 0.0015 pulgadas. a) ¿Qué proporción de ejes cumplen con este requisito? b) Si la especificación menor no puede variar, ¿cuál debería ser la especificación superior para que el 95% cumplan el requisito? 15. 3256 personas presentaron los exámenes de ingreso a una universidad, los cuales se calificaban con un puntaje máximo de 100. Las calificaciones se aproximan a una distribución normal, con una media de 67.8 y una desviación estándar de 10.1. a) El 12% de los postulantes con más alta calificación en el examen son aceptados en la universidad. ¿Un estudiante que obtiene un puntaje de 73 en el examen es aceptado o no? b) ¿Qué porcentaje de postulantes obtuvieron una calificación entre 60 y 80? 16. En una prueba de tarjetas de circuitos, la probabilidad de que un diodo en particular falle es 0.01. Una tarjeta contiene 200 diodos. a) ¿Cuál es la probabilidad de que por lo menos 4 diodos fallen en una tarjeta seleccionada al azar? b) Si se despachan cinco tarjetas a un cliente en particular, ¿cuál es la probabilidad de que por lo menos 4 de ellas funcionen bien? (una tarjeta funciona si todos los diodos funcionan bien) 17. Se sabe que el voltaje de ruptura de un diodo de cierto tipo seleccionado al azar está normalmente distribuido con valor medio de 40 V y desviación estándar de 1.5 V. a) ¿Cuál es la probabilidad de que el voltaje de un solo diodo esté entre 39 y 42? b)¿Cuál es el valor tal que sólo 15% de todos los diodos tengan voltajes que lo rebasen? 11 18. Un ingeniero de sistemas está investigando la utilidad de un lenguaje de diseño para mejorar las tareas de programación. Pidió a 200 programadores que codificaran una función estándar con ese lenguaje, anotando el tiempo, en minutos, que requiere para hacer esa tarea. Los datos obtenidos revelan una media de 23 minutos y una desviación estándar de 1.4 minutos; con el lenguaje de diseño que se utiliza actualmente, se necesitan 24 minutos. Asuma distribución normal. a) ¿Cuál es la probabilidad de mejorar el tiempo que se utiliza actualmente? b) ¿Qué valor es excedido por el 20% de los tiempos requeridos con el nuevo lenguaje? 19. En un canal de comunicación digital, el número de bits que se reciben de manera errónea puede modelarse como una variable aleatoria binomial; la probabilidad de recibir un bit de manera errónea es 1*10-5. Si se transmiten 16 millones de bits, a) ¿cuál es la probabilidad de que se presenten más de 150 errores? b) ¿cuál es la probabilidad de que se presenten más de 100 errores, pero menos de 250? 20. Se sabe que la vida útil de un equipo electrónico tiene una distribución aproximadamente normal, con una desviación estándar de 8.4 días y una media de 62 días. a) El fabricante reemplaza los equipos que fallen dentro del tiempo de garantía. Si está dispuesto a reemplazar únicamente el 2% de los equipos, ¿de qué duración debe ser la garantía que ofrezca? b) ¿Cuál debe ser la desviación estándar del tiempo de vida útil para que el fabricante pueda garantizar que sólo reemplazará los que duren menos de mes y medio? (tenga en cuenta que se reemplaza el 2% de los equipos y que la media se considera invariable en ese caso) 21. Se utilizan medidores para rechazar todos los componentes cuyas dimensiones no se encuentren dentro de la especificación 60 d. Se sabe que esta dimensión está normalmente distribuida con una media de 60 y una varianza de 33.64. a) Determine las especificaciones (simétricas a la media), de tal manera que éstas cubran el 90% de las mediciones. b) ¿Cuál debería ser la desviación estándar para que la probabilidad de que la duración de un componente esté entre 50 y 70 días sea 0.92? 22. El tiempo entre la llegada de los clientes a un cajero automático es una variable aleatoria exponencial con una media de cinco minutos. a) ¿Cuál es la probabilidad de que lleguen al cajero más de tres clientes en un lapso de 10 minutos? b) ¿Cuál es la probabilidad de que el tiempo transcurrido hasta que llega el quinto cliente sea menor que 15 minutos? 23. Se utilizan medidores para rechazar todos los componentes cuyas dimensiones no se encuentren dentro de la especificación 1.50 d. Se sabe que esta dimensión es normalmente distribuida con una media de 1.50 y una desviación estándar de 0.2. a) Determine el valor d para que la especificación cubra el 95% de las mediciones. 12 b) Cuál es la probabilidad de que la dimensión de un componente sea mayor de 1.75? 24. El número de computadores que se venden por hora en un gran almacén sigue una distribución de Poisson con un promedio de 30 computadores vendidos por hora. a) ¿Cuál es la probabilidad de que exactamente 50 computadores sean vendidos entre las 10 y las 11 de la mañana? b) ¿Cuál es la probabilidad de que el tiempo que transcurre entre dos ventas consecutivas esté entre 1 y 3 minutos? 25. La longitud de un estuche moldeado por inyección para una cinta magnética tiene una distribución normal con una media de 90.2 milímetros y desviación estándar de 0.1 mm. ¿Cuál es la probabilidad de que la longitud de una pieza sea menor que 89.7 mm o mayor que 90.3? 26. Una prueba de admisión a una universidad tiene 200 preguntas, cada una con 4 posibles respuestas, de las que sólo una es correcta. Para pasar a entrevista se debe responder correctamente por lo menos el 75% de las preguntas. a) Un aspirante está seguro de 107 respuestas, pero tiene que responder las demás al azar. ¿Cuál es la probabilidad de que sea llamado a entrevista? b) Un aspirante sólo tiene que adivinar 10 para ajustar el número de respuestas correctas que necesita, ¿cuál es la probabilidad de que sea llamado a entrevista? 27. El tiempo requerido por unos técnicos en sistemas para completar cierto trabajo tiene una media de 88 minutos y una desviación estándar de 20 minutos. Para chequear el progreso de los trabajadores en un día particular, el supervisor registró los tiempos que los técnicos de la empresa necesitaron para completar el trabajo. Dicho proceso se ajusta aproximadamente a una distribución normal. a) ¿Cuál es la probabilidad de que un técnico se demore más de dos horas para hacer ese trabajo? b) El supervisor les pasará un memo a los que se demoren más de dos horas y media. Según la distribución normal, ¿a cuántos se espera que les pase memo por esa causa? c) ¿Por debajo de qué tiempo se demora el 20% de los técnicos de la empresa para completar el trabajo? RESPUESTAS 1. a) 0.7123 b) 0.9393 c) 231 h 2. Ant: P(X>14000) = 0.9525 Act: P(X>14000) = 0.9997 3. a) 0.0548 b) 0.8767 c) 4.69 V 4. a) 0.067 b) 0.866 c) 0.002112 pulg d) 0.000214 pulg 13 5. a) 0.0367 b) 0.6306 c) 0.689 d) 4.76 mA e) 0.01627 mA2 6. a) 0.1167 b) 0.7854 7. a) 0.4990 b) 0.0104 c) 8930.75 h b) 66.6% 16. a) 0.1423 b) 0.978 17. a) 0.6568 b) 41.6 V 18. a) 0.7611 b) 24.2 min 19. a) 0.7967 b) ≈ 1 8. a) 0.5413 b) 0.226 c) 21 min 20. a) 44 días b) 8.29 días 9. a) 0.0228 b) [-1.16,1.16] 21. a) [50.46, 69.54] b) 49.9 10. ≈ 0 22. a) 0.323 b) 0.185 11. a) 0.0228 b) 0.4772 c) 0.367 seg 23. a) 0.392 b) 0.1056 12. a) 0.1539 b) 0.5349 24. a) 0.0022 b) 0.3834 13. a) 0.0099 b) 6232 h c) 0.125 25. 0.8413 14. a) 0.9192 b) 0.2516 pulg 15. a) No 26. a) ≈ 0 b) 0.6291 27. a) 0.0548 b) 0.1% c)71.2min