Material preparado por la profesora Rita Luna DISTRIBUCIONES DE PROBABILIDAD DISCRETAS. Bernoulli, Uniforme, Empírica En este documento se tratan 1. Binomial 2. Hipergeométrica 3. Poisson 4. Aproximación de Poisson a la Binomial 5. Geométrica 1. DISTRIBUCIÓN BINOMIAL Las características de esta distribución son: a) a) En los experimentos que tienen este tipo de distribución, siempre se esperan dos tipos de resultados, ejem. Defectuoso, no defectuoso, pasa, no pasa, etc, etc., denominados arbitrariamente “éxito” (que es lo que se espera que ocurra) o “fracaso” (lo contrario del éxito). b) b) Las probabilidades asociadas a cada uno de estos resultados son constantes, es decir no cambian. c) c) Cada uno de los ensayos o repeticiones del experimento son independientes entre sí. d) d) El número de ensayos o repeticiones del experimento (n) es constante. A partir de un ejemplo. Desarrollaremos una fórmula que nos permita cualquier problema que tenga este tipo de distribución. Ejemplo: Se lanza al aire una moneda normal 3 veces, determine la probabilidad de que aparezcan 2 águilas. Solución: Antes de empezar a resolver este problema, lo primero que hay que hacer es identificarlo como un problema que tiene una distribución binomial, y podemos decir que efectivamente así es, ya que se trata de un experimento en donde solo se pueden esperar dos tipos de resultados al lanzar la moneda, águila o sello, cutas probabilidades de ocurrencia son constantes, cada uno de los lanzamientos es independiente de los demás y el número de ensayos o repeticiones del experimento son constantes, n = 3. Para dar solución a este problema, lo primero que hay que hacer es un diagrama de árbol, en donde representaremos los tres lanzamientos, de ahí se obtendrá el espacio muestral y posteriormente la probabilidad pedida, usando la fórmula correspondiente. 1 Material preparado por la profesora Rita Luna A = águila, S = sello 1/2 1/2 A 1/2 S 1/2 A 1/2 S A 1/2 S 1/2 A 1/2 S A A 1/2 1/2 1/2 S A 1/2 S 1/2 S =AAA, AAS, ASA, ASS, SAA, SAS, SSA, SSS Para obtener la fórmula, definiremos lo siguiente: n = número de lanzamientos de moneda x = número de “éxitos” requeridos = número de águilas = 2 p = probabilidad de “éxito”= p(aparezca águila) =1/2 q = probabilidad de “fracaso”= p(aparezca sello) =1/2 Entonces podemos partir de la siguiente expresión para desarrollar la fórmula; P(aparezcan 2 águilas)=(No. De ramas águilas)(probabilidad asociada a cada rama) del árbol en donde ap. 2 Entonces el número de ramas en donde aparecen dos águilas se puede obtener; Enumerando las ramas de interés, estas serían: AAS, ASA, SAA, ¿QUÉ TIPO DE ARREGLOS SON ESTOS ELEMENTOS DEL ESPACIO MUESTRAL?, Son 2 Material preparado por la profesora Rita Luna permutaciones en donde algunos objetos son iguales, entonces, el número de ramas se puede obtener con la fórmula correspondiente, nPx1,x 2 ,...xk n! x1 ! x2 !...xk ! donde n = x1+x2+...+xk sustituyendo en esta fórmula, tenemos lo siguiente; nPx ,n x n! x! ( n x )! esta fórmula puede ser sustituida por la de combinaciones, solo en el caso de dos tipos de objetos, si hay más de dos tipos de objetos, definitivamente solo se usa la fórmula original, como se observará en el caso de la distribución multinomial, pero ¿porqué vamos a cambiar de fórmula?, simplemente porque en todos los libros de texto que te encuentres vas a encontrar la fórmula de combinaciones en lugar de la de permutaciones, que es la siguiente, nCx n! x! ( n x )! y sustituyendo valores, nos damos cuenta de que efectivamente son 3 las ramas de interés, que son donde aparecen dos águilas, donde n = 3, x = 2. 3 C2 3! 3! 3x 2! 3ram as 2! ( 3 2 )! 2! !1! 2!1! ¿Y la probabilidad asociada a cada rama? Probabilidad asociada a cada rama = p(águila)*p(águila)*p(sello)= p*p*q = p2q= x n x =p q Luego la fórmula de la distribución Binomial sería: p( n, x, p )n Cnx p x q nx donde: p(x, n, p) = probabilidad de obtener en n ensayos x éxitos, cuando la probabilidad de éxito es p 3 Material preparado por la profesora Rita Luna Dando solución al problema de ejemplo tenemos lo siguiente: n = 3, x = 2, p = ½ p( n 3, x 2, p 1 / 2 ) 3 C 2 ( 1 / 2 )2 ( 1 / 2 )32 3! 1 1 1 3 * * 3* 2!1! 4 2 8 8 Para calcular la media y la desviación estándar de un experimento que tenga una distribución Binomial usaremos las siguientes fórmulas: Media o valor esperado. nP Donde: n = número de ensayos o repeticiones del experimento P = probabilidad de éxito o la probabilidad referente al evento del cual se desea calcular la media que se refiere la media Q = complemento de P Desviación estándar. nPQ Ejemplos: 1. Se dice que el 75% de los accidentes de una planta se atribuyen a errores humanos. Si en un período de tiempo dado, se suscitan 5 accidentes, determine la probabilidad de que; a) dos de los accidentes se atribuyan a errores humanos, b) como máximo 1 de los accidentes se atribuya a errores de tipo humano, c) tres de los accidentes no se atribuyan a errores humanos. Solución: a) n = 5 x = variable que nos define el número de accidentes debidos a errores humanos x = 0, 1, 2,...,5 accidentes debidos a errores de tipo humano p = p(éxito) = p(un accidente se deba a errores humanos) = 0.75 q = p(fracaso) = p(un accidente no se deba a errores humanos) = 1-p = 0.25 p( x 2,n 5, p 0.75)5 C2( 0.75)2( 0.25)52 (10 )( 0.5625)( 0.015625) 0.08789 4 Material preparado por la profesora Rita Luna p( x 0,1,n 5, p 0.75) p( x 0 ) p( x 1 )5 C0( 0.75)0( 0.25)50 b) 5 C1( 0.75)1( 0.25)51 0.000976 0.014648 0.015624 c) En este caso cambiaremos el valor de p; n =5 x = variable que nos define el número de accidentes que no se deben a errores de tipo humano x = 0, 1, 2,...,5 accidentes debidos a errores humanos p = p(probabilidad de que un accidente no se deba a errores humanos) = 0.25 q = p(probabilidad de que un accidente se deba a errores humanos) = 1-p = 0.75 p( x 3,n 5, p 0.25)5 C3( 0.25)3( 0.75)53 (10 )( 0.015625)( 0.5625) 0.08789 2. Si la probabilidad de que el vapor se condense en un tubo de aluminio de cubierta delgada a 10 atm de presión es de 0.40, si se prueban 12 tubos de ese tipo y bajo esas condiciones, determine la probabilidad de que: a) el vapor se condense en 4 de los tubos, b) en más de 2 tubos se condense el vapor, c) el vapor se condense en exactamente 5 tubos. Solución: a) n =12 x = variable que nos define el número de tubos en que el vapor se condensa x = 0, 1, 2, 3,...,12 tubos en el que el vapor se condensa p =p(se condense el vapor en un tubo de Al a 10 atm)= 0.40 q = p(no se condense el vapor en un tubo de Al a 10 atm) = 1-p=0.60 p( x 4,n 12, p 0.40 )12 C4 ( 0.40 )4 ( 0.60 )12 4 ( 495)( 0.0256)( 0.016796) = 0.21284 b) p(X=3, 4, ...,12, n=12, p=0.40) = p(x=3)+p(x=4)+…+p(x=12)= 1-p(x=0,1,2)= 1 12 C0 ( 0.40 )0 ( 0.60 )12 0 12 C1( 0.40 )1( 0.60 )12 1 12 C2 ( 0.40 )2 ( 0.60 )122 5 Material preparado por la profesora Rita Luna 1 0.002176 ( 12 )( 0.4 )( 0.003627) ( 66 )( 0.16 )( 0.006047) = 1-0.002176+0.0174096+0.06385632= 1- 0.08344192= 0.91656 c) p( x 5,n 12, p 0.40 )12 C5( 0.40 )5( 0.6 )125 ( 792)( 0.01024)( 0.0279936) = 0.22703 3. La probabilidad de que el nivel de ruido de un amplificador de banda ancha exceda de 2 dB (decibeles) es de 0.15, si se prueban 10 amplificadores de banda ancha, determine la probabilidad de que; a) en solo 5 de los amplificadores el nivel de ruido exceda los 2 dB, b) por lo menos en 2 de los amplificadores, el ruido exceda de 2 dB, c)que entre 4 y 6 amplificadores no se excedan de los 2 dB, d)encuentre el número esperado de amplificadores que se exceden de un nivel de ruido de 2dB y su desviación estándar. Solución: a)n =10 x =variable que nos define el número de amplificadores de banda ancha que su nivel de ruido excede de 2 dB x = 0, 1, 2,...,10 amplificadores en los que el nivel de ruido excede de los 2 dB p = P(un amplificador exceda su nivel de ruido de 2 dB) = 0.15 q = p(un amplificador no exceda su nivel de ruido de 2 dB =1-p= 0.85 p( x 5,n 10, p 0.15)10 C5( 0.15)5( 0.85)105 ( 252)( 0.00007593)( 0.4437053) = 0.00849 b)p(x=2,3,...,10, n=10, p=0.15)= 1- p(x = 0,1) = 1 10 C0 ( 0.15 )0 ( 0.85 )100 10 C1 ( 0.15 )1 ( 0.85 )101 = 1 – (0.19687+(10)(0.15)(0.231617)=1-0.544296 = 0.455705 c) n=10 x= variable que nos define el número de amplificadores de banda ancha que su nivel de ruido no excede de 2 dB 6 Material preparado por la profesora Rita Luna x= 0, 1, 2,...,10 amplificadores que su nivel de ruido no excede de los 2 dB p = p(un amplificador no exceda su nivel de ruido de 2 dB) = 0.85 q = p(un amplificador exceda su nivel de ruido de 2 dB) = 1- p = 0.15 p( x 4,5,6,n 10, p 0.085)10 C4( 0.85)4( 0.15)104 10 C5( 0.85)5( 0.15 )105 10 C6( 0.85)6( 0.15)106 =(210)(0.522)(0.00001139)+(252)(0.4437)(0.000075937)+(210)(0.3771495)(0.00005063 )= =0.001249 + 0.00849 + 0.00400997 = 0.01374897 d)n=10, p=0.15, q=1-p=0.85 np ( 10 )( 0.15 ) 1.5 2amplificadores Interpretación: Se espera que 2 de los 10 amplificadores probados se excedan de un nivel de ruido de 2 Db npq (10 )( 0.15)( 0.85) 1.1291 1amplificador Interpretación: Este experimento puede variar en 2 1 amplificador, esto es, de 1 a 3 amplificadores que se excedan de un nivel de ruido de 2 dB 2. DISTRIBUCIÓN HIPERGEOMÉTRICA. Los experimentos que tienen este tipo de distribución tienen las siguientes características: a) a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados. b) b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) c) Cada ensayo o repetición del experimento no es independiente de los demás. d) d) El número de repeticiones del experimento (n) es constante. 7 Material preparado por la profesora Rita Luna Ejemplo: En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos? Solución: Luego; p( x ,n ) a C x * N a Cn x N Cn donde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados Cx* N a Cn x muestras de n objetos en donde hay x que son defectuosos y n-x buenos a Cn todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral N Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? Solución: N = 10 objetos en total a = 3 objetos defectuosos n = 4 objetos seleccionados en muestra 8 Material preparado por la profesora Rita Luna x = 2 objetos defectuosos deseados en la muestra p( x 2,n 4 ) 3 C2*10 3 C4 2 10 C4 3! 7! * C* C ( 3 2 )!2! ( 7 2 )!2! 3 2 7 2 10! 10 C4 ( 10 4 )!4! 3! 7! 3x2 x1! 7 x6 x5! * * 1 ! 2 ! 5 ! 2 ! 1 ! 2 ! 5!2! 3x2 x7 x6 * 4! 10! 10x9 x8 x7 x6! 10x9 x8 x7 2!2! 6!4! 6!4! donde: 3x 2 x7 x6 10 x9 x8 x 7 probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes 4! 2!2! formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería: 3x 2 x7 x6 4! 252 24 6048 * * 0.30 10 x9 x8 x7 2!2! 5040 4 20160 Ejemplos: 1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero 9 Material preparado por la profesora Rita Luna sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?. Solución: a) N = 9+6 =15 total de tabletas a = 6 tabletas de narcótico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico) p( x 1,2ó3tabletas; n 3 ) 6 C1* 9 C2 6 C2* 9 C1 6 C3* 9 C0 15 C3 15 C3 15 C3 ( 6 )( 36 ) ( 15 )( 9 ) ( 20 )( 1 ) 216 135 20 371 0.81538 455 455 455 455 455 otra forma de resolver; p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas seleccionadas no haya una sola de narcótico) 1 p( x 0; n 3 ) 1 6 C0* 9 C3 15 C3 ( 1 )( 84 ) 0.184615 0.815385 455 b) b) p(no sea arrestado por posesión de narcóticos) 1 p( x 0; n 3 ) 6 C0* 9 C3 15 C3 ( 1 )( 84 ) 0.184615 455 2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten? Solución: 10 Material preparado por la profesora Rita Luna a) N = 10 proyectiles en total a = 7 proyectiles que explotan n = 4 proyectiles seleccionados x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles que explotan entre la muestra que se dispara p( x 4; n 4 ) 7 C4* 3C0 ( 35 )(1 ) 35 0.16667 210 210 10 C4 b) N = 10 proyectiles en total a = 3 proyectiles que no explotan n = 4 proyectiles seleccionados x = 0, 1, 2 o 3 proyectiles que no explotan p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) = 3 C2* 7 C2 3 C3* 7 C1 ( 3 )( 21) ( 1 )( 7 ) 63 7 70 0.333333 210 210 210 10 C4 3. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?, b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a menores de edad? Solución: a) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad p( x 2,n 5 ) 4 C2 * 5 C3 9 C5 ( 3 )(10 ) 0.238095 126 b) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad 11 Material preparado por la profesora Rita Luna p( x 0,1,2; n 5 ) 4 C0* 5 C5 4 C1* 5 C4 4 C2* 5 C3 ( 1 )(1 ) ( 4 )( 5 ) ( 6 )(10 ) 126 9 C5 1 20 60 81 0.64286 126 126 4. Una compañía manufacturera utiliza un esquema para la aceptación de los artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algún artículo defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca. a)¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos defectuosos?, b)¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso se regresa para verificación? 3) DISTRIBUCIÓN DE POISSON. Características: En este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc, etc,: - # de defectos de una tela por m2 - # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc, etc. - # de bacterias por cm2 de cultivo - # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc. - # de llegadas de embarcaciones a un puerto por día, mes, etc, etc. Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería: p( x , ) x x! donde: p(x, ) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos es = media o promedio de éxitos por unidad de tiempo, área o producto = 2.718 x = variable que nos denota el número de éxitos que se desea que ocurra Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado. 12 Material preparado por la profesora Rita Luna Ejemplos: 1. Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en cualquiera de dos días consecutivos? Solución: a) a) x = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, ....., etc, etc. = 6 cheques sin fondo por día = 2.718 p( x 4, 6 ) ( 6 )4 ( 2.718)6 ( 1296)( 0.00248) 0.13392 4! 24 b) x= variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 0, 1, 2, 3, ......, etc., etc. = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos Nota: siempre debe de estar en función de x siempre o dicho de otra forma, debe “hablar” de lo mismo que x. p( x 10, 12 ) ( 12 )10 ( 2.718)12 ( 6.191736410 )( 0.000006151) 0.104953 10! 3628800 2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos. Solución: a) a) x = variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata p( x 1, 0.6 ) ( 0.6 )1( 2.718)0.6 ( 0.6 )( 0.548845) 0.329307 1! 1 13 Material preparado por la profesora Rita Luna b) b) x = variable que nos define el número de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata ( 1 )0 ( 2.718)1 ( 1 )( 2.718)1 p( x 2,3,4,etc.... 1 ) 1 p( x 0,1, 1 ) 1 0 ! 1 ! =1-(0.367918+0.367918) = 0.26416 c) c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc. = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata p( x 0,1, 3 ) p( x 0, 3 ) p( x 1, 3 ) ( 3 )0 ( 2.718)3 ( 3 )1( 2.718)3 0! 1! = 0.0498026 + 0.149408 = 0.1992106 4. APROXIMACIÓN DE POISSON A LA BINOMIAL. En este caso se determinarán probabilidades de experimentos Binomiales, pero que dadas sus características, es posible aproximarlas con la distribución de Poisson, estas características son, n ( n es muy grande) y p0 (p es muy pequeña), por lo que: x p( x ,n, p )n Cx p q x n x x! La expresión anterior solo se cumple cuando n y p0, solo en este caso, si esto no se cumple, la aproximación no se puede llevar a efecto, por lo que la fórmula a utilizar en este caso sería: p( x , ) x x! 14 Material preparado por la profesora Rita Luna Donde: == np = número esperado de éxitos = tasa promedio de éxitos n = número de repeticiones del experimento p = probabilidad de éxito = p(éxito) Una regla general aceptable es emplear esta aproximación si n20 y p0.05: sí n100, la aproximación es generalmente excelente siempre y cuando np10. Ejemplos: 1. 1. Se sabe que el 5% de los libros encuadernados en cierto taller tienen encuadernaciones defectuosas. Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller, tengan encuadernaciones defectuosas, usando, a) la fórmula de la distribución Binomial, b) la aproximación de Poisson a la distribución Binomial. Solución: a) n = 100 p = 0.05 = p(encuadernación defectuosa) = p(éxito) q = 0.95 = p(encuadernación no defectuosa) = p(fracaso) x = variable que nos define el número de encuadernaciones defectuosas en la muestra = = 0, 1, 2, 3,....,100 encuadernaciones defectuosas P( x 2,n 100, p 0.05)100 C2( 0.05)2( 0.95)98 ( 4950)( 0.05)2( 0.95)98 0.0812 b)n = 100 encuadernaciones p = 0.05 = np = (100)(0.05)= 5 x = variable que nos define el número de encuadernaciones defectuosas en la muestra = = 0, 1, 2, 3,....,100 encuadernaciones defectuosas p( x 2, 5 ) x x! ( 5 )2 ( 2.718)5 0.0843 2! Al comparar los resultados de las probabilidades con una y otra distribución, nos damos cuenta de que la diferencia entre un cálculo y otro es de tan solo 0.0031, por lo que la aproximación de Poisson es una buena opción para calcular probabilidades Binomiales. 2.Un fabricante de maquinaria pesada tiene instalados en el campo 3840 generadores de gran tamaño con garantía. Sí la probabilidad de que cualquiera de 15 Material preparado por la profesora Rita Luna ellos falle durante el año dado es de 1/1200 determine la probabilidad de que a) 4 generadores fallen durante el año en cuestión, b) que más 1 de un generador falle durante el año en cuestión. Solución: a) n = 3840 generadores p = 1/1200 = probabilidad de que un generador falle durante el año de garantía = np = (3840)(1/1200) = 3.2 motores en promedio pueden fallar en el año de garantía x = variable que nos define el número de motores que pueden fallar en el año de garantía = = 0, 1, 2, 3,....,3840 motores que pueden fallar en el año de garantía p( x 4, 3.2 ) ( 3.2 )4 ( 2.718)3.2 0.17815 4! b) p(x=2,3,4,....,3840;=3.2)=1-p(x=0,1;=3.2) = ( 3.2 )0 ( 2.718)3.2 ( 3.2 )1( 2.718)3.2 1 0 ! 1 ! =1- (0.04078 + 0.13048) = 0.82874 3. En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren defectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en promedio 1 de cada 1000 piezas tiene una o más burbujas. ¿Cuál es la probabilidad de que en una muestra aleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas? Solución: n = 8000 piezas p = 1/1000= 0.001 probabilidad de que una pieza tenga 1 o más burbujas = np = (8000)(1/1000) = 8 piezas en promedio con 1 o más burbujas x = variable que nos define el número de piezas que tienen 1 o más burbujas = = 0,1, 2, 3,....,8000 piezas con una o más burbujas p( x 0,1,2; 8 ) ( 8 )0 ( 2.718)8 ( 8 )1( 2.718)8 ( 8 )2 ( 2.718)8 0! 1! 2! = 0.000336 + 0.002686 + 0.010744 = 0.013766 5. DISTRIBUCIÓN GEOMÉTRICA. 16 Material preparado por la profesora Rita Luna Esta distribución es un caso especial de la Binomial, ya que se desea que ocurra un éxito por primera y única vez en el último ensayo que se realiza del experimento, para obtener la fórmula de esta distribución, haremos uso de un ejemplo. Ejemplo: Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de que aparezca águila es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de que en el último lanzamiento aparezca una águila. Solución: Si nosotros trazamos un diagrama de árbol que nos represente los 8 lanzamientos de la moneda, observaremos que la única rama de ese árbol que nos interesa es aquella en donde aparecen 7 sellos seguidos y por último una águila; como se muestra a continuación: SSSSSSSA Sí denotamos; x = el número de repeticiones del experimento necesarias para que ocurra un éxito por primera y única vez = 8 lanzamientos p = probabilidad de que aparezca una águila = p( éxito) = 2/3 q = probabilidad de que aparezca un sello = p(fracaso) = 1/3 Entonces la probabilidad buscada sería; P(aparezca una águila en lanzamiento)=p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(A) = el último x1 =q*q*q*q*q*q*q*p = q p Luego, la fórmula a utilizar cuando se desee calcular probabilidades con esta distribución sería; p( x ) q x1 p Donde: p(x) = probabilidad de que ocurra un éxito en el ensayo x por primera y única vez p = probabilidad de éxito q = probabilidad de fracaso Resolviendo el problema de ejemplo; x = 8 lanzamientos necesarios para que aparezca por primera vez una águila 17 Material preparado por la profesora Rita Luna p = 2/3 probabilidad de que aparezca una águila q = 1/3 probabilidad de que aparezca un sello 81 p(x=8) = ( 1 / 3 ) ( 2 / 3 ) 0.0003048 Ejemplos: 1. Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición sometidos a prueba sea el primero en mostrar una desviación excesiva?, b) el séptimo de estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una desviación excesiva?. Solución: a) a) x = 6 que el sexto dispositivo de medición probado sea el primero que muestre una variación excesiva p = 0.05 =probabilidad de que un dispositivo de medición muestre una variación excesiva q = 0.95 =probabilidad de que un dispositivo de medición no muestre una variación excesiva 61 p(x = 6) = ( 0.95 ) ( 0.05 ) 0.03869 b) b) x = 5 que el quinto dispositivo de medición probado, sea el primero que no muestre una desviación excesiva p = 0.95 = probabilidad de que un dispositivo de medición no muestre una variación excesiva q = 0.05 = probabilidad de que un dispositivo de medición muestre una variación excesiva 51 p(x = 5) = ( 0.05 ) ( 0.95 ) 0.0000059 2. Los registros de una compañía constructora de pozos, indican que la probabilidad de que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es de 0.20. ¿Cuál es la probabilidad de que el quinto pozo construido por esta compañía en un año dado sea el primero en requerir reparaciones en un año?. Solución: x = 5 que el quinto pozo sea el primero que requiera reparaciones en un año p = 0.20 = probabilidad de que un pozo requiera reparaciones en el término de un año q = 0.80 = probabilidad de que un pozo no requiera reparaciones en el término de un año 18 Material preparado por la profesora Rita Luna 51 p(x = 5) = ( 0.80 ) ( 0.20 ) 0.08192 DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Entre las distribuciones a tratar en esta unidad serían: 1. Distribución Normal 2. Aproximación de la Normal a la Binomial 3. Exponencial 1. DISTRIBUCIÓN NORMAL. Características: a) a) Es generada por una variable de tipo continuo, denominada x; - x b) b) La función que nos define esta distribución es: f ( x , , 2 ) 2 2 1 ( x ) / 2 2 - x Al dar a la función los valores de , 2 y valores a x, obtendremos la distribución en cuestión, la que tiene forma de campana, por lo que también se le conoce como campana de Gauss. Hay un número infinito de funciones de densidad Normal, una para cada combinación de y . La media mide la ubicación de la distribución y la desviación estándar mide su dispersión. c) Es simétrica con respecto a su eje vertical. d) Es asintótica con respecto a su eje horizontal; esto quiere decir que jamás va a tocar el eje de las equis. e) El área total bajo la curva es 1. f) Sí sumamos a , se observará que aproximadamente el 68.26% de los datos se encuentran bajo la curva, si sumamos a 2, el 95.44% de los datos estará entre esos límites y si sumamos a 3, entonces el 99.74% de los datos caerá dentro de esos límites. Esta característica es a la vez una forma empírica y rápida de demostrar si los datos que se analizan tienen una distribución Normal; ya que para trabajar los datos con esta distribución, debe verificarse que efectivamente así se distribuyen, ya que de no hacerlo, las decisiones que en un momento dado se tomarán de un análisis de los datos con la distribución Normal, serían erróneas. 19 Material preparado por la profesora Rita Luna ¿Cómo se determinan probabilidades con la distribución Normal? De acuerdo a como se trataron las distribuciones de probabilidad continuas en la unidad III, lo más lógico es que la función f(x, , 2), se integre entre los límites de la variable x; esto es, b p( a x b ) f ( x , , 2 )dx a La integral anterior nos daría el área bajo la curva de la función, desde a hasta b, que corresponde o es igual a la probabilidad buscada. Debido a la dificultad que se presenta para integrar esta función cada vez que sea necesario, lo que se hace es tipificar el valor de la variable x, esto es, x se transforma en un valor de z, de la siguiente manera: x z valor Este valor de z es buscado en una tabla donde vienen áreas asociadas a este valor, y haciendo uso de los valores tabulados, se determina la probabilidad requerida. La tabla que es usada para calcular las probabilidades es la que nos dá el área que se muestra a continuación: 0 Z Ejemplos: 1. 1. El acero que se utiliza para tuberías de agua a menudo se recubre internamente con un mortero de cemento para evitar la corrosión. En un estudio de los recubrimientos de mortero de una tubería empleada en un proyecto de transmisión de agua en California (Transportation Engineering Journal, Noviembre de 1979) se especificó un espesor de 7/16 pulgadas para el mortero. Un gran número de mediciones de espesor dieron una media de 0.635 pulgadas y una desviación estándar de 0.082 pulgadas. Sí las mediciones de espesor, tenían una distribución Normal, ¿qué porcentaje aproximado fue inferior a 7/16 de pulgada? Solución: x = variable que nos define el espesor del mortero en pulgadas 20 Material preparado por la profesora Rita Luna = 0.635 pulgadas = 0.082 pulgadas 3. DISTRIBUCIÓN EXPONENCIAL. A pesar de que la distribución Normal puede utilizarse para resolver muchos problemas en ingeniería y ciencias, existen aún numerosas situaciones que requieren diferentes tipos de funciones de densidad, tales como la exponencial y la gamma y algunas otras como la weibull, etc., etc., de momento solo trataremos sobre el uso de la exponencial. Resulta que la exponencial es un caso especial de la distribución gamma, ambas tienen un gran número de aplicaciones. Las distribuciones exponencial y gamma juegan un papel importante tanto en teoría de colas como en problemas de confiabilidad. El tiempo entre las llegadas en las instalaciones de servicio y el tiempo de falla de los componentes y sistemas eléctricos, frecuentemente involucran la distribución exponencial. La relación entre la gamma y la exponencial permite que la distribución gamma se utilice en tipos similares de problemas. La variable aleatoria x tiene una distribución exponencial, con parámetro , si su función de densidad es: f(x) 1 x x ,x0 ; f(x) = 0 en cualquier otro caso donde 0 La media y la variancia de la distribución exponencial son: y 2 2 Relación con el proceso de Poisson. Las aplicaciones más importantes de la distribución exponencial son aquellas situaciones en donde se aplica el proceso de Poisson , es necesario recordar que un proceso de Poisson permite el uso de la distribución de Poisson. Recuérdese también que la distribución de Poisson se utiliza para calcular la probabilidad de números específicos de “eventos” durante un período o espacio particular. En muchas aplicaciones, el período o la cantidad de espacio es la variable aleatoria. 21 Material preparado por la profesora Rita Luna Por ejemplo un ingeniero industrial puede interesarse en el tiempo T entre llegadas en una intersección congestionada durante la hora de salida de trabajo en una gran ciudad. Una llegada representa el evento de Poisson. La relación entre la distribución exponencial (con frecuencia llamada exponencial negativa) y el proceso llamado de Poisson es bastante simple. La distribución de Poisson se desarrolló como una distribución de un solo parámetro , donde puede interpretarse como el número promedio de eventos por unidad de “tiempo” . Considérese ahora la variable aleatoria descrita por el tiempo que se requiere para que ocurra el primer evento. Mediante la distribución de Poisson, se encuentra que la probabilidad de que no ocurran en el espacio hasta el tiempo t está dada por: t ( t )0 p( 0,t ) t ; 2.718 0! Ahora puede utilizarse lo anterior y hacer que X sea el tiempo para el primer evento de Poisson. La probabilidad de que el período hasta que ocurre el primer evento de Poisson exceda x es la misma que la probabilidad de que no ocurra un x evento de Poisson en x. Esto último por supuesto está dado por . Como resultado, x P(X x) = Entonces, la función de distribución acumulada para x es: x P(0 X x) = 1 - Ahora, con objeto de que se reconozca la presencia de la distribución exponencial, puede derivarse la distribución acumulada anterior para obtener la función de densidad: x f(x) = 1 . Nótese que la media de la distribución exponencial es el parámetro , el recíproco del parámetro en la distribución de Poisson. El lector debe recordar que con frecuencia se dice que la distribución de Poisson no tiene memoria, lo cuál implica que las ocurrencias en períodos de tiempo sucesivos son independientes. Aquí el parámetro importante es el tiempo promedio entre eventos. En teoría de la confiabilidad, donde la falla de un equipo concuerda con el proceso de Poisson, recibe el nombre de tiempo promedio entre fallas. Muchas descomposturas de equipo siguen el proceso de Poisson, y entonces la distribución exponencial es aplicable. La cual es la función de densidad de la distribución exponencial con 22 Material preparado por la profesora Rita Luna En el siguiente ejemplo se muestra una aplicación simple de la distribución exponencial en un problema de confiabilidad. La distribución binomial también juega un papel importante en la solución. Ejemplos: 1. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años está dado por la variable aleatoria T, distribuida exponencialmente con tiempo promedio de falla 5 . S í 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la probabilidad de que al menos 2 continúen funcionando después de 8 años? Solución: La probabilidad de que un determinado componente esté funcionando aún después de 8 años es: t 8 1 P( 8 ) 5 dt 5 58 evaluar desde 8 hasta 0.2 la | nos indica que la integral se va a Sea x el número de componentes funcionando después de 8 años. Entonces mediante la distribución Binomial, n=5 p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años P(x 2 ) = p(x=2) + p(x=3) + p(x=4)+p(x=5) = 1 – p(x = 0, 1) 1 5 C0( 0.2 )0( 0.8 )5 5 C1( 0.2 )1( 0.8 )4 1 0.7373 0.2627 2. El tiempo que transcurre antes de que una persona sea atendida en una cafetería es una variable aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos en al menos 4 de los 6 días siguientes? Solución: 3 1 1 3 1 t P( T 3 ) 4 dt 4 1 4 0.5276 40 integral va a ser evaluada de 0 a 3 la nos indica que la 23 Material preparado por la profesora Rita Luna x = número de días en que un cliente es atendido antes de que transcurran 3 minutos x = 0, 1, 2,...,6 días p = probabilidad de que un cliente sea atendido antes de que transcurran 3 minutos en un día cualquiera = 0.5276 q = probabilidad de que un cliente no sea atendido antes de que transcurran 3 minutos en un día cualquiera = 1- p = 0.4724 P( x 5o6, N 6, p 0.5276)6 C5( 0.5276)5( 0.4724)1 6 C6( 0.5276)6( 0.4724)0 = 0.11587 + 0.02157 = 0.13744 Distribución normal estándar acumulada N(0,1) Valores de la probabilidad acumulada por debajo de z (1) Z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00 -3.5 -3.4 -3.3 -3.2 -3.1 0.00017 0.00017 0.00018 0.00019 0.00019 0.00020 0.00021 0.00022 0.00022 0.00023 0.00024 0.00025 0.00026 0.00027 0.00028 0.00029 0.00030 0.00031 0.00032 0.00034 0.00035 0.00036 0.00038 0.00039 0.00040 0.00042 0.00043 0.00045 0.00047 0.00048 0.00050 0.00052 0.00054 0.00056 0.00058 0.00060 0.00062 0.00064 0.00066 0.00069 0.00071 0.00074 0.00076 0.00079 0.00082 0.00084 0.00087 0.00090 0.00094 0.00097 -3.0 -2.9 -2.8 -2.7 -2.6 0.0010 0.0014 0.0019 0.0026 0.0036 0.0010 0.0014 0.0020 0.0027 0.0037 0.0011 0.0015 0.0021 0.0028 0.0038 0.0011 0.0015 0.0021 0.0029 0.0039 0.0011 0.0016 0.0022 0.0030 0.0040 0.0012 0.0016 0.0023 0.0031 0.0041 0.0012 0.0017 0.0023 0.0032 0.0043 0.0013 0.0018 0.0024 0.0033 0.0044 0.0013 0.0018 0.0025 0.0034 0.0045 0.0013 0.0019 0.0026 0.0035 0.0047 -2.5 -2.4 -2.3 -2.2 -2.1 0.0048 0.0064 0.0084 0.0110 0.0143 0.0049 0.0066 0.0087 0.0113 0.0146 0.0051 0.0068 0.0089 0.0116 0.0150 0.0052 0.0069 0.0091 0.0119 0.0154 0.0054 0.0071 0.0094 0.0122 0.0158 0.0055 0.0073 0.0096 0.0125 0.0162 0.0057 0.0075 0.0099 0.0129 0.0166 0.0059 0.0078 0.0102 0.0132 0.0170 0.0060 0.0080 0.0104 0.0136 0.0174 0.0062 0.0082 0.0107 0.0139 0.0179 -2.0 -1.9 -1.8 -1.7 -1.6 0.0183 0.0233 0.0294 0.0367 0.0455 0.0188 0.0239 0.0301 0.0375 0.0465 0.0192 0.0244 0.0307 0.0384 0.0475 0.0197 0.0250 0.0314 0.0392 0.0485 0.0202 0.0256 0.0322 0.0401 0.0495 0.0207 0.0262 0.0329 0.0409 0.0505 0.0212 0.0268 0.0336 0.0418 0.0516 0.0217 0.0274 0.0344 0.0427 0.0526 0.0222 0.0281 0.0351 0.0436 0.0537 0.0228 0.0287 0.0359 0.0446 0.0548 -1.5 -1.4 -1.3 -1.2 -1.1 0.0559 0.0681 0.0823 0.0985 0.1170 0.0571 0.0694 0.0838 0.1003 0.1190 0.0582 0.0708 0.0853 0.1020 0.1210 0.0594 0.0721 0.0869 0.1038 0.1230 0.0606 0.0735 0.0885 0.1056 0.1251 0.0618 0.0749 0.0901 0.1075 0.1271 0.0630 0.0764 0.0918 0.1093 0.1292 0.0643 0.0778 0.0934 0.1112 0.1314 0.0655 0.0793 0.0951 0.1131 0.1335 0.0668 0.0808 0.0968 0.1151 0.1357 -1.0 -0.9 -0.8 -0.7 0.1379 0.1611 0.1867 0.2148 0.1401 0.1635 0.1894 0.2177 0.1423 0.1660 0.1922 0.2206 0.1446 0.1685 0.1949 0.2236 0.1469 0.1711 0.1977 0.2266 0.1492 0.1736 0.2005 0.2296 0.1515 0.1762 0.2033 0.2327 0.1539 0.1788 0.2061 0.2358 0.1562 0.1814 0.2090 0.2389 0.1587 0.1841 0.2119 0.2420 24 Material preparado por la profesora Rita Luna -0.6 0.2451 0.2483 0.2514 0.2546 0.2578 0.2611 0.2643 0.2676 0.2709 0.2743 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.2776 0.3121 0.3483 0.3859 0.4247 0.4641 0.2810 0.3156 0.3520 0.3897 0.4286 0.4681 0.2843 0.3192 0.3557 0.3936 0.4325 0.4721 0.2877 0.3228 0.3594 0.3974 0.4364 0.4761 0.2912 0.3264 0.3632 0.4013 0.4404 0.4801 0.2946 0.3300 0.3669 0.4052 0.4443 0.4840 0.2981 0.3336 0.3707 0.4090 0.4483 0.4880 0.3015 0.3372 0.3745 0.4129 0.4522 0.4920 0.3050 0.3409 0.3783 0.4168 0.4562 0.4960 0.3085 0.3446 0.3821 0.4207 0.4602 0.5000 (1) Valores calculados usando la función DISTR.NORM.ESTAND() del Excel. Distribución normal acumulada -N(0,1) Valores de la probabilidad acumulada por debajo de z (1) Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.1 0.2 0.3 0.4 0.5000 0.5398 0.5793 0.6179 0.6554 0.5040 0.5438 0.5832 0.6217 0.6591 0.5080 0.5478 0.5871 0.6255 0.6628 0.5120 0.5517 0.5910 0.6293 0.6664 0.5160 0.5557 0.5948 0.6331 0.6700 0.5199 0.5596 0.5987 0.6368 0.6736 0.5239 0.5636 0.6026 0.6406 0.6772 0.5279 0.5675 0.6064 0.6443 0.6808 0.5319 0.5714 0.6103 0.6480 0.6844 0.5359 0.5753 0.6141 0.6517 0.6879 0.5 0.6 0.7 0.8 0.9 0.6915 0.7257 0.7580 0.7881 0.8159 0.6950 0.7291 0.7611 0.7910 0.8186 0.6985 0.7324 0.7642 0.7939 0.8212 0.7019 0.7357 0.7673 0.7967 0.8238 0.7054 0.7389 0.7704 0.7995 0.8264 0.7088 0.7422 0.7734 0.8023 0.8289 0.7123 0.7454 0.7764 0.8051 0.8315 0.7157 0.7486 0.7794 0.8078 0.8340 0.7190 0.7517 0.7823 0.8106 0.8365 0.7224 0.7549 0.7852 0.8133 0.8389 1.0 1.1 1.2 1.3 1.4 0.8413 0.8643 0.8849 0.9032 0.9192 0.8438 0.8665 0.8869 0.9049 0.9207 0.8461 0.8686 0.8888 0.9066 0.9222 0.8485 0.8708 0.8907 0.9082 0.9236 0.8508 0.8729 0.8925 0.9099 0.9251 0.8531 0.8749 0.8944 0.9115 0.9265 0.8554 0.8770 0.8962 0.9131 0.9279 0.8577 0.8790 0.8980 0.9147 0.9292 0.8599 0.8810 0.8997 0.9162 0.9306 0.8621 0.8830 0.9015 0.9177 0.9319 1.5 1.6 1.7 1.8 1.9 0.9332 0.9452 0.9554 0.9641 0.9713 0.9345 0.9463 0.9564 0.9649 0.9719 0.9357 0.9474 0.9573 0.9656 0.9726 0.9370 0.9484 0.9582 0.9664 0.9732 0.9382 0.9495 0.9591 0.9671 0.9738 0.9394 0.9505 0.9599 0.9678 0.9744 0.9406 0.9515 0.9608 0.9686 0.9750 0.9418 0.9525 0.9616 0.9693 0.9756 0.9429 0.9535 0.9625 0.9699 0.9761 0.9441 0.9545 0.9633 0.9706 0.9767 2.0 2.1 2.2 2.3 2.4 0.9772 0.9821 0.9861 0.9893 0.9918 0.9778 0.9826 0.9864 0.9896 0.9920 0.9783 0.9830 0.9868 0.9898 0.9922 0.9788 0.9834 0.9871 0.9901 0.9925 0.9793 0.9838 0.9875 0.9904 0.9927 0.9798 0.9842 0.9878 0.9906 0.9929 0.9803 0.9846 0.9881 0.9909 0.9931 0.9808 0.9850 0.9884 0.9911 0.9932 0.9812 0.9854 0.9887 0.9913 0.9934 0.9817 0.9857 0.9890 0.9916 0.9936 2.5 2.6 2.7 2.8 2.9 0.9938 0.9953 0.9965 0.9974 0.9981 0.9940 0.9955 0.9966 0.9975 0.9982 0.9941 0.9956 0.9967 0.9976 0.9982 0.9943 0.9957 0.9968 0.9977 0.9983 0.9945 0.9959 0.9969 0.9977 0.9984 0.9946 0.9960 0.9970 0.9978 0.9984 0.9948 0.9961 0.9971 0.9979 0.9985 0.9949 0.9962 0.9972 0.9979 0.9985 0.9951 0.9963 0.9973 0.9980 0.9986 0.9952 0.9964 0.9974 0.9981 0.9986 3.0 3.1 3.2 3.3 3.4 3.5 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9987 0.9991 0.9993 0.9995 0.9997 0.9998 0.9987 0.9991 0.9994 0.9995 0.9997 0.9998 0.9988 0.9991 0.9994 0.9996 0.9997 0.9998 0.9988 0.9992 0.9994 0.9996 0.9997 0.9998 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9989 0.9992 0.9995 0.9996 0.9997 0.9998 0.9990 0.9993 0.9995 0.9996 0.9997 0.9998 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 (1) Valores calculados usando la función DISTR.NORM.ESTAND() del Excel. 25 Material preparado por la profesora Rita Luna 26