Explicación de la tarea 3 Felipe Guerra 1. Una ruleta legal tiene los números del 1 al 15. Este problema corresponde a una variable aleatoria discreta. La lectura de la semana menciona lo siguiente: La distribución uniforme discreta modela los casos en donde todos los resultados posibles tienen la misma probabilidad de ocurrir, y se aplica para modelar juegos de azar. a. Calcular la probabilidad de que salga un número mayor a 9. Para responder a esta pregunta primero encontramos cuantos números son mayores que 9, es decir: n >9 La cantidad de números mayores a 9 en la ruleta está dada por 15 – 9 = 6 Por lo tanto la probabilidad de que un número sea mayor a 9 es: 6 / 15 = 0.4 b. Calcular la probabilidad de que salga un número mayor a 2 y cuando mucho 7. Para responder a esta pregunta primeramente buscamos cuantos números cumplen con la condición de ser mayores que 2 y cuando mucho 7, lo que se expresa de la siguiente manera: 2 < n ≤ 7 La cantidad de números que cumplen con esta condición esta dada por: 7 – 2 = 5 Por lo tanto la probabilidad de que un número sea mayor que 2 y cuando mucho 7 es: 5 / 15 = 0.333333 c. Calcular el valor promedio del número que aparece. La lectura de la semana menciona: Sea X una v.a. discreta con rango 1, 2, 3, ..., k. Luego su función de probabilidad es P(i) = 1/k para i=1, 2, 3, ..., k. Su valor esperado o media es: Por lo tanto el promedio E(X) es: (15 + 1 ) / 2 = 8 d. Calcular la desviación estándar del número que aparece. De igual manera la lectura menciona: y su varianza es: Por lo tanto la varianza es: V(X) = (152 – 1) / 12 = 18.667 La desviación estándar es por definición la raíz cuadrada de la varianza; de ahí que: S(X) = √ 18.667 = 4.320 1 2. Un alumno contesta al azar un examen que contiene 20 preguntas, donde cada pregunta tiene 4 opciones de respuesta y solo una es la correcta. Si el alumno contesta todas las preguntas al azar. Este problema corresponde a una distribución Binomial. La lectura menciona: La Distribución Binomial. La distribución binomial se aplica en la siguiente situación. Suponer que un experimento Bernoulli se repite n veces de manera independiente, donde la probabilidad de que ocurra “éxito” es p. Y el caso del examen presentado es un experimento de Bernoulli según lo que menciona la lectura: Un experimento Bernoulli es aquél, en donde son sólo dos los resultados posibles del experimento, a estos resultados posibles los llamaremos “éxito” y “fracaso”. El adivinar las respuestas de un examen solo presenta dos posibilidades “atinar” (éxito) o “fallar” (Fracaso), por lo tanto es un experimento de Bernoulli. Ahora para resolver las preguntas del ejercicio utilizamos las formulas integradas en Excel. Pero primero veamos una explicación de cómo funcionan estas formulas. La formula =DISTR.BINOM(num_éxito, ensayos, prob_éxito, acumulado) Nos devuelve la probabilidad de una distribución Binomial en la que: num_éxito ensayos prob_éxito acumulado representa la cantidad de éxitos que deseamos sucedan en el experimento representa la cantidad de intentos en el experimento es la probabilidad de que un ensayo individual tenga éxito indica si deseamos la probabilidad especifica del numero de éxitos, o el acumulado de dicho número de éxitos o menos. Veamos un ejemplo para el caso de este ejercicio. La gráfica siguiente corresponde a las probabilidades de éxito específicas de sacar una cantidad (n) de respuestas acertadas en el examen de 20 preguntas: Primeramente el calculo de la probabilidad de éxito es 1 / 4 = 0.25 Es decir cada pregunta tiene cuatro opciones y solo una es la respuesta correcta. Entonces la formula en Excel sería =DISTR.BINOM(num_éxito, 20, 0.25, acumulado) Cantidad de preguntas acertadas Cantidad de preguntas en el examen Se explicara posteriormente Probabilidad de “atinar” a la respuesta 2 Distribución Binomial (Ejercicio 2) Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Respuestas acertadas 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0.00317121 0.02114141 0.06694781 0.13389562 0.18968545 0.20233115 0.16860929 0.1124062 0.06088669 0.02706075 0.00992228 0.00300675 0.00075169 0.00015419 2.5699E-05 3.4265E-06 3.5693E-07 2.7994E-08 1.5552E-09 5.457E-11 1.05E-14 La tabla de la izquierda muestra los valores calculados para cada una de las cantidades en la gráfica Los valores de esta gráfica fueron calculados usando =DISTR.BINOM(n, 20, 0.25, 0) en donde los valores de n fueron sustituidos por el valor específico de respuestas acertadas. El valor 0 al final de la forma indica que solo queremos el valor puntual del dato y no el valor acumulado. Por ejemplo: =DISTR.BINOM(3, 20, 0.25, 0) corresponde al valor de la barra roja y nos arroja un resultado de 0.13389562 Lo que se puede describir como la posibilidad de tener 3 (y solo 3) respuestas correctas de las 20 preguntas en el examen. 3 Una observación más. Cuando usamos el valor acumulado lo que obtenemos es: La suma de los valores anteriores al valor que estamos buscando. Es decir, para la formula siguiente: =DISTR.BINOM(3, 20, 0.25, 1) Obtenemos: Distribución Binomial (Ejercicio 2) Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Respuestas acertadas P(0) + P(1) + P(2) + P(3) = 0.00317121 + 0.02114141 + 0.06694781 + 0.13389562 = 0.22515605 Lo que se puede traducir como: “la probabilidad de tener tres respuestas acertadas o menos”. Un último comentario, la suma total de una distribución de probabilidad es siempre igual a 1. Distribución Binomial (Ejercicio 2) Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Respuestas acertadas =DISTR.BINOM(20, 20, 0.25, 1) = 1 Una vez explicado lo anterior podemos explicar las respuestas al ejercicio: 4 2. Un alumno contesta al azar un examen que contiene 20 preguntas, donde cada pregunta tiene 4 opciones de respuesta y solo una es la correcta. Si el alumno contesta todas las preguntas al azar. a. Calcular la probabilidad de que tenga menos de 5 preguntas correctas. Distribución Binomial (Ejercicio 2) Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Respuestas acertadas =DISTR.BINOM(4,20,0.25,1) = 0.4148415 Observe que usamos 4 como valor puntual por que la pregunta indica menos de 5. b. Calcular la probabilidad de que tenga por lo menos 2 y a lo mucho 7 preguntas correctas. Distribución Binomial (Ejercicio 2) Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Veamos qué es lo que indican las flechas: = DISTR.BINOM(1,20,0.25,1) Probabilidad que haya menos de 2 respuestas correctas = DISTR.BINOM(7,20,0.25,1) Probabilidad que haya a lo mucho 7 respuestas correctas De lo anterior se desprende que: = DISTR.BINOM(7,20,0.25,1) - DISTR.BINOM(1,20,0.25,1) Representa la sección indicada por la pregunta, señalada por la flecha roja. 5 c. Calcular la probabilidad que aprueba el examen si la calificación de pase es 70. Para sacar 70 el alumno tiene que contestar 14 respuestas correctas (20 x 0.70) por lo tanto, para aprobar el examen tenemos: Probabilidad 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Para calcular el valor del área indicada por la flecha roja usamos: = 1 - DISTR.BINOM(13,20,0.25,1) Ya habíamos mencionado con anterioridad que la suma total de una distribución de probabilidad es siempre igual a 1 (representado por la flecha azul). d. Obtener el número promedio de preguntas correctas en el examen y su desviación estándar. De la lectura de la semana tenemos que: Definición de Distribución Binomial. E(X) = np y Var(X) = np(1-p). Por lo tanto: E(x) = 20 x 0.25 = 5 y V(x) = 20 x 0.25 x (1 - 0.25) = 3.75 Pero como nos piden la desviación estándar en lugar de la varianza y habíamos mencionado ya que la desviación estándar es por definición la raíz cuadrada de la varianza. Tenemos: S(x) = √3.75 = 1.94 6 3. Una aerolínea intencionalmente sobrellena algunos vuelos porque se sabe que el pasajero que hace una reservación tiene una probabilidad de 85% de que se presenta a tomar el avión. Si un vuelo tiene capacidad para 122 pasajeros. Para resolver este problema debemos de calcular la probabilidad de que una vez reservada una cantidad n de boletos tengamos cuando mucho 122 personas asistiendo con un 0.85 de probabilidad. Esto se representa como: =DISTR.BINOM( 122, n, .85, 1 ) Cantidad de asistentes Cantidad de boletos vendidos Probabilidad de que una persona asista Acumulado (para tomar la posibilidad de que asistan 122 o menos) a. ¿Cuántas reservaciones se pueden hacer para tener una probabilidad de por lo menos 90% de que todos los pasajeros que se presenten se puedan acomodar en el avión? Ahora para poder determinar la posibilidad de que esto suceda con una probabilidad determinada (al menos 0.90) debemos de hacer un ensayo a prueba y error, o construir una tabla de probabilidades. El resultado es el siguiente: Cant. Boletos 136 137 138 Probabilidad =DISTR.BINOM(122,136,0.85,1) = 0.957047520 =DISTR.BINOM(122,137,0.85,1) = 0.931211501 =DISTR.BINOM(122,138,0.85,1) = 0.895816156 <<< ≥ 0.90 b. Haciendo la cantidad de reservaciones indicadas en el (A), calcular la probabilidad de que se llene el avión. Para esto determinamos la probabilidad de que lleguen 122 o mas personas con la siguiente formula: = 1 - DISTR.BINOM( 121, 137, 0.85, 1 ) = 0.11043008 Es decir la probabilidad acumulada de que asista cualquier cantidad de personas (100% = 1) menos la probabilidad de que asistan 121 personas o menos, dado que se hicieron 137 reservaciones. Observe que usamos la cantidad de 121 y no 122 por que con 122 ya se considera que el avión está lleno, aun cuando no se haya rechazado a ningún pasajero. 4. Se sabe que la probabilidad de que un cliente compre el periódico en un supermercado es 5%. a. ¿Cuántos periódicos debe tener si desea una probabilidad de 99% de que habrá periódico para los primeros 1000 clientes. Este problema se resuelve de manera similar al anterior: Determinar una tabla para diferentes cantidades de periódicos que garantice que todos los clientes que deseen comprar obtengan uno con una probabilidad de por lo menos 0.99 Cantidad 66 67 68 Probabilidad =DISTR.BINOM( 66,1000,0.05,1) = 0.989408690 =DISTR.BINOM( 67,1000,0.05,1) = 0.992592284 =DISTR.BINOM( 68,1000,0.05,1) = 0.994891273 <<< ≥ 0.99 7 Observe que en la pregunta 3 se plantea una cantidad fija de éxitos (122 lugares en el avión), y la variable que cambia es la cantidad de eventos (reservaciones). En tanto que en la pregunta 4 la cantidad de eventos es fija (los primeros 1000 clientes) y la parte variable es la cantidad de éxitos (los periódicos que se pueden vender). Por lo tanto el planteamiento de la tabla es ligeramente diferente (las variables están marcadas en azul) b. Calcular la probabilidad de que se vendan todos los periódicos considerando los primeros 1000 clientes y colocando la cantidad de periódicos indicada en (A). El enfoque en este problema es ahora el determinar la probabilidad de que todos los periódicos se vendan, es decir que la gente pida más periódicos que los que se tienen (67 o más). Esto está determinado por la siguiente fórmula: =1-DISTR.BINOM(66,1000,0.05,1) Es decir la probabilidad acumulada de que se compren (o soliciten) cualquier cantidad de periódicos (100% = 1) menos la probabilidad de que se vendan 66 periódicos o menos, considerando a las primeras 1000 personas, con una posibilidad de compra de 0.05 por persona. Una vez más debe observar que para la diferencia usamos la cantidad de 66 (es decir que no se vendan todos) y no la cantidad de 67 (pues esta asume que si se vendieron todos). c. ¿Cuantos periódicos debe colocar si desea que haya una probabilidad de que todos se vendan de por lo menos 0.9, considerando los primeros 1000 clientes? El enfoque en este problema es similar a la pregunta anterior; la probabilidad de que todos los periódicos se vendan, es decir que la gente pida más periódicos que los que se prepararon con una probabilidad de al menos 0.90 considerando únicamente las primeras 1000 personas Cantidad Probabilidad 40 =1-DISTR.BINOM(40-1,1000,0.05,1) = 0.940185121 41 =1-DISTR.BINOM(41-1,1000,0.05,1) = 0.919363427 42 =1-DISTR.BINOM(42-1,1000,0.05,1) = 0.893703829 <<< ≥ 0.90 Observe que utilizamos n-1 en el calculo de la distribución Binomial, pues indica la cantidad que dejaría al menos un periódico sin vender. 5. Una compañía de seguros vende una póliza de seguros a un grupo de 10 carros. Por cada carro que sea robado la compañía pagará $10000.00 USD. La probabilidad de que un carro sea robado es 0.05. Cuanto debe cobrar por cada carro tal que por lo menos haya un 80% de probabilidad que no perderá dinero. Este problema corresponde también a una distribución Binomial, en la cual hay dos posibilidades; los carros son robados o los carros no son robados. Su solución es similar a la planteada por el ejemplo 3.2 inciso f) de la lectura de esta semana. La cantidad de dinero que se debe pagar por cada auto robado puede considerarse como un valor de refacción en caso de que el evento falle, haciendo una similitud al problema 3.2 f) de referencia. Por lo tanto se tiene una cantidad de autos robados X que al multiplicarlo por $10,000 no debe superar el valor de dinero obtenido por la venta de pólizas w con una probabilidad del 80%. Lo primero que hacemos es calcular con una probabilidad de al menos 80% cuantos carros se van a robar. Para eso usamos la fórmula: =DISTR.BINOM(X,10,0.05,1), con la cual obtenemos la probabilidad de que se roben X carros o menos. 8 Cant. Autos Robados (X) 0 1 2 3 4 5 6 7 8 9 10 Con base en la tabla podemos determinar que hay un 91% de probabilidad de que se roben un automóvil o menos. P(n≤x) 0.598736939 0.913861644 0.988496443 0.998971502 0.99993631 0.999997245 0.999999918 0.999999998 1 1 1 Por lo tanto la compañía puede tener una certeza del 91% de que va a pagar $10,000 o menos producto de indemnizaciones. Como la probabilidad de que eso suceda es mayor al 80% bastará con que la compañía cobre $10,000 por el total de las pólizas para garantizar que no va a perder dinero. De ahí se desprende que el costo de poliza para cada carro debe ser: Costo de indemnización / Número de polizas $10,000 / 10 = $1,000 6. En la frontera con USA, al ingresar un automóvil a México se pasa por un semáforo en donde hay una probabilidad de 15% de que encienda luz roja y el auto sea detenido para su revisión. Si enciende luz verde el auto se interna a México sin ser revisado (Suponer independencia). a. Obtener la probabilidad de que el quinto auto sea el primero en ser detenido para revisión. Para responder esta pregunta debemos de calcular la posibilidad de que los primeros 4 vehículos no hayan sido revisados: =DISTR.BINOM( 0, 4, 0.15, 1) 0 éxitos 4 eventos Y después multiplicarlo por la probabilidad de que el número 5 sea revisado (0.15), de donde se obtiene: =DISTR.BINOM( 0, 4, 0.15, 1) * 0.15 = 0.07830094 b. Obtener la probabilidad de que sean necesarios más de 4 autos para que llegue el primero en ser revisado. Esto es equivalente a decir que no haya sido revisado un carro las primeras 4 veces: =DISTR.BINOM( 0, 4, 0.15,1 ) = 0.52200625 c. Obtener el número promedio de autos y su desviación estándar hasta que enciende la luz roja. Este problema corresponde a una distribución geométrica, es decir un experimento de Bernoulli (Luz roja o luz verde) repetido independientemente hasta que se alcanza el éxito (se enciende la luz roja). De acuerdo con la lectura de la semana para la distribución geométrica se tiene: y Por lo que E(x) = 1 / 0.15 = 6.66666667 y V(x) = (1/0.15) (1/0.15-1) = 37.7777778 Y la desviación estándar = S(x) = √37.778 = 6.14636297 9 7. Se sabe que el número de quejas por semana que llegan a un parque de diversiones que abre todos los días es una variable aleatoria que se ajusta bien a la distribución Poisson. En promedio se reciben 9 quejas por semana (el parque abre todos los días). Los comentarios antes mencionados referentes a la distribución binomial y las formulas en Excel, se pueden generalizar para otras distribuciones de probabilidad y sus correspondientes formulas en Excel. La formula para la distribución de Poisson es: =POISSON(x, media, acumulado) Nos devuelve la probabilidad de una distribución Poisson en la que: x representa la cantidad de éxitos que deseamos sucedan en el experimento media representa el promedio de la distribución de Poisson acumulado indica si deseamos la probabilidad especifica del numero de éxitos, o el acumulado de dicho número de exitos o menos. y también se aplica el comentario acerca de que: la suma total de una distribución de probabilidad es siempre igual a 1. a. Calcular la probabilidad de que en una semana se reciban más de 12 quejas. Podemos traducir esto como la probabilidad total menos la probabilidad de que se reciban 12 quejas o menos. = 1 - POISSON( 12, 9, 1 ) = 0.12422657 b. Calcular la probabilidad de que en una semana se reciban entre 5 y 11 quejas sin incluir). En este caso debemos buscar la probabilidad de que se den al menos 10 quejas (hasta 11 sin incluir) y le quitamos la probabilidad de que se den 5 o menos quejas. = POISSON (10, 9, 1) - POISSON( 5, 9, 1 ) = 0.5902978 c. Calcular la probabilidad de que en tres días lleguen más de 4 quejas. En el caso de la probabilidad de Poisson, si el periodo del evento se extiende o se acorta la probabilidad de ocurrencia de la media se extiende o se acorta en forma proporcional a la extensión del evento. Por ejemplo: Si en 7 días el promedio de quejas recibidas es 9 el promedio de quejas en tres días esta dado por: Promedio = 9 / 7 * 3 = 3.857 quejas Y con esos datos se resuelve el problema para periodos de tiempo extendidos o acortados. =1 - POISSON( 4, 9/7*3, 1 ) = 0.34327767 Es decir la probabilidad total menos la probabilidad de que se reciban 4 o menos quejas 10 d. Calcular la probabilidad de que en un mes lleguen entre 20 y 30 quejas (sin incluir). De forma similar al problema anterior tenemos que el promedio para un mes es: Promedio = 9 / 7 * 30 = 38.57 quejas (Se asumen meses de 30 días) Y la respuesta a la pregunta esta dada por: =POISSON( 29 , 9 / 7 * 30 , 1 ) - POISSON( 20 , 9 / 7 * 30 , 1 ) = 0.06652947 Algunos aprendizajes de la tarea: En las formulas de distribución de probabilidad en Excel podemos observar lo siguiente: =DISTR.BINOM(num_éxito, ensayos, prob_éxito, acumulado) =POISSON(x, media, acumulado) La parte de acumulado puede tomar los valores de 1 y 0 (ó VERDADERO y FALSO), a) Cuando se usa el valor de 1 (o VERDADERO) el resultado corresponde a la probabilidad del valor buscado o menos. b) Cuando se usa el valor de 0 (o FALSO) el resultado corresponde a la probabilidad puntual (ese valor y solo ese) La suma total de una distribución de probabilidad es siempre igual a 1. La desviación estándar corresponde a la raíz cuadrada de la varianza. 11