Probabilidad y Estadı́stica Problemas adicionales Comentario introductorio El siguiente material contiene un listado de problemas que se presentaron en los coloquios correspondientes al primer y segundo cuatrimestre de 2008 de las asignaturas de Probabilidad y Estadı́stica (61.06 y 61.09). Los problemas están organizados temáticamente y -en la medida de lo posible- los temas están ordenados de acuerdo con el desarrollo del programa de estas materias. Probabilidad Probabilidad y Probabilidad Condicional 1. Un dado equilibrado se arrojará sucesivamente hasta que la suma de los resultados obtenidos supere 2. Hallar la probabilidad de que la suma sea igual a 4. 2. Se tienen dos monedas. Una moneda está cargada con probabilidad p1 de salir “cara” y la otra con probabilidad p2 . Puede optar por una de las siguientes estrategias: (E1) Elegir una moneda al azar y lanzarla dos veces. (E2) Lanzar ambas monedas. El juego se gana si salen dos “caras”; en caso contrario se pierde. ¿Cuál de las dos estrategias es más conveniente?. 3. Lucas tiene 3 sacos idénticos, cada uno con dos bolsillos. Todos los sacos salvo uno tienen un paquete de cigarillos en cada bolsillo. El saco restante tiene un paquete de cigarrillos en un bolsillo y una cajita de fósforos en el otro. Lucas elige un saco al azar y sale a trabajar. En la parada del colectivo mete la mano en un bolsillo y saca un paquete de cigarrillos. ¿Cuál es la probabilidad de que pueda fumar mientras espera el colectivo? 4. Existen dos caminos de A hasta B (que no pasan por C) y dos caminos de B hasta C (que no pasan por A). Cada uno de estos caminos está bloqueado con probabilidad 0.2 independientemente de los demás. Hallar la probabilidad de que exista un camino abierto desde A hasta B sabiendo que no hay ningún camino abierto desde A hasta C. 1 C B A 5. La figura siguiente representa el mapa de una localidad turı́stica de 40 manzanas situada en la costa atlántica. H Q C P Un paseo desde el hotel, situado en el punto H, hasta el puerto de pescadores, situado en el punto P , es una sucesión de 14 cuadras -dentro de la localidad- recorridas hacia la izquierda o hacia abajo (ver la figura). Se elige al azar un paseo desde el hotel hasta el puerto de pescadores (esto es, todos los paseos tienen la misma probabilidad de ser elegidos). (a) Calcular la probabilidad de pasar por el quiosco de diarios y revistas situado en el punto Q. (b) Sabiendo que se pasó por el café situado en el punto C, hallar la probabilidad de haber pasado por el quiosco de diarios y revistas. 6. Dos bolas se pintan de rojo o de negro, independientemente y con probabilidad 1/2 para cada color, y se colocan en una urna. (a) Si se extrae una bola de la urna y es roja, cuál es la probabilidad de que la otra bola sea roja? (b) Si se sabe que en la urna hay una bola roja, cuál es la probabilidad de que la otra sea roja? 7. En una urna hay una bola blanca y dos bolas negras. En cada paso se extrae una bola al azar y se la repone junto con otra del mismo color. (a) Calcular la probabilidad de que al finalizar el segundo paso la urna contenga dos bolas blancas y tres negras. (b) Si al finalizar el segundo paso la urna contiene dos bolas blancas y tres negras, ¿cuál es la probabilidad de que en el primer paso se haya extraı́do una bola negra? 8. Una caja contiene dos monedas normales y una moneda que tiene dos cecas. Se elige una moneda al azar y se lanza al aire dos veces. Si el primer tiro fue ceca, ¿Cuál es la probabilidad de que el segundo también lo sea? 9. Inicialmente, un tirador tiene una probabilidad de acertar a un blanco de 0.6. En cada tiro mejora su punterı́a, aumentando en un 10 % la probabilidad de acertar al blanco respecto al tiro anterior. Si disparó tres tiros y acertó exactamente una vez, cuál es la probabilidad de que haya sido en el último tiro? 10. Lucas y Monk juegan un campeonato de ajedrez que ganará el primero que obtenga dos triunfos de ventaja. Cada partida es ganada por Lucas con probabilidad 0.55 y por Monk con probabilidad 0.45 (no hay tablas). Hallar la probabilidad de que Lucas gane el campeonato en la segunda partida sabiendo que lo ganará en 4 o menos partidas. Variables aleatorias 11. Sea X una variable aleatoria cuya función de distribución FX (x) = P(X ≤ x) tiene gráfico de forma 1 X F (x) 2/3 1/3 0 −3 −2 −1 0 x 1 2 3 (a) Calcular P(−1 ≤ X ≤ 1), P(1 ≤ X < 2), P(1 ≤ X ≤ 2). (b) Calcular la esperanza y la varianza de X. 12. En una urna hay 2 bolas rojas y 2 bolas negras. En cada paso se extrae una bola al azar y si es negra se la reemplaza en la urna por una roja. Encontrar la función de probabilidad de la cantidad de pasos necesarios para sacar una bola roja. 13. El tiempo, t, en horas, que se tarda en reparar una PC es una variable aleatoria con distribución uniforme sobre el intervalo (0, 4). El√costo en mano de obra de reparación depende del tiempo utilizado y es igual a 120 + 90 t. Hallar la función de distribución del costo en mano de obra de reparar una PC y calcular su media. 14. El diámetro en cm. de ciertos ejes es una variable aleatoria con función densidad de probabilidad f (x) = (x − 1)1{1 < x ≤ 2} + (3 − x)1{2 < x < 3}. Una máquina está diseñada para descartar ejes cuyos diámetros son inferiores a 1, 5 cm. Pero a veces falla y con una probabilidad de 0.1 no descarta un eje de diámetro inferior a 1.5 cm. Ningún eje cuyo diámetro sea superior a 1.5 cm. es descartado. Hallar la función de distribución de los ejes no descartados. 15. Se quiebra una vara en un punto al azar. Calcular la probabilidad de que la longitud de la pieza más larga sea mayor que el doble de la longitud de la pieza mas corta. 16. Un libro sobre juegos recomienda la siguiente estrategia para ganar en la ruleta. Se juega un peso al rojo. Si sale rojo (cuya probabilidad es 18/37), el jugador debe tomar su ganancia y retirarse de la mesa. Si no sale rojo (cuya probabilidad es 19/37), debe apostar un peso al rojo en cada uno de las dos tiradas siguientes y abandonar la mesa. Sea X la “ganancia” del jugador cuando abandona la mesa. Hallar P(X > 0) y E[X]. Qué opina de la estrategia recomendada? 17. Sea X una variable aleatoria a valores en el conjunto {1, 2, 3} tal que E[X] = 2. Hallar los valores de pi = P(X = i), i = 1, 2, 3 que maximizan la varianza de X. 18. Una máquina selecciona ciruelas clasificándolas según su diámetro. Las de diámetro superior a los 4 cm. se consideran de clase A y las otras de clase B. El diámetro de cada ciruela es una variable aleatoria uniforme entre 3 y 5 cm. Hallar la probabilidad de que en una bolsa de 20 ciruelas de tipo A exactamente 3 tengan diámetro superior a los 4.5 cm. Mezclas 19. El peso de ciertas bolsas de naranjas es una variable aleatoria uniforme entre 2 y 6 kilos. Se van agregando bolsas en una balanza hasta que el peso supere 5 kilos. (a) Hallar la media de la cantidad final de bolsas en la balanza. (b) Hallar la media de peso final ası́ obtenido. 20. En una caja hay 4 bolas negras y 6 bolas rojas. El peso de las bolas negras tiene distribución exponencial de media 25 gramos, y el de las rojas exponencial de media 35 gramos. Sea X el peso de una bola elegida al azar de la caja. (a) Hallar la función de distribución de X. (b) Sabiendo que la bola elegida pesa 30 gramos, hallar la probabilidad de que la bola elegida sea roja. Modelos bidimensionales 21. El tiempo disponible para efectuar un disparo es una variable aleatoria con distribución exponencial de media 5 segundos. La probabilidad de acertar al blanco depende del tiempo t que se tarda en efectuar el disparo y vale p(t) = 0.7(1 − e−2t ). Hallar la probabilidad de acertar exactamente tres de diez disparos. 22. Dadas dos variables aleatorias X1 , X2 , uniformes e independientes sobre el intervalo [1, 2], se construyen un cuadrado de lado X1 y un cı́rculo de radio X2 . Calcular la probabilidad de que el área del cuadrado supere el área del cı́rculo. 23. Sean a y b variables aleatorias independientes con distribución U[−2, 2]. Hallar la probabilidad de que x2 − 2ax + b no tenga raı́ces reales. 24. Sean X1 y X2 variables aleatorias independientes con distribución uniforme sobre el intervalo [0, 2]. Una vara de longitud 2 se quiebra en dos puntos cuyas distancias a la misma punta de la vara son X1 y X2 . Calcular la probabilidad de que las tres piezas ası́ formadas puedan usarse para construir un triángulo. (Sugerencia: “Παντ òς τ ̺ιγ ώνoυ αί δ ύo πλευ̺αὶ τ η̃ς λoιπ η̃ς µείζoν ές είσι π άντ η µετ αλαµβαν óµεναι” Euclides, (-300). Elementos de Geometrı́a) 25. Pedro y Pablo quedaron en encontrarse entre las 20 y las 21 hs. en un sitio determinado. Los tiempos de llegada de cada uno al lugar de la cita son variables independientes uniformemente distribuidas en el intervalo convenido. Pedro es inglés y Pablo brasilero. Fieles a sus orı́genes, si Pedro llega primero no esperará a Pablo más de 5 minutos y si Pablo llega primero no esperará a Pedro más de 15 minutos. (a) Hallar la probabilidad de que Pedro y Pablo se encuentren. (b) Se sabe que Pedro y Pablo se encontraron y que Pedro llegó a las 20:35 al lugar de la cita. ¿Cómo se distribuye el tiempo de llegada de Pablo? 26. Sea (X, Y ) con distribución uniforme en el cuadrado de vértices (0, 0), (1, 0), (1, 1), (0, 1). Sea h(x, y) = 1 y ≤ e−2x Hallar la media y la varianza de U := h(X, Y ). 27. Un tirador arroja un dardo a un blanco circular de radio 3. En cada tiro tiene probabilidad 1/5 de errar al blanco. Cuando acierta al blanco, el dardo se clava en un punto uniformemente distribuı́do en el cı́rculo. Si acierta al blanco se le asigna un puntaje igual a la distancia entre el punto donde se clavó el dardo y el centro del blanco. Si le erra, el puntaje asignado es 4. Hallar la función de distribución del puntaje asignado. 28. Sea (X, Y ) un punto aleatorio con distribución uniforme en el cuarto del cı́rculo de radio 1 centrado en (0, 0) contenido en primer cuadrante. (a) Hallar la densidad marginal de X. (b) Hallar la densidad condicional de Y dado que X = 1/2. √ (c) Hallar la función distribución de Z = X 2 + Y 2 . 29. Sea Ω la región del plano limitada por el cuadrilátero de vértices (0, 0), (1/2, 0), (1, 1/2), (1, 1). Sea (X, Y ) un punto aleatorio con distribución uniforme en la región Ω. (a) Hallar la distribución marginal de X. (b) Hallar la función densidad de probabilidades de X − Y . 30. Sea (X, Y ) con distribución uniforme en el triángulo de vértices (0, 0), (4, 0), (2, 2). Hallar la función de distribución de Z = mı́n(X, Y ). 31. Se lanzan dos dados equilibrados. Sea X el resultado del primero e Y el resultado del segundo. Hallar la función de probabilidades y el valor esperado del mı́nimo entre X e Y . 32. Sean X1 y X2 variables aleatorias con distribución Bernoulli de parámetros 1/2 y 1/3 respectivamente tales que Cov(X1 , X2 ) = 0. (a) Mostrar que los eventos A = {X1 = 1} y B = {X2 = 1} son independientes. (b) Mostrar que las variables X1 y X2 son independientes. 33. Se arroja un dado equilibrado 3 veces y se cuenta la cantidad, N , de cuatros observados. Luego se arroja una moneda equilibrada N veces y se cuenta la cantidad, M , de caras observadas. (a) Hallar la función de probabilidad conjunta de N y M . (b) Calcular Cov(N, M ). 34. Dada la función de densidad conjunta f (x, y) = y1{0 < x < 2, 0 < y < 1}. (a) ¿X e Y son variables aleatorias independientes? (b) Calcular la varianza de 3X − 2Y . 35. Sea (X, Y ) un punto aleatorio con distribución uniforme en el triángulo de vértices (0, 0), (2, 0), (2, 2). Hallar la recta de regresión de Y basada en X. 36. Se arroja un dado 100 veces. Sean X e Y las cantidades de resultados pares e impares respectivamente. Hallar la esperanza condicional E[Y |X] y el valor de Cov(X, Y ). Modelos multivariados 37. Un dado tiene sus caras numeradas de la siguiente manera 1, 1, 2, 2, 3, 3. El dado se lanza 4 veces. Sean Xi , i = 1, 2, 3, las variables aleatorias definidas por 1 si en algún lanzamiento se observó una cara numerada i, Xi = 0 en otro caso . (a) Calcular Cov(X1 , X2 ). (b) Calcular la esperanza y la varianza de X1 + X2 + X3 . Ensayos Bernoulli 38. Lucas está completamente borracho y perdido en Parque Chas. Con probabilidad 1/5 elige un camino que lo lleva a su casa en 45 minutos y con probabilidad 4/5 elige un camino circular y vuelve a su punto de partida en 20 minutos. Cada vez que retorna al punto de partida vuelve a elegir uno de los dos caminos con las mismas probabilidades dadas anteriormente. Hallar la esperanza del tiempo que demora Lucas en llegar a su casa. 39. Se tirará un dado equilibrado hasta que salga el as. Sea N la cantidad de tiradas necesarias y sea M la cantidad de cuatros obtenidos. (a) Calcular E[M ]. (b) Calcular Cov(N, M ). 40. Monk y Lucas disputan la final de un Campeonato de Ajedrez. El primero que gane 6 partidas (no hay tablas) resulta ganador. La duración de cada partida (medida en horas) es una variable aleatoria cuya función densidad de probabilidad es t−1 f (t) = 1{1 ≤ t ≤ 3}. 2 La probabilidad de que Lucas gane cada partida depende de la duración de la misma. Si dura menos de 2 horas, gana con probabilidad 3/4; si no, gana con probabilidad 1/2. ¿Cuál es la probabilidad de que Lucas gane el Campeonato en la octava partida? Exponenciales y geométricas 41. En una parada los tiempos de llegada entre taxis (en minutos) son exponenciales independientes de intensidad 1/2, mientras que los de los colectivos son exponenciales independientes pero de intensidad 3/2. Lucas llega a la parada a las 7 hs. (a) Hallar el tiempo medio hasta la llegada del primer vehı́culo. (b) Calcular la probabilidad de que el primer vehı́culo que llega sea un taxi. 42. Un proceso de arribos comienza en t = 0 y los tiempos entre arribbos T1 , T2 , . . . son variables aleatorias independientes cada una con función densidad: 2 −t 3 −t f (t) = 1{t ≥ 0}. e + te 5 5 (a) Calcular la media de T1 . (b) Calcular la probabilidad de que no ocurran arribos entre t = 0 y t = 2 43. Decida si las siguientes afirmaciones son verdaderas o falsas justificando adecuadamente su respuesta. (a) Sea X1 , X2 , . . . una sucesión de variables aleatorias independientes e idénticamente distribuidas con distribución exponencial de intensidad 3λ. Si Yk es el promedio de las primeras k variables de la sucesión, entonces la varianza de Yk es 1/(9λ2 ). (b) Si X1 y X2 son v. a. independientes con distribuciones exponenciales de intensidades 2 y 5, respectivamente, entonces mı́n(X1 , X2 ) tiene distribución exponencial de intensidad 2. (c) Sea X1 , X2 , . . . una sucesión de variables aleatorias, todas de media 2. Si N es una v.a. con distribución geométrica de parámetro p = 2/3, entonces la esperanza de X1 + · · · + XN condicionada a que N ≥ 2 es 5. 44. El precio de uso de un teléfono es de 20 centavos por pulso. Los pulsos se cuentan cada dos minutos o fracción. Las llamadas tienen duración exponencial de media 3 minutos. (a) Demostrar que la cantidad de pulsos de una llamada es una variable aleatoria geométrica de parámetro p. (b) Hallar la media y la varianza del costo de cada llamada. 45. Una televidente quiere participar de un concurso y realiza llamadas al canal de televisión. El tiempo entre llamadas es una variable exponencial de media 50 segundos. Por cada llamada la probabilidad de comunicarse con el programa es 1/6. Hallar la esperanza y la función de distribución del tiempo que tiene que esperar la televidente para comunicarse con el programa. Procesos de Poisson 46. A un banco llegan clientes de acuerdo con un proceso de Poisson de intensidad 20 por hora. (a) ¿Cuál es la probabilidad de que el lapso entre la octava y la décima llegada supere los 15 minutos? (b) Entre las 10:00 y las 11:00 llegaron 4 clientes. ¿Cuál es la probabilidad de que exactamente 2 de ellos hayan llegado entre las 10:00 y las 10:15? 47. Familias de argentinos migran a Italia de acuerdo con un proceso de Poisson de tasa 4 por semana. Si el número de integrantes de cada familia es independiente y puede ser 2, 3, 4, 5 con probabilidades respectivas 0.1, 0.2, 0.3, 0.4. ¿Cuál es el valor esperado del número de argentinos que migran a Italia durante un perı́odo fijo de 15 semanas? 48. Los accidentes en una fábrica industrial se rigen por un proceso de Poisson de intensidad 4 por mes. La cantidad de trabajadores dañados en cada accidente es una variable aleatoria que vale 1, 2 o 3 con equiprobabilidad. Hallar la media de la cantidad anual de daños accidentales en la fábrica. 49. Midiendo actividad de uranio a un contador Geiger arriban pulsos de acuerdo con un proceso de Poisson a tasa de 3 arribos por segundo. Cada pulso que arriba al contador tiene una probabilidad 2/3 de ser registrado. Sea X(t) el número de pulsos registrados en t segundos. (a) P(X(t) = 0) = ? (b) E[X(t)] = ? (c) Si se midiera plutonio la tasa serı́a de 6 arribos por segundo. Si durante 0.2 segundos no se registraron arribos, ¿cuál es la probabilidad de que se estuviera midiendo uranio? 50. Una máquina produce rollos de alambre. El alambre tiene fallas distribuidas como un proceso de Poisson de intensidad 1 cada 25 metros. La máquina corta el alambre en la primer falla antes de los 100 metros o a los 100 metros si no hay fallas antes. (a) Hallar la función de distribución de la longitud de los rollos de alambre. (b) Hallar la media de la longitud de los rollos de alambre. 51. Una maquina produce rollos de alambre. El alambre tiene fallas distribuidas como un proceso de Poisson de intensidad 1 cada 25 metros. La maquina deberı́a cortar el rollo en cada falla pero detecta cada una de ellas con probabilidad 0.9. (a) Hallar la cantidad media de fallas en los rollos. (b) Hallar la cantidad media de fallas en los rollos que tienen por lo menos una falla. (c) Hallar la cantidad media de fallas en los rollos que miden más de 100 metros. 52. Una máquina produce rollos de alambre. El alambre tiene fallas distribuidas como un proceso de Poisson de intensidad 1 cada 25 metros. La máquina corta el alambre en la primer falla detectada después de los 50 metros, pero detecta las fallas con probabilidad 0.9. (a) Hallar la cantidad media de fallas en los rollos. (b) Hallar la cantidad media de fallas en los rollos que miden más de 100 metros. 53. Una máquina produce rollos de alambre. El alambre tiene fallas distribuidas como un proceso de Poisson de intensidad 1 cada 25 metros. La máquina detecta cada falla con probabilidad 0.9 y corta el alambre en la primer falla detectada antes de los 100 metros o a los 100 metros si no se detectan fallas antes. (a) Hallar la media de la longitud de los rollos de alambre. (b) Hallar la cantidad media de fallas en los rollos. 54. Una máquina produce rollos de alambre. El alambre tiene fallas distribuidas como un proceso de Poisson de intensidad 1 cada 25 metros. La máquina corta el alambre en la primer falla detectada después de los 50 metros, pero detecta las fallas con probabilidad 0.9. Si entre los 50 y los 150 metros no detecta ninguna falla, la máquina corta el alambre a los 150 metros. Hallar la cantidad media de fallas en los rollos. Distribución Normal y Teorema Central del Lı́mite 55. En un control de calidad de hormigón se extraen 3 probetas al azar. Cada una es probada para su resistencia a la compresión. Una probeta pasará la prueba si resiste por lo menos una carga axial de 5500 kg. La resistencia a la rotura de la probetas puede ser modelada por una distribución normal de media µ = 7340 y desvı́o σ = 1050 kg. La especificación requiere que las 3 probetas pasen la prueba para que el lote sea aceptado. El contratista prepara un lote cada dı́a. (a) ¿Cuál es la probabilidad de que el primer lote rechazado sea el preparado el quinto dı́a? (b) El contratista puede mejorar la mezcla llevando la media de la distribución anterior a 8250 kg. y reduciendo además el coeficiente de variación (σ/µ) en un 10 % respecto del anterior. ¿Cuál serı́a entonces la probabilidad de que le sea rechazado por lo menos un lote en 10 dı́as? 56. Sea X una variable aleatoria con distribución normal N (0, 1). Hallar la función densidad de probabilidad de Y = X 2 . 57. Sean X e Y variables aleatorias N (0, 1) independientes. Hallar la función de densidad conjunta y las funciones de densidad marginales de W = 2X − 3Y y Z = 3X + 2Y y mostrar que W y Z son independientes. 58. Un astronauta debe permanecer 435 dı́as en el espacio y tiene que optar entre dos alternativas. Utilizar 36 tanques de oxı́geno de tipo A o 49 tanques de oxigeno de tipo B. Cada tanque de oxı́geno de tipo A tiene un rendimiento de media 12 dı́as y desvı́o 1/4. Cada tanque de oxı́geno de tipo B tiene un rendimiento de media de 8, 75 dı́as y desvı́o 25/28. Qué alternativa es la más conveniente? 59. Dos aerolı́neas A y B ofrecen idéntico servicio para viajar de Buenos Aires a San Pablo. Suponga que compiten por la misma población de 400 clientes, cada uno de los cuales elige una aerolı́nea al azar. ¿Cuál es la probabilidad de que la lı́nea A tenga más clientes que sus 210 asientos? (Debe obtener un resultado numérico) 60. Una máquina selecciona ciruelas y las separa de acuerdo con el diámetro x (medido en cm.) de cada una. Las de diámetro superior a 4 cm. se consideran de clase A y las otras de clase B. El diámetro de cada ciruela es una variable aleatoria uniforme entre 3 y 5 cm. El peso (medido en gramos) de cada ciruela depende de su diámetro y es x3 . Si las cajas pesan 100 gramos, estimar la probabilidad de que una caja con 100 ciruelas de tipo A pese más de 9.6 kilos. 61. 432 números se redondean al entero más cercano y se suman. Suponiendo que los errores individuales de redondeo se distribuyen uniformemente sobre el intervalo (−0.5, 0.5), aproximar la probabilidad de que la suma de los números redondeados difiera de la suma exacta en más de 6. 62. Lucas apuesta a que en 100 lanzamientos de una moneda honesta la cantidad de “caras” observadas diferirá de 50 en 4 o más. (a) ¿Cuál es la probabilidad de Lucas pierda su apuesta? (b) ¿Es cierto que si se tira la moneda 2n veces y X es el número de caras, entonces lı́mn→∞ P(|X − n| ≤ 4) = 0? 63. En un sistema electrónico se producen fallas de acuerdo con un proceso de Poisson de tasa 2.5 por mes. Por motivos de seguridad se ha decidido cambiarlo cuando ocurran 196 fallas. Calcular (aproximadamente) la probabilidad de que el sistema sea cambiado antes de los 67.2 meses. 64. Lucas y Monk palean arena cargando un volquete. La probabilidad de que una palada sea de Monk es 0.4 y la probabilidad de que sea de Lucas es 0.6. El volumen en decı́metros cúbicos de la palada de Lucas es una variable aleatoria uniforme entre 1 y 3, y el de la palada de Monk es una variable aleatoria uniforme entre 2 y 4. ¿Cuántas paladas son necesarias para que la probabilidad de que el volquete tenga más de 4 metros cúbicos de arena supere 0.9? 65. El peso W (en toneladas) que puede resistir un puente sin sufrir daños estructurales es una variable aleatoria con distribución normal de media 1400 y desvı́o 100. El peso (en toneladas) de cada camión de arena es una variable aleatoria de media 20 y desvı́o 0.25. ¿Cuántos camiones de arena debe haber, como mı́nimo, sobre el tablero del puente para que la probabilidad de que ocurran daños estructurales supere 0.1? Estadı́stica Estimación por máxima verosimilitud 1. En un bolillero hay 6 bolitas. Se extraen dos: una es blanca, la otra es negra. Estimar la cantidad de bolitas blancas que habı́a inicialmente en el bolillero. 2. En una urna hay k bolas blancas y 5 bolas negras, donde 0 ≤ k ≤ 6. Se extraen 2 bolas al azar sin reposición, se las examina y se las repone en la urna. Sabiendo que las dos bolas examinadas resultaron blancas y usando el método de máxima verosimilitud estimar la probabilidad de que al extraer nuevamente dos bolas al azar sin reposición una sea blanca y la otra negra. 3. Se tienen dos dados. Uno equilibrado y otro con probabilidad de as 0.21. Se elige un dado y se lo lanza 5 veces. Se observan 2 ases. Hallar el estimador de máxima verosimilitud de la probabilidad de as del dado elegido. 4. Un buzo debe realizar una tarea en el océano que le insumirá 45 minutos. Sabiendo que la duración en minutos de cada tanque de oxı́geno tiene una distribución normal con desvı́o 2 y que en una muestra aleatoria de 9 tanques se observaron las duraciones: 37.447, 51.101, 34.258, 38.401, 33.288, 45.971, 47.348, 36.241, 41.585, estimar por máxima verosimilitud la probabilidad de que el buzo pueda terminar su tarea si lleva un solo tanque de oxı́geno. 5. Lucas ingresa en un banco a las 11:30 para cobrar un cheque y le dan el número 68 de la fila de espera. Mientras se sienta a esperar observa que está siendo atendido el cliente número 61. El tiempo de atención (en minutos) para cada cliente se distribuye como una variable exponencial de intensidad λ. A las 11:45 comienza a ser atendido el cliente número 66 y Lucas decide salir del banco a fumar un cigarrillo. Suponiendo que Lucas demora 6 minutos en volver a la fila de espera, estimar por máxima verosimilitud la probabilidad de que haya perdido su turno en la fila. 6. Los tiempos de atención de clientes en un banco son variables aleatorias con distribución exponencial de intensidad λ e independientes entre sı́. Sabiendo que en 10 minutos fueron atendidos exactamente 5 clientes, estimar por máxima verosimilitud la probabilidad de que en los siguientes cinco minutos sean atendidos más de 3. Enfoque Bayesiano 7. Sea X una variable aleatoria con función densidad f (x) = ax2 para 0 < x < b. Encontrar la relación entre a y b. A priori, los valores de a están distribuidos uniformemente entre 0 y 2. Si se obtuvieron los valores muestrales 0.2, 0.8 y 3 hallar la función de distribución a posteriori de a. 8. En una bodega se desea conocer la proporción p de barriles con el vino estacionado. En base a estudios previos, se le asigna a p la siguiente densidad: f (p) = c(1 − p)1{0 < p < 1}. Un empleado prueba el vino de nueve barriles encontrando 5 barriles con el vino estacionado. (a) Hallar la densidad a posteriori en base a los 9 resultados obtenidos. (b) Estimar la proporción p. 9. El tiempo de funcionamiento en años de cada chip de computadoras, producido por una firma de semiconductores china, se distribuye como una exponencial de media 1/λ. La distribución a priori de λ es una Gamma con función de densidad 1 f (λ) = λ2 e−λ 1{λ > 0}. 2 Sabiendo que el promedio del tiempo de funcionamiento de 20 chips examinados es de 4.5 años: hallar la densidad a posteriori de λ y estimar puntualmente λ Rutilizando su máximo. ∞ n! .) (Sugerencia: si le parece conveniente puede usar la siguiente fórmula 0 xn e−ax dx = an+1 10. Un proceso de producción, produce con una calidad del 100 p % de artı́culos defectuosos. A priori se supone que la proporción p de artı́culos defectuosos se distribuye uniformemente en el intervalo (0, 1). De una partida se examina una muestra de 6 artı́culos y se encuentran 2 defectuosos. Se arma una caja con otros 4 artı́culos de la misma partida ¿cuál es la probabilidad de que tenga solo un artı́culo defectuoso? 11. El número de accidentes que ocurren diariamente en una planta industrial tiene una distribución Poisson de media λ desconocida. Sobre la base de experiencias previas en plantas industriales similares un estadı́stico afirma que los posibles valores de λ se distribuyen a priori como una variable exponencial de media 1/2. Sabiendo que durante los primeros 9 dı́as de funcionamiento de la planta industrial ocurrieron un total de 45 accidentes hallar la distribución a posteriori de λ y calcular la probabilidad de que durante el décimo dı́a ocurran dos o más accidentes. Test de hipótesis y reglas de decisión 12. En una fábrica de tornillos se quiere decidir si la proporción p de tornillos defectuosos es mayor que 0.1. Basandose en la cantidad de tornillos defectuosos en una muestra de tamaño 6 construir una regla de decisión cuya probabilidad de decidir erróneamente cuando p = 0.1 sea menor que 0.05. Expresar la curva caracterı́stica operativa en función de p y graficarla. (El enunciado de la regla de decisión debe ser comprensible para un operario sin estudios universitarios.) 13. En una elección se presentan dos candidatos: el verde y el rojo. Diseñar un test de hipótesis basado en una encuesta entre 1000 votantes para verificar si el candidato rojo obtendrá más del 20 % de los votos, con un nivel de significación del 10 %. Graficar la curva caracterı́stica operativa calculando por lo menos tres de sus puntos. ¿Qué decidirı́a si la encuesta arroja 190 votos a favor del candidato rojo? 14. Una empresa de cervezas afirma que el 40 % de las botellas de cerveza de un litro que se venden en el mercado son de su marca. Diseñar un test de hipótesis tal que: si la afirmación de la empresa es verdadera, se la confirme con probabilidad 0.95; y si el porcentaje verdadero de ventas de dichas botellas fuera del 30 % la probabilidad de refutar la afirmación de la empresa sea 0.9. (a) Cuál es la probabilidad de concluir que la afirmación de la empresa es verdadera, cuando en verdad el porcentaje de ventas de dichas botellas es del 45 %? (b) Qué concluirı́a si al realizar una encuesta sobre ventas, conforme al test de hipótesis diseñado previamente, el porcentaje observado de ventas de dichas botellas fuera del 47 %? 15. Una propaganda afirma que el uso del complejo vitamı́nico “jirafol” favorece el crecimiento anual de los niños. Medido en centı́metros, el crecimiento anual en la población infantil es una variable aleatoria normal de media 3 y desvı́o 1. Un estudio realizado sobre 2500 niños que consumieron “jirafol” arrojó un promedio de crecimiento de 3.05 cm. por niño. Suponiendo que el desvı́o se mantuvo igual a 1, recomendarı́a el uso de “jirafol”? Describa los riesgos estadı́sticos involucrados. 16. Un comprador desea adquirir lotes de pilas cuya duración media sea mayor que 233 horas. Está dispuesto a correr los siguientes riesgos: no más del 1 % de adquirir un lote si la duración media de sus pilas fuese de 233 horas; no más del 5 % de descartarlo si la duración media fuese de 240 horas. Suponiendo que la duración de las pilas tiene una distribución normal de desvı́o 10 horas, diseñar un test y construir una regla de decisión que verifique las normativas estipuladas por el comprador. Graficar la curva caracterı́stica operativa y analizar el riesgo de descartar el lote si la duración media de sus pilas fuese de 235 horas. 17. La cantidad de litros de vino consumidos anualmente por cada cliente de una bodega tiene distribución normal con desvı́o 18 litros. La bodega planea innovar su lı́nea de vinos siempre y cuando pueda asegurarse una venta media de no menos de 100 litros por cliente. Envı́a algunas botellas “gratis” a 16 clientes de confianza, quienes deberán contestar cuántos litros estarı́an dispuestos a consumir. En base a esos resultados decidirá qué hacer. Si el consumo medio fuese de 105 litros per capita, estarı́a dispuesta a correr un riesgo del 5 % de no innovar. Diseñar un test y describir una regla de decisión para esta situación, graficar la curva caracterı́stica operativa. Si la bodega decidiese no innovar, cuál serı́a la máxima probabilidad de haberse equivocado. 18. En un proceso quı́mico es necesario que una solución que se usa como reactivo tenga pH 8.21. Se dispone de un método para determinar el pH que produce mediciones normalmente distribuidas con media igual al verdadero valor del pH y desvı́o 0.02. Diseñar un test de hipótesis de manera que: si el pH es 8.21, se obtenga esa conclusión con probabilidad 0.95 y si el pH difiere de 8.21 en 0.03 (en cualquiera de las direcciones) se detecte esa diferencia con probabilidad no inferior a 0.95. (a) Que concluirı́a si la media de las mediciones observadas fuese 8.32? (b) Si el verdadero pH es 8.33, cuál es la probabilidad de concluir que el pH no es 8.21? 19. Los siguientes datos, en cientos de millones de pesos, corresponden a la facturación total del año 2007 de 10 empresas de productos alimenticios: 5.15, 5.04, 4.60, 3.42, 3.36, 3.14, 2.84, 2.65, 2.50, 2.34 (a) Construya intervalos de confianza de nivel 0.95 para la media y la varianza, suponiendo que las ventas anuales de las empresas del sector se distribuyen con una ley normal. (b) ¿Rechazarı́a la siguiente afirmación: “En media, las ventas anuales de cada empresa del sector son de 430 millones de pesos”?, ¿Qué riesgo corre de haberse equivocado? 20. Un productor de una nueva lı́nea de neumáticos afirma que su utilidad media es mayor que 40000 km. Para verificar dicha afirmación se sometieron a prueba 12 neumáticos y sus utilidades (en miles de km.) resultaron las siguientes: 40.5 40.6 41.3 41.6 42.0 39.8 40.7 40.9 40.2 39.9 41.0 40.6 Suponiendo que la utilidad de los neumáticos se distribuye como una normal N (µ, σ 2 ), verificar la afirmación del productor a un 5 % de nivel de significación. 21. Un informe oficial afirma que el consumo medio de agua en los hogares de la Ciudad de Buenos Aires es de 850 litros diarios. Se realizó una investigación sobre 20 hogares elegidos al azar y los resultados sobre el consumo diario de litros de agua en cada uno de esos hogares fueron los siguientes: 701 926 972 878 1026 845 868 930 826 966 807 950 998 800 1012 932 965 1030 958 960 Suponiendo que el consumo diario de litros de agua en los hogares de la Ciudad de Buenos Aires tiene distribución normal, diseñar un test de hipótesis de nivel de significación 0.05 para refutar la afirmación oficial. ¿Qué puede concluirse a partir de los datos observados? 22. Se tiene una población con distribución U(θ, θ + 1). Basandose en una muestra de tamaño 1, X1 , diseñar una regla de decisión de nivel de significación 0.1, para verificar H0 : θ ≤ 5 contra H1 : θ > 5. Grafique la curva caracterı́stica operativa. 23. Se tiene una población con distribución U(θ, θ + 1). Basándose en el máximo de una muestra de tamaño 3, M := max(X1 , X2 , X3 ), diseñar una regla de decisión de nivel de significación 0.1, para verificar la hipótesis H0 : θ ≤ 5 contra H1 : θ > 5. Graficar la curva caracterı́stica operativa correspondiente. ¿Qué debe concluirse si en una muestra de tamaño 3 el valor máximo observado es igual a 5.5? Test de Bondad de Ajuste 24. Para identificar las obras de su serie titulada Los paisajes binarios el artista digital Nelo las firma con una imagen aleatoria de 10 × 10 pixels producida con el siguiente procedimiento: por cada pixel se lanza un dado equilibrado: si sale 1, 2 o 3 se pinta de rojo; si sale 4 o 5 se pinta de verde y si sale 6 se pinta de azul. Se somete a examen la firma de una obra digital titulada Cordillera binaria y se obtienen los siguientes resultados: 46 pixels rojos, 37 verdes y 17 azules. Se puede concluir a un nivel del 5 % que Cordillera binaria no pertenece a la serie Los paisajes binarios?