Universidad Autónoma de Madrid Probabilidad y Estadı́stica Soluciones de los dos primeros juegos 1. Solución de Ruleta Rusa En este juego sólo debemos tomar una decisión, que es el número de disparos que vamos a hacer antes de plantarnos. Ası́, las únicas estrategias posibles son e1 , e2 , e3 , e4 , e5 , donde por ejemplo e2 es la estrategia de hacer 2 disparos y después plantarnos (si todavı́a no ha salido la bala). Para decidir cuál es mejor, simplemente debemos calcular la esperanza de la variable ganancia con cada una. e1 : p(0) = 1/6 porque es la probabilidad de que salga la bala a la primera (ya que hay seis huecos). Por tanto p(1) = 5/6 y µ = 0 ∗ (1/6) + 1 ∗ (5/6) = 5/6. e2 : p(0) = 2/6, ya que la bala saldrá en dos disparos si está en el hueco que ha salido al darle vueltas o en el lugar justo a la derecha (suponiendo que el tambor gira hacia ese lado). Por tanto p(2) = 4/6 (ya que ganamos 1 euro por bala disparada) y tenemos µ = 0 ∗ (2/6) + 2 ∗ (4/6) = 8/6. e3 : Razonando como antes, vemos que p(0) = 3/6 y µ = 0 ∗ (3/6) + 3 ∗ (3/6) = 9/6. e4 : µ = 0 ∗ (4/6) + 4 ∗ (2/6) = 8/6. e5 : µ = 0 ∗ (5/6) + 5 ∗ (1/6) = 5/6. La media más grande que ha salido es 9/6 para e3 , luego la estragia óptima es lanzar 3 balas y plantarse (si no ha salido la bala hasta entonces). Con ella, la ganancia esperada por partida es de 9/6 = 1.5 euros. De hecho, podrı́amos haberlo hecho un poco más rápido dándonos cuenta de que para la estrategia ej tenemos la media µ = j(6 − j)/6 y calculando el máximo en j. 2. Solución de Balance Si nos ponemos a pensar un poco en cómo jugar mejor a este juego, daremos con la respuesta (y eso lo hace ser un juego sencillo). La estrategia óptima va a ser la siguiente: siempre que en un momento dado tengamos más boletos de un color que del otro, entonces deberemos elegir la 1 de 4 Universidad Autónoma de Madrid Probabilidad y Estadı́stica caja con más boletos del color contrario para sacar el siguiente boleto (ya que es más probable que de esta forma equilibremos el número de boletos de cada color). Pero no es suficiente con que penséis que es es la mejor estrategia. Tenéis que justificarlo. Por otra parte, si os fiáis de vuestra intuición, muchas veces os vais a equivocar, por eso es mejor analizar siempre el juego en detalle. Yo lo voy a hacer de forma rigurosa (no serı́a necesario tanto detalle como yo voy a dar, pero mejor pasarnos que quedarnos cortos). Aquı́ el número de posibles estrategias es inmenso, ya que tras sacar cada boleto debemos elegir la caja siguiente; ası́ que estudiar todas las estrategias (como hemos hecho en el juego anterior) serı́a demasiado largo. Afortunadamente, podemos hacer el estudio por pasos, comenzando por el final. Para ello, vamos a usar el siguiente lenguaje. Escribimos “b” si sale un boleto blanco y “n” si sale negro. Por otra parte, llamaremos “B” a la caja con más boletos blancos, “N” a la caja con más negros y “X” a la que tiene tantos negros como blancos. Ası́, la cadena XbBnNnXb corresponderı́a a la siguiente jugada: primero elegimos la caja X y sale blanco; entonces elegimos la caja B y sale negro; entonces elegimos la caja N y sale negro; finalmente elegimos la caja X y sale blanco. Como han salido tantos blancos como negros, el resultado serı́a que ganamos 1 euro. Como he dicho, vamos a empezar por el final para el análisis. Supongamos que hemos sacado ya 3 boletos, y que han salido bbb (¡nos da igual con que cajas!). Entonces, ¿cuál serı́a la mejor opción para la última caja? Vamos a analizar las posibles estrategias en dicha situación: serı́an bbbN, bbbB y bbbX, donde bbbN serı́a elegir la caja negra. Abusando del lenguaje, voy a llamar bbbN a la variable ganancia suponiendo (condicinonada a) que ha salido bbb en los 3 primeros boletos y escogemos la caja N para el cuarto. Entonces: E[bbbN ] = 1p(1) − 1p(−1) − 5p(−5) = 1 ∗ 0 − 1 ∗ 2 1 − 5 ∗ = −7/3 3 3 ya que es imposible acabar con el mismo número de blancos y negros en dicha situación. De la misma forma 1 1 E[bbbX] = 1 ∗ 0 − 1 ∗ − 5 ∗ = −3 2 2 y 1 2 E[bbbB] = 1 ∗ 0 − 1 ∗ − 5 ∗ = −11/3. 3 3 Ası́, si tenemos bbb, la mejor estrategia es elegir N. Ası́, con la mejor estrategia, la esperanza para la ganancia con bbb es E[bbb] = −7/3. Puedo repetir este proceso si al haber sacado 3 boletos he obtendio nnn. Por simetrı́a, la mejor estrategia quedará elegir B, es decir nnnB, con E[nnn] = −7/3. 2 de 4 Universidad Autónoma de Madrid Probabilidad y Estadı́stica Si tengo bbn tras tres boletos (¡da igual el orden en que hayan salido!), haciendo de nuevo el cálculo, queda que la mejor opción es bbnN, con 2 1 − 1 ∗ − 5 ∗ 0 = 1/3. 3 3 y para bnn serı́a bnnB con la misma media, luego E[bbnN ] = 1 ∗ E[bbn] = E[bnn] = 1/3. Ya hemos conseguido la mejor estrategia para elegir la última caja, que puede resumirse como bbbN, nnnB, bnnB, nbbN. Ahora vamos a estudiar la mejor estrategia para la tercera caja. Como llevaremos dos boletos sacados, las posibilidades son bb, nb, nn; debemos estudiar cada una de ellas. Por ejemplo, para bb debemos estudiar las posibilidades bbB, bbX y bbN. Se sobreentiende que para la cuarta caja usaremos la estrategia óptima previamente obtenida. Por ejemplo, para bbB 22 11 + = 5/9 33 33 ya que si sale blanca en la tercera tendremos bbn y entonces elegiremos bbnN, con lo que la probabilidad de negra en la última es de 2/3. Podrı́amos seguir ası́ con p(1) y p(−5), pero es más rápido usar la siguiente fórmula par la esperanza (que está en las notas de la lección 10): X E[X] = pY (y)E[X | Y = y] p(−1) = P(bn) + P(nb) = y Es la versión de la probabilidad total para esperanzas. Con ella podemos calcular E[bbB] directamente: 1 1 2 7 13 E[bbB] = P(salga n de B)E[bbn] + P(salga b de B)E[bbb] = ∗ + ∗ (− ) = − . 3 3 3 3 3 Igualmente 1 1 1 7 E[bbX] = ∗ + ∗ (− ) = −1 2 3 2 3 y 2 1 1 7 E[bbN ] = ∗ + ∗ (− ) = −5/9. 3 3 3 3 Luego la mejor opción es bbN y con ella E[bb] = −5/9. De la misma forma, con nn la mejor opción es nnB y con ella E[nn] = −5/9. Por último, si tenemos bn, al calcular las esperanzas de bnN, bnB y bnX veremos que dan los mismo, ası́ que da igual cuál escoger. Calculemos una de ellas 1 1 11 11 E[bnX] = E[bnn] + E[bnb] = + = 1/3, 2 2 23 23 3 de 4 Universidad Autónoma de Madrid Probabilidad y Estadı́stica luego E[bn] = 1/3. Ası́, la estrategia para la tercera caja se resume en bbN y nnB. Vamos con la segunda caja: 1 2 11 2 5 E[bB] = E[bn] + E[bb] = + (− ) = −7/27, 3 3 33 3 9 11 1 5 E[bX] = + (− ) = −2/9, 23 2 9 21 1 5 + (− ) = 1/27. E[bN ] = 33 3 9 Por tanto, la mejor opción es bN, con la cual E[b] = 1/27. Por simetrı́a, para n la mejor estrategia es nB, con la que E[n] = 1/27. Finalmente, debemos elegir la primera caja. Pero, como E[b] = E[n] = 1/27, vemos que da igual lo que salga, luego da igual cuál elijamos: en cualquier caso, queda que la esperanza de ganancia 1/27. Luego, podemos describir la estrategia óptima con los “comandos” siguientes: bN, nB, bbN, nnB, bbnN, nnbB. (En el resto de situaciones, se sobreentiende que da igual qué caja escojamos) Con dicha estrategia, la ganancia esperada es de 1/27 ≈ 0.037 euros por partida. 4 de 4