1. Solución de Ruleta Rusa 2. Solución de Balance

Anuncio
Universidad Autónoma de Madrid
Probabilidad y Estadı́stica
Soluciones de los dos primeros juegos
1.
Solución de Ruleta Rusa
En este juego sólo debemos tomar una decisión, que es el número de disparos que vamos
a hacer antes de plantarnos. Ası́, las únicas estrategias posibles son e1 , e2 , e3 , e4 , e5 , donde por
ejemplo e2 es la estrategia de hacer 2 disparos y después plantarnos (si todavı́a no ha salido
la bala). Para decidir cuál es mejor, simplemente debemos calcular la esperanza de la variable
ganancia con cada una.
e1 : p(0) = 1/6 porque es la probabilidad de que salga la bala a la primera (ya que hay
seis huecos). Por tanto p(1) = 5/6 y
µ = 0 ∗ (1/6) + 1 ∗ (5/6) = 5/6.
e2 : p(0) = 2/6, ya que la bala saldrá en dos disparos si está en el hueco que ha salido al
darle vueltas o en el lugar justo a la derecha (suponiendo que el tambor gira hacia ese
lado). Por tanto p(2) = 4/6 (ya que ganamos 1 euro por bala disparada) y tenemos
µ = 0 ∗ (2/6) + 2 ∗ (4/6) = 8/6.
e3 : Razonando como antes, vemos que p(0) = 3/6 y
µ = 0 ∗ (3/6) + 3 ∗ (3/6) = 9/6.
e4 : µ = 0 ∗ (4/6) + 4 ∗ (2/6) = 8/6.
e5 : µ = 0 ∗ (5/6) + 5 ∗ (1/6) = 5/6.
La media más grande que ha salido es 9/6 para e3 , luego la estragia óptima es lanzar 3
balas y plantarse (si no ha salido la bala hasta entonces). Con ella, la ganancia esperada por
partida es de 9/6 = 1.5 euros.
De hecho, podrı́amos haberlo hecho un poco más rápido dándonos cuenta de que para la
estrategia ej tenemos la media µ = j(6 − j)/6 y calculando el máximo en j.
2.
Solución de Balance
Si nos ponemos a pensar un poco en cómo jugar mejor a este juego, daremos con la respuesta
(y eso lo hace ser un juego sencillo). La estrategia óptima va a ser la siguiente: siempre que en
un momento dado tengamos más boletos de un color que del otro, entonces deberemos elegir la
1 de 4
Universidad Autónoma de Madrid
Probabilidad y Estadı́stica
caja con más boletos del color contrario para sacar el siguiente boleto (ya que es más probable
que de esta forma equilibremos el número de boletos de cada color).
Pero no es suficiente con que penséis que es es la mejor estrategia. Tenéis que justificarlo.
Por otra parte, si os fiáis de vuestra intuición, muchas veces os vais a equivocar, por eso es
mejor analizar siempre el juego en detalle.
Yo lo voy a hacer de forma rigurosa (no serı́a necesario tanto detalle como yo voy a dar, pero
mejor pasarnos que quedarnos cortos). Aquı́ el número de posibles estrategias es inmenso, ya
que tras sacar cada boleto debemos elegir la caja siguiente; ası́ que estudiar todas las estrategias
(como hemos hecho en el juego anterior) serı́a demasiado largo. Afortunadamente, podemos
hacer el estudio por pasos, comenzando por el final.
Para ello, vamos a usar el siguiente lenguaje. Escribimos “b” si sale un boleto blanco y
“n” si sale negro. Por otra parte, llamaremos “B” a la caja con más boletos blancos, “N”
a la caja con más negros y “X” a la que tiene tantos negros como blancos. Ası́, la cadena
XbBnNnXb corresponderı́a a la siguiente jugada: primero elegimos la caja X y sale blanco;
entonces elegimos la caja B y sale negro; entonces elegimos la caja N y sale negro; finalmente
elegimos la caja X y sale blanco. Como han salido tantos blancos como negros, el resultado
serı́a que ganamos 1 euro.
Como he dicho, vamos a empezar por el final para el análisis. Supongamos que hemos
sacado ya 3 boletos, y que han salido bbb (¡nos da igual con que cajas!). Entonces, ¿cuál
serı́a la mejor opción para la última caja? Vamos a analizar las posibles estrategias en dicha
situación: serı́an bbbN, bbbB y bbbX, donde bbbN serı́a elegir la caja negra. Abusando del
lenguaje, voy a llamar bbbN a la variable ganancia suponiendo (condicinonada a) que ha salido
bbb en los 3 primeros boletos y escogemos la caja N para el cuarto. Entonces:
E[bbbN ] = 1p(1) − 1p(−1) − 5p(−5) = 1 ∗ 0 − 1 ∗
2
1
− 5 ∗ = −7/3
3
3
ya que es imposible acabar con el mismo número de blancos y negros en dicha situación. De
la misma forma
1
1
E[bbbX] = 1 ∗ 0 − 1 ∗ − 5 ∗ = −3
2
2
y
1
2
E[bbbB] = 1 ∗ 0 − 1 ∗ − 5 ∗ = −11/3.
3
3
Ası́, si tenemos bbb, la mejor estrategia es elegir N. Ası́, con la mejor estrategia, la esperanza
para la ganancia con bbb es
E[bbb] = −7/3.
Puedo repetir este proceso si al haber sacado 3 boletos he obtendio nnn. Por simetrı́a, la mejor
estrategia quedará elegir B, es decir nnnB, con
E[nnn] = −7/3.
2 de 4
Universidad Autónoma de Madrid
Probabilidad y Estadı́stica
Si tengo bbn tras tres boletos (¡da igual el orden en que hayan salido!), haciendo de nuevo el
cálculo, queda que la mejor opción es bbnN, con
2
1
− 1 ∗ − 5 ∗ 0 = 1/3.
3
3
y para bnn serı́a bnnB con la misma media, luego
E[bbnN ] = 1 ∗
E[bbn] = E[bnn] = 1/3.
Ya hemos conseguido la mejor estrategia para elegir la última caja, que puede resumirse
como bbbN, nnnB, bnnB, nbbN. Ahora vamos a estudiar la mejor estrategia para la tercera
caja. Como llevaremos dos boletos sacados, las posibilidades son bb, nb, nn; debemos estudiar
cada una de ellas. Por ejemplo, para bb debemos estudiar las posibilidades bbB, bbX y bbN.
Se sobreentiende que para la cuarta caja usaremos la estrategia óptima previamente obtenida.
Por ejemplo, para bbB
22 11
+
= 5/9
33 33
ya que si sale blanca en la tercera tendremos bbn y entonces elegiremos bbnN, con lo que la
probabilidad de negra en la última es de 2/3. Podrı́amos seguir ası́ con p(1) y p(−5), pero es
más rápido usar la siguiente fórmula par la esperanza (que está en las notas de la lección 10):
X
E[X] =
pY (y)E[X | Y = y]
p(−1) = P(bn) + P(nb) =
y
Es la versión de la probabilidad total para esperanzas. Con ella podemos calcular E[bbB]
directamente:
1 1 2
7
13
E[bbB] = P(salga n de B)E[bbn] + P(salga b de B)E[bbb] = ∗ + ∗ (− ) = − .
3 3 3
3
3
Igualmente
1 1 1
7
E[bbX] = ∗ + ∗ (− ) = −1
2 3 2
3
y
2 1 1
7
E[bbN ] = ∗ + ∗ (− ) = −5/9.
3 3 3
3
Luego la mejor opción es bbN y con ella
E[bb] = −5/9.
De la misma forma, con nn la mejor opción es nnB y con ella E[nn] = −5/9. Por último, si
tenemos bn, al calcular las esperanzas de bnN, bnB y bnX veremos que dan los mismo, ası́ que
da igual cuál escoger. Calculemos una de ellas
1
1
11 11
E[bnX] = E[bnn] + E[bnb] =
+
= 1/3,
2
2
23 23
3 de 4
Universidad Autónoma de Madrid
Probabilidad y Estadı́stica
luego E[bn] = 1/3. Ası́, la estrategia para la tercera caja se resume en bbN y nnB. Vamos con
la segunda caja:
1
2
11 2 5
E[bB] = E[bn] + E[bb] =
+ (− ) = −7/27,
3
3
33 3 9
11 1 5
E[bX] =
+ (− ) = −2/9,
23 2 9
21 1 5
+ (− ) = 1/27.
E[bN ] =
33 3 9
Por tanto, la mejor opción es bN, con la cual E[b] = 1/27. Por simetrı́a, para n la mejor
estrategia es nB, con la que E[n] = 1/27.
Finalmente, debemos elegir la primera caja. Pero, como E[b] = E[n] = 1/27, vemos que da
igual lo que salga, luego da igual cuál elijamos: en cualquier caso, queda que la esperanza de
ganancia 1/27.
Luego, podemos describir la estrategia óptima con los “comandos” siguientes:
bN, nB, bbN, nnB, bbnN, nnbB.
(En el resto de situaciones, se sobreentiende que da igual qué caja escojamos) Con dicha
estrategia, la ganancia esperada es de 1/27 ≈ 0.037 euros por partida.
4 de 4
Descargar