Junio 2012- 1ª semana

Anuncio
Procesos estocásticos
Junio 2012 — Primera Semana
Tres jugadores, A, B y C disponen de un mazo de cartas, en cada
una de las cuales figura una de las tres letras A, B o C. Inicialmente
A extrae una carta al azar y gana el juego si obtiene una carta con
su propio nombre. En caso contrario pasa el turno al jugador que
indique la carta obtenida y éste, una vez devuelta la carta al mazo,
realiza su jugada de la misma manera. La partida continúa hasta
que alguno consigue ganar. Además, se sabe que la proporción p de
cartas marcadas con B y con C es la misma y p se elige para que
los tres jugadores tengan la misma probabilidad de ganar.
a) Determinar el valor de p.
b) Hallar la duración media de la partida.
c) Obtener la distribución del número de jugadas que realiza A.
d) Si hay que poner un euro en la mesa cada vez que se hace una
extracción y el ganador se lo lleva todo, calcular el beneficio
esperado de cada jugador.
Solución
a) Puesto que en cada extracción las probabilidades de obtener cada resultado
son
P (B) = P (C) = p, P (A) = 1 − 2p,
la cadena que indica el jugador que realiza la extracción hasta que alguno consigue
ganar tiene matriz de transición
A
B C GA GB GC
A
p p 1 − 2p
B 1 − 2p
p
p
C 1 − 2p p
p
1
GA
GB
1
GC
1
Las probabilidades fi = fi,GA de que gane A si le toca jugar a i = A, B, C verifican
fA = 1 − 2p + pfB + pfC
fB = (1 − 2p)fA + pfC
fC = (1 − 2p)fA + pfB
De las dos últimas ecuaciones se obtiene
fB + fC =
2(1 − 2p)
fA ,
1−p
con lo cual
(1 − p)(1 − 2p)
1 − 2p
=
.
1 − 2p(1 − 2p)/(1 − p)
1 − 3p + 4p2
√
Para que sea fA = 1/3 debe ser p = (3 − 5)/2 ' 00 382.
Directamente se deduce fA,GB = fA,GC = 1/3 (porque fA,GB + fA,GC = 2/3 y
fA,GB = fAGC por simetrı́a).
fA =
b) Las duraciones mi de la partida cuando le toca jugar a i = A, B, C cumplen
mA = 1 + pmB + pmC
mB = 1 + (1 − 2p)mA + pmC
mC = 1 + (1 − 2p)mA + pmB ,
en cuya solución es
√
√
1+p
5+2 5
0
mA =
=
'
3
157
para
p
=
(3
−
5)/2.
1 − 3p + 4p2
3
c) Las probabilidades fi = fi,A de alcanzar el estado A desde i = A, B, C satisfacen
fA = pfB + pfC
fB = 1 − 2p + pfC
fC = 1 − 2p + pfB
de modo que
√
2p(1 − 2p)
= 7 − 3 5 ' 00 292.
1−p
Por consiguiente el número VA de veces que se llega al estado A tiene distribución
√
√
P{VA = k} = (7 − 3 5)k−1 (3 5 − 6) para k = 1, 2, 3, . . .
fA =
d) Para simplificar los cálculos pueden agruparse los estados B y C en un solo
estado A, de modo que la matriz de transición queda
A
A
GA GA
A
2p 1 − 2p
A 1 − 2p p
p
GA
1
GA
1
Con ella las probabilidades de que gane o pierda A, según que la próxima extracción la realice o no A, son
fA,GA =
(1 − p)(1 − 2p)
1 − 3p + 4p2
fA,GA =
2p2
1 − 3p + 4p2
fA,GA =
(1 − 2p)2
1 − 3p + 4p2
fA,GA =
p
1 − 3p + 4p2
Las partidas que gana A se producen de acuerdo con la matriz de transición
A
A
GA
A
2p(1 − 2p)/(1 − p) 1 − 2p(1 − 2p)/(1 − p)
A 1−p
p
GA
1
y la ganancia media de A es el número medio de visitas a A. Como aquı́
fA,A =
2p(1 − 2p)
,
1−p
fA,A = 3p − 4p2 ,
resulta
3p − 4p2
1 − 3p + 4p2
2p(1 − 2p)
.
PA,A (1) =
(1 − p)(1 − 3p + 4p2 )
PA,A (1) =
En cambio las partidas que pierde A transcurren según la matriz de transición
A
A
GA
A
1
A 2p(1 − 2p) p 1 − 3p + 4p2
GA
1
y la pérdida de A es entonces el número medio de visitas a A, mas 1 por el euro
inicial. Ahora
fA,A = fA,A =
con lo cual
1 + PA,A (1) = 1 +
2p(1 − 2p)
1−p
2p(1 − 2p)
1−p
=
.
1 − 3p + 4p2
1 − 3p + 4p2
En definitiva, el beneficio esperado de A resulta
2p(1 − 2p)
1−p
− fA,GA
2
(1 − p)(1 − 3p + 4p )
1 − 3p + 4p2
2p((1 − 5p + 5p2 )
=
(1 − 3p + 4p2 )2
√
Para el valor de p seleccionado es B = −2(1 + 5)/9 ' −00 72 euros.
B = fA,GA
Descargar