Teor´ıa de las decisiones y de los juegos

Anuncio
Teorı́a de las decisiones y de los juegos
Asignatura: 25101
Profesores: Sjaak Hurkens y Flip Klijn
Examen: 6 de febrero de 2008
Observaciones:
•
•
•
•
•
•
Versión: 1
Duración: 3 horas
Documentos autorizados: ninguno
Teléfonos móviles: apagados y guardados
No se permite hacer el examen con lapiz
No se permite arrancar hojas
Dar el resultado final sin explicaciones no será considerado como una respuesta válida
P.1. (10 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N =
{A, B} es el conjunto de jugadores, SA = {a1 , a2 , a3 , a4 } y SB = {b1 , b2 , b3 , b4 } los
conjuntos de estrategias. Los pagos están resumidos en la matriz de pagos:
A\B
a1
a2
a3
a4
b1
(1, 0)
(5, 5)
(3, 0)
(4, −2)
b2
(1, 7)
(0, 8)
(0, 5)
(3, 2)
b3
(8, 1)
(6, 3)
(2, 3)
(3, 6)
b4
(3, 6)
(0, 4)
(6, 4)
(4, 1)
(a) ¿Cuáles son las estrategias estrictamente dominadas de A? Y, ¿cuáles son las
estrategias estrictamente dominadas de B?
Solución: Ninguna estrategia del jugador A es estrictamente dominada. Por
ejemplo, la estrategia a1 no es estrictamente domindada ya que ninguna otra
estrategia le da siempre un pago estrictamente mayor. (Porque uA (a1 , b3 ) ≥
uA (ai , b3 ) para i = 2, 3, 4.)
Solamente las estrategias b1 y b4 del jugador B son estrictamente dominadas.
De hecho, la estrategia b2 domina ambas estrategias: uB (aj , b2 ) > uB (aj , b1 ) y
uB (aj , b2 ) > uB (aj , b4 ) para j = 1, 2, 3, 4. También lo hemos indicado en la matriz
de pagos (los pagos de las estrategias dominadas han sido subrayados, y los pagos
de la estrategias que las domina en negrita):
A\B
a1
a2
a3
a4
b1
(1, 0)
(5, 5)
(3, 0)
(4, −2)
1
b2
(1, 7)
(0, 8)
(0, 5)
(3, 2)
b3
(8, 1)
(6, 3)
(2, 3)
(3, 6)
b4
(3, 6)
(0, 4)
(6, 4)
(4, 1)
(b) ¿Cuáles son las estrategias que sobreviven la eliminación iterativa de estrategias
estrictamente dominadas? Determina el juego resultante G′ .
Solución: Ya hemos visto en el apartado (a) que se pueden eliminar las estrategias
b1 y b4 del jugador B. Por tanto, el juego efectivo se ha reducido a un juego de
4 × 2, la matriz del cual es la siguiente:
A\B
a1
a2
a3
a4
b2
(1, 7)
(0, 8)
(0, 5)
(3, 2)
b3
(8, 1)
(6, 3)
(2, 3)
(3, 6)
Repetimos la eliminación de estrategias dominadas. Vemos que las únicas
estrategias dominadas en el juego reducido son las estrategias a2 y a3 del jugador
A tal y como hemos indicado en la figura izquierda:
A\B
a1
a2
a3
a4
b2
b3
(1, 7) (8, 1)
(0, 8) (6, 3)
(0, 5) (2, 3)
(3, 2) (3, 6)
A\B
a1
a4
b2
b3
(1, 7) (8, 1)
(3, 2) (3, 6)
Por tanto, el juego reducido después de eliminar estas estrategias es el juego a
la derecha. Se comprueba directamente que en este juego no hay estrategias
dominadas. Por tanto, este es el juego que queda después de la eliminación
iterativa de estrategias estrictamente dominadas.
(c) Determina todos los equilibrios de Nash en estrategias puras del juego G (el juego
original).
Solución: Sabemos que en un equilibrio de Nash ningún jugador utilizará ninguna
estrategia eliminada en el apartado (b). Por tanto, solamente hemos de considerar
el juego reducido después de la eliminación iterativa de estrategias estrictamente
dominadas. Ahora hemos de buscar las mejores respuestas a las estrategias puras
de este juego. Por ejemplo, si el jugador B utiliza su estrategia b2 entonces la
mejor respuesta del jugador A es a4 ya que le da un pago de 3 mientras que
su (única otra) estrategia a1 solamente le da un pago de 4. Subrayamos 3 en
la matriz de pago para indicarlo. Si hacemos lo mismo con las otras estrategias
puras de ambos jugadores obtenemos todas las mejores respuestas:
A\B
a1
a4
b2
b3
(1, 7) (8, 1)
(3, 2) (3, 6)
Vemos que en ninguno de los 4 perfiles (a1 , b2 ), (a1 , b3 ), (a4 , b2 ) y (a4 , b3 ) ambos
jugadores dan al mismo la mejor respuesta. Es decir, en cada uno de los 4 perfiles
algún jugador dispone de una desviación profitable. Por tanto, no hay equilibrio
de Nash en estrategias puras. Por ejemplo, el perfil (a1 , b2 ) no es equilibrio de
Nash ya que el jugador A puede mejorar (estrictamente) su pago si utiliza la
estrategia a4 en lugar de a1 .
2
P.2. (15 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N =
{A, B} es el conjunto de jugadores, SA = {a1 , a2 } y SB = {b1 , b2 } los conjuntos de
estrategias. Los pagos están resumidos en la matriz de pagos:
A\B
a1
a2
b1
b2
(2, 9) (9, 3)
(4, 4) (4, 8)
(a) Calcula las funciones de mejores respuestas y represéntalas gráficamente.
Solución: Sea (p, 1 − p) (o simplemente p) la estrategia de jugar la estrategia
a1 con probabilidad p y la estrategia a2 con probabilidad 1 − p. Sea (q, 1 − q)
(o simplemente q) la estrategia de jugar la estrategia b1 con probabilidad q y la
estrategia b2 con probabilidad 1 − q.
Calculamos las correspondencias Ri de mejores respuestas para ambos jugadores.
Para hallar las mejores respuestas del jugador A fijemos la estrategia q del jugador
B. El jugador A es indiferente entre jugar a1 y a2 si y sólo si uA (a1 , q) = uA (a2 , q),
lo cual es equivalente a 2q + 9(1 − q) = 4q + 4(1 − q) = 4, o sea, q = 75 ≈ 0.71. Es
fácil verificar que

si q < 0.71;
 1
[0,1] si q = 0.71;
RA (q) =

0
si q > 0.71.
Para hallar las mejores respuestas del jugador B fijemos la estrategia p del jugador
A. El jugador B es indiferente entre jugar b1 y b2 si y sólo si uB (p, b1 ) = uB (p, b2 ),
lo cual es equivalente a 9p + 4(1 − p) = 2p + 7(1 − p), o sea, p = 52 = 0.4. Es fácil
verificar que

si p < 0.4;
 0
[0,1] si p = 0.4;
RB (p) =

1
si p > 0.4.
La representación gráfica de las funciones RA y RB viene dada por la Figura 1.
mejor respuesta RB
q
1
0.71
mejor respuesta RA
1
p
0.4
Figura 1: Juego, problema 2: RA y RB
3
(b) Determina todos los equilibrios de Nash en estrategias puras y mixtas y los pagos
correspondientes.
Solución:
Utilizando la representación gráfica (la Figura 1) de las
correspondencias de mejor respuesta vemos que su “intersección” es el conjunto
{( 52 , 57 )}. Por tanto el único equilibrio de Nash del juego original es
2 3 5 2
( , ), ( , ) .
5 5 7 7
Los pagos correspondientes son
5 2
5
2
28
2 3 5 2
uA ( , ), ( , )
= uA a1 , ( , ) = 2 × + 9 × =
= 4,
5 5 7 7
7 7
7
7
7
2 3
2
3
30
2 3 5 2
uB ( , ), ( , )
= uB ( , ), b1 = 9 × + 4 × =
= 6.
5 5 7 7
5 5
5
5
5
4
P.3. (20 puntos) Considera el juego en forma extensiva de la Figura 2.
d1
1
2
d2
b2
(1, 1, 2)
3
d3
b3
d3
b3
(2, 2, 1)
3
d3
b3
3
(6, 3, 1)
(3, 3, 3)
(3, 2, 4)
b1
(4, 2, 0)
Figura 2: Juego, problema 3
(a) Indica si les afirmaciones siguientes son verdaderas V o falsas F .
Tacha (es decir, elimina/borra) las respuestas incorrectas.
Solución:
(i) Es un juego de información perfecta.
V
X
F
(ii) Es un juego de memoria perfecta.
V
F
X
(iii) Es un juego de suma zero.
V
X
F
(b) ¿Cuál es el conjunto de estrategias del jugador 3?
Solución: S3 = {d3 , b3 }.
(c) ¿Cuántos subjuegos hay?
Solución: Uno. (El juego completo.)
(d) Indica si les afirmaciones siguientes son verdaderas V o falsas F en relación a lo
que los jugadores pueden ver en el momento de decidir su acción.
Tacha (es decir, elimina/borra) las respuestas incorrectas.
Solución:
(i) 1 no puede ver las acciones de 2 y 3
V
F
X
(ii) 2 no puede ver las acciones de 3
V
F
X
(iii) 3 no puede ver las acciones de 2
V
F
X
(iv) 3 puede ver las acciones de 1 pero no las de 2
V
X
F
5
(e) Calcula los equilibrios de Nash perfectos en subjuegos en estrategias puras,
especificando el perfil, la trayectoria y los pagos.
Solución: Como hay un solo subjuego, solamente hemos de calcular los EN de
este juego. Primero buscamos el juego en forma normal correspondiente. Hay
tres jugadores (1, 2 y 3) y hacemos que el jugador 1 escoja la fila, el jugador 2
escoja la columna y el jugador 3 la matriz.

d2
b2
 1\2
d1 (6, 3, 1) (3, 2, 4)
b3

b1 (4, 2, 0) (4, 2, 0)

d2
b2
 1\2
d1 (1, 1, 2) (3, 3, 3)
d3

b1 (2, 2, 1) (2, 2, 1)
Buscamos las mejores respuestas a todas las estrategias puras de todos los
jugadores. Por ejemplo, la mejor respuesta del jugador 1 a las estrategias (b2 , d3 )
de los jugadores 2 y 3 es d1 (ya que d1 le da un pago de 3, mientras b1 le da
un pago de 2). Otro ejemplo, la mejor respuesta del jugador 3 a las estrategias
(d1 , b2 ) de los jugadores A y B es d3 (ya que d3 le da un pago de 4, mientras b3 le
da un pago de 3). Indicamos todas las mejores respuestas en negrita:

d2
 1\2
d1 (1, 1, 2)
d3

b1 (2, 2, 1)

d2
b2
 1\2
d1 (6, 3, 1) (3, 2, 4)
b3

b1 (4, 2, 0) (4, 2, 0)
b2
(3, 3, 3)
(2, 2, 1)
Hay un solo perfil en el que todos los jugadores dan la mejor respuesta a las
estrategias de los demás jugadores: (b1 , d2 , d3). Por tanto, el único equilibrio de
Nash perfecto en subjuegos es (b1 , d2 , d3). La trayectoria es b1 − d3 y los pagos
(2, 2, 1).
(f) Supón ahora que 3 puede observar todas las acciones de 1 y 2 antes de decidir.
Representa el nuevo juego en forma extensiva (árbol). Determina los equilibrios
de Nash perfectos en subjuegos en estrategias puras, especificando el perfil, la
trayectoria y los pagos.
Solución: Ahora el juego en forma extensiva es el de la Figura 3. Como es un
d1
1
2
d2
b2
(1, 1, 2)
3
d3
b3
d3
b3
(2, 2, 1)
3
d3
b3
3
(6, 3, 1)
(3, 3, 3)
(3, 2, 4)
b1
(4, 2, 0)
Figura 3: Juego, problema 3f
juego de información perfecta (ningún conjunto de información tiene más de un
nodo de decisión), el EPS se halla por inducción hacia atrás, tal y como se ha
6
d1
2
(1, 1, 2) d3
3 b3
d2
b2 (3, 2, 4)d3
3 b3
(1, 1, 2)
(2, 2, 1) d3
3 b3
(2, 2, 1)
(3, 2, 4)
1
b1
(6, 3, 1)
(3, 3, 3)
(3, 2, 4)
(4, 2, 0)
Figura 4: Juego, problema 3f: EPS
indicado en la Figura 4. Concluimos que el único equilibrio de Nash perfecto en
subjuegos es (d1 , b2 , d3 b3 d3 ). La trayectoria es d1 − b2 − b3 y los pagos (3, 2, 4).
7
P.4. (20 puntos) Dos duopolistas operan en un mercado a la Cournot con una demanda
inversa dada por P (Q) = max{0, 4 − Q}, donde Q = q1 + q2 y qi ≥ 0 es la cantidad
producida por la empresa i. La empresa 1 tiene la función de coste lineal
C1 (q1 ) = q1 ,
y la empresa 2 tiene la función de coste lineal
C2 (q2 ) = 3q2 .
(a) ¿Es (q1∗ , q2∗ ) = (0, 0) un equilibrio de Nash? Explica cuidadosamente la respuesta.
(b) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0? Si hay un equilibrio,
especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no.
(c) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0? Si hay un equilibrio,
especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no.
(d) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0? Si hay un equilibrio,
especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no.
Solución:
Sea πi (q1 , q2 ) el pago (los beneficios) de la empresa i. Entonces,
πi (q1 , q2 ) = max{0, 4 − q1 − q2 }qi − ci qi ,
donde c1 = 1 y c2 = 3.
(a) Supongamos que (q1∗ , q2∗ ) = (0, 0) es un EN. Considera la desviación q1′ = ǫ > 0
donde ǫ es una cantidad “pequeña”. Como (0, 0) es un EN, la desviación no es
profitable:
π1 (q1′ , 0) ≤ π1 (0, 0) = 0.
Si ǫ > 0 es suficientemente pequeño (es decir, muy cerca de 0), entonces 4 − ǫ > 0.
Luego,
π1 (q1′ , 0) =
=
=
=
max{0, 4 − q1′ − 0}q1′ − q1′
max{0, 4 − ǫ − 0}ǫ − ǫ
(4 − ǫ)ǫ − ǫ
(3 − ǫ)ǫ
Concluimos que para ǫ > 0 suficientemente pequeño, (3 − ǫ)ǫ ≤ 0. Como ǫ >
0, (3 − ǫ) ≤ 0 para ǫ > 0 suficientemente pequeño. Por tanto, 3 ≤ 0, ¡una
contradicción! Por tanto, (0, 0) no es un equilibrio. Es decir, no hay un equilibrio
del tipo (a).
(b) Supongamos que (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0 es un EN. Notamos primero que
4 − q1∗ − q2∗ > 0. Pues, si 4 − q1∗ − q2∗ ≤ 0 cada empresa i tiene una desviación
profitable (producir 0):
πi (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }qi∗ − ci qi∗ = 0qi∗ − ci qi∗ < 0,
8
mientras producir qi′ = 0 conlleva el pago 0.
Como 4 − q1∗ − q2∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor
de q1∗ (tal intervalo existe porque q1∗ > 0) con 4 − q1 − q2∗ > 0. En este intervalo
la función de pago del jugador 1 tiene la siguiente forma
π1 (q1 , q2∗ ) = max{0, 4 − q1 − q2∗ }q1 − q1 = (4 − q1 − q2∗ )q1 − q1 .
(1)
Dado que (q1∗ , q2∗ ) es un EN, el jugador 1 no tiene incentivos para desviarse. En
otras palabras, dada la estrategia q2∗ del jugador 2, q1∗ es débilmente mejor que
cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ). Por
tanto, q1∗ maximiza (1) en dicho intervalo. Por consiguiente, q1∗ satisface la CPO
correspondiente:
4 − 2q1∗ − q2∗ − 1 = 0.
(2)
Por tanto,
3 − q2∗
(3)
=
2
Utilizando los mismos argumentos llegamos a una conclusión similar para la
cantidad q2∗ :
1 − q1∗
(4)
q2∗ =
2
y sustituyendo (3) en (4),
∗
3−q2
1−
2
q2∗ =
,
2
obtenemos (después de unos cálculos sencillos)
q1∗
q2∗ =
−1
< 0,
3
lo que supone una contradicción al supuesto que q2∗ > 0. Por tanto, concluimos
que no hay un equilibrio del tipo (b).
(c) Supongamos que (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0 es un EN. Notamos primero que
4 − q1∗ > 0. Pues, si 4 − q1∗ ≤ 0 la empresa 1 tiene una desviación profitable
(producir 0):
π1 (q1∗ , 0) = max{0, 4 − q1∗ − 0}q1∗ − q1∗ = 0q1∗ − q1∗ < 0,
mientras producir q1′ = 0 conlleva el pago 0.
Como 4 − q1∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor de q1∗
(tal intervalo existe porque q1∗ > 0) con 4 − q1 > 0. En este intervalo la función
de pago del jugador 1 tiene la siguiente forma
π1 (q1 , 0) = max{0, 4 − q1 }q1 − q1 = (4 − q1 )q1 − q1 .
(5)
Dado que (q1∗ , 0) es un EN, el jugador 1 no tiene incentivos para desviarse. En
otras palabras, dada la estrategia q2∗ = 0 del jugador 2, q1∗ es débilmente mejor
que cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ).
9
Por tanto, q1∗ maximiza (5) en dicho intervalo. Por consiguiente, q1∗ satisface la
CPO correspondiente:
3 − 2q1∗ = 0.
(6)
Por tanto,
q1∗ =
3
2
Se comprueba fácilmente que
(4 −
q1∗
−
q2∗ )
3
=
4− −0
2
5
=
2
> 0.
Por tanto,
π1 (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }q1∗ − q1∗
5 ∗
=
q − q1∗
2 1
2
3
=
2
> 0 = π1 (0, q2∗ ).
La última desigualdad junto con (6) y el hecho de que π1 (q1 , 0) = −q1 para q1 ≥ 4
nos lleva a la conclusión que si q2∗ = 0, entonces la función de pago q1 → π1 (q1 , 0)
del jugador 1 tiene la forma de la Figura 5. Por tanto, q1∗ = 32 es mejor respuesta
π1 (q1 , 0)
3 2
2
0
4
0
q1
3
2
Figura 5: Problema 4, caso (c)
a q2∗ = 0.
10
Ahora vamos a verificar si q2∗ es mejor respuesta a q1∗ = 32 . Primero notamos que
para q2 ≥ 52 ,
π2 (q1∗ , q2 ) = max{0, 4 − q1∗ − q2 }q2 − 3q2 = 0q2 − 3q2 < 0
(7)
Ahora estudiamos qué pasa si 0 ≤ q2 < 25 . Está claro que
π2 (q1∗ , 0) = 0.
(8)
Además, la derivada de la función de pago (de una variable, q2 ) es
∂π2 (q1∗ , q2 )
∂(4 − q1∗ − q2 )q2 − 3q2
=
∂q2
∂q2
∗
= 4 − q1 − 2q2 − 3
−1
=
− 2q2
2
< 0.
Esto, junto con (7) y (8) nos hace concluir que la función de pago q2 → π2 (q1∗ , q2 )
del jugador 2 tiene la forma de la Figura 6. Vemos que q2∗ = 0 es mejor respuesta
π2 (q1∗ , q2 )
0
5
2
0
q2
Figura 6: Problema 4, caso (c)
a q1∗ = 32 . Por tanto, hay un solo equilibrio de Nash del tipo (c):
3
,0 .
2
(d) Supongamos que (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0 es un EN. Notamos primero que
4 − q2∗ > 0. Pues, si 4 − q2∗ ≤ 0 la empresa 2 tiene una desviación profitable
(producir 0):
π2 (0, q2∗ ) = max{0, 4 − 0 − q2∗ }q2∗ − 3q2∗ = 0q2∗ − 3q2∗ < 0,
11
mientras producir q2′ = 0 conlleva el pago 0.
Como 4 − q2∗ > 0, hay un (pequeño) intervalo de valores de q2 > 0 alrededor de q2∗
(tal intervalo existe porque q2∗ > 0) con 4 − q2 > 0. Para este intervalo la función
de pago del jugador 2 tiene la siguiente forma
π2 (0, q2 ) = max{0, 4 − 0 − q2 }q2 − 3q2 = (4 − q2 )q2 − 3q2 .
(9)
Dado que (0, q2∗) es un EN, el jugador 2 no tiene incentivos para desviarse. En
otras palabras, dada la estrategia q1∗ = 0 del jugador 1, q2∗ es débilmente mejor
que cualquier otra estrategia en el intervalo que consideramos (alrededor de q2∗ ).
Por tanto, q2∗ maximiza (9) en dicho intervalo. Por consiguiente, q2∗ satisface la
CPO correspondiente:
4 − 2q2∗ − 3 = 0.
Por tanto,
q2∗ =
1
2
Se comprueba fácilmente que
(4 −
q1∗
−
q2∗ )
1
=
4−0−
2
7
=
2
> 0.
Por tanto en el caso de una desviación q1′ = ǫ > 0 del jugador 1 (con ǫ
suficientemente pequeño),
π1 (q1′ , q2∗ ) = max{0, 4 − ǫ − q2∗ }q1 − q1
= (4 − ǫ − q2∗ )q1 − q1
5
=
−ǫ ǫ
2
> 0.
Por tanto, el jugador 1 tiene una desviación profitable (producir q1′ le da un pago
superior que q1∗ ). Concluimos que no hay un equilibrio del tipo (d).
Resumiendo, hay un solo equilibrio de Nash (del tipo (c)). El perfil estratégico es
3
,0 .
2
12
P.5. (20 puntos) Consideramos el juego dinámico de 2 jugadores que consiste en jugar dos
veces el juego G estático, dado por la siguiente tabla de pagos:
1\2
T
M
B
L
C
(3, 1) (0, 0)
(2, 1) (1, 2)
(1, 2) (a, 1)
R
(5, 0)
(3, 1)
(4, 4)
donde a es una constante. Los jugadores escogen simultáneamente una acción en la
primera etapa. Luego observan el resultado y escogen de nuevo simultáneamente una
acción en la segunda etapa. Suponemos que no hay descuento (es decir que el pago
final es la suma de los pagos de las dos etapas).
(a) La Figura 7 muestra (parcialmente) la representación en forma extensiva. Faltan
2
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
2
1
Figura 7: Problema 5, juego
los conjuntos de información. Indı́calos (sólo en la parte representada en la Figura
7).
Solución: Véase la Figura 8.
(b) ¿Cuántas estrategias tiene cada jugador?
Solución: El jugador 1 tiene un conjunto de información en la primera etapa y 9
conjuntos de información en la segunda etapa. En cada conjunto de información
tiene que elegir entre las tres acciones T , M y B. Por tanto, tiene 310 = 59049
estrategias. Utilizando el mismo argumento (¡!), el jugador 2 también tiene 310 =
59049 estrategias.
(c) ¿Cuántos subjuegos hay?
Solución: Hay 10 subjuegos. En la Figura 7 cada nodo del jugador 1 define un
subjuego, y cada subjuego empieza en un nodo del jugador 1.
13
2
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
2
1
Figura 8: Problema 5, juego: conjuntos de información
(d) Supón que a = 2. ¿Cuáles son los pagos correspondientes a los equilibrios de Nash
perfectos en subjuegos en estrategias puras?
Solución: Si a = 2 entonces el juego estático es el siguiente:
1\2
T
M
B
L
(3, 1)
(2, 1)
(1, 2)
C
R
(0, 0) (5, 0)
(1, 2) (3, 1)
(2, 1) (4, 4)
Hemos indicado las mejores respuestas en negrita. Hay un único EN: (T, L). Por
tanto, un teorema del Tema 3 (la Diapositiva 43) nos dice que el juego dinámico
tienen un único resultado perfecto en subjuegos: en cada etapa se juega (T, L).
Luego, los pagos son (3, 1) + (3, 1) = (6, 2).
(e) Supón que a = 0. ¿Existe algún equilibrio de Nash perfecto en subjuegos (en
estrategias puras) en el que los jugadores obtienen los pagos (4, 4) en la primera
etapa?
En caso afirmativo, especificar el perfil estratégico completo y explicar
cuidadosamente por qué es un equilibrio.
En caso negativo, explicar cuidadosamente por qué no.
Solución: Sı́, en el siguiente equilibrio perfecto en subjuegos los jugadores obtienen
los pagos (4, 4) en la primera etapa.
Si a = 0 entonces el juego estático es el siguiente:
1\2
L
C
T
(3, 1) (0, 0)
M (2, 1) (1, 2)
B (1, 2) (0, 1)
14
R
(5, 0)
(3, 1)
(4, 4)
Hemos indicado las mejores respuestas en negrita. Hay dos EN: (T, L) y (M, C).
Podemos aprovechar la existencia de un segundo EN para obtener los pagos (4, 4)
en la primera etapa. (Veáse también el Ejemplo 3.9 del Tema 3.)
• Estrategia s1 del jugador 1:
– Jugar B en la primera etapa;
– Si se ha jugado (B, R) en la primera etapa, jugar T en la segunda etapa.
En caso contrario, jugar M.
• Estrategia s2 del jugador 2:
– Jugar R en la primera etapa;
– Si se ha jugado (B, R) en la primera etapa, jugar L en la segunda etapa.
En caso contrario, jugar C.
Está claro que en el perfil (s1 , s2 ) los jugadores obtienen los pagos (4, 4) en
la primera etapa (y (3, 1) en la segunda). Veamos porque estas estrategias
constituyen un EPS.
En cada subjuego que empieza en la segunda etapa: el perfil (s1 , s2 ) inducen a un
EN del subjuego, a saber, o bien (T, L) o bien (M, C).
En la primera etapa el juego “efectivo” es
1\2
L
T
(4, 3)
M (3, 3)
B (4, 3)
C
(1, 2)
(2, 4)
(1, 3)
R
(6, 2)
(4, 3)
(7, 5)
Uno de los 3 tres equilibrios de Nash es (B, R), el perfil de acciones prescritas por
las estrategias (s1 , s2 ). Por tanto, (s1 , s2 ) es un EPS.
15
P.6. (15 puntos) Considera el siguiente juego con información incompleta entre los jugadores
1 y 2.
• El azar determina si los pagos de los jugadores son como en la matriz X o como
en la matriz Y. La matriz X tiene probabilidad 3/4 de ser seleccionada mientras
la matriz Y tiene probabilidad 1/4 de ser seleccionada.
• El jugador 2 es informado sobre qué matriz ha sido seleccionada, pero el jugador
1 no sabe cuál es la matriz seleccionada.
• El jugador 1 elige entre las acciones A y B mientras jugador 2 elige
simultáneamente entre las acciones I y D.
• Los pagos son los que se dan en la matriz seleccionada por el azar.
1/2
I
D
A (3,6) (1,3)
B (1,1) (2,3)
1/2
I
D
A (4,1) (3,3)
B (0,6) (2,2)
Matriz X
Matriz Y
(a) Calcula el pago esperado de cada jugador en caso de que el jugador 1 elige la
estrategia A y el jugador 2 elige la estrategia DD.
Solución: u1 (A, DD) = (3/4)(1) + (1/4)(3) = 1.5 y u2 (A, DD) = (3/4)(3) +
(1/4)(3) = 3.
(b) ¿Cuál es la mejor respuesta para el jugador 2 cuando el jugador 1 elige A? ¿Cuál
es la mejor respuesta para el jugador 2 cuando el jugador 1 elige B?
Solución: Obviamente MR2 (A) = ID y MR2 (B) = DI.
(c) Calcula todos los equilibrios Bayesianos en estrategias puras.
Solución: Visto lo visto, sólo tenemos que calcular la mejor respuesta del jugador
1 contra ID y contra DI. Ahora bien, MR1 (ID) = A (porque u1 (A, ID) = 3
y u1 (B, ID) = 5/4). Ası́ mismo, MR1 (DI) = A (porque u1 (A, DI) = 7/4 y
u1 (B, DI) = 6/4). Por tanto, el único equilibrio Bayesiano en estrategias puras
es (A, ID).
16
Descargar