Examen diciembre. File

Anuncio
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
Montevideo, 21 de diciembre de 2011
Examen Teoría de juegos
Nombre ______________________________________
C.I.
_______________
El examen consta de dos partes. La primera parte debe ser realizada por todos los estudiantes y el
tiempo previsto es de 2 horas. La segunda parte debe ser realizada sólo por los estudiantes libres y el
tiempo adicional es de 1 hora.
Primera parte
1. (4 puntos) La siguiente matriz representa un juego estático entre el Jugador 1 y el
Jugador 2. Los números entre paréntesis representan las utilidades de los jugadores. El
número a la izquierda de la coma es la utilidad del jugador 1 y el de la derecha, la
utilidad del jugador 2.
Jugador 1
x1
x2
x3
x4
Jugador 2
y2
y3
(2,-2)
(2,0)
(-1,1)
(0,2)
(0,0)
(1,1)
(2,1)
(0,1)
y1
(-1,-1)
(-2,0)
(0,2)
(-1,2)
y4
(-1,-2)
(-2,0)
(1,-1)
(0,1)
1.1 (1 punto) Determine si los jugadores tienen estrategias dominadas y reduzca la
matriz eliminándolas.
1.2 (1 punto) Determine si la matriz reducida tiene equilibrios de Nash y diga cuáles
son.
1.3 (2 puntos) Represente el juego original de forma extensiva y determine el resultado
por retroinducción para el caso en el que el jugador 2 juega en primer término.
2. (3 puntos) Acosados por los ladrones, dos vecinos consideran la posibilidad de poner
cercas eléctricas en sus casas. El conjunto de acciones posibles de cada vecino está
compuesto por sólo dos elementos , . Es decir que si llamamos a la
acción que elige el vecino 1, tenemos que ∈ , . Es análogo para el
vecino 2. Los vecinos actúan separada y simultáneamente. Cada vecino sabe que el
efecto principal de la cerca es inducir al ladrón a elegir la casa del otro. Las pérdidas por
robo dependen entonces de las decisiones que toman los dos vecinos: las pérdidas del
vecino 1 son , y las del vecino 2 son , . Cada vecino piensa que: (i) si
ninguno de los dos pone una cerca, las pérdidas por robos serán iguales a 10, es decir
que , = , = 10; (ii) si él pone una cerca y el vecino no lo hace no
tendrá pérdidas por robos, es decir que , = , = 0; (iii) si el vecino pone
una cerca y él no lo hace sufrirá una pérdida de 20, es decir que: , = , =
20; y (iv) si ambos ponen cerca, las pérdidas por robos vuelven a ser 10 (se neutralizan
1
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
mutuamente), es decir que , = , = 10. Poner la cerca tiene un costo de
5. Es decir que elegir la acción cuesta 5 y elegir la acción tiene un costo nulo:
= 5 y = 0. La utilidad que obtienen los vecinos 1 y 2 cuando se
han elegido las acciones y son entonces, respectivamente: , =
− , − y , = − , − .
2.1. (1 punto) Escriba la matriz de pagos de este juego.
2.2. (1 punto) Identifique los equilibrios de Nash (en estrategias puras). Fundamente su
respuesta.
2.3. (1 punto) ¿Sería posible mejorar el resultado si los vecinos pudieran coordinar sus
acciones? Explique.
3. (2 puntos) Considere un juego repetido infinitas veces y en el que los jugadores
tienen un factor de descuento temporal = 0,8. El juego de etapa tiene la siguiente
matriz de pagos:
Jugador 2
Jugador 1
N
C
N
-10,-10
-15,0
C
0,-15
-5,-5
Si le resulta conveniente, puede pensar en la jugada C como “cooperar” y en la jugada
N como “no cooperar”.
¿Puede encontrar un equilibrio perfecto por subjuegos en el que ambos jugadores juegan
“C” en el sendero de equilibrio en todas las etapas? Si su respuesta es afirmativa,
caracterice el perfil de estrategias que sostienen el resultado y explique por qué
conforman un equilibrio perfecto por subjuegos. Si su respuesta es negativa, explique
por qué no puede encontrar tal equilibrio. (Ayuda: sugiero probar con la estrategia
gatillo).
2
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
Segunda parte
4. (1,5 puntos) Dos países fronterizos compiten por atraer una inversión en un proyecto
de generación eléctrica de gran envergadura. Si se instala la planta, abastece las
necesidades de ambos países por los siguientes 20 años. Si no se instala, los países
entran en crisis energética. El país A juega primero. Sus acciones posibles son habilitar
o no habilitar la instalación de la planta en su territorio. El país B juega después. Sus
acciones posibles son comprar o no comprar energía, si la planta se instaló en el país A,
y habilitar o no habilitar la instalación de la planta en su territorio, si la planta no se
instaló en el país A. Sólo en el caso en que la planta se instala en el país B, el país A
tiene una jugada más, que consiste en comprar o no energía producida en el país B. La
forma extensiva del juego puede representarse por el siguiente árbol:
País A
Habilita
No habilita
País B
País B
Habilita
Compra
No compra
País A
Compra
A
B
10
5
No habilita
4
0
No compra
5
10
4.1. Identifique todos los subjuegos. Explique.
4.2. Resuelva el juego por retroinducción. Explique.
5. (1,5 puntos) Considere el siguiente árbol de un juego con dos jugadores:
3
0
4
0
0
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
A
I
D
B
(1,1)
i
d
A
(2,2)
I
(-1,-1)
D
(0,3)
5.1. (1/4 punto) ¿Es este un juego de información completa o incompleta? Fundamente
su respuesta.
5.2. (1/4 punto) ¿Es este un juego de información perfecta o imperfecta? Fundamente su
respuesta.
5.3. (1/2 punto) Identifique todos los subjuegos. Explique.
5.4. (1/2 punto) Identifique el o los equilibrios perfectos por subjuegos. Explique.
4
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
Pauta de respuesta
1.1. Jugar x2 es una estrategia dominada para el jugador 1. x2. Una vez eliminada x2,
analizo dominancia en lo que queda. En principio, el jugador 1 no tiene más estrategias
dominadas, pero la estrategia y2 e y4 del jugador 2 también son dominadas. Una vez
eliminadas estas dos jugadas de 2 resulta que la jugada x4 del jugador 1 está dominada
por x3. La matriz reducida queda con x1, x3 y y1, y3 ya que todas ellas incluyen posibles
mejores repuestas.
1.2. Considero la matriz reducida. Si el jugador 1 elige x1, la mejor respuesta del
jugador 2 es y3. Si el jugador 2 elige y3, la mejor respuesta del jugador 1 es x1. Por lo
tanto, el par (x1,y3) es un equilibrio de Nash. Si el jugador 1 elige x3, la mejor respuesta
del jugador 2 es y1. Si el jugador 2 elige y1, la mejor respuesta del jugador 1 es x3. Por
lo tanto, el par (x3,y1) también es un equilibrio de Nash.
1.3. Representación en forma extensiva
J2
y1
y2
y4
y3
J1
J1
J1
J1
x1
x2
(-1,-1) (0,-2)
x3
x4
x1
x4
x2
(2,0) (2,-1)
I
(-2,2) (1,-1)
x3
x1
x2
x3
x1
x4
(0,2)
(1,0)
(2,0)
(1,1)
x2
x3
x4
(-2,-1) (0,-2) (-1,1) (1,0)
(0,0) (1,2)
Nota: En la forma extensiva, seguimos la convención usual de poner las utilidades en el
orden en que se juega. Por eso, la utilidad que registramos a la izquierda de la coma es
la del jugador 2 y a la derecha es la del jugador 1. Notar que este es el orden inverso del
que usamos en la forma normal del juego, en el que seguimos la convención, también
usual, de poner primero la utilidad del jugador que está en las filas y después la del
jugador que está en las columnas.
Si J2 elige y1 la mejor respuesta de J1 es x3. Si J2 elige y2 las mejores respuestas de J1
son x1 y x4. Si J2 elige y3 la mejor respuesta de J1 es x1. Si J2 elige y4 la mejor respuesta
de J1 es x3. Entre los cinco perfiles de estrategia a los que puede llevar el juego J1, J2
maximiza su utilidad jugando y1 porque obtiene 2>1>0>-1 (2 es mayor que las
utilidades que obtendría jugando las otras opciones). Por lo tanto la solución por
retroinducción es (y1, x3)
2.1. (1 punto) Escriba la matriz de pagos de este juego.
5
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
, C
C
N
N
C
N
C
N
10
0
20
10
5
5
0
0
, = − , − -15
-5
-20
-10
, 10
20
0
10
5
0
5
0
, = − , − -15
-20
-5
-10
La matriz de pagos resulta entonces:
Vecino 2
Vecino 1
Cerca
No cerca
Cerca
-15,-15
-20,-5
No cerca
-5,-20
-10,-10
2.2. (1 punto) Identifique los equilibrios de Nash (en estrategias puras). Fundamente su
respuesta.
Se trata de encontrar los pares de mejores respuestas. Supongamos que el vecino 2 elige
“cerca”. Entonces, el vecino 1 obtiene -15 si elige “cerca” y -20 si elige “no cerca”. La
mejor respuesta del vecino 1 a la jugada “cerca” del vecino 2 es, por lo tanto, “cerca”. A
su vez, si el vecino 1 juega cerca, el vecino 2 obtiene -15 si elige “cerca” y -20 si elige
“no cerca”. Por lo tanto, la mejor respuesta del vecino 2 a la jugada “cerca” del vecino 1
es “cerca”. Entonces, el par (“cerca”, “cerca”) es un par de mejores respuestas, es decir
que es un equilibrio de Nash.
Si el vecino 2 juega “no cerca”, el vecino 1 obtiene -5 si juega “cerca” y -10 si juega
“no cerca”. La mejor respuesta del vecino 1 a la jugada “no cerca” del vecino 2 es
entonces “cerca”. Ya vimos que la mejor respuesta del vecino 2 a la jugada “cerca” del
vecino 1 es “cerca”. Por lo tanto, la jugada “no cerca” no forma parte de un equilibrio
de Nash.
2.3. (1 punto) ¿Sería posible mejorar el resultado si los vecinos pudieran coordinar sus
acciones? Explique.
Sí. Si pudieran coordinar sus acciones, podrían elegir no poner cerca eléctrica y
alcanzarían las utilidades (-10,-10) en lugar de las utilidades (-15,-15) del equilibrio de
Nash.
Este tipo de resultados contribuye a justificar la intervención gubernamental en temas de
seguridad. En este ejemplo en particular hay una externalidad: cuando un vecino pone
una cerca eléctrica perjudica al otro vecino. El vecino que pone la cerca no internaliza
todos los efectos de su acción. Por eso, la acción que es individualmente óptima no es
socialmente óptima. Este tipo de argumentos puede utilizarse para criticar la
privatización que se ha dado de hecho de la seguridad pública en los últimos años en
muchos países, incluido el nuestro.
3. La estrategia gatillo en este caso adoptaría la siguiente forma:
a) En la primera etapa, jugar “C”.
6
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
b) En las siguientes etapas:
• Jugar “C”, si en todas las etapas previas ambos jugaron “C”.
• Jugar “N” en el caso contrario.
Supongo que J1 juega esta estrategia y demuestro que es óptimo para J2 seguir esta
misma estrategia (i) en el juego completo y (ii) en todos los subjuegos.
(i) Juego completo.
Primero observamos que es óptimo “el castigo” previsto en la estrategia gatillo. Si en
alguna etapa se juega algo diferente a (C,C), J1 jugará N. Entonces es óptimo para J2
jugar N también.
Segundo, verificamos si es óptimo para J2 “cooperar” (elegir C) al inicio del juego o en
cualquier nodo en que antes ambos jugadores hayan jugado C. J2 puede elegir C y
obtener una utilidad:
5
−5 + × −5 + × −5 + ⋯ = −5 × 1 + + + ⋯ = −
1−
O puede elegir N, beneficiándose en lo inmediato, pero desatando el “castigo” de J1. Su
utilidad es entonces:
0 + × −10 + × −10 + ⋯ = 0 − 10 × + + ⋯ = −
10
1−
Para que a J2 le convenga “cooperar” deberá cumplirse que:
−
O, lo que es lo mismo:
10
5
>−
1−
1−
> 5⁄10 = 1⁄2
En este caso, los jugadores tienen un factor de descuento temporal 0,8, por lo cual la
condición anterior se verifica. Con esto demostramos que el par de estrategias gatillo
conforman un equilibrio de Nash del juego completo.
(ii) Subjuegos. Verificaremos ahora que este par de estrategias también conforma
equilibrios de Nash en todos los subjuegos. En los subjuegos en que ambos jugadores
han jugado previamente C estamos en una situación como la resuelta en (i). Por lo tanto,
en esos subjuegos ya sabemos que jugar C es óptimo para J2. Analizamos ahora los
subjuegos en los que ha habido algún desvío. En estos subjuegos, J2 espera que J1
juegue N de ahora en más. Por lo tanto, lo mejor que puede hacer J2 es jugar N él
también.
Conclusión: es óptimo para J2 jugar C si se jugó C en todas las etapas previas y N si
hubo algún desvío. Pero ésta es precisamente la estrategia gatillo. Por lo tanto, hemos
demostrado que la estrategia gatillo es la mejor respuesta que puede dar J2 a la
estrategia gatillo que supusimos que adopta J1. Como el juego es simétrico, lo mismo
valdrá para el jugador 1, es decir que si J2 adopta la estrategia gatillo, es óptimo para J1
adoptar la misma estrategia.
7
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
4.1. Los subjuegos son subconjuntos del juego que: (i) empiezan en un singleton, (ii)
incluye a todos los nodos que le siguen y (iii) no hay intersección entre conjuntos de
información del subjuego y conjuntos de información de fuera del subjuego. Identifico 3
subjuegos, destacados con una elipse en rojo en el siguiente dibujo:
País A
Habilita
No habilita
País B
País B
Habilita
Compra
No compra
País A
Compra
A
B
10
5
No habilita
4
0
5
10
No compra
0
4
4.2. Resuelva el juego por retroinducción. Explique.
a) Después de que el país A habilita, el país B prefiere jugar “compra”, ya que obtiene
5, mientras que si jugara “no compra” obtendría 0.
b) Después de que el país A no habilita y el país B habilita, el país A en su segunda
jugada elige “compra” ya que comprando energía obtiene 5 y no comprando obtiene 0.
c) Después de que el país A no habilita, el país B puede no habilitar, en cuyo caso
obtiene 0, o habilitar, en cuyo caso obtiene 10, ya que el país A luego compra, según
vimos en el punto (b). Por lo tanto, el país B habilita y el resultado es 5 para el país A y
10 para el país B.
d) El país A sabe entonces que si no habilita la instalación de la planta en su territorio
obtendrá 5 y si la habilita obtendrá 10.
Conclusión: en la primera etapa el país A “habilita” y en la segunda el país B
“compra”.
5.1 Es un juego de información completa porque todos los jugadores conocen las
utilidades que recibirán los demás jugadores en todos los perfiles de estrategia.
5.2 Es un juego de información perfecta porque todos los jugadores conocen las jugadas
anteriores de todos los jugadores en todos los puntos del juego, esto es, todos los
conjuntos de información de los jugadores son singletons.
8
0
0
Facultad de Ciencias Sociales, Universidad de la República, Uruguay
Teoría de Juegos 2011
5.3 Hay un primer subjuego que comienza en el nodo donde el jugador A juega por
segunda vez y contiene a todos sus sucesores. Hay un segundo subjuego que comienza
en el nodo donde le toca jugar a B y contiene a todos sus sucesores. También se puede
considerar como subjuego a la totalidad del juego.
A
I
D
B
i
(1,1)
d
A
(2,2)
I
D
(-1,-1)
(0,3)
B
A
II
ID
DI
DD
i
(1,1)
(1,1)
(2,2)
(2,2)
d
(1,1)
(1,1)
(-1,-1)
(0,3)
5.4 El juego tiene tres equilibrios de Nash (II, d), (ID, d) y (DI, i). Sin embargo sólo el
segundo de ellos es perfecto por subjuegos. Los otros dos equilibrios de Nash del juego
completo incluyen estrategias que no son parte de un equilibrio de Nash en el segundo
subjuego. En efecto, para el jugador A no es una mejor respuesta elegir I después de que
el jugador B eligió d. Por lo tanto, esas estrategias deben considerarse como “amenazas
vacías” o “no creíbles”. En cambio, el perfil de estrategias (ID, d) no sólo es un
equilibrio de Nash del juego completo, sino que también es un equilibrio de Nash en
todos los subjuegos: (i) En el segundo subjuego, es óptimo para el jugador A elegir D.
(ii) En el primer subjuego, el par de estrategias (D,d) conforman un equilibrio de Nash.
Si B elige d, la mejor respuesta de A es elegir D. Si A elige D, la mejor respuesta de B
es elegir d. Se verifica entonces que (D,d) es un equilibrio de Nash de este subjuego.
Con esto queda demostrado que (ID, d) es un equilibrio perfecto por subjuegos.
9
Descargar