Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 Montevideo, 21 de diciembre de 2011 Examen Teoría de juegos Nombre ______________________________________ C.I. _______________ El examen consta de dos partes. La primera parte debe ser realizada por todos los estudiantes y el tiempo previsto es de 2 horas. La segunda parte debe ser realizada sólo por los estudiantes libres y el tiempo adicional es de 1 hora. Primera parte 1. (4 puntos) La siguiente matriz representa un juego estático entre el Jugador 1 y el Jugador 2. Los números entre paréntesis representan las utilidades de los jugadores. El número a la izquierda de la coma es la utilidad del jugador 1 y el de la derecha, la utilidad del jugador 2. Jugador 1 x1 x2 x3 x4 Jugador 2 y2 y3 (2,-2) (2,0) (-1,1) (0,2) (0,0) (1,1) (2,1) (0,1) y1 (-1,-1) (-2,0) (0,2) (-1,2) y4 (-1,-2) (-2,0) (1,-1) (0,1) 1.1 (1 punto) Determine si los jugadores tienen estrategias dominadas y reduzca la matriz eliminándolas. 1.2 (1 punto) Determine si la matriz reducida tiene equilibrios de Nash y diga cuáles son. 1.3 (2 puntos) Represente el juego original de forma extensiva y determine el resultado por retroinducción para el caso en el que el jugador 2 juega en primer término. 2. (3 puntos) Acosados por los ladrones, dos vecinos consideran la posibilidad de poner cercas eléctricas en sus casas. El conjunto de acciones posibles de cada vecino está compuesto por sólo dos elementos , . Es decir que si llamamos a la acción que elige el vecino 1, tenemos que ∈ , . Es análogo para el vecino 2. Los vecinos actúan separada y simultáneamente. Cada vecino sabe que el efecto principal de la cerca es inducir al ladrón a elegir la casa del otro. Las pérdidas por robo dependen entonces de las decisiones que toman los dos vecinos: las pérdidas del vecino 1 son , y las del vecino 2 son , . Cada vecino piensa que: (i) si ninguno de los dos pone una cerca, las pérdidas por robos serán iguales a 10, es decir que , = , = 10; (ii) si él pone una cerca y el vecino no lo hace no tendrá pérdidas por robos, es decir que , = , = 0; (iii) si el vecino pone una cerca y él no lo hace sufrirá una pérdida de 20, es decir que: , = , = 20; y (iv) si ambos ponen cerca, las pérdidas por robos vuelven a ser 10 (se neutralizan 1 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 mutuamente), es decir que , = , = 10. Poner la cerca tiene un costo de 5. Es decir que elegir la acción cuesta 5 y elegir la acción tiene un costo nulo: = 5 y = 0. La utilidad que obtienen los vecinos 1 y 2 cuando se han elegido las acciones y son entonces, respectivamente: , = − , − y , = − , − . 2.1. (1 punto) Escriba la matriz de pagos de este juego. 2.2. (1 punto) Identifique los equilibrios de Nash (en estrategias puras). Fundamente su respuesta. 2.3. (1 punto) ¿Sería posible mejorar el resultado si los vecinos pudieran coordinar sus acciones? Explique. 3. (2 puntos) Considere un juego repetido infinitas veces y en el que los jugadores tienen un factor de descuento temporal = 0,8. El juego de etapa tiene la siguiente matriz de pagos: Jugador 2 Jugador 1 N C N -10,-10 -15,0 C 0,-15 -5,-5 Si le resulta conveniente, puede pensar en la jugada C como “cooperar” y en la jugada N como “no cooperar”. ¿Puede encontrar un equilibrio perfecto por subjuegos en el que ambos jugadores juegan “C” en el sendero de equilibrio en todas las etapas? Si su respuesta es afirmativa, caracterice el perfil de estrategias que sostienen el resultado y explique por qué conforman un equilibrio perfecto por subjuegos. Si su respuesta es negativa, explique por qué no puede encontrar tal equilibrio. (Ayuda: sugiero probar con la estrategia gatillo). 2 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 Segunda parte 4. (1,5 puntos) Dos países fronterizos compiten por atraer una inversión en un proyecto de generación eléctrica de gran envergadura. Si se instala la planta, abastece las necesidades de ambos países por los siguientes 20 años. Si no se instala, los países entran en crisis energética. El país A juega primero. Sus acciones posibles son habilitar o no habilitar la instalación de la planta en su territorio. El país B juega después. Sus acciones posibles son comprar o no comprar energía, si la planta se instaló en el país A, y habilitar o no habilitar la instalación de la planta en su territorio, si la planta no se instaló en el país A. Sólo en el caso en que la planta se instala en el país B, el país A tiene una jugada más, que consiste en comprar o no energía producida en el país B. La forma extensiva del juego puede representarse por el siguiente árbol: País A Habilita No habilita País B País B Habilita Compra No compra País A Compra A B 10 5 No habilita 4 0 No compra 5 10 4.1. Identifique todos los subjuegos. Explique. 4.2. Resuelva el juego por retroinducción. Explique. 5. (1,5 puntos) Considere el siguiente árbol de un juego con dos jugadores: 3 0 4 0 0 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 A I D B (1,1) i d A (2,2) I (-1,-1) D (0,3) 5.1. (1/4 punto) ¿Es este un juego de información completa o incompleta? Fundamente su respuesta. 5.2. (1/4 punto) ¿Es este un juego de información perfecta o imperfecta? Fundamente su respuesta. 5.3. (1/2 punto) Identifique todos los subjuegos. Explique. 5.4. (1/2 punto) Identifique el o los equilibrios perfectos por subjuegos. Explique. 4 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 Pauta de respuesta 1.1. Jugar x2 es una estrategia dominada para el jugador 1. x2. Una vez eliminada x2, analizo dominancia en lo que queda. En principio, el jugador 1 no tiene más estrategias dominadas, pero la estrategia y2 e y4 del jugador 2 también son dominadas. Una vez eliminadas estas dos jugadas de 2 resulta que la jugada x4 del jugador 1 está dominada por x3. La matriz reducida queda con x1, x3 y y1, y3 ya que todas ellas incluyen posibles mejores repuestas. 1.2. Considero la matriz reducida. Si el jugador 1 elige x1, la mejor respuesta del jugador 2 es y3. Si el jugador 2 elige y3, la mejor respuesta del jugador 1 es x1. Por lo tanto, el par (x1,y3) es un equilibrio de Nash. Si el jugador 1 elige x3, la mejor respuesta del jugador 2 es y1. Si el jugador 2 elige y1, la mejor respuesta del jugador 1 es x3. Por lo tanto, el par (x3,y1) también es un equilibrio de Nash. 1.3. Representación en forma extensiva J2 y1 y2 y4 y3 J1 J1 J1 J1 x1 x2 (-1,-1) (0,-2) x3 x4 x1 x4 x2 (2,0) (2,-1) I (-2,2) (1,-1) x3 x1 x2 x3 x1 x4 (0,2) (1,0) (2,0) (1,1) x2 x3 x4 (-2,-1) (0,-2) (-1,1) (1,0) (0,0) (1,2) Nota: En la forma extensiva, seguimos la convención usual de poner las utilidades en el orden en que se juega. Por eso, la utilidad que registramos a la izquierda de la coma es la del jugador 2 y a la derecha es la del jugador 1. Notar que este es el orden inverso del que usamos en la forma normal del juego, en el que seguimos la convención, también usual, de poner primero la utilidad del jugador que está en las filas y después la del jugador que está en las columnas. Si J2 elige y1 la mejor respuesta de J1 es x3. Si J2 elige y2 las mejores respuestas de J1 son x1 y x4. Si J2 elige y3 la mejor respuesta de J1 es x1. Si J2 elige y4 la mejor respuesta de J1 es x3. Entre los cinco perfiles de estrategia a los que puede llevar el juego J1, J2 maximiza su utilidad jugando y1 porque obtiene 2>1>0>-1 (2 es mayor que las utilidades que obtendría jugando las otras opciones). Por lo tanto la solución por retroinducción es (y1, x3) 2.1. (1 punto) Escriba la matriz de pagos de este juego. 5 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 , C C N N C N C N 10 0 20 10 5 5 0 0 , = − , − -15 -5 -20 -10 , 10 20 0 10 5 0 5 0 , = − , − -15 -20 -5 -10 La matriz de pagos resulta entonces: Vecino 2 Vecino 1 Cerca No cerca Cerca -15,-15 -20,-5 No cerca -5,-20 -10,-10 2.2. (1 punto) Identifique los equilibrios de Nash (en estrategias puras). Fundamente su respuesta. Se trata de encontrar los pares de mejores respuestas. Supongamos que el vecino 2 elige “cerca”. Entonces, el vecino 1 obtiene -15 si elige “cerca” y -20 si elige “no cerca”. La mejor respuesta del vecino 1 a la jugada “cerca” del vecino 2 es, por lo tanto, “cerca”. A su vez, si el vecino 1 juega cerca, el vecino 2 obtiene -15 si elige “cerca” y -20 si elige “no cerca”. Por lo tanto, la mejor respuesta del vecino 2 a la jugada “cerca” del vecino 1 es “cerca”. Entonces, el par (“cerca”, “cerca”) es un par de mejores respuestas, es decir que es un equilibrio de Nash. Si el vecino 2 juega “no cerca”, el vecino 1 obtiene -5 si juega “cerca” y -10 si juega “no cerca”. La mejor respuesta del vecino 1 a la jugada “no cerca” del vecino 2 es entonces “cerca”. Ya vimos que la mejor respuesta del vecino 2 a la jugada “cerca” del vecino 1 es “cerca”. Por lo tanto, la jugada “no cerca” no forma parte de un equilibrio de Nash. 2.3. (1 punto) ¿Sería posible mejorar el resultado si los vecinos pudieran coordinar sus acciones? Explique. Sí. Si pudieran coordinar sus acciones, podrían elegir no poner cerca eléctrica y alcanzarían las utilidades (-10,-10) en lugar de las utilidades (-15,-15) del equilibrio de Nash. Este tipo de resultados contribuye a justificar la intervención gubernamental en temas de seguridad. En este ejemplo en particular hay una externalidad: cuando un vecino pone una cerca eléctrica perjudica al otro vecino. El vecino que pone la cerca no internaliza todos los efectos de su acción. Por eso, la acción que es individualmente óptima no es socialmente óptima. Este tipo de argumentos puede utilizarse para criticar la privatización que se ha dado de hecho de la seguridad pública en los últimos años en muchos países, incluido el nuestro. 3. La estrategia gatillo en este caso adoptaría la siguiente forma: a) En la primera etapa, jugar “C”. 6 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 b) En las siguientes etapas: • Jugar “C”, si en todas las etapas previas ambos jugaron “C”. • Jugar “N” en el caso contrario. Supongo que J1 juega esta estrategia y demuestro que es óptimo para J2 seguir esta misma estrategia (i) en el juego completo y (ii) en todos los subjuegos. (i) Juego completo. Primero observamos que es óptimo “el castigo” previsto en la estrategia gatillo. Si en alguna etapa se juega algo diferente a (C,C), J1 jugará N. Entonces es óptimo para J2 jugar N también. Segundo, verificamos si es óptimo para J2 “cooperar” (elegir C) al inicio del juego o en cualquier nodo en que antes ambos jugadores hayan jugado C. J2 puede elegir C y obtener una utilidad: 5 −5 + × −5 + × −5 + ⋯ = −5 × 1 + + + ⋯ = − 1− O puede elegir N, beneficiándose en lo inmediato, pero desatando el “castigo” de J1. Su utilidad es entonces: 0 + × −10 + × −10 + ⋯ = 0 − 10 × + + ⋯ = − 10 1− Para que a J2 le convenga “cooperar” deberá cumplirse que: − O, lo que es lo mismo: 10 5 >− 1− 1− > 5⁄10 = 1⁄2 En este caso, los jugadores tienen un factor de descuento temporal 0,8, por lo cual la condición anterior se verifica. Con esto demostramos que el par de estrategias gatillo conforman un equilibrio de Nash del juego completo. (ii) Subjuegos. Verificaremos ahora que este par de estrategias también conforma equilibrios de Nash en todos los subjuegos. En los subjuegos en que ambos jugadores han jugado previamente C estamos en una situación como la resuelta en (i). Por lo tanto, en esos subjuegos ya sabemos que jugar C es óptimo para J2. Analizamos ahora los subjuegos en los que ha habido algún desvío. En estos subjuegos, J2 espera que J1 juegue N de ahora en más. Por lo tanto, lo mejor que puede hacer J2 es jugar N él también. Conclusión: es óptimo para J2 jugar C si se jugó C en todas las etapas previas y N si hubo algún desvío. Pero ésta es precisamente la estrategia gatillo. Por lo tanto, hemos demostrado que la estrategia gatillo es la mejor respuesta que puede dar J2 a la estrategia gatillo que supusimos que adopta J1. Como el juego es simétrico, lo mismo valdrá para el jugador 1, es decir que si J2 adopta la estrategia gatillo, es óptimo para J1 adoptar la misma estrategia. 7 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 4.1. Los subjuegos son subconjuntos del juego que: (i) empiezan en un singleton, (ii) incluye a todos los nodos que le siguen y (iii) no hay intersección entre conjuntos de información del subjuego y conjuntos de información de fuera del subjuego. Identifico 3 subjuegos, destacados con una elipse en rojo en el siguiente dibujo: País A Habilita No habilita País B País B Habilita Compra No compra País A Compra A B 10 5 No habilita 4 0 5 10 No compra 0 4 4.2. Resuelva el juego por retroinducción. Explique. a) Después de que el país A habilita, el país B prefiere jugar “compra”, ya que obtiene 5, mientras que si jugara “no compra” obtendría 0. b) Después de que el país A no habilita y el país B habilita, el país A en su segunda jugada elige “compra” ya que comprando energía obtiene 5 y no comprando obtiene 0. c) Después de que el país A no habilita, el país B puede no habilitar, en cuyo caso obtiene 0, o habilitar, en cuyo caso obtiene 10, ya que el país A luego compra, según vimos en el punto (b). Por lo tanto, el país B habilita y el resultado es 5 para el país A y 10 para el país B. d) El país A sabe entonces que si no habilita la instalación de la planta en su territorio obtendrá 5 y si la habilita obtendrá 10. Conclusión: en la primera etapa el país A “habilita” y en la segunda el país B “compra”. 5.1 Es un juego de información completa porque todos los jugadores conocen las utilidades que recibirán los demás jugadores en todos los perfiles de estrategia. 5.2 Es un juego de información perfecta porque todos los jugadores conocen las jugadas anteriores de todos los jugadores en todos los puntos del juego, esto es, todos los conjuntos de información de los jugadores son singletons. 8 0 0 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2011 5.3 Hay un primer subjuego que comienza en el nodo donde el jugador A juega por segunda vez y contiene a todos sus sucesores. Hay un segundo subjuego que comienza en el nodo donde le toca jugar a B y contiene a todos sus sucesores. También se puede considerar como subjuego a la totalidad del juego. A I D B i (1,1) d A (2,2) I D (-1,-1) (0,3) B A II ID DI DD i (1,1) (1,1) (2,2) (2,2) d (1,1) (1,1) (-1,-1) (0,3) 5.4 El juego tiene tres equilibrios de Nash (II, d), (ID, d) y (DI, i). Sin embargo sólo el segundo de ellos es perfecto por subjuegos. Los otros dos equilibrios de Nash del juego completo incluyen estrategias que no son parte de un equilibrio de Nash en el segundo subjuego. En efecto, para el jugador A no es una mejor respuesta elegir I después de que el jugador B eligió d. Por lo tanto, esas estrategias deben considerarse como “amenazas vacías” o “no creíbles”. En cambio, el perfil de estrategias (ID, d) no sólo es un equilibrio de Nash del juego completo, sino que también es un equilibrio de Nash en todos los subjuegos: (i) En el segundo subjuego, es óptimo para el jugador A elegir D. (ii) En el primer subjuego, el par de estrategias (D,d) conforman un equilibrio de Nash. Si B elige d, la mejor respuesta de A es elegir D. Si A elige D, la mejor respuesta de B es elegir d. Se verifica entonces que (D,d) es un equilibrio de Nash de este subjuego. Con esto queda demostrado que (ID, d) es un equilibrio perfecto por subjuegos. 9