Teorı́a de las decisiones y de los juegos Asignatura: 25101 Profesores: Sjaak Hurkens y Flip Klijn Examen: 6 de febrero de 2008 Observaciones: • • • • • • Versión: 1 Duración: 3 horas Documentos autorizados: ninguno Teléfonos móviles: apagados y guardados No se permite hacer el examen con lapiz No se permite arrancar hojas Dar el resultado final sin explicaciones no será considerado como una respuesta válida P.1. (10 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N = {A, B} es el conjunto de jugadores, SA = {a1 , a2 , a3 , a4 } y SB = {b1 , b2 , b3 , b4 } los conjuntos de estrategias. Los pagos están resumidos en la matriz de pagos: A\B a1 a2 a3 a4 b1 (1, 0) (5, 5) (3, 0) (4, −2) b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) b4 (3, 6) (0, 4) (6, 4) (4, 1) (a) ¿Cuáles son las estrategias estrictamente dominadas de A? Y, ¿cuáles son las estrategias estrictamente dominadas de B? Solución: Ninguna estrategia del jugador A es estrictamente dominada. Por ejemplo, la estrategia a1 no es estrictamente domindada ya que ninguna otra estrategia le da siempre un pago estrictamente mayor. (Porque uA (a1 , b3 ) ≥ uA (ai , b3 ) para i = 2, 3, 4.) Solamente las estrategias b1 y b4 del jugador B son estrictamente dominadas. De hecho, la estrategia b2 domina ambas estrategias: uB (aj , b2 ) > uB (aj , b1 ) y uB (aj , b2 ) > uB (aj , b4 ) para j = 1, 2, 3, 4. También lo hemos indicado en la matriz de pagos (los pagos de las estrategias dominadas han sido subrayados, y los pagos de la estrategias que las domina en negrita): A\B a1 a2 a3 a4 b1 (1, 0) (5, 5) (3, 0) (4, −2) 1 b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) b4 (3, 6) (0, 4) (6, 4) (4, 1) (b) ¿Cuáles son las estrategias que sobreviven la eliminación iterativa de estrategias estrictamente dominadas? Determina el juego resultante G′ . Solución: Ya hemos visto en el apartado (a) que se pueden eliminar las estrategias b1 y b4 del jugador B. Por tanto, el juego efectivo se ha reducido a un juego de 4 × 2, la matriz del cual es la siguiente: A\B a1 a2 a3 a4 b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) Repetimos la eliminación de estrategias dominadas. Vemos que las únicas estrategias dominadas en el juego reducido son las estrategias a2 y a3 del jugador A tal y como hemos indicado en la figura izquierda: A\B a1 a2 a3 a4 b2 b3 (1, 7) (8, 1) (0, 8) (6, 3) (0, 5) (2, 3) (3, 2) (3, 6) A\B a1 a4 b2 b3 (1, 7) (8, 1) (3, 2) (3, 6) Por tanto, el juego reducido después de eliminar estas estrategias es el juego a la derecha. Se comprueba directamente que en este juego no hay estrategias dominadas. Por tanto, este es el juego que queda después de la eliminación iterativa de estrategias estrictamente dominadas. (c) Determina todos los equilibrios de Nash en estrategias puras del juego G (el juego original). Solución: Sabemos que en un equilibrio de Nash ningún jugador utilizará ninguna estrategia eliminada en el apartado (b). Por tanto, solamente hemos de considerar el juego reducido después de la eliminación iterativa de estrategias estrictamente dominadas. Ahora hemos de buscar las mejores respuestas a las estrategias puras de este juego. Por ejemplo, si el jugador B utiliza su estrategia b2 entonces la mejor respuesta del jugador A es a4 ya que le da un pago de 3 mientras que su (única otra) estrategia a1 solamente le da un pago de 4. Subrayamos 3 en la matriz de pago para indicarlo. Si hacemos lo mismo con las otras estrategias puras de ambos jugadores obtenemos todas las mejores respuestas: A\B a1 a4 b2 b3 (1, 7) (8, 1) (3, 2) (3, 6) Vemos que en ninguno de los 4 perfiles (a1 , b2 ), (a1 , b3 ), (a4 , b2 ) y (a4 , b3 ) ambos jugadores dan al mismo la mejor respuesta. Es decir, en cada uno de los 4 perfiles algún jugador dispone de una desviación profitable. Por tanto, no hay equilibrio de Nash en estrategias puras. Por ejemplo, el perfil (a1 , b2 ) no es equilibrio de Nash ya que el jugador A puede mejorar (estrictamente) su pago si utiliza la estrategia a4 en lugar de a1 . 2 P.2. (15 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N = {A, B} es el conjunto de jugadores, SA = {a1 , a2 } y SB = {b1 , b2 } los conjuntos de estrategias. Los pagos están resumidos en la matriz de pagos: A\B a1 a2 b1 b2 (2, 9) (9, 3) (4, 4) (4, 8) (a) Calcula las funciones de mejores respuestas y represéntalas gráficamente. Solución: Sea (p, 1 − p) (o simplemente p) la estrategia de jugar la estrategia a1 con probabilidad p y la estrategia a2 con probabilidad 1 − p. Sea (q, 1 − q) (o simplemente q) la estrategia de jugar la estrategia b1 con probabilidad q y la estrategia b2 con probabilidad 1 − q. Calculamos las correspondencias Ri de mejores respuestas para ambos jugadores. Para hallar las mejores respuestas del jugador A fijemos la estrategia q del jugador B. El jugador A es indiferente entre jugar a1 y a2 si y sólo si uA (a1 , q) = uA (a2 , q), lo cual es equivalente a 2q + 9(1 − q) = 4q + 4(1 − q) = 4, o sea, q = 75 ≈ 0.71. Es fácil verificar que si q < 0.71; 1 [0,1] si q = 0.71; RA (q) = 0 si q > 0.71. Para hallar las mejores respuestas del jugador B fijemos la estrategia p del jugador A. El jugador B es indiferente entre jugar b1 y b2 si y sólo si uB (p, b1 ) = uB (p, b2 ), lo cual es equivalente a 9p + 4(1 − p) = 2p + 7(1 − p), o sea, p = 52 = 0.4. Es fácil verificar que si p < 0.4; 0 [0,1] si p = 0.4; RB (p) = 1 si p > 0.4. La representación gráfica de las funciones RA y RB viene dada por la Figura 1. mejor respuesta RB q 1 0.71 mejor respuesta RA 1 p 0.4 Figura 1: Juego, problema 2: RA y RB 3 (b) Determina todos los equilibrios de Nash en estrategias puras y mixtas y los pagos correspondientes. Solución: Utilizando la representación gráfica (la Figura 1) de las correspondencias de mejor respuesta vemos que su “intersección” es el conjunto {( 52 , 57 )}. Por tanto el único equilibrio de Nash del juego original es 2 3 5 2 ( , ), ( , ) . 5 5 7 7 Los pagos correspondientes son 5 2 5 2 28 2 3 5 2 uA ( , ), ( , ) = uA a1 , ( , ) = 2 × + 9 × = = 4, 5 5 7 7 7 7 7 7 7 2 3 2 3 30 2 3 5 2 uB ( , ), ( , ) = uB ( , ), b1 = 9 × + 4 × = = 6. 5 5 7 7 5 5 5 5 5 4 P.3. (20 puntos) Considera el juego en forma extensiva de la Figura 2. d1 1 2 d2 b2 (1, 1, 2) 3 d3 b3 d3 b3 (2, 2, 1) 3 d3 b3 3 (6, 3, 1) (3, 3, 3) (3, 2, 4) b1 (4, 2, 0) Figura 2: Juego, problema 3 (a) Indica si les afirmaciones siguientes son verdaderas V o falsas F . Tacha (es decir, elimina/borra) las respuestas incorrectas. Solución: (i) Es un juego de información perfecta. V X F (ii) Es un juego de memoria perfecta. V F X (iii) Es un juego de suma zero. V X F (b) ¿Cuál es el conjunto de estrategias del jugador 3? Solución: S3 = {d3 , b3 }. (c) ¿Cuántos subjuegos hay? Solución: Uno. (El juego completo.) (d) Indica si les afirmaciones siguientes son verdaderas V o falsas F en relación a lo que los jugadores pueden ver en el momento de decidir su acción. Tacha (es decir, elimina/borra) las respuestas incorrectas. Solución: (i) 1 no puede ver las acciones de 2 y 3 V F X (ii) 2 no puede ver las acciones de 3 V F X (iii) 3 no puede ver las acciones de 2 V F X (iv) 3 puede ver las acciones de 1 pero no las de 2 V X F 5 (e) Calcula los equilibrios de Nash perfectos en subjuegos en estrategias puras, especificando el perfil, la trayectoria y los pagos. Solución: Como hay un solo subjuego, solamente hemos de calcular los EN de este juego. Primero buscamos el juego en forma normal correspondiente. Hay tres jugadores (1, 2 y 3) y hacemos que el jugador 1 escoja la fila, el jugador 2 escoja la columna y el jugador 3 la matriz. d2 b2 1\2 d1 (6, 3, 1) (3, 2, 4) b3 b1 (4, 2, 0) (4, 2, 0) d2 b2 1\2 d1 (1, 1, 2) (3, 3, 3) d3 b1 (2, 2, 1) (2, 2, 1) Buscamos las mejores respuestas a todas las estrategias puras de todos los jugadores. Por ejemplo, la mejor respuesta del jugador 1 a las estrategias (b2 , d3 ) de los jugadores 2 y 3 es d1 (ya que d1 le da un pago de 3, mientras b1 le da un pago de 2). Otro ejemplo, la mejor respuesta del jugador 3 a las estrategias (d1 , b2 ) de los jugadores A y B es d3 (ya que d3 le da un pago de 4, mientras b3 le da un pago de 3). Indicamos todas las mejores respuestas en negrita: d2 1\2 d1 (1, 1, 2) d3 b1 (2, 2, 1) d2 b2 1\2 d1 (6, 3, 1) (3, 2, 4) b3 b1 (4, 2, 0) (4, 2, 0) b2 (3, 3, 3) (2, 2, 1) Hay un solo perfil en el que todos los jugadores dan la mejor respuesta a las estrategias de los demás jugadores: (b1 , d2 , d3). Por tanto, el único equilibrio de Nash perfecto en subjuegos es (b1 , d2 , d3). La trayectoria es b1 − d3 y los pagos (2, 2, 1). (f) Supón ahora que 3 puede observar todas las acciones de 1 y 2 antes de decidir. Representa el nuevo juego en forma extensiva (árbol). Determina los equilibrios de Nash perfectos en subjuegos en estrategias puras, especificando el perfil, la trayectoria y los pagos. Solución: Ahora el juego en forma extensiva es el de la Figura 3. Como es un d1 1 2 d2 b2 (1, 1, 2) 3 d3 b3 d3 b3 (2, 2, 1) 3 d3 b3 3 (6, 3, 1) (3, 3, 3) (3, 2, 4) b1 (4, 2, 0) Figura 3: Juego, problema 3f juego de información perfecta (ningún conjunto de información tiene más de un nodo de decisión), el EPS se halla por inducción hacia atrás, tal y como se ha 6 d1 2 (1, 1, 2) d3 3 b3 d2 b2 (3, 2, 4)d3 3 b3 (1, 1, 2) (2, 2, 1) d3 3 b3 (2, 2, 1) (3, 2, 4) 1 b1 (6, 3, 1) (3, 3, 3) (3, 2, 4) (4, 2, 0) Figura 4: Juego, problema 3f: EPS indicado en la Figura 4. Concluimos que el único equilibrio de Nash perfecto en subjuegos es (d1 , b2 , d3 b3 d3 ). La trayectoria es d1 − b2 − b3 y los pagos (3, 2, 4). 7 P.4. (20 puntos) Dos duopolistas operan en un mercado a la Cournot con una demanda inversa dada por P (Q) = max{0, 4 − Q}, donde Q = q1 + q2 y qi ≥ 0 es la cantidad producida por la empresa i. La empresa 1 tiene la función de coste lineal C1 (q1 ) = q1 , y la empresa 2 tiene la función de coste lineal C2 (q2 ) = 3q2 . (a) ¿Es (q1∗ , q2∗ ) = (0, 0) un equilibrio de Nash? Explica cuidadosamente la respuesta. (b) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. (c) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. (d) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. Solución: Sea πi (q1 , q2 ) el pago (los beneficios) de la empresa i. Entonces, πi (q1 , q2 ) = max{0, 4 − q1 − q2 }qi − ci qi , donde c1 = 1 y c2 = 3. (a) Supongamos que (q1∗ , q2∗ ) = (0, 0) es un EN. Considera la desviación q1′ = ǫ > 0 donde ǫ es una cantidad “pequeña”. Como (0, 0) es un EN, la desviación no es profitable: π1 (q1′ , 0) ≤ π1 (0, 0) = 0. Si ǫ > 0 es suficientemente pequeño (es decir, muy cerca de 0), entonces 4 − ǫ > 0. Luego, π1 (q1′ , 0) = = = = max{0, 4 − q1′ − 0}q1′ − q1′ max{0, 4 − ǫ − 0}ǫ − ǫ (4 − ǫ)ǫ − ǫ (3 − ǫ)ǫ Concluimos que para ǫ > 0 suficientemente pequeño, (3 − ǫ)ǫ ≤ 0. Como ǫ > 0, (3 − ǫ) ≤ 0 para ǫ > 0 suficientemente pequeño. Por tanto, 3 ≤ 0, ¡una contradicción! Por tanto, (0, 0) no es un equilibrio. Es decir, no hay un equilibrio del tipo (a). (b) Supongamos que (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0 es un EN. Notamos primero que 4 − q1∗ − q2∗ > 0. Pues, si 4 − q1∗ − q2∗ ≤ 0 cada empresa i tiene una desviación profitable (producir 0): πi (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }qi∗ − ci qi∗ = 0qi∗ − ci qi∗ < 0, 8 mientras producir qi′ = 0 conlleva el pago 0. Como 4 − q1∗ − q2∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor de q1∗ (tal intervalo existe porque q1∗ > 0) con 4 − q1 − q2∗ > 0. En este intervalo la función de pago del jugador 1 tiene la siguiente forma π1 (q1 , q2∗ ) = max{0, 4 − q1 − q2∗ }q1 − q1 = (4 − q1 − q2∗ )q1 − q1 . (1) Dado que (q1∗ , q2∗ ) es un EN, el jugador 1 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q2∗ del jugador 2, q1∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ). Por tanto, q1∗ maximiza (1) en dicho intervalo. Por consiguiente, q1∗ satisface la CPO correspondiente: 4 − 2q1∗ − q2∗ − 1 = 0. (2) Por tanto, 3 − q2∗ (3) = 2 Utilizando los mismos argumentos llegamos a una conclusión similar para la cantidad q2∗ : 1 − q1∗ (4) q2∗ = 2 y sustituyendo (3) en (4), ∗ 3−q2 1− 2 q2∗ = , 2 obtenemos (después de unos cálculos sencillos) q1∗ q2∗ = −1 < 0, 3 lo que supone una contradicción al supuesto que q2∗ > 0. Por tanto, concluimos que no hay un equilibrio del tipo (b). (c) Supongamos que (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0 es un EN. Notamos primero que 4 − q1∗ > 0. Pues, si 4 − q1∗ ≤ 0 la empresa 1 tiene una desviación profitable (producir 0): π1 (q1∗ , 0) = max{0, 4 − q1∗ − 0}q1∗ − q1∗ = 0q1∗ − q1∗ < 0, mientras producir q1′ = 0 conlleva el pago 0. Como 4 − q1∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor de q1∗ (tal intervalo existe porque q1∗ > 0) con 4 − q1 > 0. En este intervalo la función de pago del jugador 1 tiene la siguiente forma π1 (q1 , 0) = max{0, 4 − q1 }q1 − q1 = (4 − q1 )q1 − q1 . (5) Dado que (q1∗ , 0) es un EN, el jugador 1 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q2∗ = 0 del jugador 2, q1∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ). 9 Por tanto, q1∗ maximiza (5) en dicho intervalo. Por consiguiente, q1∗ satisface la CPO correspondiente: 3 − 2q1∗ = 0. (6) Por tanto, q1∗ = 3 2 Se comprueba fácilmente que (4 − q1∗ − q2∗ ) 3 = 4− −0 2 5 = 2 > 0. Por tanto, π1 (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }q1∗ − q1∗ 5 ∗ = q − q1∗ 2 1 2 3 = 2 > 0 = π1 (0, q2∗ ). La última desigualdad junto con (6) y el hecho de que π1 (q1 , 0) = −q1 para q1 ≥ 4 nos lleva a la conclusión que si q2∗ = 0, entonces la función de pago q1 → π1 (q1 , 0) del jugador 1 tiene la forma de la Figura 5. Por tanto, q1∗ = 32 es mejor respuesta π1 (q1 , 0) 3 2 2 0 4 0 q1 3 2 Figura 5: Problema 4, caso (c) a q2∗ = 0. 10 Ahora vamos a verificar si q2∗ es mejor respuesta a q1∗ = 32 . Primero notamos que para q2 ≥ 52 , π2 (q1∗ , q2 ) = max{0, 4 − q1∗ − q2 }q2 − 3q2 = 0q2 − 3q2 < 0 (7) Ahora estudiamos qué pasa si 0 ≤ q2 < 25 . Está claro que π2 (q1∗ , 0) = 0. (8) Además, la derivada de la función de pago (de una variable, q2 ) es ∂π2 (q1∗ , q2 ) ∂(4 − q1∗ − q2 )q2 − 3q2 = ∂q2 ∂q2 ∗ = 4 − q1 − 2q2 − 3 −1 = − 2q2 2 < 0. Esto, junto con (7) y (8) nos hace concluir que la función de pago q2 → π2 (q1∗ , q2 ) del jugador 2 tiene la forma de la Figura 6. Vemos que q2∗ = 0 es mejor respuesta π2 (q1∗ , q2 ) 0 5 2 0 q2 Figura 6: Problema 4, caso (c) a q1∗ = 32 . Por tanto, hay un solo equilibrio de Nash del tipo (c): 3 ,0 . 2 (d) Supongamos que (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0 es un EN. Notamos primero que 4 − q2∗ > 0. Pues, si 4 − q2∗ ≤ 0 la empresa 2 tiene una desviación profitable (producir 0): π2 (0, q2∗ ) = max{0, 4 − 0 − q2∗ }q2∗ − 3q2∗ = 0q2∗ − 3q2∗ < 0, 11 mientras producir q2′ = 0 conlleva el pago 0. Como 4 − q2∗ > 0, hay un (pequeño) intervalo de valores de q2 > 0 alrededor de q2∗ (tal intervalo existe porque q2∗ > 0) con 4 − q2 > 0. Para este intervalo la función de pago del jugador 2 tiene la siguiente forma π2 (0, q2 ) = max{0, 4 − 0 − q2 }q2 − 3q2 = (4 − q2 )q2 − 3q2 . (9) Dado que (0, q2∗) es un EN, el jugador 2 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q1∗ = 0 del jugador 1, q2∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q2∗ ). Por tanto, q2∗ maximiza (9) en dicho intervalo. Por consiguiente, q2∗ satisface la CPO correspondiente: 4 − 2q2∗ − 3 = 0. Por tanto, q2∗ = 1 2 Se comprueba fácilmente que (4 − q1∗ − q2∗ ) 1 = 4−0− 2 7 = 2 > 0. Por tanto en el caso de una desviación q1′ = ǫ > 0 del jugador 1 (con ǫ suficientemente pequeño), π1 (q1′ , q2∗ ) = max{0, 4 − ǫ − q2∗ }q1 − q1 = (4 − ǫ − q2∗ )q1 − q1 5 = −ǫ ǫ 2 > 0. Por tanto, el jugador 1 tiene una desviación profitable (producir q1′ le da un pago superior que q1∗ ). Concluimos que no hay un equilibrio del tipo (d). Resumiendo, hay un solo equilibrio de Nash (del tipo (c)). El perfil estratégico es 3 ,0 . 2 12 P.5. (20 puntos) Consideramos el juego dinámico de 2 jugadores que consiste en jugar dos veces el juego G estático, dado por la siguiente tabla de pagos: 1\2 T M B L C (3, 1) (0, 0) (2, 1) (1, 2) (1, 2) (a, 1) R (5, 0) (3, 1) (4, 4) donde a es una constante. Los jugadores escogen simultáneamente una acción en la primera etapa. Luego observan el resultado y escogen de nuevo simultáneamente una acción en la segunda etapa. Suponemos que no hay descuento (es decir que el pago final es la suma de los pagos de las dos etapas). (a) La Figura 7 muestra (parcialmente) la representación en forma extensiva. Faltan 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 2 1 Figura 7: Problema 5, juego los conjuntos de información. Indı́calos (sólo en la parte representada en la Figura 7). Solución: Véase la Figura 8. (b) ¿Cuántas estrategias tiene cada jugador? Solución: El jugador 1 tiene un conjunto de información en la primera etapa y 9 conjuntos de información en la segunda etapa. En cada conjunto de información tiene que elegir entre las tres acciones T , M y B. Por tanto, tiene 310 = 59049 estrategias. Utilizando el mismo argumento (¡!), el jugador 2 también tiene 310 = 59049 estrategias. (c) ¿Cuántos subjuegos hay? Solución: Hay 10 subjuegos. En la Figura 7 cada nodo del jugador 1 define un subjuego, y cada subjuego empieza en un nodo del jugador 1. 13 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 2 1 Figura 8: Problema 5, juego: conjuntos de información (d) Supón que a = 2. ¿Cuáles son los pagos correspondientes a los equilibrios de Nash perfectos en subjuegos en estrategias puras? Solución: Si a = 2 entonces el juego estático es el siguiente: 1\2 T M B L (3, 1) (2, 1) (1, 2) C R (0, 0) (5, 0) (1, 2) (3, 1) (2, 1) (4, 4) Hemos indicado las mejores respuestas en negrita. Hay un único EN: (T, L). Por tanto, un teorema del Tema 3 (la Diapositiva 43) nos dice que el juego dinámico tienen un único resultado perfecto en subjuegos: en cada etapa se juega (T, L). Luego, los pagos son (3, 1) + (3, 1) = (6, 2). (e) Supón que a = 0. ¿Existe algún equilibrio de Nash perfecto en subjuegos (en estrategias puras) en el que los jugadores obtienen los pagos (4, 4) en la primera etapa? En caso afirmativo, especificar el perfil estratégico completo y explicar cuidadosamente por qué es un equilibrio. En caso negativo, explicar cuidadosamente por qué no. Solución: Sı́, en el siguiente equilibrio perfecto en subjuegos los jugadores obtienen los pagos (4, 4) en la primera etapa. Si a = 0 entonces el juego estático es el siguiente: 1\2 L C T (3, 1) (0, 0) M (2, 1) (1, 2) B (1, 2) (0, 1) 14 R (5, 0) (3, 1) (4, 4) Hemos indicado las mejores respuestas en negrita. Hay dos EN: (T, L) y (M, C). Podemos aprovechar la existencia de un segundo EN para obtener los pagos (4, 4) en la primera etapa. (Veáse también el Ejemplo 3.9 del Tema 3.) • Estrategia s1 del jugador 1: – Jugar B en la primera etapa; – Si se ha jugado (B, R) en la primera etapa, jugar T en la segunda etapa. En caso contrario, jugar M. • Estrategia s2 del jugador 2: – Jugar R en la primera etapa; – Si se ha jugado (B, R) en la primera etapa, jugar L en la segunda etapa. En caso contrario, jugar C. Está claro que en el perfil (s1 , s2 ) los jugadores obtienen los pagos (4, 4) en la primera etapa (y (3, 1) en la segunda). Veamos porque estas estrategias constituyen un EPS. En cada subjuego que empieza en la segunda etapa: el perfil (s1 , s2 ) inducen a un EN del subjuego, a saber, o bien (T, L) o bien (M, C). En la primera etapa el juego “efectivo” es 1\2 L T (4, 3) M (3, 3) B (4, 3) C (1, 2) (2, 4) (1, 3) R (6, 2) (4, 3) (7, 5) Uno de los 3 tres equilibrios de Nash es (B, R), el perfil de acciones prescritas por las estrategias (s1 , s2 ). Por tanto, (s1 , s2 ) es un EPS. 15 P.6. (15 puntos) Considera el siguiente juego con información incompleta entre los jugadores 1 y 2. • El azar determina si los pagos de los jugadores son como en la matriz X o como en la matriz Y. La matriz X tiene probabilidad 3/4 de ser seleccionada mientras la matriz Y tiene probabilidad 1/4 de ser seleccionada. • El jugador 2 es informado sobre qué matriz ha sido seleccionada, pero el jugador 1 no sabe cuál es la matriz seleccionada. • El jugador 1 elige entre las acciones A y B mientras jugador 2 elige simultáneamente entre las acciones I y D. • Los pagos son los que se dan en la matriz seleccionada por el azar. 1/2 I D A (3,6) (1,3) B (1,1) (2,3) 1/2 I D A (4,1) (3,3) B (0,6) (2,2) Matriz X Matriz Y (a) Calcula el pago esperado de cada jugador en caso de que el jugador 1 elige la estrategia A y el jugador 2 elige la estrategia DD. Solución: u1 (A, DD) = (3/4)(1) + (1/4)(3) = 1.5 y u2 (A, DD) = (3/4)(3) + (1/4)(3) = 3. (b) ¿Cuál es la mejor respuesta para el jugador 2 cuando el jugador 1 elige A? ¿Cuál es la mejor respuesta para el jugador 2 cuando el jugador 1 elige B? Solución: Obviamente MR2 (A) = ID y MR2 (B) = DI. (c) Calcula todos los equilibrios Bayesianos en estrategias puras. Solución: Visto lo visto, sólo tenemos que calcular la mejor respuesta del jugador 1 contra ID y contra DI. Ahora bien, MR1 (ID) = A (porque u1 (A, ID) = 3 y u1 (B, ID) = 5/4). Ası́ mismo, MR1 (DI) = A (porque u1 (A, DI) = 7/4 y u1 (B, DI) = 6/4). Por tanto, el único equilibrio Bayesiano en estrategias puras es (A, ID). 16