Teor´ıa de las decisiones y de los juegos

Teorı́a de las decisiones y de los juegos Asignatura: 25101 Profesores: Sjaak Hurkens y Flip Klijn Examen: 6 de febrero de 2008 Observaciones: • • • • • • Versión: 1 Duración: 3 horas Documentos autorizados: ninguno Teléfonos móviles: apagados y guardados No se permite hacer el examen con lapiz No se permite arrancar hojas Dar el resultado final sin explicaciones no será considerado como una respuesta válida P.1. (10 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N = {A, B} es el conjunto de jugadores, SA = {a1 , a2 , a3 , a4 } y SB = {b1 , b2 , b3 , b4 } los conjuntos de estrategias. Los pagos están resumidos en la matriz de pagos: A\B a1 a2 a3 a4 b1 (1, 0) (5, 5) (3, 0) (4, −2) b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) b4 (3, 6) (0, 4) (6, 4) (4, 1) (a) ¿Cuáles son las estrategias estrictamente dominadas de A? Y, ¿cuáles son las estrategias estrictamente dominadas de B? Solución: Ninguna estrategia del jugador A es estrictamente dominada. Por ejemplo, la estrategia a1 no es estrictamente domindada ya que ninguna otra estrategia le da siempre un pago estrictamente mayor. (Porque uA (a1 , b3 ) ≥ uA (ai , b3 ) para i = 2, 3, 4.) Solamente las estrategias b1 y b4 del jugador B son estrictamente dominadas. De hecho, la estrategia b2 domina ambas estrategias: uB (aj , b2 ) > uB (aj , b1 ) y uB (aj , b2 ) > uB (aj , b4 ) para j = 1, 2, 3, 4. También lo hemos indicado en la matriz de pagos (los pagos de las estrategias dominadas han sido subrayados, y los pagos de la estrategias que las domina en negrita): A\B a1 a2 a3 a4 b1 (1, 0) (5, 5) (3, 0) (4, −2) 1 b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) b4 (3, 6) (0, 4) (6, 4) (4, 1) (b) ¿Cuáles son las estrategias que sobreviven la eliminación iterativa de estrategias estrictamente dominadas? Determina el juego resultante G′ . Solución: Ya hemos visto en el apartado (a) que se pueden eliminar las estrategias b1 y b4 del jugador B. Por tanto, el juego efectivo se ha reducido a un juego de 4 × 2, la matriz del cual es la siguiente: A\B a1 a2 a3 a4 b2 (1, 7) (0, 8) (0, 5) (3, 2) b3 (8, 1) (6, 3) (2, 3) (3, 6) Repetimos la eliminación de estrategias dominadas. Vemos que las únicas estrategias dominadas en el juego reducido son las estrategias a2 y a3 del jugador A tal y como hemos indicado en la figura izquierda: A\B a1 a2 a3 a4 b2 b3 (1, 7) (8, 1) (0, 8) (6, 3) (0, 5) (2, 3) (3, 2) (3, 6) A\B a1 a4 b2 b3 (1, 7) (8, 1) (3, 2) (3, 6) Por tanto, el juego reducido después de eliminar estas estrategias es el juego a la derecha. Se comprueba directamente que en este juego no hay estrategias dominadas. Por tanto, este es el juego que queda después de la eliminación iterativa de estrategias estrictamente dominadas. (c) Determina todos los equilibrios de Nash en estrategias puras del juego G (el juego original). Solución: Sabemos que en un equilibrio de Nash ningún jugador utilizará ninguna estrategia eliminada en el apartado (b). Por tanto, solamente hemos de considerar el juego reducido después de la eliminación iterativa de estrategias estrictamente dominadas. Ahora hemos de buscar las mejores respuestas a las estrategias puras de este juego. Por ejemplo, si el jugador B utiliza su estrategia b2 entonces la mejor respuesta del jugador A es a4 ya que le da un pago de 3 mientras que su (única otra) estrategia a1 solamente le da un pago de 4. Subrayamos 3 en la matriz de pago para indicarlo. Si hacemos lo mismo con las otras estrategias puras de ambos jugadores obtenemos todas las mejores respuestas: A\B a1 a4 b2 b3 (1, 7) (8, 1) (3, 2) (3, 6) Vemos que en ninguno de los 4 perfiles (a1 , b2 ), (a1 , b3 ), (a4 , b2 ) y (a4 , b3 ) ambos jugadores dan al mismo la mejor respuesta. Es decir, en cada uno de los 4 perfiles algún jugador dispone de una desviación profitable. Por tanto, no hay equilibrio de Nash en estrategias puras. Por ejemplo, el perfil (a1 , b2 ) no es equilibrio de Nash ya que el jugador A puede mejorar (estrictamente) su pago si utiliza la estrategia a4 en lugar de a1 . 2 P.2. (15 puntos) Considera el juego en forma normal G = {N; SA , SB ; uA , uB } donde N = {A, B} es el conjunto de jugadores, SA = {a1 , a2 } y SB = {b1 , b2 } los conjuntos de estrategias. Los pagos están resumidos en la matriz de pagos: A\B a1 a2 b1 b2 (2, 9) (9, 3) (4, 4) (4, 8) (a) Calcula las funciones de mejores respuestas y represéntalas gráficamente. Solución: Sea (p, 1 − p) (o simplemente p) la estrategia de jugar la estrategia a1 con probabilidad p y la estrategia a2 con probabilidad 1 − p. Sea (q, 1 − q) (o simplemente q) la estrategia de jugar la estrategia b1 con probabilidad q y la estrategia b2 con probabilidad 1 − q. Calculamos las correspondencias Ri de mejores respuestas para ambos jugadores. Para hallar las mejores respuestas del jugador A fijemos la estrategia q del jugador B. El jugador A es indiferente entre jugar a1 y a2 si y sólo si uA (a1 , q) = uA (a2 , q), lo cual es equivalente a 2q + 9(1 − q) = 4q + 4(1 − q) = 4, o sea, q = 75 ≈ 0.71. Es fácil verificar que  si q < 0.71;  1 [0,1] si q = 0.71; RA (q) =  0 si q > 0.71. Para hallar las mejores respuestas del jugador B fijemos la estrategia p del jugador A. El jugador B es indiferente entre jugar b1 y b2 si y sólo si uB (p, b1 ) = uB (p, b2 ), lo cual es equivalente a 9p + 4(1 − p) = 2p + 7(1 − p), o sea, p = 52 = 0.4. Es fácil verificar que  si p < 0.4;  0 [0,1] si p = 0.4; RB (p) =  1 si p > 0.4. La representación gráfica de las funciones RA y RB viene dada por la Figura 1. mejor respuesta RB q 1 0.71 mejor respuesta RA 1 p 0.4 Figura 1: Juego, problema 2: RA y RB 3 (b) Determina todos los equilibrios de Nash en estrategias puras y mixtas y los pagos correspondientes. Solución: Utilizando la representación gráfica (la Figura 1) de las correspondencias de mejor respuesta vemos que su “intersección” es el conjunto {( 52 , 57 )}. Por tanto el único equilibrio de Nash del juego original es 2 3 5 2 ( , ), ( , ) . 5 5 7 7 Los pagos correspondientes son 5 2 5 2 28 2 3 5 2 uA ( , ), ( , ) = uA a1 , ( , ) = 2 × + 9 × = = 4, 5 5 7 7 7 7 7 7 7 2 3 2 3 30 2 3 5 2 uB ( , ), ( , ) = uB ( , ), b1 = 9 × + 4 × = = 6. 5 5 7 7 5 5 5 5 5 4 P.3. (20 puntos) Considera el juego en forma extensiva de la Figura 2. d1 1 2 d2 b2 (1, 1, 2) 3 d3 b3 d3 b3 (2, 2, 1) 3 d3 b3 3 (6, 3, 1) (3, 3, 3) (3, 2, 4) b1 (4, 2, 0) Figura 2: Juego, problema 3 (a) Indica si les afirmaciones siguientes son verdaderas V o falsas F . Tacha (es decir, elimina/borra) las respuestas incorrectas. Solución: (i) Es un juego de información perfecta. V X F (ii) Es un juego de memoria perfecta. V F X (iii) Es un juego de suma zero. V X F (b) ¿Cuál es el conjunto de estrategias del jugador 3? Solución: S3 = {d3 , b3 }. (c) ¿Cuántos subjuegos hay? Solución: Uno. (El juego completo.) (d) Indica si les afirmaciones siguientes son verdaderas V o falsas F en relación a lo que los jugadores pueden ver en el momento de decidir su acción. Tacha (es decir, elimina/borra) las respuestas incorrectas. Solución: (i) 1 no puede ver las acciones de 2 y 3 V F X (ii) 2 no puede ver las acciones de 3 V F X (iii) 3 no puede ver las acciones de 2 V F X (iv) 3 puede ver las acciones de 1 pero no las de 2 V X F 5 (e) Calcula los equilibrios de Nash perfectos en subjuegos en estrategias puras, especificando el perfil, la trayectoria y los pagos. Solución: Como hay un solo subjuego, solamente hemos de calcular los EN de este juego. Primero buscamos el juego en forma normal correspondiente. Hay tres jugadores (1, 2 y 3) y hacemos que el jugador 1 escoja la fila, el jugador 2 escoja la columna y el jugador 3 la matriz.  d2 b2  1\2 d1 (6, 3, 1) (3, 2, 4) b3  b1 (4, 2, 0) (4, 2, 0)  d2 b2  1\2 d1 (1, 1, 2) (3, 3, 3) d3  b1 (2, 2, 1) (2, 2, 1) Buscamos las mejores respuestas a todas las estrategias puras de todos los jugadores. Por ejemplo, la mejor respuesta del jugador 1 a las estrategias (b2 , d3 ) de los jugadores 2 y 3 es d1 (ya que d1 le da un pago de 3, mientras b1 le da un pago de 2). Otro ejemplo, la mejor respuesta del jugador 3 a las estrategias (d1 , b2 ) de los jugadores A y B es d3 (ya que d3 le da un pago de 4, mientras b3 le da un pago de 3). Indicamos todas las mejores respuestas en negrita:  d2  1\2 d1 (1, 1, 2) d3  b1 (2, 2, 1)  d2 b2  1\2 d1 (6, 3, 1) (3, 2, 4) b3  b1 (4, 2, 0) (4, 2, 0) b2 (3, 3, 3) (2, 2, 1) Hay un solo perfil en el que todos los jugadores dan la mejor respuesta a las estrategias de los demás jugadores: (b1 , d2 , d3). Por tanto, el único equilibrio de Nash perfecto en subjuegos es (b1 , d2 , d3). La trayectoria es b1 − d3 y los pagos (2, 2, 1). (f) Supón ahora que 3 puede observar todas las acciones de 1 y 2 antes de decidir. Representa el nuevo juego en forma extensiva (árbol). Determina los equilibrios de Nash perfectos en subjuegos en estrategias puras, especificando el perfil, la trayectoria y los pagos. Solución: Ahora el juego en forma extensiva es el de la Figura 3. Como es un d1 1 2 d2 b2 (1, 1, 2) 3 d3 b3 d3 b3 (2, 2, 1) 3 d3 b3 3 (6, 3, 1) (3, 3, 3) (3, 2, 4) b1 (4, 2, 0) Figura 3: Juego, problema 3f juego de información perfecta (ningún conjunto de información tiene más de un nodo de decisión), el EPS se halla por inducción hacia atrás, tal y como se ha 6 d1 2 (1, 1, 2) d3 3 b3 d2 b2 (3, 2, 4)d3 3 b3 (1, 1, 2) (2, 2, 1) d3 3 b3 (2, 2, 1) (3, 2, 4) 1 b1 (6, 3, 1) (3, 3, 3) (3, 2, 4) (4, 2, 0) Figura 4: Juego, problema 3f: EPS indicado en la Figura 4. Concluimos que el único equilibrio de Nash perfecto en subjuegos es (d1 , b2 , d3 b3 d3 ). La trayectoria es d1 − b2 − b3 y los pagos (3, 2, 4). 7 P.4. (20 puntos) Dos duopolistas operan en un mercado a la Cournot con una demanda inversa dada por P (Q) = max{0, 4 − Q}, donde Q = q1 + q2 y qi ≥ 0 es la cantidad producida por la empresa i. La empresa 1 tiene la función de coste lineal C1 (q1 ) = q1 , y la empresa 2 tiene la función de coste lineal C2 (q2 ) = 3q2 . (a) ¿Es (q1∗ , q2∗ ) = (0, 0) un equilibrio de Nash? Explica cuidadosamente la respuesta. (b) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. (c) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. (d) ¿Existe un equilibrio de Nash (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0? Si hay un equilibrio, especifica el perfil. Si no hay un equilibrio, explica cuidadosamente por qué no. Solución: Sea πi (q1 , q2 ) el pago (los beneficios) de la empresa i. Entonces, πi (q1 , q2 ) = max{0, 4 − q1 − q2 }qi − ci qi , donde c1 = 1 y c2 = 3. (a) Supongamos que (q1∗ , q2∗ ) = (0, 0) es un EN. Considera la desviación q1′ = ǫ > 0 donde ǫ es una cantidad “pequeña”. Como (0, 0) es un EN, la desviación no es profitable: π1 (q1′ , 0) ≤ π1 (0, 0) = 0. Si ǫ > 0 es suficientemente pequeño (es decir, muy cerca de 0), entonces 4 − ǫ > 0. Luego, π1 (q1′ , 0) = = = = max{0, 4 − q1′ − 0}q1′ − q1′ max{0, 4 − ǫ − 0}ǫ − ǫ (4 − ǫ)ǫ − ǫ (3 − ǫ)ǫ Concluimos que para ǫ > 0 suficientemente pequeño, (3 − ǫ)ǫ ≤ 0. Como ǫ > 0, (3 − ǫ) ≤ 0 para ǫ > 0 suficientemente pequeño. Por tanto, 3 ≤ 0, ¡una contradicción! Por tanto, (0, 0) no es un equilibrio. Es decir, no hay un equilibrio del tipo (a). (b) Supongamos que (q1∗ , q2∗ ) con q1∗ > 0 y q2∗ > 0 es un EN. Notamos primero que 4 − q1∗ − q2∗ > 0. Pues, si 4 − q1∗ − q2∗ ≤ 0 cada empresa i tiene una desviación profitable (producir 0): πi (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }qi∗ − ci qi∗ = 0qi∗ − ci qi∗ < 0, 8 mientras producir qi′ = 0 conlleva el pago 0. Como 4 − q1∗ − q2∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor de q1∗ (tal intervalo existe porque q1∗ > 0) con 4 − q1 − q2∗ > 0. En este intervalo la función de pago del jugador 1 tiene la siguiente forma π1 (q1 , q2∗ ) = max{0, 4 − q1 − q2∗ }q1 − q1 = (4 − q1 − q2∗ )q1 − q1 . (1) Dado que (q1∗ , q2∗ ) es un EN, el jugador 1 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q2∗ del jugador 2, q1∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ). Por tanto, q1∗ maximiza (1) en dicho intervalo. Por consiguiente, q1∗ satisface la CPO correspondiente: 4 − 2q1∗ − q2∗ − 1 = 0. (2) Por tanto, 3 − q2∗ (3) = 2 Utilizando los mismos argumentos llegamos a una conclusión similar para la cantidad q2∗ : 1 − q1∗ (4) q2∗ = 2 y sustituyendo (3) en (4), ∗ 3−q2 1− 2 q2∗ = , 2 obtenemos (después de unos cálculos sencillos) q1∗ q2∗ = −1 < 0, 3 lo que supone una contradicción al supuesto que q2∗ > 0. Por tanto, concluimos que no hay un equilibrio del tipo (b). (c) Supongamos que (q1∗ , q2∗ ) = (q1∗ , 0) con q1∗ > 0 es un EN. Notamos primero que 4 − q1∗ > 0. Pues, si 4 − q1∗ ≤ 0 la empresa 1 tiene una desviación profitable (producir 0): π1 (q1∗ , 0) = max{0, 4 − q1∗ − 0}q1∗ − q1∗ = 0q1∗ − q1∗ < 0, mientras producir q1′ = 0 conlleva el pago 0. Como 4 − q1∗ > 0, hay un (pequeño) intervalo de valores de q1 > 0 alrededor de q1∗ (tal intervalo existe porque q1∗ > 0) con 4 − q1 > 0. En este intervalo la función de pago del jugador 1 tiene la siguiente forma π1 (q1 , 0) = max{0, 4 − q1 }q1 − q1 = (4 − q1 )q1 − q1 . (5) Dado que (q1∗ , 0) es un EN, el jugador 1 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q2∗ = 0 del jugador 2, q1∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q1∗ ). 9 Por tanto, q1∗ maximiza (5) en dicho intervalo. Por consiguiente, q1∗ satisface la CPO correspondiente: 3 − 2q1∗ = 0. (6) Por tanto, q1∗ = 3 2 Se comprueba fácilmente que (4 − q1∗ − q2∗ ) 3 = 4− −0 2 5 = 2 > 0. Por tanto, π1 (q1∗ , q2∗ ) = max{0, 4 − q1∗ − q2∗ }q1∗ − q1∗ 5 ∗ = q − q1∗ 2 1 2 3 = 2 > 0 = π1 (0, q2∗ ). La última desigualdad junto con (6) y el hecho de que π1 (q1 , 0) = −q1 para q1 ≥ 4 nos lleva a la conclusión que si q2∗ = 0, entonces la función de pago q1 → π1 (q1 , 0) del jugador 1 tiene la forma de la Figura 5. Por tanto, q1∗ = 32 es mejor respuesta π1 (q1 , 0) 3 2 2 0 4 0 q1 3 2 Figura 5: Problema 4, caso (c) a q2∗ = 0. 10 Ahora vamos a verificar si q2∗ es mejor respuesta a q1∗ = 32 . Primero notamos que para q2 ≥ 52 , π2 (q1∗ , q2 ) = max{0, 4 − q1∗ − q2 }q2 − 3q2 = 0q2 − 3q2 < 0 (7) Ahora estudiamos qué pasa si 0 ≤ q2 < 25 . Está claro que π2 (q1∗ , 0) = 0. (8) Además, la derivada de la función de pago (de una variable, q2 ) es ∂π2 (q1∗ , q2 ) ∂(4 − q1∗ − q2 )q2 − 3q2 = ∂q2 ∂q2 ∗ = 4 − q1 − 2q2 − 3 −1 = − 2q2 2 < 0. Esto, junto con (7) y (8) nos hace concluir que la función de pago q2 → π2 (q1∗ , q2 ) del jugador 2 tiene la forma de la Figura 6. Vemos que q2∗ = 0 es mejor respuesta π2 (q1∗ , q2 ) 0 5 2 0 q2 Figura 6: Problema 4, caso (c) a q1∗ = 32 . Por tanto, hay un solo equilibrio de Nash del tipo (c): 3 ,0 . 2 (d) Supongamos que (q1∗ , q2∗ ) = (0, q2∗ ) con q2∗ > 0 es un EN. Notamos primero que 4 − q2∗ > 0. Pues, si 4 − q2∗ ≤ 0 la empresa 2 tiene una desviación profitable (producir 0): π2 (0, q2∗ ) = max{0, 4 − 0 − q2∗ }q2∗ − 3q2∗ = 0q2∗ − 3q2∗ < 0, 11 mientras producir q2′ = 0 conlleva el pago 0. Como 4 − q2∗ > 0, hay un (pequeño) intervalo de valores de q2 > 0 alrededor de q2∗ (tal intervalo existe porque q2∗ > 0) con 4 − q2 > 0. Para este intervalo la función de pago del jugador 2 tiene la siguiente forma π2 (0, q2 ) = max{0, 4 − 0 − q2 }q2 − 3q2 = (4 − q2 )q2 − 3q2 . (9) Dado que (0, q2∗) es un EN, el jugador 2 no tiene incentivos para desviarse. En otras palabras, dada la estrategia q1∗ = 0 del jugador 1, q2∗ es débilmente mejor que cualquier otra estrategia en el intervalo que consideramos (alrededor de q2∗ ). Por tanto, q2∗ maximiza (9) en dicho intervalo. Por consiguiente, q2∗ satisface la CPO correspondiente: 4 − 2q2∗ − 3 = 0. Por tanto, q2∗ = 1 2 Se comprueba fácilmente que (4 − q1∗ − q2∗ ) 1 = 4−0− 2 7 = 2 > 0. Por tanto en el caso de una desviación q1′ = ǫ > 0 del jugador 1 (con ǫ suficientemente pequeño), π1 (q1′ , q2∗ ) = max{0, 4 − ǫ − q2∗ }q1 − q1 = (4 − ǫ − q2∗ )q1 − q1 5 = −ǫ ǫ 2 > 0. Por tanto, el jugador 1 tiene una desviación profitable (producir q1′ le da un pago superior que q1∗ ). Concluimos que no hay un equilibrio del tipo (d). Resumiendo, hay un solo equilibrio de Nash (del tipo (c)). El perfil estratégico es 3 ,0 . 2 12 P.5. (20 puntos) Consideramos el juego dinámico de 2 jugadores que consiste en jugar dos veces el juego G estático, dado por la siguiente tabla de pagos: 1\2 T M B L C (3, 1) (0, 0) (2, 1) (1, 2) (1, 2) (a, 1) R (5, 0) (3, 1) (4, 4) donde a es una constante. Los jugadores escogen simultáneamente una acción en la primera etapa. Luego observan el resultado y escogen de nuevo simultáneamente una acción en la segunda etapa. Suponemos que no hay descuento (es decir que el pago final es la suma de los pagos de las dos etapas). (a) La Figura 7 muestra (parcialmente) la representación en forma extensiva. Faltan 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 2 1 Figura 7: Problema 5, juego los conjuntos de información. Indı́calos (sólo en la parte representada en la Figura 7). Solución: Véase la Figura 8. (b) ¿Cuántas estrategias tiene cada jugador? Solución: El jugador 1 tiene un conjunto de información en la primera etapa y 9 conjuntos de información en la segunda etapa. En cada conjunto de información tiene que elegir entre las tres acciones T , M y B. Por tanto, tiene 310 = 59049 estrategias. Utilizando el mismo argumento (¡!), el jugador 2 también tiene 310 = 59049 estrategias. (c) ¿Cuántos subjuegos hay? Solución: Hay 10 subjuegos. En la Figura 7 cada nodo del jugador 1 define un subjuego, y cada subjuego empieza en un nodo del jugador 1. 13 2 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 2 1 Figura 8: Problema 5, juego: conjuntos de información (d) Supón que a = 2. ¿Cuáles son los pagos correspondientes a los equilibrios de Nash perfectos en subjuegos en estrategias puras? Solución: Si a = 2 entonces el juego estático es el siguiente: 1\2 T M B L (3, 1) (2, 1) (1, 2) C R (0, 0) (5, 0) (1, 2) (3, 1) (2, 1) (4, 4) Hemos indicado las mejores respuestas en negrita. Hay un único EN: (T, L). Por tanto, un teorema del Tema 3 (la Diapositiva 43) nos dice que el juego dinámico tienen un único resultado perfecto en subjuegos: en cada etapa se juega (T, L). Luego, los pagos son (3, 1) + (3, 1) = (6, 2). (e) Supón que a = 0. ¿Existe algún equilibrio de Nash perfecto en subjuegos (en estrategias puras) en el que los jugadores obtienen los pagos (4, 4) en la primera etapa? En caso afirmativo, especificar el perfil estratégico completo y explicar cuidadosamente por qué es un equilibrio. En caso negativo, explicar cuidadosamente por qué no. Solución: Sı́, en el siguiente equilibrio perfecto en subjuegos los jugadores obtienen los pagos (4, 4) en la primera etapa. Si a = 0 entonces el juego estático es el siguiente: 1\2 L C T (3, 1) (0, 0) M (2, 1) (1, 2) B (1, 2) (0, 1) 14 R (5, 0) (3, 1) (4, 4) Hemos indicado las mejores respuestas en negrita. Hay dos EN: (T, L) y (M, C). Podemos aprovechar la existencia de un segundo EN para obtener los pagos (4, 4) en la primera etapa. (Veáse también el Ejemplo 3.9 del Tema 3.) • Estrategia s1 del jugador 1: – Jugar B en la primera etapa; – Si se ha jugado (B, R) en la primera etapa, jugar T en la segunda etapa. En caso contrario, jugar M. • Estrategia s2 del jugador 2: – Jugar R en la primera etapa; – Si se ha jugado (B, R) en la primera etapa, jugar L en la segunda etapa. En caso contrario, jugar C. Está claro que en el perfil (s1 , s2 ) los jugadores obtienen los pagos (4, 4) en la primera etapa (y (3, 1) en la segunda). Veamos porque estas estrategias constituyen un EPS. En cada subjuego que empieza en la segunda etapa: el perfil (s1 , s2 ) inducen a un EN del subjuego, a saber, o bien (T, L) o bien (M, C). En la primera etapa el juego “efectivo” es 1\2 L T (4, 3) M (3, 3) B (4, 3) C (1, 2) (2, 4) (1, 3) R (6, 2) (4, 3) (7, 5) Uno de los 3 tres equilibrios de Nash es (B, R), el perfil de acciones prescritas por las estrategias (s1 , s2 ). Por tanto, (s1 , s2 ) es un EPS. 15 P.6. (15 puntos) Considera el siguiente juego con información incompleta entre los jugadores 1 y 2. • El azar determina si los pagos de los jugadores son como en la matriz X o como en la matriz Y. La matriz X tiene probabilidad 3/4 de ser seleccionada mientras la matriz Y tiene probabilidad 1/4 de ser seleccionada. • El jugador 2 es informado sobre qué matriz ha sido seleccionada, pero el jugador 1 no sabe cuál es la matriz seleccionada. • El jugador 1 elige entre las acciones A y B mientras jugador 2 elige simultáneamente entre las acciones I y D. • Los pagos son los que se dan en la matriz seleccionada por el azar. 1/2 I D A (3,6) (1,3) B (1,1) (2,3) 1/2 I D A (4,1) (3,3) B (0,6) (2,2) Matriz X Matriz Y (a) Calcula el pago esperado de cada jugador en caso de que el jugador 1 elige la estrategia A y el jugador 2 elige la estrategia DD. Solución: u1 (A, DD) = (3/4)(1) + (1/4)(3) = 1.5 y u2 (A, DD) = (3/4)(3) + (1/4)(3) = 3. (b) ¿Cuál es la mejor respuesta para el jugador 2 cuando el jugador 1 elige A? ¿Cuál es la mejor respuesta para el jugador 2 cuando el jugador 1 elige B? Solución: Obviamente MR2 (A) = ID y MR2 (B) = DI. (c) Calcula todos los equilibrios Bayesianos en estrategias puras. Solución: Visto lo visto, sólo tenemos que calcular la mejor respuesta del jugador 1 contra ID y contra DI. Ahora bien, MR1 (ID) = A (porque u1 (A, ID) = 3 y u1 (B, ID) = 5/4). Ası́ mismo, MR1 (DI) = A (porque u1 (A, DI) = 7/4 y u1 (B, DI) = 6/4). Por tanto, el único equilibrio Bayesiano en estrategias puras es (A, ID). 16

Teor´ıa de las decisiones y de los juegos

Documentos relacionados

Productos

Apoyo

Teor´ıa de las decisiones y de los juegos

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib