Economía política Jorge M. Streb Clase 4 10.7.2013 Temas I. Forma normal y extensiva II. Política preelectoral versus poselectoral: credibilidad y discreción III. Modelo espacial con actores de veto IV. Paradoja de Condorcet, ciclos e instituciones V. Equilibrio perfecto en subjuegos VI. Ejemplo donde equilibrios de Nash y de Nash perfecto en subjuegos no coinciden Desarrollo I. Forma normal y extensiva A. Diferentes representaciones Estuvimos discutiendo dos formas de representación de juegos, la forma normal y la extensiva. Para los juegos de dos jugadores, la forma normal se puede ver como una generalización de una matriz de decisión bajo incertidumbre. En la matriz de decisión bajo incertidumbre, los cursos de acción determinan las filas, los estados de naturaleza las columnas y las celdas representan los pagos del decisor. La forma normal es una matriz de juegos donde las filas son los cursos de acción del primer jugador, las columnas son los cursos de acción del otro jugador y las celdas son pares ordenados que representan los pagos de los jugadores fila y columna (en ese orden). La incertidumbre del jugador fila sobre los pagos pasa a ser endógena, ya que depende de la respuesta del otro jugador a sus acciones, y no exógena como en el caso donde las columnas son los diversos estados de la naturaleza. De forma similar, la forma extensiva se puede ver como una generalización de árbol de decisión para contemplar la interacción de dos (o más) jugadores. Mientras que para 1 decisiones simultáneas es más simple mirar forma normal, para decisiones secuenciales la forma extensiva es más conveniente. B. Equivalencia de las formas normal y extensiva Ahora vamos a ver en más detalle la equivalencia entre ambas formas de representar un juego tomando al juego de coordinación. Luego agregamos un ejemplo bien conocido: el dilema del prisionero. Juego de coordinación con información perfecta: desaparece problema coordinación Un ejemplo de información imperfecta es con el juego de coordinación. Si hay información perfecta, el problema de coordinación desaparece. El problema de coordinación se puede representar como sigue cuando hay información perfecta: Gráfico 1. Coordinación con información perfecta Jugador 1 D I Jugador 2 I Jugador 2 D I 1, 1 0, 0 0, 0 D 1, 1 En este caso, no hay problema de coordinación alguno: cuando se resuelve por inducción hay atrás, hay dos resultados posibles, que ambos elijan I o D, pero no aparece el equilibrio en estrategias mixtas. De hecho, el jugador 1 va a estar dispuesto a jugar una 2 estrategia mixta, por ejemplo elegir I o D con igual probabilidad, porque el otro jugador va a seguir su ejemplo, imitando la estrategia pura que resulta elegida (esto se conoce como equilibrio híbrido, porque un jugador juega estrategia mixta y el otro una estrategia pura). Si representamos esto en forma normal: Cuadro 1. Coordinación con información perfecta I, I I, D D, I D, D I 1,1 1,1 0,0 0,0 D 0,0 1,1 0,0 1,1 Aparecen cuatro equilibrios de Nash en estrategias puras, aunque no todos son igualmente razonables, es decir, no todos son equilibrios de Nash perfecto en subjuegos (como aclaramos mejor después). Si el jugador 1 juega cualquier estrategia mixta, en cambio, el jugador 2 sólo quiere jugar la estrategia (I,D): es el equilibrio híbrido que se corresponde con discusión anterior. Dilema del prisionero y la información perfecta e imperfecta El dilema del prisionero es un juego con información imperfecta. Cuando decide 1, no sabe si 2 eligió confesar o no confesar (esta incertidumbre de hecho se resuelve en el equilibrio Nash, ya que ahí las expectativas están determinadas por las estrategias de equilibrio que indican que 1 confiesa). Cuadro 2. Dilema del prisionero: información imperfecta Prisionero 2 no confesar confesar no confesar -1,-1 -6, 0 confesar 0,-6 -3,-3 Prisionero 1 A la forma normal con equilibrio Nash [confesar, confesar] le corresponde la siguiente forma extensiva: 3 Gráfico 2. Dilema del prisionero: información imperfecta Prisionero 1 confesar no confesar Prisionero 2 confesar no confesar no confesar -1, -1 -6, -0 confesar 0, -6 -3, -3 Con información perfecta, el dilema del prisionero cambiaría, ya que el prisionero 2 sabe lo que hizo el prisionero 1 antes de decidir. En los juegos de información perfecta, la resolución se puede hacer por inducción hacia atrás. Se resuelve cada subjuego, reemplazándolo por pagos equilibrio, y se sigue resolviendo secuencialmente. Acá vemos que esto nos lleva a pagos de (-3,-3) que corresponden al resultado (confesar, confesar). Gráfico 3. Dilema del prisionero “secuencial”: información perfecta Prisionero 1 confesar no confesar Prisionero 2 no confesar Prisionero 2 confesar no confesar -1, -1 -6, -0 confesar 0, -6 -3, -3 A esta forma extensiva le corresponde el siguiente juego en forma normal: 4 Cuadro 3. Dilema del prisionero “secuencial”: información perfecta Prisionero 2 no confesar, no confesar, confesar, confesar, no confesar confesar no confesar confesar no confesar -1,-1 -1,-1 -6, 0 -6, 0 confesar 0,-6 -3,-3 0,-6 -3,-3 Prisionero 1 El prisionero 2 tiene dos nodos de decisión, no uno. Por tanto, en la forma normal una estrategia para el prisionero 2 es un par de acciones ya que hay que especificar qué se va a hacer en cada uno de los dos nodos de decisión, es decir, el jugador 2 tiene que especificar las siguientes estrategias condicionales: qué va a hacer si 1 no confiesa, qué va a hacer si 1 confiesa. El equilibrio Nash es [confesar, (confesar, confesar)], que lleva al resultado (confesar, confesar) que encontramos por inducción hacia atrás. II. Modelos de política preelectoral y poselectoral: credibilidad y discreción Vamos a mirar una versión discreta del modelo espacial de Downs, para ver cómo inciden cambios en el timing de las acciones. Para esto usamos lo que se conoce como forma extensiva de un juego, que estudiamos después en más detalle. Esto se discute también en la primera parte de la sección 6 de Streb y Torrens (2011). A. Política preelectoral: compromisos vinculantes En el modelo de competencia espacial entre dos partidos va a tener influencia el elemento oportunista o pragmático de adaptarse a lo que desea el votante mediano. Se puede representar con un árbol de juegos haciendo una versión con dos estrategias para cada partido (en lugar de un continuo de estrategias). Sea 30 la política ideal del partido A y 80 la del partido B. Si el votante mediano está en 50 y tiene preferencias espaciales, el único que va a poder implementar políticas es el que gane las elecciones: si B insiste en aplicar política 80, A gana las elecciones con política de 30. Es decir, no solo pierde B, sino que se aplica una política que desde el punto de vista de B es mucho peor que la del votante 5 mediano. Dado esto, lo mejor que pueden hacer los partidos es aplicar la política deseada por el votante mediano, ya que si se apartan lo único que consiguen es perder las elecciones y ser irrelevantes a la hora de influir en las políticas efectivamente implementadas. El juego en forma extensiva del gráfico 1 simplifica las estrategias para que cada partido sólo pueda elegir entre su punto ideal y lo que haría el votante mediano. La utilidad esperada de los partidos es Eu (π , x) , que depende de la probabilidad de ganar (π =1) o no (π =0) las elecciones y de cuán cerca están los resultados de sus políticas preferidas. En el caso de preferencias aditivas, tiene una ponderación 1-λ la utilidad K de ganar las elecciones, multiplicada por la probabilidad π de ganar, y una ponderación λ el resultado final, cuya utilidad se puede representar por preferencias espaciales, por ejemplo cuadráticas. Gráfico 4. Competencia preelectoral: un mundo de compromisos creíbles A 50 30 B 50 80 80 50 mediano mediano "A " u A (1;30), u B (0;30), u m (30) "B " u A (0;50), u B (1;50), u m (50) "A " u A (1;30), u B (0;30), u m (30) mediano mediano "B " "A " u A (0;80), u (1;50), A u B (1;80), u (0;50), B u m (80) u m (50) "B " u A (0;50), u B (1;50), u m (50) "A " u A (1;50), u B (0;50), u m (50) "B " u A (0;80), u B (1;80), u m (80) En este juego, el votante mediano siempre va a preferir el punto más cercano a 50. Dado eso, a B no le conviene elegir 80 ya que siempre pierde las elecciones (es una estrategia estrictamente dominada: no importa qué haga A, no conviene elegir 50). Si B juega 50, entonces a A le conviene elegir también 50. El votante mediano termina eligiendo al azar 6 entre A y B, ya que le reportan la misma utilidad, por lo que ambos van a tener una probabilidad π =1/2 de ganar. B. Política pos-electoral: acciones discrecionales de políticos con ideología En cambio, si no existe la posibilidad de hacer compromisos vinculantes y las promesas de campaña no restringen nada, Alesina muestra que los resultados cambian radicalmente (ver por ejemplo Alesina y Rosenthal 1995). Lo podemos ver en el gráfico 2, donde el gobierno decide una vez que está en el poder (π=1). Gráfico 5. Competencia poselectoral: un mundo de política discrecional mediano "A" "B" A 30 u m (30), u A (π =1;30) B 50 u m (50), u A (π =1;50) 50 u m (50), u B (π =1;50) 80 u m (80), u B (π =1;80) Dado este cambio en la secuencia de juego, cada partido va a elegir su política preferida cuando esté en el gobierno. En vista de eso, el votante mediano prefiere a A, que aplica política más cercana de 50 que B. En un mundo de discrecionalidad, podría existir un incentivo para que entren nuevos partidos más cercanos al votante mediano, ya que van a tener una ventaja, pero es algo que no profundizamos. 7 III. Modelo espacial con actores de veto Una variante muy importante al modelo espacial simple es el modelo de fijador de agenda, a partir del importante modelo de Romer y Rosenthal (1978) sobre la relación entre una agencia con poder de hacer propuestas y la población que puede aprobar o no la propuesta (este se inspira, a su vez, en la discusión de la burocracia y su rol frente a la legislatura en Niskanen). Esto agrega al modelo espacial un actor de veto. Una vez que hay un actor de veto, se limita el poder del fijador de agenda o del que formula propuestas de política. Primero mencionamos brevemente el análisis del capítulo 5 de Shepsle y Bonchek (1997), donde discuten el caso de democracia directa, que sirve también como un modelo de funcionamiento de la legislatura. El modelo espacial con un actor de veto sirve para modelar la división de poderes, que requiere la interacción (y acuerdo) entre ejecutivo y legislativo. Esto se discute en más detalle en la sección 7 de Streb y Torrens (2011). Además, como discutimos en clase, una vez que existe una constitución, el poder judicial puede actuar como un actor de veto adicional, al actuar en su análisis de constitucionalidad de las leyes (aunque el poder legislativo y ejecutivo pueden remover a la corte suprema o ampliarla, eso puede suponer un costo político así que no es gratis). Los antecedentes se remontan a la Corte Suprema de Estados Unidos en Marbury vs. Madison en 1803. A. Modelos de legislatura (o de democracia directa) Shepsle y Bonchek (1997) analizan tres modelos de la legislatura, que surgieron de una modificación del modelo de Romer y Rosenthal (1978) para aplicarlo a la relación entre una comisión legislativa y el plenario de la legislatura: (i) el modelo de mayoría pura: se impone la propuesta del votante mediano xm (teorema de Black para democracia directa). (ii) el modelo con agenda cerrada (sin enmiendas): la propuesta de la comisión legislativa, cuyo miembro mediano tiene preferencia xc, se puede aprobar o rechazar; si se rechaza, rige 8 el statu quo x0. La comisión tiene que decidir si presenta una propuesta o no, lo que depende de la ubicación del statu quo en relación a las preferencias xc y xm. La clave es el punto Im(x0), el punto que es indiferente para el mediano de la legislatura al statu quo x0. (iii) el modelo con agenda abierta (con enmiendas): la propuesta de la comisión legislativa, cuyo miembro mediano tiene preferencia xc, se puede enmendar por el plenario de la legislatura, cuyo miembro mediano tiene preferencia xm. En caso de enmienda, el plenario puede presentar como alternativa a la propuesta de la comisión aquella propuesta que más prefiera. La comisión tiene que decidir si presenta una propuesta o no, lo que depende de la ubicación del statu quo en relación a las preferencias xc y xm. La clave es el punto Ic(x0), el punto que es indiferente para el mediano de la comisión al statu quo x0. El caso de mayoría pura tiene puntos de contactos formales con el modelo de competencia partidaria de Downs, por lo que muchas veces se los trata como casos equivalentes del teorema del votante mediano. Sin embargo, hay una gran diferencia: mientras que en Downs los dos partidos tiene que elegir estratégicamente una propuesta, así que esa es la variable clave (la ubicación elegida), aquí en la legislatura las alternativas están dadas y se puede votar por cualquiera hasta que surja un ganador. Este caso de Black es problemático en términos estratégicos, ya que una vez que hay más de dos alternativas pueden surgir problemas de manipulación de las preferencias. Por tanto, esto de que se impone la propuesta mediana rige claramente sólo si el mediano relevante tiene el poder de agenda en el plenario y en la comisión legislativa. El modelo del poder legislativo con agenda cerrada se parece formalmente al modelo con actor de veto del punto que sigue, donde el poder ejecutivo tiene el poder de agenda para mandar propuestas al poder legislativo. El modelo del poder legislativo con agenda abierta implica un caso donde el poder legislativo puede revisar las propuestas del poder ejecutivo, por lo que se transforma en el que tiene poder de agenda. B. Modelo de fijador de agenda aplicado a la división de poderes Ahora pasamos a un modelo donde miramos la interacción entre el poder ejecutivo y el poder legislativo (en América Latina el poder ejecutivo es típicamente el que define la agenda, dado el poder de gobernar por decreto que tiene en muchos países de la región, 9 además de la poca iniciativa y capacitación de la legislatura en muchos de los países). También puede servir para representar una monarquía constitucional, donde, a diferencia de un gobierno absolutista, el monarca tiene que responder a un parlamento antes de cambiar las cosas. Suponemos en el gráfico 3 que el poder ejecutivo, representado por A, está en el punto 50, que corresponde a las preferencias del votante mediano. Gráfico 6. Modelo espacial con ejecutivo y legislatura A 0 50 B 70= statu quo 80 100 El poder legislativo está en manos de B, que está en el punto 80. Si el statu quo es 70, entonces B puede vetar las propuestas de A, ya que se impone un resultado igual al statu quo. El modelo espacial con actor de veto se puede representar gráficamente como un juego en forma extensiva. Consideremos un versión discreta, donde las únicas alternativas son el punto ideal del fijador de agenda A (50) y el statu quo (70). Dado que no puede imponer un cambio al actor de veto B, si prefiere débilmente no recibir un veto entonces suponemos que A va a proponer mantener el statu quo. La estrategia óptima de A va a depender de las preferencias específicas de B (en este caso su punto ideal está dado por 80). 10 Gráfico 7. Modelo espacial con actor de veto (status quo dado por 70) A 70 50 B si B no si no uA(50) uA(70) uA(70) uA(70) uB(50) uB(70) uB(70) uB(70) En este ejemplo, el statu quo le da inercia a la política. Si, en cambio, el statu quo fuera 0 o 30, B aceptaría una propuesta de 50 por parte de A. Esto permite explicar por qué puede tener tanta estabilidad la política en sistemas con actores de veto (en Argentina antes de 1930, donde los senadores duraban nueve años y se renovaban en forma escalonada, llevaba tiempo poder revertir las políticas cuando llegaba un nuevo presidente, como pasó con resistencia de provincias petroleras de iniciativa de los gobiernos radicales de darle el monopolio de la explotación a YPF). Como los actores de veto son en general endógenos, según el diseño institucional de cada país eventualmente pueden llegar a cambiar. Además, los votantes lo pueden tener en cuenta al decidir su voto. Ver discusión en la sección 7 de Streb y Torrens (2011). IV. Paradoja de Condorcet, ciclos e instituciones Drazen (2000), cap. 3, muestra un clásico ejemplo con tres alternativas y tres votantes. Se produce un ciclo en las votaciones por mayoría entre todas las alternativas posibles, ya que la alternativa 1 es preferida por una mayoría a la 2, que es preferida a la 3, que es preferida a la 1. Los tres votantes A, B y C no sólo no se ponen de acuerdo en la mejor alternativa, sino tampoco en la peor. Las preferencias de uno de los jugadores (el jugador 11 C) no son de un solo tope, ya que prefiere cualquiera de las alternativas extremas a la intermedia. Este problema no se presentaría, en cambio, si los votantes tuvieran preferencias de un solo tope, ya que al menos se pueden poner de acuerdo en cuáles son peores, lo que permite encontrar un ganador de Condorcet que corresponde al votante mediano. Cada votante tiene 3x2x1=6 perfiles de preferencias posibles (la alternativa favorita puede ser cualquiera de las tres, dado eso hay dos alternativas para segundo lugar y una para tercero), lo que da un total de 6x6x6=216 perfiles posibles. Sólo 12 casos sobre 216 llevan a ciclos (5.6% de los casos). Cuando aumenta el número de votantes, probabilidad de ciclos aumenta (en el límite es 8,8%); cuando aumentan las alternativas, la probabilidad de ciclos tiende a 1 (Shepsle y Bonchek 1997, capítulo 4, p. 49 a 56). Más importante aún, en cuestiones de cómo repartir la torta los ciclos son inherentes a la situación. Persson y Tabellini (2000), cap. 2, muestran un ejemplo simple con tres jugadores en un gráfico bidimensional que representa en cada eje lo que le corresponde a los jugadores A y B (el jugador C se queda con el resto), lo que lleva a un triángulo rectángulo con catetos 1 y 1 sobre cada eje. Surgen ciclos, un problema recurrente en todos los conflictos redistributivos. Hay soluciones institucionales que evitan los ciclos, a costa de apartarnos de la soberanía del votante mediano. Uno es exigir la unanimidad, lo que hace imposible cambiar el statu quo en el marco de este problema (pensar, en este sentido, en los requisitos para cambiar la Ley de Coparticipación en Argentina). El modelo de fijador de agenda (originado en Romer y Rosenthal) puede proveer una solución a los ciclos, a costa de sesgar los resultados a favor del que tiene el poder de agenda. Persson y Tabellini (2000), cap. 2, muestran cómo funciona esto y los problemas que aparecen de votar estratégicamente. Para problemas multidimensionales, Persson y Tabellini discuten una variante que es dividir el tema en diferentes dimensiones y asignar la potestad sobre cada dimensión a diferentes comisiones (siguiendo a Shepsle). 12 V. Equilibrio de Nash perfecto en subjuegos Las definiciones de conjuntos de información, estrategias, subjuegos y equilibrio de Nash perfecto en subjuegos siguen a Gibbons (1992), capítulo 2. Definición: Un conjunto de información es un conjunto de nodos de decisión donde (i) un mismo jugador decide y (ii) no puede distinguir entre los nodos decisión pertenecientes a ese conjunto. Definición: Una estrategia es un plan completo de acción que especifica una acción para cada conjunto de información en la cuál pueda actuar un jugador. Definición: Un subjuego (i) empieza en un conjunto de información con nodo de decisión unitario (que no sea el inicial, sino el juego primitivo es trivialmente un subjuego), (ii) incluye todos los nodos decisión y terminales que siguen, (iii) no corta conjuntos de información, es decir, todos los jugadores que participan saben que el juego pasó por el nodo en punto (i). Definición: un equilibrio de Nash perfecto en subjuegos es un equilibrio donde las estrategias de los jugadores son un equilibrio de Nash tanto en el juego como también en cada subjuego. Esta idea proviene de Selten. Si se restringen las estrategias a un subjuego, la idea es que debe seguir siendo un equilibrio de Nash. Se puede decir que el equilibrio de Nash perfecto en subjuegos es Nash Nash, ya que es la doble aplicación del criterio de Nash: es equilibrio de Nash en juegos y equilibrio de Nash en subjuegos. VI. Ejemplo donde equilibrios de Nash y de Nash perfecto en subjuegos no coinciden Esto sirve para entender la especificidad del equilibrio perfecto en subjuegos. Si se resuelve por inducción hacia atrás el gráfico 1, el jugador 2 juega la estrategia D en los dos subjuegos, y el jugador 1 juega I: esto lleva al equilibrio de Nash perfecto en subjuegos [I, (D,D)]. El resultado del juego es (I,D) que lleva a pagos de (10,0). 13 Gráfico 8. Juego con amenazas no creíbles Jugador 1 D I Jugador 2 I Jugador 2 D I 2, -2 10, 0 D 2, -2 3, 4 Si representamos a este juego en forma normal, el jugador 1 puede elegir a1∈A1={I,D}, y dado a1, el jugador 2 puede elegir a2∈A2={I,D}. Los pagos (u1(a1, a2), u2(a1, a2)) son (2,2) para (I,(I,.), (10,0) para (I,(D,.), (2,-2) para (D,(.,I )y (3,4) para (D,(.,D ). Cuadro 4. Juego con amenazas no creíbles Jugador 2 Jugador 1 I,I I,D D,I D,D I 2,-2 2,-2 10,0 10,0 D 2,-2 3,4 2,-2 3,4 En este juego, hay tres equilibrios de Nash en estrategias puras: [I, (D,I)], [I, (D,D)], y [D, (I,D)]. La idea de Selten de que en cada subjuego las estrategias sean un equilibrio de Nash hace que, fuera del sendero de equilibrio, se eliminen en otros subjuegos lo que podrían ser amenazas no creíbles (es decir, acciones que no serían ejecutadas si llegara el momento de efectivamente hacerlas). Precisamente, el equilibrio de Nash [D, (I,D)] implica lo que Selten llama amenazas no creíbles fuera del sendero de equilibrio, a saber, que 2 juegue D si 1 se desvía a D. El equilibrio de Nash [I, (D,I)] tampoco es perfecto en subjuegos, aunque en este caso la jugada fuera de equilibrio no afecta al resultado. 14 Referencias Alesina, Alberto y Howard Rosenthal (1995), Partisan politics, divided government, and the economy, Cambridge, Cambridge University Press. Drazen, Allan (2000), Political Economy in Macroeconomics, Princeton, NJ, Princeton University Press. Gibbons, Robert (1992), Game theory for applied economists, Princeton, NJ, Princeton University Press (en castellano: Un primer curso de teoría de juegos, Barcelona, Bosch). Persson, Torsten, y Tabellini, Guido (2000), Political Economics. Explaining Economic Policy, Cambridge, MA, MIT Press. Romer, Thomas y Rosenthal, Howard (1978), “Political resource allocation, controlled agendas, and the status quo”, Public Choice 33: 27-43. Romer, Thomas y Rosenthal, Howard (1982), “Median voters or budget maximizers: Evidence from school expenditure referenda”, Economic Inquiry 20: 556-578. Shepsle, Kenneth, y Bonchek, Mark (1997), Analyzing politics, New York, W.W. Norton & Co, cap. 5, pp. 104-136. Streb, Jorge M., y Gustavo Torrens (2011), “La economía política de la política fiscal”, borrador de capítulo preparado para Progresos en economía del sector público, editado por Fernando Navajas y Alberto Porto. 15