Teoría de Juegos Problema general de optimización: Dados un conjunto X y una función real f : X IR, se quiere maximizar f (x) sujeto a x X. Problema típico de teoría de juegos: Dados los conjuntos X1 , …, Xn ; y las funciones reales f1 : X1 … Xn IR, …, fn : X1 … Xn IR ; se quiere, … ¿qué? 1) El dilema del prisionero La policía ha prendido a dos sospechosos sabiendo que al menos uno de ellos ha cometido el delito en cuestión, y los tiene incomunicados. Ha de presentarles un documento en el que se confiesa la comisión del delito para que, si lo desean, la firmen. Las consecuencias de sus decisiones aparecen en la tabla siguiente. firma firma -1, -1 rehúsa -2, 1 rehúsa 1, -2 0, 0 Su representación en forma extendida es: 2) La batalla de los sexos Él y ella se aman locamente y quieren decidir en dónde se divertirán esta noche. Él prefiere el box al ballet pero ella al revés. Ambos querrían la compañía de su cónyuge. Las consecuencias de sus decisiones aparecen en la tabla siguiente. ballet ballet 2, 1 box -1, -1 box 0, 0 1, 2 1 Teoría de Juegos Su representación en forma extendida es: 3) El reparto de la torta. Una torta ha de repartirse entre dos niños. Cada una puede pedir una fracción (mitad, 2 tercios, todo, nada, etc.) de ella. Si la suma de ambas fracciones no pasa de 1, ambos reciben lo pedido; pero si dicha suma pasa de 1, ninguna recibe nada. xi , si xi x j 1 Entonces, las funciones de pagos de los jugadores son: i (xi , xj) := . 0, si xi x j 1 Su representación en forma extendida requiere un continuo tridimensional. I. Juegos no-cooperativos Representación en forma extensiva componentes: - conj. de jugadores: N = {1, …, n} ó {0, 1, …, n}; - conj. de actos posibles: A ; - orden de dichos actos; - conocimiento presente, en cada momento, de cada jugador, - consecuencias finales para los jugadores el orden de los actos: (K, R), donde K es un conjunto no vacío de nodos del árbol representativo del juego; y R es una relación binaria en K, “precedencia”, i.e., irreflexiva y transitiva R determina en K la relación P de “precedencia inmediata” : xPy xRy z, (xRz zRx). Así, P(x) := {y de K: yPx} es conjunto de “predecesores inmediatos” de x, y 2 Teoría de Juegos 3 P-1(x) := {z de K: xPz} es conjunto de “sucesores inmediatos” de x. Asunción 1: ! x0 en K, P(x0) = . x0 es el “nodo inicial”. Asunción 2: x de K \ { x0}, ! m de , ! (x0 , x1 , …, xm) tal que x = xm x0 P(x1) … xm-1 P(xm). Una sucesión tal es una “senda”. Consecuencia inmediata: x x0 , 1 = P(x). Asunción 3: No existe ninguna senda de longitud infinita y toda senda es subsenda de otra que termina en un nodo carente de sucesores inmediatos, es decir, que con Z := {x de K: P-1(x) = }, conj. de nodos terminales, senda (x0 , x1 , …, xm), una senda (x0 , z1 , …, zk) tal que k m zk Z z1 = x1 … zm = xm . El orden de los actos es determinado así: Hay una partición, {K0 , K1 , …, Kn}, de K \ Z. Para i > 0, Ki es el conjunto de nodos en los que toca jugar al jug i. Hay una correspondencia, A, que a cada nodo, x, asigna el conjunto A(x) de actos disponibles al jug i . Además, cada A(x) es biyectivo con P-1(x); ella indica a qué nodo sucesor inmediato de x llevará el acto que el jugador decida realizar. El conocimiento presente de cada jugador es determinado por particiones dadas, Hi , de los conjuntos Ki . Así, si en un momento el juego se encuentra en un nodo de un elemento h de la partición Hi de Ki , entonces el jug i no sabrá en qué nodo de h se encuentra el juego. Por ello, ha de asumirse que la correspondencia A es tal que A(x) = A(y) {x, y} h. Se llaman conjuntos de información del jug i los elementos de la partición Hi de Ki . Consecuencias finales: cada jugador (no natura) posee una relación de preferencias (binaria transitiva y total) en el conjunto de nodos terminales Z. Según la teoría de la utilidad esperada de von Neumann, puede asumirse que dichas relaciones de preferencias están representadas por funciones de utilidad lineal si es que las preferencias son continuas e independientes. Denótense dichas funciones de utilidad por 1 , …, m. En definitiva, un juego no cooperativo n-personal en forma extensiva se representará por el quíntuple ordenado ( (Ki )0n , R, (H )0n , ( A( x))xK\Z , ( ( z) zZ ) ) si juega natura, y por ( (Ki )1n , R, (H )1n , ( A( x))xK \ Z , ( ( z) zZ ) ) si no juega natura. ` Representación de un juego en forma estratégica o normal Teoría de Juegos 4 En un juego n-personal en forma extensiva, , se definen las estrategias de los jugadores como indicaciones precisas acerca de cómo hay que jugar cada vez que sea su turno. Definición: 1) Una “estrategia” del jug i es cualquier función, si , definida en Hi y que tome valores en Ai := A(h) , debiendo cumplirse que h de Hi , si (h) A(h). hH i 2) Se denotará el conjunto de todas las posibles estrategias del jug i por Si . 3) Un “perfil de estrategias” es cualquier (s1 , …, sn) S1 … Sn . Cada perfil de estrategias determina una senda que acaba en un nodo terminal, y así, hay una función : S1 … Sn Z que asigna a cada perfil de estrategias un único nodo terminal. Como en cada nodo terminal ya está determinado el vector (z) = (1(z) , …, m(z)), puede considerarse la función compuesta * := : S1 … Sn ; en este contexto de representación estratégica, la función * que acaba de definirse será representada simplemente por . Con esta notación la representación en forma normal o estratégica de un juego no cooperativo n-personal es: G := ((Si )1n , ( i )1n ) . Extensión mixta de un juego en forma normal Una estrategia mixta del jug i en el juego n-personal G es cualquier distribución probabilística sobre su conjunto Si de estrategias (en adelante llamadas “puras”). Así, si i es una estrategia mixta del jug i, entonces, con ri := Si , será i = (i1 , …, iri ), donde iq := i (siq) q de {1, …, ri}. El conjunto de todas las estrategias mixtas del jug i se representa por i , el simplejo ri del espacio euclídeo de dimensión ri . La extensión mixta del juego G se define como G* := ((i )1n , ( i)1n ) , donde las funciones i se definen como los pagos esperados al jug i según (1 , …, n) Esto es, que i () = r1 ,...,rn ( s i q1 ,...q n 1 1q1 ,...,snq n )1q1 ... nq n = E[i ]. En adelante, en vez de escribir i (), se escribirá simplemente i () sin temor a confusión. Dominación y dominación iterativa 5 Teoría de Juegos Ejemplo: En el juego representado en forma normal o estratégica siguiente, A B C X 2,7 2,0 2,2 Y 7,0 Z 4,1 0,4 1,3 1,1 3,2 , el jug 1 nunca jugará Z, ya que siempre le va mejor con Y. Puede, pues, asumirse que el juego realmente se reduce al siguiente A B C X Y 2,7 2,0 2,2 . En éste, el jug 2 nunca juega B pues siempre le va mejor con C. 7,0 1,1 3,2 A Así, el juego se reduce al X Y le irá mejor con Y. C 2,7 2,2 . Aquí el jug 1 nunca jueg X, pues siempre 7,0 3,2 Entonces, el juego se reduce aún más: A Y C 7,0 3,2 . Finalmente, el jug 2 ve que con C le va mejor que con A, por lo que el juego termina C siendo , y ya se puede esperar que en el juego inicial, los jugadores elijan Y 3,2 respectivamente sus estrategias Y y C. Definición: Una estrategia pura, si , del jug i, es “dominada” si i i tal que si de S-i , i (i , s-i) > i (si, s-i). Se dice también que i domina a si. Nota : Si la estrategia pura si es dominada, entonces cualquier estrategia mixta, i tal que asigne probabilidad positiva a si será también “superada” por alguna otra estrategia mixta, i.e. i tal que s-i de S-i , i (i , s-i) > i (i, s-i). Equilibrios de Nash Definición: En un juego G dado en forma estratégica o normal, un perfil estratégico o situación, s* (s1* , …, sn*), es un “equilibrio de Nash” si ningún jugador puede, unilateralmente actuando, incrementar el pago que le corresponde por s*. Dicho de modo formal, si i si Si , i (s*) , i (si , s-i*). A Ejemplo : En el juego saber, (A, A). B C A 1,1 1,0 B 0,1 2,2 1,0 hay un único equilibrio de Nash, a 2,2 C 0,1 2,2 2,2 Teoría de Juegos En cambio, en el juego 1,1 1,1 no hay ningún equilibrio de Nash. 1,1 1,1 Definición : En la extensión mixta, G*, de un juego dado en forma normal, G, una situación (1*, …, n*) * es un “equilibrio de Nash” si i, i i , i (s*) i (i , -i*). Definición: En un juego G dado en forma normal se llama “correspondencia de respuesta óptima del jug i ” a la correspondencia: i : -i i i { i i : i ( i, i ) i ( i , i ) i i } . Nótese que esta correspondencia puede fácilmente extenderse al dominio mediante: i i( i ). En adelante esta extensión se denotará por i . Entonces, se define también la “correspondencia de respuesta óptima” del juego como la : dada por := 1 … n . Así, resulta que * es equilibrio de Nash si, y sólo si, * (*). Ejemplo: En el juego 0, 2 -1, -1 0, 2 1, 1 se encuentra que 1 : 2 1 2 1 (2) := { 1 1 : 1 (1, 2 ) 1 (1, 2 )1 1 }. {(0,1)}, si 21 [0,1 / 2[ Por lo tanto, resulta ser 1 (2) = cualq. si 21 1 / 2 {(1,0)}, si ]1 / 2,1], 21 pues 1(1 , 2) = (1 - 11)(1 – 2 21). {(0,1)}, si 11 1 Similarmente sale que 2 (1) = , cualq. si 11 1 pues 2(1 , 2) = (2 11 + 12) – 2 12 21) . Estas correspondencias pueden representarse gráficamente mediante: 6 Teoría de Juegos 7 La intersección de ellas dará los equilibrios de Nash: {((0, 1), (0, 1))}{((1, 0), 2): 0 21 1}. Teorema (Nash): La extensión mixta de cualquier juego finito posee al menos un equilibrio de Nash en estrategias mixtas. Teorema (de Nash) Cualquiera que sea el juego finito en forma normal, G, su extensión mixta, G*, posee al menos un equilibrio de Nash. Hay una extensión del teorema de Nash: Teorema (Glicksberg): Si G es un juego en forma normal tal que todos los jugadores tienen conjuntos de estrategias compactos en espacios euclidianos y sus funciones de pagos son continuas, entonces la extensión mixta del juego posee al menos un equilibrio de Nash. Nota: Los teoremas anteriores sólo garantizan la existencia de equilibrios de Nash en la extensión mixta del juego pero no en el juego mismo; para esto se tiene el siguiente teorema. Teorema (Debreu, Fan y Glicksberg) Si en el juego en forma normal, G, todos los conjuntos de estrategias puras son subespacios compactos y convexos de espacios euclidianos y todas las funciones de pagos a los jugadores son cuasicóncavas en sus estrategias propias (i.e. i, s-i , i (,s-i) es cuasicóncava); entonces hay al menos un equilibrio de Nash para G. Teoría de Juegos 8 Refinamientos del equilibrio de Nash En el siguiente ejemplo hay dos equilibrios de Nash, a saber (B, a) y (A, b). Pero el primero posee lo que se conoce como una amenaza increíble, pues el jug 1 elige su acción B porque cree en la amenaza del jug 2 de elegir su acción a. Sin embargo, el jug 1, siendo racional, debiera anticipar que si él eligiese su acción A, el jug 2 habría de elegir su acción b en lugar de a. El segundo equilibrio de Nash sí es creíble, pues resulta de una inducción regresiva. Se dice también que dicho equilibrio es perfecto en subjuegos debido a que él induce un equilibrio de Nash en cada subjuego. Equilibrios perfecto y propio Definición: En un juego en forma normal, G, una estrategia pura, si , es “débilmente dominada” si i i,(s-i , i (i , s-i ) i(si , s-i) ) (s-i´, i (i , s-i´) > i (si , s-i´). Definición: En un juego en forma normal, G, un perfil estratégico, *, es un “equilibrio perfecto (ó “de mano trémula”)” si (k) tal que: 1º) k, k es “completamente mezclado” (i.e. i, si , ik (si ) 0 ) 2º) (k) 0 tal que k, i, ( i (si , ki ) i (s´i , ki ) ik (si ) k ) 3º) * = limk (k). Ejemplos: 1) El único equilibrio de Nash del Dilema del prisionero es un equilibrio perfecto, pues con k := ((1 – 1/2k, 1/2k ), (1 – 1/2k, 1/2k)) y k := 1/k se cumplen las tres condiciones de la definición. 2) En el juego bimatricial 0, 0 0, 0 0, 0 1, 1 hay dos equilibrios de Nash pero sólo uno de ellos es perfecto. Teorema: Todo juego finito en forma normal o estratégica posee al menos un equilibrio perfecto. Teoría de Juegos 9 Teorema: Si * es un equilibrio perfecto de un juego finito en forma normal, entonces * (si) = 0, estrategia pura, si, que sea débilmente dominada. Teorema: Genéricamente, todo equilibrio de Nash de un juego finito en forma normal es perfecto. Definición: En un juego en forma normal, G, un perfil estratégico, *, es un “equilibrio propio” si (k) tal que: 1º) k, k es “completamente mezclado” (i.e. i, si , ik (si ) 0 ) 2º) (k) 0 tal que k, i, ( i (si , ki ) i (s´i , ki ) ik (si ) k ik (si ) ) 3º) * = limk (k). Notas : (1) Todo equilibrio propio es equilibrio perfecto (su demostración es un ejercicio). (2) Si en un equilibrio de Nash todas sus estrategias mixtas son completamente mezcladas, entonces él es un equilibrio propio. II Juegos cooperativos Definición: Un “juego cooperativo n-personal con pagos transferibles” (jcpt-n) es una v : P(N) IR, donde N := INn. Definición: Una “imputación” en un jcpt-n, v, es cualquier x de IRn ; ella es “factible” si v (N) = x (N) := n x . Dado cualquier M N, se dice que i 1 x es “M-factible” si v (M) = x (M). El conjunto de imputaciones de v es Iv . Definición: El “núcleo” de un jcpt-n , v, es {x Iv : M N, x (M) v (M)}. Se lo denota por C(v). , si card( M ) 2 Ejemplo: Con n = 3, sea v tal que v (N) = 1 v (M) = 0, si card( M ) 1 con [0, 1]. Entonces, C(v) si, y sólo si, [0, 2/3]. Para cada coalición M y para cada jugador i, sea i (M) := v(M{i}) – v(M), el aporte de i a M. Definción: Un jugador i es un “maniquí” si i (M) = v({i}), M tal que i M. Definición: Los jugadores i y j son “intercambiables” si i (M) = j (M), M tal que {i, j} M = . Se pregunta si habrá una función, , que asigne a cada jcpt-n un vector de IRn de manera que se satisfagan las siguientes condiciones. Axioma de simetría: Si en v son intercambiables i y j, entonces i(v) = j(v). Teoría de Juegos 10 Axioma del maniquí: Si en v el jugador i es un maniquí, entonces i(v) = v({i}). Axioma de aditividad: Para cualesquiera dos jcpt-n, u y v, ha de ser (u +v) = (u) + (v). La respuesta a la pregunta anterior es dada por el siguiente teorema. Teorema (de Shapley): Dado un jcpt-n, v, existe una única función que satisfaga los axiomas de simetría, del maniquí y de aditividad, y ella es dada por la expresión conocida como “valor de Shapley”: i (v) = (q(m)i (M {i})) , donde q(m) := (m-1)!(n-m)!/n! M N Ejemplo: Con N = {1, 2}, si v ({1}) = 5, v ({2}) = 7 y v (N) = 20; entonces (v) = (9, 11).