Teoría de Juegos 1 X

Anuncio
Teoría de Juegos
Problema general de optimización:
Dados un conjunto X   y una función real f : X  IR,
se quiere maximizar f (x) sujeto a x  X.
Problema típico de teoría de juegos:
Dados los conjuntos X1 , …, Xn ; y las funciones reales
f1 : X1  …  Xn  IR, …, fn : X1  …  Xn  IR ; se quiere, … ¿qué?
1) El dilema del prisionero
La policía ha prendido a dos sospechosos sabiendo que al menos uno de ellos ha
cometido el delito en cuestión, y los tiene incomunicados.
Ha de presentarles un documento en el que se confiesa la comisión del delito para que,
si lo desean, la firmen.
Las consecuencias de sus decisiones aparecen en la tabla siguiente.
firma
firma -1, -1
rehúsa -2, 1
rehúsa
1, -2
0, 0
Su representación en forma extendida es:
2) La batalla de los sexos
Él y ella se aman locamente y quieren decidir en dónde se divertirán esta noche.
Él prefiere el box al ballet pero ella al revés.
Ambos querrían la compañía de su cónyuge.
Las consecuencias de sus decisiones aparecen en la tabla siguiente.
ballet
ballet 2, 1
box
-1, -1
box
0, 0
1, 2
1
Teoría de Juegos
Su representación en forma extendida es:
3) El reparto de la torta.
Una torta ha de repartirse entre dos niños.
Cada una puede pedir una fracción (mitad, 2 tercios, todo, nada, etc.) de ella.
Si la suma de ambas fracciones no pasa de 1, ambos reciben lo pedido; pero si dicha
suma pasa de 1, ninguna recibe nada.
 xi , si xi x j  1
Entonces, las funciones de pagos de los jugadores son: i (xi , xj) := 
.
0, si xi x j  1
Su representación en forma extendida requiere un continuo tridimensional.
I.
Juegos no-cooperativos
Representación en forma extensiva

componentes:
- conj. de jugadores: N = {1, …, n} ó {0, 1, …, n};
- conj. de actos posibles: A ;
- orden de dichos actos;
- conocimiento presente, en cada momento, de cada jugador,
- consecuencias finales para los jugadores

el orden de los actos: (K, R), donde K es un conjunto no vacío de nodos del
árbol representativo del juego; y R es una relación binaria en K, “precedencia”,
i.e., irreflexiva y transitiva
R determina en K la relación P de “precedencia inmediata” :
xPy  xRy  z, (xRz  zRx).
Así, P(x) := {y de K: yPx} es conjunto de “predecesores inmediatos” de x, y
2
Teoría de Juegos
3
P-1(x) := {z de K: xPz} es conjunto de “sucesores inmediatos” de x.
Asunción 1: ! x0 en K, P(x0) = . x0 es el “nodo inicial”.
Asunción 2: x de K \ { x0}, ! m de , ! (x0 , x1 , …, xm) tal que x = xm  x0 
P(x1)  …  xm-1  P(xm). Una sucesión tal es una “senda”.
Consecuencia inmediata: x  x0 , 1 =  P(x).
Asunción 3: No existe ninguna senda de longitud infinita y toda senda es
subsenda de otra que termina en un nodo carente de sucesores inmediatos, es
decir, que con
Z := {x de K: P-1(x) = }, conj. de nodos terminales, senda (x0 , x1 , …, xm),
una senda (x0 , z1 , …, zk) tal que k  m  zk  Z  z1 = x1  …  zm = xm .
El orden de los actos es determinado así: Hay una partición, {K0 , K1 , …, Kn},
de K \ Z. Para i > 0, Ki es el conjunto de nodos en los que toca jugar al jug i.
Hay una correspondencia, A, que a cada nodo, x, asigna el conjunto A(x) de actos
disponibles al jug i .
Además, cada A(x) es biyectivo con P-1(x); ella indica a qué nodo sucesor
inmediato de x llevará el acto que el jugador decida realizar.

El conocimiento presente de cada jugador es determinado por particiones
dadas, Hi , de los conjuntos Ki . Así, si en un momento el juego se encuentra en
un nodo de un elemento h de la partición Hi de Ki , entonces el jug i no sabrá en
qué nodo de h se encuentra el juego. Por ello, ha de asumirse que la
correspondencia A es tal que A(x) = A(y)  {x, y}  h. Se llaman conjuntos de
información del jug i los elementos de la partición Hi de Ki .

Consecuencias finales: cada jugador (no natura) posee una relación de
preferencias (binaria transitiva y total) en el conjunto de nodos terminales Z.
Según la teoría de la utilidad esperada de von Neumann, puede asumirse que
dichas relaciones de preferencias están representadas por funciones de utilidad
lineal si es que las preferencias son continuas e independientes. Denótense
dichas funciones de utilidad por 1 , …, m.
En definitiva, un juego no cooperativo n-personal en forma extensiva se
representará por el quíntuple ordenado ( (Ki )0n , R, (H )0n , ( A( x))xK\Z , ( ( z) zZ ) ) si
juega natura, y por ( (Ki )1n , R, (H )1n , ( A( x))xK \ Z , ( ( z) zZ ) ) si no juega natura.
`
Representación de un juego en forma estratégica o normal
Teoría de Juegos
4
En un juego n-personal en forma extensiva, , se definen las estrategias de los
jugadores como indicaciones precisas acerca de cómo hay que jugar cada vez que sea su
turno.
Definición: 1) Una “estrategia” del jug i es cualquier función, si , definida en Hi y que
tome valores en Ai :=  A(h) , debiendo cumplirse que h de Hi , si (h)  A(h).
hH i
2) Se denotará el conjunto de todas las posibles estrategias del jug i por Si .
3) Un “perfil de estrategias” es cualquier (s1 , …, sn)  S1  …  Sn .
Cada perfil de estrategias determina una senda que acaba en un nodo terminal, y así, hay
una función  : S1  …  Sn  Z que asigna a cada perfil de estrategias un único nodo
terminal.
Como en cada nodo terminal ya está determinado el vector  (z) = (1(z) , …, m(z)),
puede considerarse la función compuesta * :=    : S1  …  Sn  ; en este contexto
de representación estratégica, la función * que acaba de definirse será representada
simplemente por .
Con esta notación la representación en forma normal o estratégica de un juego no
cooperativo n-personal es: G := ((Si )1n , ( i )1n ) .
Extensión mixta de un juego en forma normal
Una estrategia mixta del jug i en el juego n-personal G es cualquier distribución
probabilística sobre su conjunto Si de estrategias (en adelante llamadas “puras”).
Así, si i es una estrategia mixta del jug i, entonces, con ri :=  Si , será
i = (i1 , …,  iri ), donde  iq := i (siq) q de {1, …, ri}.
El conjunto de todas las estrategias mixtas del jug i se representa por i , el
simplejo ri del espacio euclídeo de dimensión ri .
La extensión mixta del juego G se define como G* := ((i )1n , ( i)1n ) , donde las funciones
i se definen como los pagos esperados al jug i según (1 , …, n)   Esto es, que
 i () =
r1 ,...,rn
 ( s
i
q1 ,...q n 1
1q1
,...,snq n )1q1 ... nq n = E[i  ].
En adelante, en vez de escribir  i (), se escribirá simplemente i () sin temor a
confusión.
Dominación y dominación iterativa
5
Teoría de Juegos
Ejemplo: En el juego representado en forma normal o estratégica siguiente,
A
B C
X
2,7 2,0 2,2
Y
7,0
Z
4,1 0,4 1,3
1,1
3,2
, el jug 1 nunca jugará Z, ya que siempre le va mejor con Y.
Puede, pues, asumirse que el juego realmente se reduce al siguiente
A
B C
X
Y
2,7 2,0 2,2
. En éste, el jug 2 nunca juega B pues siempre le va mejor con C.
7,0 1,1 3,2
A
Así, el juego se reduce al X
Y
le irá mejor con Y.
C
2,7 2,2 . Aquí el jug 1 nunca jueg X, pues siempre
7,0 3,2
Entonces, el juego se reduce aún más:
A
Y
C
7,0 3,2
.
Finalmente, el jug 2 ve que con C le va mejor que con A, por lo que el juego termina
C
siendo
, y ya se puede esperar que en el juego inicial, los jugadores elijan
Y 3,2
respectivamente sus estrategias Y y C.
Definición: Una estrategia pura, si , del jug i, es “dominada” si  i  i tal que si de S-i , i (i , s-i) > i (si, s-i). Se dice también que i domina a si.
Nota : Si la estrategia pura si es dominada, entonces cualquier estrategia mixta, i
tal que asigne probabilidad positiva a si será también “superada” por alguna otra
estrategia mixta, i.e. i tal que s-i de S-i , i (i , s-i) > i (i, s-i).
Equilibrios de Nash
Definición: En un juego G dado en forma estratégica o normal, un perfil estratégico
o situación, s*  (s1* , …, sn*), es un “equilibrio de Nash” si ningún jugador puede,
unilateralmente actuando, incrementar el pago que le corresponde por s*. Dicho de
modo formal, si i si  Si , i (s*)  , i (si , s-i*).
A
Ejemplo : En el juego
saber, (A, A).
B
C
A 1,1 1,0
B 0,1 2,2
1,0
hay un único equilibrio de Nash, a
 2,2
C 0,1  2,2
2,2
Teoría de Juegos
En cambio, en el juego
1,1  1,1
no hay ningún equilibrio de Nash.
 1,1 1,1
Definición : En la extensión mixta, G*, de un juego dado en forma normal, G, una
situación (1*, …, n*)  * es un “equilibrio de Nash” si i, i  i , i (s*) 
i (i , -i*).
Definición: En un juego G dado en forma normal se llama “correspondencia de
respuesta óptima del jug i ” a la correspondencia:
i : -i  i
 i  { i  i :  i ( i, i )   i ( i , i ) i  i } .
Nótese que esta correspondencia puede fácilmente extenderse al dominio 
mediante:    i  i(  i ). En adelante esta extensión se denotará por i .
Entonces, se define también la “correspondencia de respuesta óptima” del juego
como la  :    dada por  := 1  …  n . Así, resulta que * es equilibrio de
Nash si, y sólo si, *   (*).
Ejemplo: En el juego
0, 2
-1, -1
0, 2
1, 1
se encuentra que
1 : 2  1
2  1 (2) := { 1  1 : 1 (1, 2 )  1 (1, 2 )1  1 }.
{(0,1)}, si  21  [0,1 / 2[

Por lo tanto, resulta ser 1 (2) =  cualq. si  21  1 / 2
 {(1,0)}, si  ]1 / 2,1],
21

pues 1(1 , 2) = (1 - 11)(1 – 2 21).
 {(0,1)}, si 11  1
Similarmente sale que 2 (1) = 
,
 cualq. si 11  1
pues 2(1 , 2) = (2 11 + 12) – 2 12 21) .
Estas correspondencias pueden representarse gráficamente mediante:
6
Teoría de Juegos
7
La intersección de ellas dará los equilibrios de Nash:
{((0, 1), (0, 1))}{((1, 0), 2): 0  21  1}.
Teorema (Nash): La extensión mixta de cualquier juego finito posee al menos un
equilibrio de Nash en estrategias mixtas.
Teorema (de Nash) Cualquiera que sea el juego finito en forma normal, G, su
extensión mixta, G*, posee al menos un equilibrio de Nash.
Hay una extensión del teorema de Nash:
Teorema (Glicksberg): Si G es un juego en forma normal tal que todos los jugadores
tienen conjuntos de estrategias compactos en espacios euclidianos y sus funciones
de pagos son continuas, entonces la extensión mixta del juego posee al menos un
equilibrio de Nash.
Nota: Los teoremas anteriores sólo garantizan la existencia de equilibrios de Nash
en la extensión mixta del juego pero no en el juego mismo; para esto se tiene el
siguiente teorema.
Teorema (Debreu, Fan y Glicksberg) Si en el juego en forma normal, G, todos los
conjuntos de estrategias puras son subespacios compactos y convexos de espacios
euclidianos y todas las funciones de pagos a los jugadores son cuasicóncavas en sus
estrategias propias (i.e. i, s-i , i (,s-i) es cuasicóncava); entonces hay al menos
un equilibrio de Nash para G.
Teoría de Juegos
8
Refinamientos del equilibrio de Nash
En el siguiente ejemplo
hay dos equilibrios de Nash, a saber (B, a) y (A, b).
Pero el primero posee lo que se conoce como una amenaza increíble, pues el jug 1
elige su acción B porque cree en la amenaza del jug 2 de elegir su acción a. Sin
embargo, el jug 1, siendo racional, debiera anticipar que si él eligiese su acción A, el
jug 2 habría de elegir su acción b en lugar de a.
El segundo equilibrio de Nash sí es creíble, pues resulta de una inducción regresiva.
Se dice también que dicho equilibrio es perfecto en subjuegos debido a que él
induce un equilibrio de Nash en cada subjuego.
Equilibrios perfecto y propio
Definición: En un juego en forma normal, G, una estrategia pura, si , es “débilmente
dominada” si i i,(s-i , i (i , s-i ) i(si , s-i) )  (s-i´, i (i , s-i´) > i (si , s-i´).
Definición: En un juego en forma normal, G, un perfil estratégico, *, es un
“equilibrio perfecto (ó “de mano trémula”)” si  (k) tal que:
1º) k, k es “completamente mezclado” (i.e. i, si , ik (si )  0 ) 
2º) (k) 0 tal que k, i, (  i (si , ki )   i (s´i , ki )   ik (si )   k ) 
3º) * = limk (k).
Ejemplos:
1) El único equilibrio de Nash del Dilema del prisionero es un equilibrio perfecto,
pues con k := ((1 – 1/2k, 1/2k ), (1 – 1/2k, 1/2k)) y k := 1/k se cumplen las tres
condiciones de la definición.
2) En el juego bimatricial
0, 0 0, 0
0, 0 1, 1
hay dos equilibrios de Nash pero sólo uno de ellos es perfecto.
Teorema: Todo juego finito en forma normal o estratégica posee al menos un
equilibrio perfecto.
Teoría de Juegos
9
Teorema: Si * es un equilibrio perfecto de un juego finito en forma normal,
entonces * (si) = 0, estrategia pura, si, que sea débilmente dominada.
Teorema: Genéricamente, todo equilibrio de Nash de un juego finito en forma
normal es perfecto.
Definición: En un juego en forma normal, G, un perfil estratégico, *, es un
“equilibrio propio” si  (k) tal que:
1º) k, k es “completamente mezclado” (i.e. i, si , ik (si )  0 ) 
2º) (k) 0 tal que k, i, (  i (si , ki )   i (s´i , ki )   ik (si )   k ik (si ) ) 
3º) * = limk (k).
Notas :
(1) Todo equilibrio propio es equilibrio perfecto (su demostración es un ejercicio).
(2) Si en un equilibrio de Nash todas sus estrategias mixtas son completamente
mezcladas, entonces él es un equilibrio propio.
II Juegos cooperativos
Definición: Un “juego cooperativo n-personal con pagos transferibles” (jcpt-n) es
una v : P(N)  IR, donde N := INn.
Definición: Una “imputación” en un jcpt-n, v, es cualquier x de IRn ; ella es
“factible” si v (N) = x (N) :=
n
 x . Dado cualquier M  N, se dice que
i
1
x es “M-factible” si v (M) = x (M). El conjunto de imputaciones de v es Iv .
Definición: El “núcleo” de un jcpt-n , v, es {x  Iv : M  N, x (M)  v (M)}. Se lo
denota por C(v).
  , si card( M )  2
Ejemplo: Con n = 3, sea v tal que v (N) = 1  v (M) = 
0, si card( M )  1
con   [0, 1]. Entonces, C(v)   si, y sólo si,   [0, 2/3].
Para cada coalición M y para cada jugador i, sea i (M) := v(M{i}) – v(M), el
aporte de i a M.
Definción: Un jugador i es un “maniquí” si i (M) = v({i}), M tal que i M.
Definición: Los jugadores i y j son “intercambiables” si i (M) = j (M), M tal
que {i, j}  M = .
Se pregunta si habrá una función, , que asigne a cada jcpt-n un vector de IRn de
manera que se satisfagan las siguientes condiciones.
 Axioma de simetría: Si en v son intercambiables i y j, entonces
i(v) = j(v).
Teoría de Juegos


10
Axioma del maniquí: Si en v el jugador i es un maniquí, entonces
i(v) = v({i}).
Axioma de aditividad: Para cualesquiera dos jcpt-n, u y v, ha de ser (u +v)
= (u) + (v).
La respuesta a la pregunta anterior es dada por el siguiente teorema.
Teorema (de Shapley): Dado un jcpt-n, v, existe una única función  que satisfaga
los axiomas de simetría, del maniquí y de aditividad, y ella es dada por la expresión
conocida como “valor de Shapley”:
i (v) =  (q(m)i (M  {i})) , donde q(m) := (m-1)!(n-m)!/n!
M N
Ejemplo: Con N = {1, 2}, si v ({1}) = 5, v ({2}) = 7 y v (N) = 20; entonces
(v) = (9, 11).
Documentos relacionados
Descargar