¿Cómo jugar?

Anuncio
TEORÍA DE JUEGOS
¿Cómo
Có
jjugar??
¿Estrategias puras o mixtas?
Parte I
J g de
Juegos
d suma cero
Bart y Lisa aplican
p
maximin:
L1 = 0 L2 = 1 L3 = 2
B1 = 0
B2 = 1
B3 = 2
−5
2
3
2
3
3
−5
−5
2
B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2
i
⎝ j
⎠
L * = min max (π ij ) = min (3,3, 2 ) = 2
j
(
i
)
J g de
Juegos
d suma cero
Bart y Lisa aplican
p
maximin:
Solución estrategias puras:
B*=B3, L*=L3, Л=2
Punto de Silla :
(
max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij )
j
i ⎝ j
i
⎠
)
J g de
Juegos
d suma constante
t t
y Punto de silla: condición necesaria y suficiente
para encontrar equilibrio en estrategias puras
⎧⎪π io , j ≥ π io , jo ∀j = 1K m
∃io , jo / ⎨
⎪⎩π i , jo ≤ π io , jo ∀i = 1K n
Punto de silla
¿Y si no hay un punto de silla?
Lisa
Papel
Tijeras
Piedra
Papel
0,0
-1,1
1,1
1,-1
1,
1
Tijeras
1,-1
1,
1
0,0
-1,1
1,1
Piedra
-1,1
1,1
1,-1
1,
1
0,0
Bart
Definiciones
y
y
y
Estrategia mixta:
jugada con una probabilidad p
E t t i pura:
Estrategia
jugada con una probabilidad p=1
Distribución de probabilidad subjetiva:
un jugador cree que el otro elegirá la estrategia k
con probabilidad лk,
¿Y si no hay un punto de silla?
Estrategia mixta:
y Distribución de p
probabilidad asociada con el conjunto
j
de estrategias puras de un jugador.
P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1;
i
pi es la probabilidad de jugar la estrategia Ai
Estrategias mixtas
y Juego bipersonal
y B jjuega
g Bi con p
probabilidad pi ((P))
y L juega Lj con probabilidad qj (Q)
Def. Valor esperado del juego:
(
)
E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j
j
i
i
j
p, q son probabilidades subjetivas
Piedra, papel
Piedra,
papel,, tijeras
tijeras::
deja que adivine…
adivine…
Pb(rock)=1
"Good ol' rock.
Nuthin' beats
that!"
TEORÍA DE JUEGOS
¿Cómo
Có
jjugar??
Parte II
Ejemplo: cara / cruz
Fila y Columna escriben cara o cruz en un papel
y Si escriben
ib llo mismo,
i
Columna
C l
lle paga 1 a Fila
Fil
y Si escriben algo diferente, Fila le paga 1 a
Columna
y
Ejemplo: cara / cruz
Estrategia mixta:
y Fila juega cara con
probabilidad 2/3
y Columna juega cruz
cru
¿Cuál es el valor
esperado
d ddell juego dde
Fila?
Columna
Cara
Cruz
Cara
1,-1
-1,1
Cruz
-1,1
1,-1
Fil
Fila
Teorema Minimax (I)
y En un juego bipersonal de suma constante, el valor
p
del juego
j g tiene siempre,
p , al menos un
esperado
punto de silla:
(
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
Q
P ⎝ Q
P
⎠
Todo juego bipersonal de suma constante tiene
solución
Equilibrio en estrategias mixtas
Teorema:
y En un juego bipersonal de suma constante, El valor esperado del juego
tiene siempre, al menos un punto de silla:
(
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
Q
P ⎝ Q
P
⎠
Todo juego bipersonal de suma constante tiene solución
Juegos
y Cooperativos:
y Coalición
y Negociación de las reglas del juego
y Coordinación
y Amenazas y promesas confiables
y No cooperativos:
y N personas actúan independientemente
y No hay coaliciones posibles
y Acciones racionales
Solución
ó juegos no cooperativos
y Minimax
y Todo juego bipersonal de suma cero tiene una estrategia mixta
óptima
p
para
p cada jugador
j g
y Espera lo mejor, prepárate para lo peor
y Equilibrio de Nash
y Solución a una clase más amplia de juegos no cooperativos
y Muestra que puede haber más de una solución
y La extiende a un número finito de jugadores
¿Cómo jugar?
jugar?
¿Cuál es la solución del juego?
juego?
y Minimax
y Equilibrio de Nash
y Equilibrio en estrategias dominantes
y Eliminación de estrategias dominadas
y Inducción hacia atrás
¿Qué
é es un equilibrio?
Columna
Cara
Cruz
Cara
2,1
0,0
Cruz
0,0
1,2
Fila
Juego bipersonal,
bipersonal, no cooperativo
Definiciones:
F: conjunto de estrategias mixtas de Fila
pf = probabilidad de jugar la estrategia f Є F
C: conjunto de estrategias mixtas de Columna
pc = probabilidad de jugar la estrategia c Є C
Objetivo:
Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye
un equilibrio
S l ió
Solución
pf
pc
y Función
F ió pagos Fil
Fila: uf(f,c)
(f )
y Лc , Лf,f son las probabilidades subjetivas
que f y c tienen sobre las decisiones del
otro
y pf,pc: estrategias
t t i mixtas
i t
y pfЛc: probabilidad –desde
desde el punto de
vista de f- de que se juegue la estrategia
(f,c)
S l ió
Solución
y Fila escoge la distribución de probabilidad (pf)
que maximiza el valor esperado de sus pagos:
E[pagosf] = ∑f∑cpfЛcuf(f,c)
(f c)
y Columna busca maximizar:
E[pagosc] = ∑f∑cpcЛfuc(f,c)
Equilibrio de Nash
Equilibrio de Nash: El equilibrio de Nash consiste en las
conjeturas sobre la probabilidad de ocurrencia de las
estrategias (Лc ,Л
Лf, ) y la probabilidad de que dichas
estrategias sean elegidas (pf, pc), tal que:
1
1.
L conjeturas
Las
j t
son correctas:
t pf = Лf, pc = Лc; y
2. Cada jugador escoge (pf) y (pc) de forma que
maximiza su utilidad esperada, dadas sus conjeturas.
E ilib i d
Equilibrio
de N
Nash
h
Estrategias puras
Un equilibrio de Nash en estrategias puras es un par (f*,
(f , cc*)) tal que
uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y
uc(f*,
(f* c*)
*) ≥ uc(f*,c)
(f* ) para cada
d estrategia
t t i c dde C
C.
¿Cuál es el equilibrio de Nash en
estrategias puras?
Columna
Cara
Cruz
Cara
20,80
70,30
Cruz
90,10
30,70
Fila
Teorema Existencia (Nash)
y Suponga que un juego tiene un número finito de estrategias
para cada jugador. Entonces existe al menos un equilibrio de
Nash
as en
e estrategias
est ateg as mixtas
tas
¿Cuál es la estrategia mixta de
equilibrio?
Columna
Cara
Cruz
Cara
20,80
70,30
Cruz
90,10
30,70
Fila
Equilibrio en estrategias mixtas
Columna
c
s
c
20,80
70,30
s
90,10
30,70
Fila
Estrategias
E
i
Fila:
Cara, pc; Sello, ps
Columna:
Cara, Лc; Sello Лs
E[ pagos fila ] = ∑∑ prπ c u (r , c)
r
c
E[ pagos fila
fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30)
E[ pagoscol ] = ∑∑ prπ c u (r , c)
r
c
E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)
Planteamiento del problema
fila :
max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30)
s.t
pc + p s = 1
pc , p s ≥ 0
columna :
max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)
s.t
πc +πs =1
π c ,π s ≥ 0
Planteamiento del problema (II)
fila :
fil
max
[ pc (π c * 20 + π s * 70)
columna :
max
[π c ( pc * 80 + ps *10)
+ ps (π c * 90 + π s * 30)]
+ π s ( pc * 30 + ps * 70)]
s.t
p s = 1 − pc
π s = 1− π c
[ pc (π c * 20 + π s * 70)}
+ (1 − pc )(π c * 90 + π s * 30)]
∂u
∂π
≤ 0,
=0
∂pc
∂pc
− 70π c + 40π s ≤ 0
s.t
max
[π c ( pc * 80 + ps *10)
+ (1 − π c )( pc * 30 + ps * 70)]
∂u
∂p
≤ 0,
=0
∂π c
∂π c
50 pc − 60 ps ≤ 0
Función de reacción
(Mejor respuesta)
Лs
Mejor respuesta de fila a
cualquier
l i estrategia
t t i d
de
columna
-70Л c+40Л s=0
fila :
− 70π c + 40π s = 0
πc,π s ≥ 0
πc + πs = 1
7/11
4/11
Лc
Л c+ Л s=1
Equilibrio en estrategias mixtas
ps
Mejor respuesta de
columna
l
a cualquier
l i
estrategia de fila
50p c-60p s=0
columna :
50 pc − 60 ps = 0
5/11
pc + p s = 1
pc , p s ≥ 0
6/11
pc
p c+ p s=1
Equilibrio de Nash
Columna
Л c=4/11
cara
cruz
cara
20,80
70,30
cruz
90,10
30,70
p c=6/11
Fila
Batalla de los sexos:
sexos:
¿Cuántos equilibrios de Nash hay?
Ananías
misa
fútbol
misa
4,1
0,0
fútbol
00
0,0
14
1,4
Tola
El dilema del prisionero II
y Wally y Dilbert son compañeros de trabajo
y Cada uno debe evaluar el desempeño del otro
y La calificación determinará un aumento de sueldo
y El aumento será mayor si el propio desempeño es superior al del otro
Dilbert
Wally
El dilema del prisionero II
Dilbert
Wally
“Rat out”
(denigrar)
Alabar
“Rat out”
(denigrar)
0,0
5,-1
Alabar
-1,5
1,1
Solución
ó por dominación
ó
y Definiciones:
y Estrategia dominante
y Estrategia débilmente dominante
y Estrategia dominada
y Eliminación iterada de estrategias dominadas
Dominación
ó
y ss’i domina estrictamente a si si y solo sí:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i
z
s*i domina débilmente a si si y solo sí:
u i ( s * i , s − i ) ≥ u i ( s i , s − i ),
) ∀ s− i ∈ S −i
y
u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i
Dominación
ó estricta
y s’i es una estrategia estrictamente dominante
ppara el jjugador
g
i si:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i
s’i es superior a todas las otras estrategias de i
E t t gi estrictamente
Estrategia
ti t
t dominante
d i
t
Dilbert
W ll
Wally
“Rat out”
(denigrar)
Alabar
“Rat
Rat out”
out
(denigrar)
0,0
5,-1
Alabar
-1,5
1,1
Solución: {Rat-out, Rat-out}
Equilibrio y estrategias dominantes
y Dilema del prisionero II:
y Rat-Out estrictamente dominante para Wally y Dilbert
y {Rat-out, Rat-out} es el equilibrio
y El equilibrio
q
en estrategias
g dominantes es el equilibrio
q
de Nash
El dilema del prisionero II
Dominación
ó débil
é
y s’i es una estrategia débilmente dominante para el jugador i si
s’i domina débilmente a todas las otras estrategias de i
z
s*i domina débilmente a si si y solo sí:
u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i
y
u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i
Ejemplo: estrategia débilmente
dominante
2
1
Arriba
Izquierda
Derecha
7,3
5,3
Solución: {Arriba, Izquierda}
Abajo
7,0
3,-1
Estrategias dominantes
y Las estrategias dominantes definen la solución del juego
y Racionalidad:
y Los jugadores prefieren las estrategias dominantes,
dominantes si existen
M h jjuegos no ti
Muchos
tienen estrategias
t t i
dominantes
Dominación
ó
Et t i d
Estrategia
dominada:
i d s**i es dominada
d i d por s’i si:
i
ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ),
) ∀si
ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ),
) ∃sˆ−i
Estrategia no dominada s*i es no dominada si
no existe s’i tal que:
ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i
Solución
ó por dominación
ó
y Estrategias no dominadas preferibles a las dominadas
y Un jugador racional no juega estrategias dominadas
y Un
U jugador
j d racional
i l no espera que los
l otros
t jjuegen
estrategias dominadas
Elimine estrategias indeseables
Ejemplo: eliminación iterativa de
Ejemplo:
estrategias dominadas
Columna
Izquierda
Derecha
Arriba
11
1,1
01
0,1
Medio
0,2
1,0
Abajo
0,-1
0,0
Fila
Problemas de la eliminación iterativa de
estrategias dominadas
y Capas de racionalidad
y Una estrategia se vuelve dominada en la ronda de eliminación
#
#15?
y El orden de eliminación importa
y Estrategias débilmente dominantes
y Múltiples resultados
y Estrategias débilmente dominantes
y No existencia de estrategias dominadas
Ejemplo: eliminación iterativa de
estrategias dominadas
Columna
Izquierda
Centro
Derecha
Arriba
4,5
1,6
5,6
Medio
3,5
2,5
5,4
Abajo
j
2,5
,
2,0
,
7,0
,
Fil
Fila
Ejemplo: eliminación iterativa de
Ejemplo:
estrategias dominadas
Columna
Izquierda
Centro
Mala
Arriba
1,-1
-1,1
0,-2
Medio
-1,1
1,-1
0,-2
Mala
-2,0
,
-2,0
,
-2,-2
,
Fil
Fila
¿Cuál es la estrategia dominante?
dominante?
Columna
C
Cara
S ll
Sello
Cara
1,-1
-1,1
Sello
-1,1
1,-1
Fila
¿Porqué podemos determinar las estrategias
dominadas usando únicamente los pagos?
Competencia a la Bertrand
y Dos firmas en un mercado pueden cargar precios alto,
alto
medio, bajo
y Si cargan el mismo precio
precio, comparten el mercado
equitativamente
y Quien cargue el menor precio,
precio gana todo el mercado
Competencia a la Bertrand
Firma 2
Alto
Medio
Bajo
Alto
o
6,6
0,10
0,
0
0,8
Medio
10,0
5,5
0,8
Bajo
8,0
8,0
4,4
Firma 1
Descargar