teoria de juegos

Anuncio
TEORIA DE JUEGOS
M. En C. Eduardo Bustos
Farías
1
Teoría de juegos
„
„
Es una herramienta matemática que analiza las
interrelaciones entre dos o mas individuos, y busca un
modelo de actuación óptimo.
Desarrollada por Von Neuman & Morgenster en su
libro: “The Theory of Games Behavior” (1944).
2
Elementos
„
„
„
„
„
„
„
Jugadores
No jugadores (“naturaleza”)
Acciones
Información
Estrategias
Resultados
Equilibrio
3
Supuestos
Los participantes en la relación:
•
•
•
•
•
Son conscientes de ésta
Buscan el máximo provecho
Actúan racionalmente
Existe un costo de la relación y se obtiene un
beneficio de ella.
Se supone que el jugador escogerá la elección
óptima
4
Juegos
„
„
„
„
„
Un juego es una situación competitiva entre n
personas o grupos, denominados jugadores
Se realiza bajo un conjunto de reglas
previamente establecidas con consecuencias
conocidas
Las reglas definen las actividades elementales o
movimientos del juego.
Pueden permitirse diferentes movimientos para
los distintos jugadores , pero cada jugador
conoce los movimientos de que dispone cada
jugador
Si un jugador gana lo que otro jugador pierde el
juego se le denomina de suma cero
5
„
„
„
„
„
„
Un juego de 2 personas es un juego que tiene solo dos
jugadores
Cada jugador tiene un número finito de elecciones o infinito
llamadas estrategias.
Los resultados o pagos de un juego se resumen como
funciones de las diferentes estrategias para cada jugador
Un juego con 2 jugadores, donde la ganancia de un jugador
es igual a la perdida de otro se conoce como un juego de 2
persona y de suma cero
En tal juego es suficiente expresar los resultados en
términos del pago a un jugador.
Se emplea una matriz para resumir los pagos al jugador
cuyas estrategias están dadas por los renglones de la
matriz
6
„
„
Una estrategia pura es un plan
previamente determinado, que establece
la secuencia de movimientos y contra
movimientos que un jugador realiza
durante un juego completo.
La matriz de consecuencias o pagos
proporciona una caracterización completa
del juego al que corresponde.
7
Ejemplo 1
„
„
„
Construya la matriz de pagos para el
siguiente juego.
Considere un juego de “igualar” monedas
en el cual cada uno de 2 jugadores A y B
elige sol (S) ó águila (A).
Si son iguales los 2 resultados (S y S) ó (A
y A) el jugador A gana 1 peso al jugador
B, de otra manera A pierde un peso que
paga a B
8
Solución
1.- Son dos jugadores
2.- Lo que uno gana el otro lo pierde
3.- Cada jugador tiene 2 estrategias
puras
4.- La matriz de juegos es de 2x2
expresado en términos del pago al
jugador
Jugador A
Jugador B
A
S
A
1
-1
S
-1
1
9
Ejemplo 2
„
„
„
Construya la matriz de juegos para el
siguiente juego
Considere un juego en el cual 2 jugadores
muestran simultáneamente 1, 2 ó 3 dedos
uno al otro. Si la suma de dedos
mostrados, es par, el jugador II paga al
jugador I esta suma en pesos.
Si la suma es non, el jugador I paga esa
cantidad al jugador II.
10
Solución
„
„
„
„
Son dos jugadores
Lo que gana 1 el otro lo pierde por lo que es de
suma cero
Cada jugador tiene 3 estrategias puras, mostrar 1,
2, 3 dedos
La matriz de juegos es de 3x3 expresada en
términos del pago del jugador I
Jugador II
Jugador I
1
2
3
1
2
-3
4
2
-3
4
5
3
4
5
6
11
Ejemplo 3
„
„
„
„
„
„
„
Construya una matriz de consecuencias para el siguiente
juego.
Dos cadenas de supermercados se proponen construir, cada
una, una tienda en una región rural en donde se
encuentran 3 pueblos.
45% de la población vive cerca del pueblo A
35% de la población vive cerca del pueblo B
20% de la población vive cerca del pueblo C
Debido a que la cadena I es más grande que la cadena II,
la cadena I controlará la mayoría de los negocios, siempre
que sus ubicaciones sean comparativas.
Ambas cadenas conocen los intereses de la otra en la
región y ambas han terminado estudios de mercado que
dan proyecciones idénticas.
12
Solución
„
„
„
„
Si I se ubica en A y II en B entonces I
tendrá (0.9)(0.45) + (0.4)(0.35) +
(0.4)(0.2) = 0.625 o sea el 62.5% de los
negocios de la región.
Si I se ubica en B y II en C, entonces I
tendrá (0.9)(0.45) + (0.9)(0.35) +
(0.4)(0.2) = 0.8
O sea el 80% de los negocios de la región.
Si I se ubica en B y II en A entonces I
tendrá (0.9)(0.35) + (0.4)(0.45) +
(0.9)(0.2) = 0.575 o sea un 57%
13
Jugador I
A
B
A
65
67.5
Jugador II
B
62.5
65
C
80
80
14
Juegos de suma cero
„
„
Se dice que un juego es de “suma cero”
cuando lo que gana un jugador lo pierde el
otro, como en ajedrez, poquer, etc.
Todos los ejemplos que hemos visto de
juegos son de suma cero, por eso en las
celdas de la matriz del juego un mismo
número es la ganancia para el jugador de
los renglones y la pérdida para el de las
columnas.
15
Solución Óptima de juegos de 2
personas y suma cero
- Juegos estables (Valor de juego,
estrategias mínimas y maximin).
Puntos silla
- Juegos Inestables (estrategias
mixtas
16
Juegos inestables o estrategias
mixtas
„
„
El objetivo en la teoría de juegos es determinar
una estrategia “mejor” para un jugador dado,
bajo la consideración de que el oponente es
racional y realizará movimientos inteligentes en
contra. En consecuencia si un jugador siempre
selecciona la misma estrategia pura o selecciona
estrategias puras en un orden fijo, su oponente
reconocerá a tiempo el patrón y tratará de
vencerlo, si es posible.
Por esto, la estrategia más efectiva es una
estrategia mixta, definida por una distribución
probabilística sobre un conjunto de estrategias
puras.
17
Ejemplo 1: Estrategias mixtas.
„
„
„
En el juego de mostrar 1,2 ó 3 dados
se puede construir una estrategia
mixta
X=[1/6, 1/3, ½],
que significa que el jugador uno,
planea mostrar el dedo 1 1/6 de
veces, 2 dedos 1/3 de veces, 3
dedos ½ de las veces.
18
Ejemplo 2: Estrategias Mixtas.
„
„
Sea la siguiente matriz de pagos para un
juego de 2 jugadores de suma cero
Este juego no tiene punto de silla, ni se
puede calcular el valor de juego. Se dice
que es un juego inestable.
Jugador A
1
2
1
5
6
3
4
8
3
Jugador B
2
3
-10
9
7
8
7
4
15
-1
4
0
1
2
4
19
Solución del problema de
estrategias mixtas
„
„
Se basa en el criterio mínimax. La única
diferencia es que A (ó jugador I) elije Xi,
la cual maximiza el pago esperado más
pequeño en una columna, en tanto que B
(ó jugador II) selecciona Yj, la cual
minimiza el pago esperado en un renglón.
Igual que en estrategias puras se verifica
la relación:
pago esperado minimo < pago esperado maximin
20
„
„
„
Cuando Xi y Yj corresponden a la solución
óptima, se cumple la igualdad y los
valores resultantes llegan a ser iguales al
valor esperado (óptimo) del juego.
Si Xi* y Yj* son las soluciones óptimas
para ambos jugadores, cada elemento de
pago Aij estará asociado a la probabilidad
(Xi*, Yj*). Por consiguiente, el valor
esperado óptimo del juego es:
En otras palabras cualquier juego matricial
tiene un valor
21
Métodos para resolver juegos
Métodos para resolver juegos
(2xn) ó (mx2)
-Grafico
„
De suma cero
-De programación lineal
„
22
Solución gráfica de juegos de
(2xN) y (Mx2)
„
Las soluciones gráficas son
únicamente aplicables a juegos en
los cuales, por lo menos uno de los
jugadores, tiene solamente 2
estrategias.
23
Ejemplo 1: Considere el siguiente
juego (2x4)
1.
2.
3.
Encuentre el punto máximo
Calcule la estrategia optima de A
Calcule el valor del juego
A
1
2
1
2
4
B
2
2
3
3
3
2
4
-1
6
24
Solución
„
„
El juego no es estable ya que las
estrategias puras maximin = 2 es
diferente a la mínimax = 3
Por lo que los pagos esperados de A
corresponden a las estrategias
puras de B son:
25
Estrategias puras Pagos esperados
de B
de A
1
-2X1 + 4
2
X1 + 3
3
X1 +2
4
-7X1 + 6
X1 = 0
X1 = 1
4
3
2
6
2
2
3
-1
Resolviendo 2 y 3
-X1 + 3 = X1 +2
-2X1 = -1
X1 = ½
La estrategia óptima es (½ ,
½)
V* = - ½ +3 = 5/2
26
27
Ejemplo 2: Considere el juego
(2x4)
„
„
„
Encuentre el punto maximin
Calcule la estrategia óptima
Calcule el valor de juego
P1
1
2
1
19
0
P2
2
15
20
3
17
15
4
16
5
28
Solución
„
El juego no es estable ya que las
estrategias puras maximin = 15 es
diferente a mínimax = 16
Estrategias puras Pagos esperados
de P2
de P1
1
(19-0)X1 + 0 =
19X1
2
(15-20)X1 + 20 =
-5X1 + 20
3
(17-15)X1 + 15 =
2X1 +15
4
(16-5)X1 + 5 =
11X1 + 5
X1 = 0
X1 = 1
0
19
20
15
15
17
5
16
29
Se trazan las rectas como
funciones de X1
30
„
„
„
„
„
„
„
„
„
„
„
La línea OBCD de la esperanza mínima para cualquier valor
de X1, 0 < X < 1
P1 debe escoger Xi de tal suerte que maximice su
esperanza menor.
La intersección de 2 y 4, el punto C, es el punto donde la
esperanza menor es máxima (maximin).
Resolvemos 2 y 4
-5X1 + 20 = 11X1 + 5
15 = 16X1
X1 = 15/16
La estrategia óptima es (X1*, X2*) = (X, 1-X1) = (15/16,
1/16)
El valor del juego es
V* = 11(15/16) + 5 = 245/16
V* = 245/16
31
Ejemplo 3. Considere el siguiente
juego (4x2)
A
1
2
3
4
B
1
2
2
3
-2
2
4
3
2
6
32
El juego no tiene punto silla. Sean Y1 y Y2 (Y2 =
1-Y1) dos estrategias mixtas de B
Estrategias puras Pagos esperados
de A
de B
1
-2Y1 + 4
2
-Y1 + 3
3
Y1 + 2
4
-8Y1 + 6
Y1 = 0
Y1 = 1
4
3
2
6
2
2
3
-2
33
„
„
„
„
„
„
„
„
„
El punto minimax se determina como el punto
mas bajo de la envolvente superior
El valor de Y1* se obtiene como el punto de
intersección de las líneas 1 y 3
-2Y1 + 4 = Y1 + 2
-3Y = -2
Y = 2/3
Sustituyendo en 1 y en 3
V* =
-2(2/3) + 4 = 8/3
2/3 + 2 = 8/3
El valor del juego es 8/3
34
Solución de juegos (mxn) por
programación lineal
„
„
Se trata de Maximizar el valor del
juego (representado por las
estrategias de un jugador). Sujeto a
la combinación lineal por renglón de
la matriz de juego.
Si el valor maximin es positivo se
procede de este modo, si es negativo
se agrega a la matriz de juego una
constante k
35
Ejemplo 1: solución por PL
„
Considere el siguiente juego (2x2)
Jugador 1
A1
A2
Jugador 2
B1
0
1
B2
½
0
36
Bibliografía
„
„
„
„
Theory of Games and Economic Behavior; Von
Neuman
Game Theory; A. J. Jones
Game Theory; Guillermo Owen
Games and Information; Rasmusen
37
Descargar