JUEGOS SIMULTANEOS (2)

Anuncio
JUEGOS SIMULTANEOS
CASO DIARIOS
Portada correo
Sida
Presupuesto
Portada Expreso
Sida
Presupuesto
35, 35
70, 30
30, 70
15,15
CASO DE LA LANGOSTA
Después de muchos años, usted y nueve ex compañeros de colegio salen a comer. Cada
uno debe elegir entre pedir pollo y pedir langosta. El plato de pollo cuesta 5 mil soles, la
langosta 20 mil. Además se sobreentiende que la cuenta se dividirá por partes iguales
entre los diez comensales.
Si usted (o alguno de sus compañeros de colegio) estuviera solo en el restaurante, erigiría
pollo; aun cuando la langosta le gusta más, es demasiado cara. Pero usted no está solo y
la cuenta que pague dependerá de lo que elijan los demás. ¿Es razonable, entonces,
suponer que todos pedirán pollo? La respuesta es que no, porque si todos los demás
piden pollo, a usted le conviene pedir langosta. En tal caso la cuenta será de 65 mil soles
(45 mil por las nueve porciones de pollo y los 20 mil por su langosta), la cual se dividirá en
partes iguales, por lo cual usted pagara 6.500 soles. Es decir, si todos piden pollo, a usted
la langosta le cuesta tan solo 6.500 soles, una ganga comparada con los 20 mil soles que
realmente cuesta. LA LANGOSTA MAS BARATA DE SU VIDA Conclusión: podemos
descartar el escenario en que todos piden pollo.
Consideremos ahora la posibilidad que todos pidan langosta. En tal caso a usted no le
conviene ser el único que pide pollo, ya que un cálculo análogo a la anterior muestra que
pagara 18.500 soles por su plato de pollo. EL POLLO MAS CARO DE SU VIDA Más le
conviene pagar 1.500 soles adicionales y comer una langosta, al igual que los demás.
Conclusión: es probable que todos pidan langosta.
Nash postulo que cuando varias personas toman decisiones simultáneamente, y lo que
decide hacer cada uno afecta a los demás, las estrategias que observaremos (“equilibrios
de Nash”) serán solo aquellas en que cada uno hace lo que más le conviene dado lo que
hacen los demás. Que todos pidan pollo no es equilibrio de Nash, que todos pidan
langosta si lo es
Pollo
Pollo
Langosta
langosta
CASO MAR DE BISMARCK
A fines de 1942, cuando el clima bélico en el Pacífico Oriental estaba ingresando en uno
de sus picos más altos, los informes de inteligencia aliados señalaron que las fuerzas
japonesas embarcarían un grueso contingente de infantería, zarpando en conjunto con
varias naves de transporte de combustible en el puerto de Rabaul. Esta plaza está
ubicada al norte de la isla de Nueva Bretaña, y el destino detectado por los informes daba
por seguro al puerto de Lae, localizado en una pequeña península de la isla de Nueva
Guinea, que separa el Mar de Bismarck del Mar de Salomón.
El estado mayor de las fuerzas imperiales, al mando del veterano contralmirante
Kimura Masatomi , analizó las dos rutas disponibles para llegar a destino, Una de ellas,
caracterizada por su clima lluvioso, atraviesa el mar de Bismarck bordeando el litoral
marítimo norte de Nueva Bretaña. (02 días) La otra ruta atraviesa el mar de Salomón, y
posee en general buenas condiciones meteorológicas. (03)
El general norteamericano George Kenney, al estudiar el escenario descrito, reparó en las
dos elecciones que ofrecía la situación. Ambas implicaban concentrar sus aviones de
reconocimiento sobre una ruta o la otra. Una vez avistado, el convoy podría ser
bombardeado antes de su llegada a Lae. Si envía sus aviones por la ruta equivocada el
número de horas de bombardeo disminuye, perdiendo efectividad.
En unidades dadas por días de bombardeo, el estado mayor del general norteamericano
elaboró la siguiente matriz para el inminente enfrentamiento:
Estrategias de Masatomi
ruta norte ruta sur
Estrategias de Kenney ruta norte 2
2
ruta sur 1
3
Se puede ver fácilmente que existe un par de estrategias que conforman un equilibrio:
(ruta norte; ruta norte), con un costo medio estimado de 2 (dos) días de bombardeo. Los
aviones de reconocimiento norteamericanos y australianos participantes en el evento,
avistaron el convoy en la madrugada del 1 de marzo de 1943, unas horas después de que
hubiera abandonado el puerto de Rabaul.
El resultado fue completamente adverso para las fuerzas japonesas. A pesar de esto no
puede afirmarse que la elección del contralmirante Masatomi haya sido errónea. La
elección de la ruta norte fue correcta, en el sentido teórico proporcionado por la teoría de
juegos. Es decir, como mínimo, fue tan buena como la estrategia provista por la ruta sur,
al enfrentarla contra cualquiera de las elecciones a disposición del general Kenney.
CASO HOTELES
Dos empresas compiten por dominar el mercado hotelero de una concurrida isla
mediterránea. Ambas empresas están bien establecidas, y la demanda de habitaciones se
viene reduciendo en los últimos años por causa de la competencia de destinos como
Túnez o Turquía. Las empresas se plantean tres alternativas para tratar de aumentar sus
beneficios: la primera es permanecer como están, la segunda expandirse construyendo
nuevos hoteles y la tercera es cerrar algún hotel y adaptarse así a la demanda. La matriz
de ganancias sería la siguiente:
Hoteles A
Mantenerse
Hoteles B
Crecer
Reducir
Mantenerse -5 -10
-10 -30
-10
Crecer
-15 -5
-25 -30
+20 +10*
Reducir
+5 -15
+15 -40
+10 +15
0
*EQUILIBRIO DOMINANTES
Sólo hay un equilibrio de estrategias dominantes que es Hoteles B crecer y Hoteles A
reducir. Desde el punto de vista de A, dado que Hoteles B ha elegido crecer, su mejor
decisión es la que ha adoptado (+10>-5>-30). Desde el punto de vista de B, dado que
Hoteles A ha reducido capacidad, su mejor decisión posible es crecer (+20>+10>-10).
Hoteles A
Hoteles B
Mantenerse
Mantenerse -5 -10
Crecer
-10 -30
Crecer
-25 -30
-15 -5
Si las opciones fueran mantenerse o crecer, el equilibrio de Nash sería que ambas
empresas se mantuvieran como están. El número de opciones al alcance de las empresas
no cambia la definición de equilibrio, simplemente varía las comparaciones que hay que
hacer.
CASO CIAS AUTOBUSES
Dos compañías de autobuses, A y B, explotan la misma ruta entre dos ciudades y están
en una lucha por una mayor parte del mercado. Puesto que la parte total del mercado es
un 100 por 100 fijo, cada punto porcentual ganado por uno debe ser perdido por el otro.
(Juego de suma cero de dos personas).
Si se supone que la compañía A y la compañía B están considerando las tres mismas
estrategias para ganar una mayor parte relativa del mercado como sigue:



a1 o b1: Sirve refrescos durante el viaje.
a2 o b2: Introduce autobuses con aire acondicionado.
a3 o b3: Anuncia diariamente en estaciones de televisión en las dos ciudades.
Roggero (columnas)
Bebidas
Aire
Publicidad
Acondiciona
do
(-10)
(-11)
(-1)
Aire
9
Acondiciona
do
(-8)
6
Publicidad
(-10)
(-13)
Bebidas
Cruz
Del Sur
(filas)
20
Por comodidad, se supone que antes de comenzar el juego ambas compañías no están
haciendo ningún esfuerzo especial y comparte por igual el mercado –50 por 100 cada
una. Además, si se supone también que cada compañía no puede emplear más de uno
de estas actitudes o estrategias al mismo tiempo y que las tres estrategias tienen
idénticos costos.
Por estos supuestos, hay un total de 3 x 3 = 9 combinaciones posibles de movimientos, y
cada una es capaz de afectar a la parte del mercado en una forma específica. Por
ejemplo, si A y B sirvan refrescos durante el viaje, se dice que A perdería 10 por 100 de la
parte del mercado a favor de B, igualmente, si A anuncio y B, por ejemplo, sirve
refrescos, se supone que A ganaría 20 por 100 del mercado en perjuicio de B;
evidentemente, la publicidad en televisión parece ser más eficaz que servir refrescos.
Ahora, por cada una de las 9 combinaciones puede determinar ganancias o pérdidas del
mercado para A como se indica en la siguiente matriz de pagos.
ROGGERO
CRUZ
DEL
SUR
a1
a2
a3
b1
b2
b3
-10,
-11,
-1,
10
9,
11
1
-8,
-9
20,
6,
8*
-6
-10,
-20
-13,
10
13
*dominante
VIDA DE CERDOS
• Experimento biológico: Dos cerdos de distinto tamaño (uno grande y el otro pequeño)
son puestos en una caja que posee en un extremo un dispositivo que, cuando es
presionado, del otro extremo se liberan 10 unidades de comida
Presionar el dispositivo implica un costo de 2 unidades de comida (se pierden
Calorías en el esfuerzo)
• Si el cerdo grande llega primero al extremo donde se encuentra la comida
Obtiene 9 unidades, mientras que el pequeño sólo logra 1 unidad.
• Por el contrario, si el que arriba primero al lugar donde se libera la comida es el
Pequeño, puede comer sólo 4 unidades.
• Si ambos arriban al mismo tiempo, el pequeño obtiene 3 unidades y el grande
Las restantes 7 unidades.
Cerdo Pequeño
Cerdo Grande
Presionar
Esperar
Presionar
(5, 1)
(4, 4)
Esperar
(9, -1)
(0, 0)
Equilibrio de estrategias dominantes: (4, 4)
Análisis de un juego de guerra previo a un combate real
Un trabajo realizado por O. G. Haywood analiza los dos criterios de decisión válidos
mediante las cuales un jefe militar puede encarar las consideraciones previas a las
acciones de un combate inminente.
En la primera de ellas, el jefe selecciona el curso de las acciones estimando lo que el
enemigo es capaz de realizar. En la segunda, la selección se realiza sobre la estimación
de lo que el enemigo intentará realizar. Como ejemplo de estas opciones, las fuerzas
armadas de los Estados Unidos propician primariamente la toma de decisiones basadas
en la capacidad de las fuerzas enemigas y no en las posibles intenciones de éstas.
En el desembarco aliado, en agosto de 1944, se ha abierto una brecha por mar en
Avranches (Francia). La cabeza de playa ha expuesto el flanco oeste del noveno ejército
alemán, mandado por el general von Kluge. Este tiene dos posibles formas de actuar: (1)
Atacar hacia el oeste para llegar al mar, asegurándose su flanco occidental y dividir a las
fuerzas americanas. (2) Retirarse hacia el este para llegar a una mejor posición defensiva
cerca del rió Sena. El general americano Bradley tiene al primer ejército americano
conteniendo al ejercito alemán desde la cabeza de playa, y más al interior tiene al tercer
ejercito, bajo las órdenes del general Patton, en reserva, haciendo misiones de limpieza
del terreno hacia el este, sur y oeste. Bradley considero tres posibilidades: (1) Ordenar a
la reserva volver a defender la brecha abierta. (2) Enviar la reserva hacia el este para
intentar cortar la retirada del noveno ejército alemán. (3) Mantener las reservas en sus
posición durante un da y decidir después si ordenar ayudar a la cabeza de playa si era
atacada o enviarlas hacia el este.
El análisis completo de la situación le llevo a valorar los diferentes resultados de acuerdo
con la tabla siguiente, en la que las representan las estrategias del general Bradley, y las
columnas las estrategias del general von Kluge.
BOQUETE
ESCAPE
VON KLUGE
1. Atacar
B
R
A
D
L
E
Y
1. Reforzar
Se mantiene
La brecha. Aliados
Rechazan ataque
2. Retirarse
(2,-1)
Se mantiene la brecha (2,1)
Débil presión sobre
la retirada alemana
2. Mover
Se produce (-1,3)
El corte alemán
Fuerte presión en
(2,-1)
en la retirada alemana
Se mantiene la brecha y
Los alemanes son rodeados
(3,0)
las reservas llegan un
día tarde. Moderada presión
En la retirada alemana (2,0)
3. Esperar
Equilibrio de estrategias dominantes, el general Bradley escogió la tercera estrategia. Las
valoraciones alemanas deban ser similares, pues el general von Kluge decidió retirarse,
pero nunca ejecuto su decisión. Hitler, a cientos de kilómetros del campo de batalla, debió
tener otras valoraciones del conflicto y ordeno atacar y cerrar la brecha.
El resultado fue que Bradley resistió el ataque alemán, y mantuvo la reserva en el sur, lo
que permitió enviarla el segundo da hacia el este; los alemanes comenzaron la retirada,
siendo rodeados por las armadas americana y francesa, lo que llevo al suicidio al general
alemán.
ENCONTRAR EL EQUILIBRIO NASH
El equilibrio de Nash fue formulado por John Nash, en 1951. Un par de estrategias es un
equilibrio de Nash si la elección de A es óptima dada la de B y la de B es óptima, dada la
de A. Un juego puede tener más de un equilibrio de Nash. Existen juegos en los no existe
un equilibrio de Nash.
EL JUEGO DE LA GALLINA
• Los motociclistas se enfrentan con sus motocicletas a alta velocidad. Al aproximarse
a una colisión, cada uno debe decidir si acelerar o esquivar a su rival.
• El que esquiva a su rival pasa un papelón. El que acelera gana el respeto y la
Admiración de sus amigos (y amigas)
• Si ambos aceleran, chocan y mueren
• Si ambos esquivan a su rival, se los considera gallinas (cobardes)
James
Acelera
Esquiva
Marlon Acelera
Esquiva
(-3, -3)
(0, 2)
(2, 0)
(1, 1)
Equilibrios de Nash: (2, 0) y (0, 2)
Aplicaciones posibles: Banco Central independiente vs. Ministerio de Economía;
Gobierno vs. Sindicatos.
CUANDO NO HAY UN EQUILIBRIO DE ESTRATEGIAS DOMINANTES O NASH
ENCONTRAR EQUIIBRIO MAXIMIN MINIMAX O PUNTO DE SILLA DE MONTAR
Cuando no hay dominantes ni dominadas criterios maximin y mínimax Aplicar el enfoque
conservador: (regla maximin) “LAS COSAS MALAS SIEMPRE ME SUCEDEN A MÍ”
CASO MONTO DE ANTICIPO
El jugador llamado A vende un determinado bien con el jugador B y negocia con él el
monto del anticipo. El deudor B analiza sus posibilidades financieras y determina con
todo cuidado 4 estrategias diferentes de formalizar el pago del anticipo acordado. A, el
acreedor, estudia también sus propios intereses financieros, y determina a su vez 5
estrategias de efectuar el cobro.
Las filas corresponden a las estrategias de cobro y las columnas a las estrategias de
pago.
a1
a2
a3
a4
a5
b1
18
0
5
16
9
b2
3
3
4
4
3
b3
0
8
5
2
0
b4
2
20
5
25
20
Matriz del juego del anticipo
Si el vendedor A es el que comienza a estudiar sus estrategias de cobro, ¿Cuál será la
más conveniente para sus intereses? Ante las diversas estrategias imaginadas por A,
será natural que B elija aquella que implique el menor pago por su parte, tal como lo
indica la tabla siguiente, construida a partir de la figura 1:
Estrategias
propuestas por A
a1
Elección de B 0
a2
0
a3
4
a4
2
a5
0
Mínimos para A según cada
estrategia
Se observa que la estrategia a3 = 4 seria el valor mayor de los mínimos pensados
por B (estrategia maximin)
Por cada estrategia se escoge el mínimo de pagos (o el peor de los escenarios posibles)
y luego de entre todos los pagos mínimos de las varias estrategias se selecciona aquella
que registra el mayor de estos pagos mínimos. (Por lo tanto, el pago mínimo posible es
maximizado.)
Maximin –para maximizar la recompensa mínima (ofensivo) tomar al menos lo menos
malo o el más alto de lo mínimos
Si ahora es B el que estudia las consecuencias asociadas con sus estrategias de
pago, será natural aceptar en este caso que el vendedor A elegirá los máximos valores de
cada una de las mismas, tal como lo indica la tabla siguiente
Estrategias
propuestas por B
b1
Elección de A 18
b2
b3
b4
4
8
25
Máximos que desea A y que B debe considerar
.
Aquí también se observa que B posee una estrategia, b2 = 4 le permite pagar lo
menos posible. Se entiende que esta conducta es la primariamente natural en B,
(estrategia minimax)
Se trata de escoger entre los peores escenarios donde los pagos son los mas altos
posibles el menor de ellos. Dadas varias estrategias en cada una de ellas hay un
supuesto en que según le comportamiento del oponente nos toca hacer el pago o tener el
costo más alto. Se escogen esos valores de cada estrategia y finalmente se selecciona el
valor más bajo o mínimo de esos valores máximos previamente seleccionados. La
estrategia con ese valor será la que se aplicara
Minimax –para minimizar la máxima perdida (defensivo) Que le otro medre menos,
Columnas busca el menor pago- peor escenario para filas
En el ejemplo las estrategias maximin y mínimas coinciden es un equilibrio = 4 es
decir ambos jugadores deberán escoger esa opción si son racionales, no les conviene
escoger otra alternativa
CUANDO NO HAY UN EQUILIBRIO ESTRATEGIA MÍNIMAX Y MAXIMIN
Si no hay un equilibrio, esto significa que cualquier conducta sistemática (comportamiento
repetido o previsible) por parte de uno puede ser aprovechada por los rivales, e indica que
lo más apropiado es volverse imprevisible
Si no existe coincidencia entre la estrategia mínimax y maximin de los jugadores es decir
no hay una solución estable, cada jugador tratara de sacar provecho del otro. Cada
jugador debera escoger un dispositivo aleatorio asignar probabilidades de a cada
posibilidad (p.ej cuantas chances hay en 3 jugadas de que salga cara o cruz) aplicara el
procedimiento de azar y en base a ello escogerá la estrategia a seguir. La introducción del
azar sirve para evitar ser predecible y ser neutralizado por el oponente.
Puede no usarse el azar si un jugador quiere explotar su talento para anticiparse a las
elecciones de su contrincante. (El buen jugador de póker analiza el comportamiento de su
oponente, su rostro, su voz, como acomoda su cuerpo en la silla, etc.) Por ejemplo si el
contrincante desconoce el empleo del azar o se cree equivocadamente mas hábil que el
otro jugador.
Siempre es relativa esta opción, puede resultar el oponente más inteligente de lo que
aparentaba (p ej. Se comportaba para parecer torpe o descuidado, utiliza artificios,
engaños, etc.)
CUANDO NO HAY COINCIDENCIA ENTRE LAS ESTRATEGIAS MAXIMIN Y
MINIMAX
a1
a2
a3
b1
0
5
2
b2
-2
4
3
b3
2
-3
-4
A (estrategias filas) pagar lo mínimo en otras palabras darle la mínima participación e el
mercado es decir 2,5,3 entonces B utilizara estrategia Minimax tomara el valor más
beneficioso para el dentro de esos mínimos 2 no gana nada pero el otro solo gana 2
Quieres darme lo mínimo yo tomo la máximo de ello
B quiere penetrar al máximo el mercado buscara los máximos resultados para el -4,-2,0
entonces el que ya está en el mercado de esos máximos que aspira el otro le dará el
minino estrategia Maximin A tu quieres quédate con la máximo, te doy lo mínimo te doy 0
Sujeto A
Sujeto B
a
b
c
A
11
1
-10
B
-7
1
-7
C
8
2*
21
NO HAY EQUILIBRIO ESTRATEGIAS DOMINANTES
ENTONCES BUSCARA MAXIMIZAR SU BENEFICIO
Sujeto B
Estrategia a 11 su mejor resultado
“
b 2
“
c 21
Entonces sujeto A ESCOGERA tomara de los máximos que espera B el menor MAXIMIN=
2
El sujeto B también tratara de escoger los más altos rendimientos (como es juego de
suma cero son aquello que pierde el otro es exacto a lo que el gana) o en otras palabras
concederle la menor ganancia al opositor escogería las siguientes estrategias
Estrategia A -10
“
B -7
“
C 2
Si A quiere dar los menores réditos entonces B escoge de ellos el más alto MiNIMAX = 2
Aquí si hay equilibrio Minimax maximin estrategia C para ambos
En muchos casos existiendo un equilibrio de Nash, no es aplicado por los jugadores, es
decir existiendo una estrategia que es la que da mejores resultados teniendo en cuenta el
comportamiento racional del otro jugador debido no es utilizada sea por sesgos en la toma
de decisiones o problemas de cálculo de los jugadores. (Fallos de la racionalidad.
Muchas) decisiones tomadas por individuos o empresas carecen de toda coherencia
lógica.
El común de los individuos tienden a preferir estrategias que rinden una ganancia media
aparentemente alta, no observan bien el escenario completo y simplemente escogen
aquella estrategia que según un comportamiento dado del oponente le da la mayor
ganancia. No analizan que siguiendo esa misma estrategia si su oponente cambia su
comportamiento puede no obtener la ganancia que esperaba sino más bien una perdida
catastrófica.
La estrategia de equilibrio se basa en el supuesto de que el oponente jugara
razonablemente bien, si esto no es cierto, como en el caso descrito arriba de un individuo
común que ignora o subestima la existencia de una estrategia de equilibrio, no hay porque
limitarse a ella, es decir si el otro no maneja estos criterios podemos sacar ventaja de el
obteniendo mejores pagos o beneficios con otra estrategia en principio “racionalmente
peor”.
CASO SOBRINO
En muchos casos existiendo un equilibrio de Nash, no es aplicado por los jugadores, es
decir existiendo una estrategia que es la que da mejores resultados teniendo en cuenta el
comportamiento racional del otro jugador no es utilizada sea por sesgos en la toma de
decisiones o problemas de cálculo de los jugadores. (Fallos de la racionalidad.) Muchas
decisiones tomadas por individuos o empresas carecen de toda coherencia lógica.
El común de los individuos tienden a preferir estrategias que rinden una ganancia media
aparentemente alta, no observan bien el escenario completo y simplemente escogen
aquella estrategia que según un comportamiento dado del oponente le da la mayor
ganancia. No analizan que siguiendo esa misma estrategia si su oponente cambia su
comportamiento puede no obtener la ganancia que esperaba sino más bien una perdida
catastrófica.
La estrategia de equilibrio se basa en el supuesto de que el oponente jugara
razonablemente bien, si esto no es cierto, como en el caso de un individuo común que
ignora o subestima la existencia de una estrategia de equilibrio, no hay porque limitarse a
ella, es decir si el otro no maneja estos criterios podemos sacar ventaja de el obteniendo
mejores pagos o beneficios con otra estrategia en principio “racionalmente peor”.
Estrategias
Sobrino
Ruta Sierra
Estrategias Ramos
Ruta Sierra
-50
Ruta Llanura
100
Ruta Llanura
200
-100
Maximin de Sobrino espera lo peor escojo lo menos malo( va a buscar mi destrucción
total) estrategias filas
ruta sierra peor pago -50
ruta llanura peor pago -100 el menos malo -50 IR SIERRA
Minimax de Ramos a la defensiva, el otro quiere ganar lo maximo, yo tomo le doy
oportunidad de ganar lo minimos
estrategias columnas
Ruta sierra 200
Ruta llanura 100 ir por llanura
Reglas de acción en juegos simultáneos:












Elegir la estrategia dominante.
Una Estrategia es dominante cuando maximiza los beneficios para un jugador
independientemente de lo que haga el otro.
El término dominancia se refiere a dominancia sobre las otras estrategias
disponibles para uno, no a dominancia sobre el oponente.
Si un jugador no tiene una estrategia dominante pero el oponente sí la tiene, hay
que anticipar que el oponente va a usar esa estrategia y elegir la jugada propia de
acuerdo a ese supuesto.
Si nadie tiene una estrategia dominante, simplificar el problema eliminando las
estrategias dominadas.
Una estrategia dominada es aquella que independientemente de lo que haga el
otro jugador le da peores pagos que alguna otra estrategia que pueda jugar, por lo
que nunca decidirá jugarla. (Como el otro jugador sabe esto tomará en cuenta
dicha información para decidir que jugar: eliminará los resultados del juego que
impliquen que el otro jugador juegue estrategias dominadas)
Cuando se hayan explorado los caminos de buscar estrategias dominantes y
eliminar estrategias dominadas, el paso siguiente es buscar un equilibrio para el
juego.
Un equilibrio es la situación en que ambos jugadores juegan la mejor respuesta a
la mejor respuesta del otro
Que un resultado sea un equilibrio no quiere decir que este equilibrio sea
necesariamente lo mejor para todos los jugadores. (Cooperación)
Si un juego tiene un único equilibrio de Nash y los jugadores son completamente
racionales, los jugadores escogerán las estrategias que forman el equilibrio.
Si no hay un equilibrio, se debe confrontar el problema de razonamiento circular: lo
que es mejor para uno depende de lo que es mejor para el otro y viceversa
,aplicando estrategias mínimax o maximin (enfoque conservador)
Si no coincidencia entre la estrategia mínimax y maximin de los jugadores es decir
no hay una solución estable cada jugador deberá escoger un dispositivo aleatorio
asignar probabilidades de a cada posibilidad aplicara el procedimiento de azar y en
base a ello escogerá la estrategia a seguir. Se le llama a este procedimiento
estrategia mixta.
Para evitar ser predecible cuando no hay un equilibrio, no existe una soluciona al
juego (no hay estabilidad no se puede predecir quien va a ganar) una manera de
hacerlo es mediante la utilización de estrategia mixta es decir la utilización de un
mecanismo de azar para determinar cuál de la estrategias puras aplicar.
De esta manera se huye al problema de que el oponente en base a nuestros
antecedentes ( p.ej muy cauteloso) o por la capacidad de interpretar nuestro
comportamiento mediante indicadores o en última instancia la intuición, se anticipe a
nuestra elección y aplique una contraestraegia o en otros términos adecue su
comportamiento ejecutando la estrategia que nos produciría el peor resultado.
Este recurso se aplica en tiempos de guerra cuando el elemento sorpresa es de vital
importancia, ante la posibilidad siempre presente de filtraciones de información o
espionaje. Eligiendo a último minuto que estrategia usar mediante el azar incremente
nuestras posibilidades de éxito.
Documentos relacionados
Descargar