TEORIA DE JUEGOS M. En C. Eduardo Bustos Farías 1 Teoría de juegos Es una herramienta matemática que analiza las interrelaciones entre dos o mas individuos, y busca un modelo de actuación óptimo. Desarrollada por Von Neuman & Morgenster en su libro: “The Theory of Games Behavior” (1944). 2 Elementos Jugadores No jugadores (“naturaleza”) Acciones Información Estrategias Resultados Equilibrio 3 Supuestos Los participantes en la relación: • • • • • Son conscientes de ésta Buscan el máximo provecho Actúan racionalmente Existe un costo de la relación y se obtiene un beneficio de ella. Se supone que el jugador escogerá la elección óptima 4 Juegos Un juego es una situación competitiva entre n personas o grupos, denominados jugadores Se realiza bajo un conjunto de reglas previamente establecidas con consecuencias conocidas Las reglas definen las actividades elementales o movimientos del juego. Pueden permitirse diferentes movimientos para los distintos jugadores , pero cada jugador conoce los movimientos de que dispone cada jugador Si un jugador gana lo que otro jugador pierde el juego se le denomina de suma cero 5 Un juego de 2 personas es un juego que tiene solo dos jugadores Cada jugador tiene un número finito de elecciones o infinito llamadas estrategias. Los resultados o pagos de un juego se resumen como funciones de las diferentes estrategias para cada jugador Un juego con 2 jugadores, donde la ganancia de un jugador es igual a la perdida de otro se conoce como un juego de 2 persona y de suma cero En tal juego es suficiente expresar los resultados en términos del pago a un jugador. Se emplea una matriz para resumir los pagos al jugador cuyas estrategias están dadas por los renglones de la matriz 6 Una estrategia pura es un plan previamente determinado, que establece la secuencia de movimientos y contra movimientos que un jugador realiza durante un juego completo. La matriz de consecuencias o pagos proporciona una caracterización completa del juego al que corresponde. 7 Ejemplo 1 Construya la matriz de pagos para el siguiente juego. Considere un juego de “igualar” monedas en el cual cada uno de 2 jugadores A y B elige sol (S) ó águila (A). Si son iguales los 2 resultados (S y S) ó (A y A) el jugador A gana 1 peso al jugador B, de otra manera A pierde un peso que paga a B 8 Solución 1.- Son dos jugadores 2.- Lo que uno gana el otro lo pierde 3.- Cada jugador tiene 2 estrategias puras 4.- La matriz de juegos es de 2x2 expresado en términos del pago al jugador Jugador A Jugador B A S A 1 -1 S -1 1 9 Ejemplo 2 Construya la matriz de juegos para el siguiente juego Considere un juego en el cual 2 jugadores muestran simultáneamente 1, 2 ó 3 dedos uno al otro. Si la suma de dedos mostrados, es par, el jugador II paga al jugador I esta suma en pesos. Si la suma es non, el jugador I paga esa cantidad al jugador II. 10 Solución Son dos jugadores Lo que gana 1 el otro lo pierde por lo que es de suma cero Cada jugador tiene 3 estrategias puras, mostrar 1, 2, 3 dedos La matriz de juegos es de 3x3 expresada en términos del pago del jugador I Jugador II Jugador I 1 2 3 1 2 -3 4 2 -3 4 5 3 4 5 6 11 Ejemplo 3 Construya una matriz de consecuencias para el siguiente juego. Dos cadenas de supermercados se proponen construir, cada una, una tienda en una región rural en donde se encuentran 3 pueblos. 45% de la población vive cerca del pueblo A 35% de la población vive cerca del pueblo B 20% de la población vive cerca del pueblo C Debido a que la cadena I es más grande que la cadena II, la cadena I controlará la mayoría de los negocios, siempre que sus ubicaciones sean comparativas. Ambas cadenas conocen los intereses de la otra en la región y ambas han terminado estudios de mercado que dan proyecciones idénticas. 12 Solución Si I se ubica en A y II en B entonces I tendrá (0.9)(0.45) + (0.4)(0.35) + (0.4)(0.2) = 0.625 o sea el 62.5% de los negocios de la región. Si I se ubica en B y II en C, entonces I tendrá (0.9)(0.45) + (0.9)(0.35) + (0.4)(0.2) = 0.8 O sea el 80% de los negocios de la región. Si I se ubica en B y II en A entonces I tendrá (0.9)(0.35) + (0.4)(0.45) + (0.9)(0.2) = 0.575 o sea un 57% 13 Jugador I A B A 65 67.5 Jugador II B 62.5 65 C 80 80 14 Juegos de suma cero Se dice que un juego es de “suma cero” cuando lo que gana un jugador lo pierde el otro, como en ajedrez, poquer, etc. Todos los ejemplos que hemos visto de juegos son de suma cero, por eso en las celdas de la matriz del juego un mismo número es la ganancia para el jugador de los renglones y la pérdida para el de las columnas. 15 Solución Óptima de juegos de 2 personas y suma cero - Juegos estables (Valor de juego, estrategias mínimas y maximin). Puntos silla - Juegos Inestables (estrategias mixtas 16 Juegos inestables o estrategias mixtas El objetivo en la teoría de juegos es determinar una estrategia “mejor” para un jugador dado, bajo la consideración de que el oponente es racional y realizará movimientos inteligentes en contra. En consecuencia si un jugador siempre selecciona la misma estrategia pura o selecciona estrategias puras en un orden fijo, su oponente reconocerá a tiempo el patrón y tratará de vencerlo, si es posible. Por esto, la estrategia más efectiva es una estrategia mixta, definida por una distribución probabilística sobre un conjunto de estrategias puras. 17 Ejemplo 1: Estrategias mixtas. En el juego de mostrar 1,2 ó 3 dados se puede construir una estrategia mixta X=[1/6, 1/3, ½], que significa que el jugador uno, planea mostrar el dedo 1 1/6 de veces, 2 dedos 1/3 de veces, 3 dedos ½ de las veces. 18 Ejemplo 2: Estrategias Mixtas. Sea la siguiente matriz de pagos para un juego de 2 jugadores de suma cero Este juego no tiene punto de silla, ni se puede calcular el valor de juego. Se dice que es un juego inestable. Jugador A 1 2 1 5 6 3 4 8 3 Jugador B 2 3 -10 9 7 8 7 4 15 -1 4 0 1 2 4 19 Solución del problema de estrategias mixtas Se basa en el criterio mínimax. La única diferencia es que A (ó jugador I) elije Xi, la cual maximiza el pago esperado más pequeño en una columna, en tanto que B (ó jugador II) selecciona Yj, la cual minimiza el pago esperado en un renglón. Igual que en estrategias puras se verifica la relación: pago esperado minimo < pago esperado maximin 20 Cuando Xi y Yj corresponden a la solución óptima, se cumple la igualdad y los valores resultantes llegan a ser iguales al valor esperado (óptimo) del juego. Si Xi* y Yj* son las soluciones óptimas para ambos jugadores, cada elemento de pago Aij estará asociado a la probabilidad (Xi*, Yj*). Por consiguiente, el valor esperado óptimo del juego es: En otras palabras cualquier juego matricial tiene un valor 21 Métodos para resolver juegos Métodos para resolver juegos (2xn) ó (mx2) -Grafico De suma cero -De programación lineal 22 Solución gráfica de juegos de (2xN) y (Mx2) Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo menos uno de los jugadores, tiene solamente 2 estrategias. 23 Ejemplo 1: Considere el siguiente juego (2x4) 1. 2. 3. Encuentre el punto máximo Calcule la estrategia optima de A Calcule el valor del juego A 1 2 1 2 4 B 2 2 3 3 3 2 4 -1 6 24 Solución El juego no es estable ya que las estrategias puras maximin = 2 es diferente a la mínimax = 3 Por lo que los pagos esperados de A corresponden a las estrategias puras de B son: 25 Estrategias puras Pagos esperados de B de A 1 -2X1 + 4 2 X1 + 3 3 X1 +2 4 -7X1 + 6 X1 = 0 X1 = 1 4 3 2 6 2 2 3 -1 Resolviendo 2 y 3 -X1 + 3 = X1 +2 -2X1 = -1 X1 = ½ La estrategia óptima es (½ , ½) V* = - ½ +3 = 5/2 26 27 Ejemplo 2: Considere el juego (2x4) Encuentre el punto maximin Calcule la estrategia óptima Calcule el valor de juego P1 1 2 1 19 0 P2 2 15 20 3 17 15 4 16 5 28 Solución El juego no es estable ya que las estrategias puras maximin = 15 es diferente a mínimax = 16 Estrategias puras Pagos esperados de P2 de P1 1 (19-0)X1 + 0 = 19X1 2 (15-20)X1 + 20 = -5X1 + 20 3 (17-15)X1 + 15 = 2X1 +15 4 (16-5)X1 + 5 = 11X1 + 5 X1 = 0 X1 = 1 0 19 20 15 15 17 5 16 29 Se trazan las rectas como funciones de X1 30 La línea OBCD de la esperanza mínima para cualquier valor de X1, 0 < X < 1 P1 debe escoger Xi de tal suerte que maximice su esperanza menor. La intersección de 2 y 4, el punto C, es el punto donde la esperanza menor es máxima (maximin). Resolvemos 2 y 4 -5X1 + 20 = 11X1 + 5 15 = 16X1 X1 = 15/16 La estrategia óptima es (X1*, X2*) = (X, 1-X1) = (15/16, 1/16) El valor del juego es V* = 11(15/16) + 5 = 245/16 V* = 245/16 31 Ejemplo 3. Considere el siguiente juego (4x2) A 1 2 3 4 B 1 2 2 3 -2 2 4 3 2 6 32 El juego no tiene punto silla. Sean Y1 y Y2 (Y2 = 1-Y1) dos estrategias mixtas de B Estrategias puras Pagos esperados de A de B 1 -2Y1 + 4 2 -Y1 + 3 3 Y1 + 2 4 -8Y1 + 6 Y1 = 0 Y1 = 1 4 3 2 6 2 2 3 -2 33 El punto minimax se determina como el punto mas bajo de la envolvente superior El valor de Y1* se obtiene como el punto de intersección de las líneas 1 y 3 -2Y1 + 4 = Y1 + 2 -3Y = -2 Y = 2/3 Sustituyendo en 1 y en 3 V* = -2(2/3) + 4 = 8/3 2/3 + 2 = 8/3 El valor del juego es 8/3 34 Solución de juegos (mxn) por programación lineal Se trata de Maximizar el valor del juego (representado por las estrategias de un jugador). Sujeto a la combinación lineal por renglón de la matriz de juego. Si el valor maximin es positivo se procede de este modo, si es negativo se agrega a la matriz de juego una constante k 35 Ejemplo 1: solución por PL Considere el siguiente juego (2x2) Jugador 1 A1 A2 Jugador 2 B1 0 1 B2 ½ 0 36 Bibliografía Theory of Games and Economic Behavior; Von Neuman Game Theory; A. J. Jones Game Theory; Guillermo Owen Games and Information; Rasmusen 37