Teoría de Juegos M. En C. Eduardo Bustos Farías 1 ¿Qué es un juego? • Un juego es un problema de toma de decisiones en el que participan dos o más individuos (≡ decisores, jugadores, agentes, controladores). • Es una herramienta matemática que analiza las interrelaciones entre dos o mas individuos, y busca un modelo de actuación óptimo. Con un individuo el problema es un problema de control. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 2 ¿Qué tipos de juegos hay? • Juegos estáticos o de una tirada (one-shot games). • Juegos repetidos. • Juegos dinámicos. Juego diferencial Juego diferencial estocástico Juegos de saltos (tipo cadenas de Markov), juegos híbridos, … Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 3 Juegos cooperativos: • los jugadores deciden cooperar entre ellos para alcanzar un resultado que sea “benéfico” para ellos. Problema: encontrar equilibrios cooperativos conocidos también como equilibrios de Pareto. Juegos de Stackelberg: • uno de los jugadores es el líder (tira primero) y • el resto de los jugadores son seguidores… … etc, etc, etc,… Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 4 Generalmente, en un juego hay un conflicto de intereses − los objetivos de los jugadores pueden oponerse unos contra otros. Por lo tanto, los jugadores tienen que negociar, es decir, ponerse de acuerdo cómo “jugar el juego”. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 5 ¿Como se juega un juego? Juegos no cooperativos: • los jugadores no cooperan entre ellos; • actúan independientemente, • cada uno tratando de satisfacer su propio objetivo. Problema: encontrar equilibrios no-cooperativos también conocidos como Equilibrios de Nash. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías Elementos del juego Jugadores No jugadores (“naturaleza”) Acciones Información Estrategias Resultados Equilibrio Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 7 Supuestos Los participantes en la relación: • • • • • Son conscientes de ésta Buscan el máximo provecho Actúan racionalmente Existe un costo de la relación y se obtiene un beneficio de ella. Se supone que el jugador escogerá la elección óptima Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 8 Juegos Un juego es una situación competitiva entre n personas o grupos, denominados jugadores Se realiza bajo un conjunto de reglas previamente establecidas con consecuencias conocidas Las reglas definen las actividades elementales o movimientos del juego. Pueden permitirse diferentes movimientos para los distintos jugadores , pero cada jugador conoce los movimientos de que dispone cada jugador Si un jugador gana lo que otro jugador pierde el juego se le denomina de suma cero Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 9 Un juego de 2 personas es un juego que tiene solo dos jugadores Cada jugador tiene un número finito de elecciones o infinito llamadas estrategias. Los resultados o pagos de un juego se resumen como funciones de las diferentes estrategias para cada jugador Un juego con 2 jugadores, donde la ganancia de un jugador es igual a la perdida de otro se conoce como un juego de 2 persona y de suma cero En tal juego es suficiente expresar los resultados en términos del pago a un jugador. Se emplea una matriz para resumir los pagos al jugador cuyas estrategias est án dadas por los Investigació 10 Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías renglones de la matriz Una estrategia pura es un plan previamente determinado, que establece la secuencia de movimientos y contra movimientos que un jugador realiza durante un juego completo. La matriz de consecuencias o pagos proporciona una caracterización completa del juego al que corresponde. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 11 Juegos en Forma Normal Un Juego en Forma Normal consiste en: • Jugadores • Estrategias de acciones factibles. • Matriz de Pagos (“Payoffs”) Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 12 Juegos de suma cero Se dice que un juego es de “suma cero” cuando lo que gana un jugador lo pierde el otro, como en ajedrez, poquer, etc. Todos los ejemplos que hemos visto de juegos son de suma cero, por eso en las celdas de la matriz del juego un mismo número es la ganancia para el jugador de los renglones y la pérdida para el de las columnas. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 13 Ejemplo 1 Construya la matriz de pagos para el siguiente juego. Considere un juego de “igualar” monedas en el cual cada uno de 2 jugadores A y B elige sol (S) ó águila (A). Si son iguales los 2 resultados (S y S) ó (A y A) el jugador A gana 1 peso al jugador B, de otra manera A pierde un peso que paga a B Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 14 Solución 1.- Son dos jugadores 2.- Lo que uno gana el otro lo pierde 3.- Cada jugador tiene 2 estrategias puras 4.- La matriz de juegos es de 2x2 expresado en términos del pago al jugador Jugador A Jugador B Investigació Investigación de Operaciones A S A 1 -1 M. En C. Eduardo Bustos Farí Farías S -1 1 15 Ejemplo 2 Construya la matriz de juegos para el siguiente juego Considere un juego en el cual 2 jugadores muestran simultáneamente 1, 2 ó 3 dedos uno al otro. Si la suma de dedos mostrados, es par, el jugador II paga al jugador I esta suma en pesos. Si la suma es non, el jugador I paga esa cantidad al jugador II. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 16 Solución Son dos jugadores Lo que gana 1 el otro lo pierde por lo que es de suma cero Cada jugador tiene 3 estrategias puras, mostrar 1, 2, 3 dedos La matriz de juegos es de 3x3 expresada en términos del pago del jugador I Jugador II Jugador I Investigació Investigación de Operaciones 1 2 3 1 2 -3 4 2 -3 4 -5 M. En C. Eduardo Bustos Farí Farías 3 4 -5 6 17 A 10 kms 20 kms B 15 kms C Ejemplo 3 Construya una matriz de consecuencias para el siguiente juego. Dos cadenas de supermercados se proponen construir, cada una, una tienda en una región rural en donde se encuentran 3 pueblos. 45% de la población vive cerca del pueblo A 35% de la población vive cerca del pueblo B 20% de la población vive cerca del pueblo C Debido a que la cadena I es más grande que la cadena II, la cadena I controlará la mayoría de los negocios, siempre que sus ubicaciones sean comparativas. Ambas cadenas conocen los intereses de la otra en la región y ambas han terminado estudios de Investigació ón de Operaciones 18 mercado que danM.proyecciones idénticas. Investigaci En C. Eduardo Bustos Farí Farías Si ambas cadenas se sitúan en el mismo pueblo o los equidistantes de un pueblo, la cadena I controlará el 65% de los negocios en ese pueblo. Si la cadena I está más cercana a un pueblo que la cadena II, la cadena I controlará 90% de los negocios en este pueblo. Si la cadena I está más alejada de un pueblo que la cadena II, atraerá a 40% de los negocios de este pueblo. El resto de las operaciones, bajo cualquier circunstancia, irán a la cadena II. Además ambas cadenas saben que la política de la cadena I es no ubicarse en pueblos que sean demasiado pequeños, y el pueblo C cae dentro de esta categoría. M. En C. Eduardo Bustos Faríías Investigació 19 Investigación de Operaciones Far Solución Hay 2 jugadores. El jugador I tiene 2 estrategias puras y el II tiene 3 estrategias puras. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 20 I A B C I II Si I se ubica en A y II en B entonces I tendrá (0.9)(0.45) + (0.4)(0.35) + (0.4)(0.2) = 0.625 O sea el 62.5% de los negocios de la región. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 21 A B I C II Si I se ubica en B y II en C, entonces I tendrá (0.9)(0.45) + (0.9)(0.35) + (0.4)(0.2) = 0.8 O sea el 80% de los negocios de la región. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 22 II A B I C Si I se ubica en B y II en A entonces I tendrá (0.9)(0.35) + (0.4)(0.45) + (0.9)(0.2) = 0.575 O sea un 57% Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 23 I A B II II I C Si ambas cadenas se ubican en el mismo pueblo I recibirá 65% de los negocios de toda la región. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 24 Tabla de pagos o consecuencias Jugador I Investigació Investigación de Operaciones A B A 65 67.5 M. En C. Eduardo Bustos Farí Farías Jugador II B 62.5 65 C 80 80 25 DOMINANCIA 26 Estrategia dominante Se dice que una estrategia es “dominante” cuando es la mejor opción del jugador para todas las posibles opciones del contrincante (similarmente para varios contrincantes). Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 27 Dominancia Algunas veces una fila o columna de la matriz de pagos carece de efectividad para influir sobre las estrategias óptimas y el valor del juego Una estrategia pura P es dominada por una estrategia pura Q si, para cada estrategia pura del oponente, el pago asociado con P no es mejor que el pago asociado con Q. Ya que una estrategia pura dominada no puede ser nunca parte de una estrategia óptima, el renglón o columna correspondiente en la matriz del juego debe ser eliminada Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 28 Ejemplo 1. Dominancia II I 1 2 3 1 4 3 2 2 -8 -9 6 3 7 2 8 4 -2 -3 2 Observe que entre las filas 1 y 2, la 2 no desempeña ningún papel de importancia en la estrategia del jugador I. 4>3 -8 > -9 7>2 -2 > -3 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 29 Por lo tanto la probabilidad asociada a ella será cero. La solución del juego anterior sería la misma si la matriz de pago fuera: II I Investigació Investigación de Operaciones 1 3 1 4 2 2 -8 6 M. En C. Eduardo Bustos Farí Farías 3 7 8 4 -2 2 30 Estrategia débilmente dominante Decimos que una estrategia es “débilmente dominante” cuando no es peor que ninguna otra estrategia. Es lo mismo que decir que es la mejor o al menos igual a otra. Ojo: Una estrategia dominante es también débilmente dominante; lo contrario no es cierto. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 31 Estrategia dominante, ejemplo (cont) Análisis de casos para ver si B tiene estrategia dominante Si A elige 1 (renglón sup.), la mejor opción de B es 2 (u=-2). Si A elige 2 (renglón cen.), la mejor opción de B es 2 (u=0). Si A elige 3 (renglón inf.), las mejores opciones de B son 1 y 2 (u=-5). a1 a2 a3 b1 0 2 -5 b2 -2 0 -5 b3 4 10 0 B tiene una estrategia débilmente dominante Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 32 Ejemplo 2. Dominancia Determine si alguna de las estrategias puras del problema de la ubicación de los supermercados en los pueblos A, B y C pueden descartarse por dominación. La matriz del juego era: II I Investigació Investigación de Operaciones A B A 65 67.5 M. En C. Eduardo Bustos Farí Farías B 62.5 65 C 80 80 33 Solución El jugador I puede descartar ubicarse en A, ya que las consecuencias de esta estrategia siempre son menores o iguales a las consecuencias de B 67.5 > 65 65 > 62.5 80 = 80 II I Investigació Investigación de Operaciones A B A 65 67.5 Farías M. En C. Eduardo Bustos Farí B 62.5 65 C 80 80 34 El jugador II puede descartar A y C, ya que son inferiores a B. La matriz es: II I A 65 67.5 A B B 62.5 65 C 80 80 I II A 35 37.5 20 A B C B 32.5 35 20 I II A B C A 35 37.5 20 B 32.5 35 20 La matriz de consecuencias se reduce al valor en que coinciden ambas tablas B. Lo que indica que el supermercado I debe ubicarse en el pueblo B y controlar Investigación de Operaciones M. En C. Eduardo Bustos Farí ías elInvestigació 65% de los negocios y la cadena II ubicarseFar en el mismo pueblo y manejar 35 el 35% de los negocios restantes VALOR DEL JUEGO EL PAGO QUE SE OBTIENE PARA EL JUGADOR 1 CUANDO AMBOS JUEGAN DE MANERA OPTIMA. JUEGO JUSTO: EL VALOR DEL JUEGO ES 0. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 36 CRITERIO MINIMAX JUGADOR 2 ESTRATEGIA JUGADOR 1 1 2 3 1 -3 -2 6 2 2 0 2 3 5 -2 -4 ¿QUE OPCION ESCOGE CADA JUGADOR DE MANERA QUE LA MAYOR PERDIDA POSIBLE SEA MINIMIZADA? Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 37 CRITERIO MINIMAX JUGADOR 2 ESTRATEGIA 1 2 3 MÍNIMO 1 -3 -2 6 2 2 0 2 3 5 -2 -4 JUGADOR 1 MÁXIMO -3 0 -4 5 0 6 VALOR MAXIMIN PUNTO SILLA VALOR MINIMAX SE SELECCIONA LA OPCION 2 VALOR DEL JUEGO= 0 (JUEGO JUSTO). Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 38 PUNTO SILLA MINIMAX= MAXIMIN PUNTO SILLA ->NINGUN JUGADOR PUEDE APROVECHAR LA ESTRATEGIA CONOCIDA DE SU OPONENTE -> SOLUCION ESTABLE Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 39 SOLUCIONES SIN PUNTO SILLA JUGADOR 2 ESTRATEGIA 1 0 -2 2 2 5 4 -3 3 2 3 -4 JUGADOR 1 MÁXIMO Investigació Investigación de Operaciones 1 2 3 MÍNIMO -2 -3 -4 maximin 5 4 2 M. En C. Eduardo Bustos Farí Farías minimax 40 Solución Óptima de juegos de 2 personas y suma cero - Juegos estables (Valor de juego, estrategias minimax y maximin). Puntos silla - Juegos Inestables (estrategias mixtas) Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 41 Juegos inestables o estrategias mixtas El objetivo en la teoría de juegos es determinar una estrategia “mejor” para un jugador dado, bajo la consideración de que el oponente es racional y realizará movimientos inteligentes en contra. En consecuencia si un jugador siempre selecciona la misma estrategia pura o selecciona estrategias puras en un orden fijo, su oponente reconocerá a tiempo el patrón y tratará de vencerlo, si es posible. Por esto, la estrategia más efectiva es una estrategia mixta, definida por una distribución probabilística sobre un conjunto de estrategias puras. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 42 Ejemplo 1: Estrategias mixtas. En el juego de mostrar 1,2 ó 3 dados se puede construir una estrategia mixta X=[1/6, 1/3, ½], que significa que el jugador uno, planea mostrar el dedo 1 1/6 de veces, 2 dedos 1/3 de veces, 3 dedos ½ de las veces. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 43 Ejemplo 2: Estrategias Mixtas. Sea la siguiente matriz de pagos para un juego de 2 jugadores de suma cero Este juego no tiene punto de silla, ni se puede calcular el valor de juego. Se dice que es un juego inestable. Jugador A Investigació Investigación de Operaciones 1 2 3 4 1 5 6 Jugador B 2 3 -10 9 7 8 8 7 15 3 4 -1 M. En C. Eduardo Bustos Farí Farías 4 0 1 2 4 44 Solución del problema de estrategias mixtas Se basa en el criterio mínimax. La única diferencia es que A (ó jugador I) elije Xi, la cual maximiza el pago esperado más pequeño en una columna, en tanto que B (ó jugador II) selecciona Yj, la cual minimiza el pago esperado en un renglón. Igual que en estrategias puras se verifica la relación: pago esperado minimo < pago esperado maximin Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 45 Cuando Xi y Yj corresponden a la solución óptima, se cumple la igualdad y los valores resultantes llegan a ser iguales al valor esperado (óptimo) del juego. Si Xi* y Yj* son las soluciones óptimas para ambos jugadores, cada elemento de pago Aij estará asociado a la probabilidad (Xi*, Yj*). Por consiguiente, el valor esperado óptimo del juego es: En otras palabras cualquier juego matricial tiene un valor Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 46 Métodos para resolver juegos Métodos para resolver juegos (2xn) ó (mx2) Gráfico De programación lineal Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 47 Solución gráfica de juegos de (2xN) y (Mx2) Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo menos uno de los jugadores, tiene solamente 2 estrategias. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 48 Solución gráfica de juegos (mx2) 49 Ejemplo 1 Considere el siguiente juego: B A 1 2 1 2 4 2 2 3 3 3 2 4 -M.2En C. Eduardo Bustos 6 Farí Farías Investigació Investigación de Operaciones 50 SOLUCIÓN 51 El juego no tiene un punto silla. Sean y1 y y2 (=1- y1) dos estrategias mixtas de B. Estrategia pura de A 1 Pagos esperados para B -2y1 + 4 2 -y1 + 3 3 y1 + 2 4 Investigació Investigación de Operaciones -8y1 + 6 M. En C. Eduardo Bustos Farí Farías 52 El juego no tiene punto silla. Sean Y1 y Y2 (Y2 = 1-Y1) dos estrategias mixtas de B Estrategias puras Pagos esperados de A de B 1 -2Y1 + 4 2 -Y1 + 3 3 Y1 + 2 4 -8Y1 + 6 Investigació Investigación de Operaciones Y1 = 0 Y1 = 1 4 3 2 6 2 2 3 -2 M. En C. Eduardo Bustos Farí Farías 53 El punto minimax se determina como el punto mas bajo de la envolvente superior El valor de Y1* se obtiene como el punto de intersección de las líneas 1 y 3 -2Y1 + 4 = Y1 + 2 -3Y = -2 Y = 2/3 (Esta es la estrategia óptima para A) Sustituyendo en 1 y en 3 V* = -2(2/3) + 4 = 8/3 2/3 + 2 = 8/3 El valor del juego es 8/3 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 54 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 55 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 56 POR WINQSB ESTRATEGIA ÓPTIMA PARA EL JUGADOR A ESTRATEGIA ÓPTIMA PARA EL JUGADOR B Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 57 Ejemplo2: Considere el siguiente juego (2x4) 1. 2. 3. Encuentre el punto máximo Calcule la estrategia optima de A Calcule el valor del juego A Investigació Investigación de Operaciones 1 2 1 2 4 B 2 2 3 M. En C. Eduardo Bustos Farí Farías 3 3 2 4 -1 6 58 Solución El juego no es estable ya que las estrategias puras maximin = 2 es diferente a la mínimax = 3 Por lo que los pagos esperados de A corresponden a las estrategias puras de B son: Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 59 Estrategias puras Pagos esperados de B de A 1 -2X1 + 4 -X1 + 3 2 3 X1 +2 4 -7X1 + 6 X1 = 0 X1 = 1 4 3 2 6 2 2 3 -1 Resolviendo 2 y 3 -X1 + 3 = X1 +2 -2X1 = -1 X1 = ½ (maximin) A La estrategia óptima es (½ , ½) V* = - ½ +3 = 5/2 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 1 2 1 2 4 B 2 2 3 3 3 2 4 -1 6 60 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 61 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 62 Ejemplo 3: Considere el juego (2x4) Encuentre el punto maximin Calcule la estrategia óptima Calcule el valor de juego P1 Investigació Investigación de Operaciones 1 2 1 19 0 P2 2 15 20 M. En C. Eduardo Bustos Farí Farías 3 17 15 4 16 5 63 Solución El juego no es estable ya que las estrategias puras maximin = 15 es diferente a mínimax = 16 Estrategias puras Pagos esperados de P2 de P1 1 (19-0)X1 + 0 = 19X1 2 (15-20)X1 + 20 = -5X1 + 20 3 (17-15)X1 + 15 = 2X1 +15 4 (16-5)X1 + 5 = 11X1 + 5 Investigació Investigación de Operaciones X1 = 0 X1 = 1 0 19 20 15 15 17 5 16 M. En C. Eduardo Bustos Farí Farías 64 Resuélvalo por winqsb Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 65 Método simplex 66 Solución de juegos (mxn) por programación lineal Se trata de Maximizar el valor del juego (representado por las estrategias de un jugador). Sujeto a la combinación lineal por renglón de la matriz de juego. Si el valor maximin es positivo se procede de este modo, si es negativo se agrega a la matriz de juego una constante k Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 67 Ejemplo 1. Sea la matriz de consecuencias para el juego (2x2): Jugador 1 Investigació Investigación de Operaciones A1 A2 Jugador 2 B1 B2 0 ½ 1 0 M. En C. Eduardo Bustos Farí Farías 68 Solución por programación lineal Como el valor maximin = 0, se procede a resolver: MAX Z = Y1 + Y2 S.A. Jugador 1 A1 A2 0Y1 + 0.5Y2 <= 1 1Y1 + 0Y2 < = 1 Y1, Y2 >= 0 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías Jugador 2 B1 B2 0 ½ 1 0 69 Solución por Winqsb: planteamiento Jugador 1 Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías A1 A2 Jugador 2 B1 B2 0 ½ 1 0 70 Datos importantes Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 71 Estrategias óptimas Estrategias óptimas del jugador 2 V* = 1/3 Y1* = 1/3 Y2* = 2/3 (.3, .6) Estrategias para uno de los jugadores Para obtener las estrategias óptimas del jugador 1 resolvemos por simplex dual y se tiene: X1* = 2/3 X2* = 1/3 (0.66, 0.33), véase que suman 1. Investigació Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías 72 EJERCICIOS DE REPASO DEL TEMA DE TEORÍA DE JUEGOS. INVESTIGACIÓN DE OPERACIONES M. EN C. EDUARDO BUSTOS FARÍAS 6 1