TEORÍA DE JUEGOS La Teoría de Juegos consiste en la elaboración de recomendaciones sobre la forma razonable de las acciones de cada uno de los contrincantes en el curso de una situación de conflicto; es prácticamente una teoría matemática de las situaciones en conflicto. En un conflicto de juego los dos oponentes son llamados jugadores y cada uno de ellos tendrá un numero finito o infinito de estrategias; a cada estrategia se encuentra asociada una recompensa que un jugador paga a otro. Estos juegos se conocen como juegos de suma cero entre dos personas debido a que la ganancia de un jugador es igual a la pérdida del otro y los intereses de los jugadores son completamente opuestos, por lo tanto, es suficiente con resumir el juego en términos del pago a solo uno de los dos jugadores, es decir, al designar dos jugadores A y B con estrategias m y n, respectivamente, el juego se representa mediante una matriz de pagos al jugador A, de la siguiente manera: A1 A2 . . . Am B1 a11 a21 . . . am1 B2 a12 a22 . . . am2 B3 a13 a23 . . . . . . am3 Bn a1n a2n . . . amn La anterior representación indica que si A usa la estrategia i y B la estrategia j, el pago a A es aij y el pago a B es − aij. En la teoría de juegos se denomina jugada a la elección de una de las estrategia dadas; estas jugadas pueden ser personales, cuando la elección de la estrategia se hace conscientemente, o al azar, cuando la elección de la estrategia es realizada por un mecanismo de elección casual y no por el jugador. Para que el juego esté matemáticamente definido, se debe indicar para cada estrategia la distribución de probabilidad. Su objetivo principal es elaborar recomendaciones para elegir la estrategia óptima, definida como la estrategia que garantiza al jugador la ganancia media máxima posible o la pérdida media máxima posible a medida que el juego se repite reiteradamente, de cada uno de los jugadores SOLUCIÓN OPTIMA DE JUEGOS DE SUMA CERO ENTRE DOS PERSONAS Debido a que los juegos se concentran en conflictos de interés, la solución optima del problema elige una o más estrategias para cada jugador de tal manera que cualquier cambio en las estrategias elegidas no mejore el pago a cualquiera de los dos jugadores. Estas soluciones pueden realizarse de dos formas: estrategia pura, con una sola estrategia, o estrategia mixta, con varias estrategias que se mezclan de acuerdo con probabilidades predeterminadas. Ejemplo 1 Dos compañías A y B venden dos marcas de antigripales, La compañía A se anuncia por radio (A1), televisión (A2) y periódicos (A3). La compañía B, además de utilizar radio (B1), televisión (B2) y periódicos (B3), también manda por correo folletos (B4). Dependiendo del ingenio y la intensidad de la 1 campaña de publicidad, cada compañía puede capturar una porción del mercado de la otra. La siguiente matriz resume el porcentaje del mercado capturado o perdido por la compañía A: A1 A2 A3 Máximo de la columna B1 8 6 −2 B2 −2 5 4 8 B3 9 6 −9 5 B4 −3 8 5 9 Mínimo de la fila −3 5 Maximin −9 8 Minimax La solución del juego se basa en asegurar lo mejor de lo peor para cada jugador. Si la compañía A selecciona la estrategia A1, entonces sin importar lo que haga B, lo peor que le puede suceder es que pierda 3% de la participación del mercado a favor de B. Esto se encuentra representado por el valor mínimo de las entradas de la fila 1. De manera similar, el peor resultado de la estrategia A2 es que capture 5% del mercado de B y el peor resultado de la estrategia A3 es que pierda 9% de la participación del mercado a favor de B. Los anteriores resultados se separan en la columna mínimo de fila y, para lograr lo mejor de lo peor, la compañía A escoge la estrategia A2 debido a que a esta corresponde el mayor valor de la columna mínimo de fila denominado Maximin. Considerando ahora la estrategia de B se requiere escoger el valor mínimo Minimax de la columna Máximo de la columna para lograr lo mejor de lo peor de B debido a que la matriz de pago esta dada para A. Tenemos así que la estrategia a escoger es B2. La solución optima del juego debe seleccionar las estrategias A2 y B2, es decir, ambas compañías deben anunciarse en televisión Esto indica que el resultado estará a favor de A debido a que su participación en el mercado aumentará un 5%, por lo tanto, decimos que el valor del juego es 5% y que A y B usan una solución de punto de equilibrio. Esta solución garantiza que ninguna compañía está tentada a seleccionar otra estrategia debido a que esto ocasionaría perdidas en la participación del mercado, es decir, en caso de que B decida moverse a cualquiera de las otras estrategias, A puede escoger quedarse con la elegida ocasionando así una perdida de participación de mercado para B del 6% u 8% según la estrategia elegida por B, de igual manera, si A decide cambiar a la estrategia A3 , B puede moverse a B3 ocasionando así un incremento del 9% en la participación del mercado a favor de B. Ejemplo 2 Dos jugadores A y B participan en un juego de lanzamiento al aire de una moneda. Cada jugador, desconocido para el otro, elige cara (C) o cruz (Z). Ambos jugadores revelarán sus elecciones de forma simultánea. Si concuerdan (CC o ZZ), el jugador A recibe 1 dólar de B, de otra forma, A paga 1 dólar a B. La siguiente matriz de pagos para el jugador A da los valores mínimo de la fila y máximo de la columna que corresponden a las estrategias de A y B, respectivamente: Ac Az Máximo de la columna Bc 1 −1 Bz −1 1 Mínimo de la fila −1 −1 1 1 2 Los valores máximo y mínimo del juego son −1 dólar y 1 dólar, respectivamente. Debido a que los valores no son iguales, el juego no tiene una solución de estrategia pura ya que si A utiliza una estrategia que ocasione perdidas a B, B puede moverse de tal forma que no le ocasione perdidas lo que indica que los jugadores pueden cambiar de estrategias según conveniencia y por esto es que una estrategia pura no es aceptable. Tenemos entonces que ambos jugadores deben usar mezclas aleatorias apropiadas de sus respectivas estrategias. En este caso, el valor óptimo del juego se dará en algún lugar entre los valores maximin y minimax , así: Valor maximin (más bajo) " valor del juego " valor minimax (más alto) Así, el valor del juego debe estar entre −1 dólar y 1 dólar. SOLUCIÓN DE JUEGOS DE ESTRATEGIAS MIXTAS Al emplear estrategias mixtas se puede obtener para cada juego finito una solución o un par de estrategias que al ser empleadas por los dos jugadores originarán una ganancia igual al valor del juego y en caso de que un jugador decida cambiar su estrategia la ganancia sólo cambiará desfavorablemente para este. Los juegos de estrategias mixtas se pueden resolver de forma gráfica o mediante programación lineal. La solución gráfica es conveniente para juegos en los que al menos un jugador tiene exactamente dos estrategias puras. La ganancia obtenida como fruto de la solución se llama valor del juego, denotado como , el cual siempre se encuentra entre los valores mínimo y máximo del juego. SOLUCIÓN GRÁFICA DE JUEGOS Comenzamos por el caso en que el jugador A tiene dos estrategias, (2xn) x1 : 1 − x1 : A1 A2 y1 B1 a11 a21 y2 B2 a12 a22 yn Bn a1n a2n En este juego el jugador A mezcla las estrategias A1 y A2 con sus respectivas probabilidades x1 y 1 − x1 con 0 " x1 " 1 y el jugador B mezcla las estrategias B1 a Bn con las probabilidades y1, y2, , y yn donde yj " 0 para j = 1,2, , n y y1+y2 + + yn = 1. Para este caso el pago esperado de A que corresponde a la j−ésima estrategia pura de B esta dada por: (a1j − a2j ) x1 ± a2j , j = 1,2, , n (1) El jugador A busca entonces determinar el valor de x1 que maximice los pagos mínimos esperados, es decir: Max min {(a1j − a2j ) x1 ± a2j } x1 j Ejemplo 3. 3 Considere el siguiente juego de 2 x 4. El pago es para el jugador A. A1 A2 B1 2 4 B2 2 3 B3 3 2 Bn −1 6 Este juego no posee una solución de estrategia pura, por lo tanto, las estrategias deben mezclarse. Utilizando la fórmula (1) calculamos los pagos esperados de A correspondientes a las estrategias puras de B, así: Estrategia pura de B 1 2 3 4 Pago esperado de A −2x1 + 4 − x1 + 3 x1 + 2 −7x1 + 6 Utilizando las ecuaciones obtenidas para los pagos esperados de A realizamos las gráficas correspondientes, mostradas a continuación: Esta gráfica presenta las cuatro líneas rectas asociadas con las estrategias puras de B. Para determinar lo mejor de lo peor , la envolvente inferior representa el pago esperado mínimo, es decir lo peor, para A sin tener en cuenta lo que haga B. El máximo, o sea lo mejor, de la envolvente inferior corresponde al punto de la solución maximin en x*1 = 0.5, que es el punto intersección entre las rectas 3 y 4. La solución óptima del jugador A pide mezclar las estrategias A1 y A2 con probabilidades 0.5 y 0.5, respectivamente. El valor del juego se determina sustituyendo x1 = 0.5 en cualquiera de las ecuaciones 3 y 4, así: 4 La mezcla óptima del jugador B se determina mediante las dos estrategias que definen la envolvente inferior de la gráfica, por lo tanto B puede mezclar las estrategias B3 y B4 , en cuyo caso y1 = y2 = 0 y y4 = 1 − y3 . Tenemos entonces que los pagos de B correspondientes a las estrategias puras de A están dados como: Estrategias puras de A 1 2 Pago esperado de B 4y3 − 1 − 4y3 + 6 La solución lo mejor de lo peor para B es el punto mínimo sobre la envolvente superior de las dos líneas dadas. Este proceso es equivalente a resolver la ecuación La solución de y3 = , que da el valor del juego como: La solución del juego requiere que el jugador A mezcle A1 y A2 con probabilidades iguales y para el jugador B mezclar B1 y B2 con probabilidades y . SOLUCIÓN DE JUEGOS CON PROGRAMACIÓN LINEAL La teoría de juegos tiene una fuerte relación con la programación lineal debido a que un juego de suma cero entre dos personas se puede expresar como un programa lineal y viceversa. Incluso, J. von Neuman, padre de la teoría de juegos, reconoció la relación entre esta teoría y la programación y recalcó el concepto de dualidad en la programación lineal. Tenemos entonces que las probabilidades óptimas del jugador A xi , con i = 1, 2,, m se puede determinar resolviendo el siguiente problema máximin: 5 Para transformar el problema en un programa lineal, sea La ecuación implica que El problema del jugador A se puede escribir como: Maximice z = v Sujeta a: El valor del juego no tiene restricciones debido a que su signo puede cambiar dependiendo del resultado de este. Las estrategias óptimas de B , y1 , y2 , .. , y yn se determinan resolviendo el problema Mediante un procedimiento al requerido con el problema de A, resolvemos el de B obteniendo que: Minimice w = v 6 Sujeta a: Los dos problemas optimizan la misma variable v, el valor del juego, debido a que el problema B es el dual del problema A, lo que significa que la solución optima de un problema automáticamente de la solución del otro. Ejemplo 4. Resuelva el siguiente juego con programación lineal: A1 A2 A3 Máximo de la columna B1 3 −2 −5 B2 −1 4 −6 B3 −3 −1 2 Mínimo de la fila −3 −2 −6 3 4 2 Notamos que el valor del juego se encuentra entre los valores −2 y 2. Tenemos entonces que el programa lineal del jugador A es: Maximice z = v Sujeta a: 7 La solución óptima es: La solución dual asociada es: La razón por la cual los resultados de las probabilidades de B son negativos es debido a que el problema de A es una maximización con restricciones ", una condición que requiere que las variables duales asociadas sean negativas. El programa lineal de B esta dado por: Minimice z = v Sujeta a: La solución óptima es: La solución dual asociada es: 8 BIBLIOGRAFÍA • TAHA, Handy A., Investigación de Operaciones, Una Introducción, Sexta Edición, Prentice Hall, México, 1998 • VÉNTSEL, E.S, Elementos de la teoría de los juegos, Editorial MIR, Moscú, 1977 9 10 11 • 12