INSTITUTO POLITÉCNICO NACIONAL Escuela Superior de Fı́sica y Matemáticas Teorı́a de Juegos Matriciales y Aplicaciones TESIS QUE PARA OBTENER EL TÍTULO DE LICENCIADO EN FÍSICA Y MATEMÁTICAS PRESENTA: Guillermina Ávila Garcı́a. Director de Tesis: Prof. Rubén Téllez Sánchez. México D. F., agosto de 2006 A mi querida mamá, por todo el amor que me ha manifestado siempre, la paciencia y confianza que deposita en mi, y sobre todo por que me ha mostrado lo bello de la vida a través de sus dulces palabras y su tierna luz en la mirada. A mi padre por el apoyo que me ha brindado. A mis hermanos: Lety, Luı́s, Geovanni, Ricky y Nenita por el amor, cariño, comprensión y alegrı́a que siempre me demuestran. A Iván por su infinita paciencia, cariño, amor y comprensión que siempre me expresa. A Dios por permitirme ser hija, hermana y compañera de tan excelentes y maravillosos seres humanos. Con amor y agradecimiento. 2 Agradecimientos Al M. en C. Rubén Mancio Toledo, docente de la Escuela Superior de Fı́sica y Matemáticas, amigo y excelente profesor, que me ha brindado todo su apoyo incondicional durante y después del trayecto de la carrera, ası́ como su colaboración para la escritura del presente trabajo. Al M. en I. Rubén Téllez Sánchez asesor de la presente tésis, por su valioso apoyo y paciencia para llevar a cabo éste trabajo. A los integrantes del jurado: M. en C. Rubén Mancio Toledo, Dr. Isidro Romero Medina, Lic. Francisco Quezada Campo, Lic. Armando Hernández Solis, por su valiosa colaboración en la revisión y sugerencias de ésta tésis. A todos los profesores de la Escuela Superior de Fı́sica y Matemáticas por contribuir a mi formación académica. Agradeciendo infinitamente la atención, apoyo y paciencia recibida. 3 Índice general Introducción 6 1. Esquema Conceptual y Contexto de la Teorı́a de Juegos 9 1.1. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2. La importancia de la Teorı́a de Juegos . . . . . . . . . . . . . . . . . 10 1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos . . . . . . . . . 11 1.4. Aplicación de la Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . . 13 2. Tipologı́as y Fundamentos Matemáticos de la Teorı́a de Juegos 14 2.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2. Tipos de jugadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.3. Juegos de información perfecta . . . . . . . . . . . . . . . . . . . . . 16 2.4. Juegos de suma-cero para 2 oponentes . . . . . . . . . . . . . . . . . 16 3. Metodologı́a para la solución de problemas 19 3.1. Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2. Estrategias de Seguridad . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.4. Uso de estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 23 3.5. Métodos para resolver juegos matriciales . . . . . . . . . . . . . . . . 24 3.6. Técnica de punto de silla de montar . . . . . . . . . . . . . . . . . . . 25 3.7. Técnica de dominación . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.7.1. Reducción de orden de Matrices . . . . . . . . . . . . . . . . . 27 3.8. Método Algebraico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.9. Método Geométrico para los juegos 2 × n . . . . . . . . . . . . . . . . 38 3.10. Solución de juegos 2 x 2 con engaño . . . . . . . . . . . . . . . . . . . 41 4 ÍNDICE GENERAL 5 3.11. Método de subjuegos para encontrar el valor del juego . . . . . . . . . 4. Programación Lineal 44 49 4.1. Teorema del Mı́nimax . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.2. Solución por medio de Programación Lineal . . . . . . . . . . . . . . 51 5. Juegos No Cooperativos 59 5.1. Juegos suma diferente de cero o metajuegos . . . . . . . . . . . . . . 59 Conclusiones 64 Bibliografı́a 65 Indice Alfabético 66 Avila Garcia Introducción Antecedentes Los inicios de lo que hoy se conoce como Teorı́a de Juegos se remontan al año 1759 cuando el economista Quesnay empieza a utilizar modelos primitivos de programación matemática. Más tarde, otro economista de nombre Walras, hace uso, en 1874, de técnicas similares. Los modelos lineales de la investigación de operaciones, tienen como precursores a Jordan en 1873, Minkowsky en 1896 y a Farkas en 1903. La teorı́a de juegos se cimentó en 1939 con el matemático von Neuman y el economista Oskar Morgenstern. No fue sino hasta la Segunda Guerra Mundial cuando la Teorı́a de Juegos empezó a tomar auge. Primero se le utilizó en la logı́stica estratégica para vencer al enemigo y, más tarde al finalizar la guerra, en la logı́stica de distribución de todos los recursos militares de los aliados por todo el mundo. Fue debido precisamente a este último problema que el doctor George Datzing, el que en 1947, resumiendo el trabajo de muchos de sus precursores, inventará el método simplex con lo cual dio inicio a la programación lineal, que hoy en dı́a se utiliza con mucha frecuencia en la teorı́a de juegos.1 Problemática Los conflictos que se presentan hoy en dı́a, no sólo es en el sector privado, sino también en el sector de los servicios públicos, en contratos, guerras militares, guerras comerciales, marketing para la competencia de los mercados, negociaciones domésticas, comerciales y colectivas, y en alianzas, tanto en los paı́ses desarrollados como en los paı́ses del tercer mundo, lo cual ha dado lugar a que se aplique la teorı́a de juegos constantemente. En México la Teorı́a de Juegos se utiliza dentro del sector público, entre otros la Secretarı́a de Comunicaciones, Partidos Polı́ticos, Bancos, etc. 1 veáse [6] 6 Dado a que todos somos agentes económicos, conviene estudiar esta teorı́a, a fin de entender qué operaciones teóricas y prácticas podrı́an ofrecernos premios monetarios más grandes. Debe incluirse en la lista a cualquier otra situación en que dos o más individuos requieran interactuar a fines de obtener ganancias económicas. Como el ser humano es un homo economicus tanto como un homo ludicus, él puede encontrar infinidad de aplicaciones a la Teorı́a de juegos. Objetivo El objetivo principal del presente trabajo es desarrollar la teorı́a de juegos y sus aplicaciones en el ámbito laboral y en estrategias tanto militares como de mercadeo. Hipótesis La teorı́a de juegos constituye una herramienta adecuada para resolver racionalmente situaciones de conflicto. Presentación En el Capı́tulo 1 se hace referencia a un texto biblı́co, donde se realiza un análisis de cómo intuitivamente ya se usaba la teorı́a de juegos y que en la vida cotidiana estamos estrechamente ligados con la toma de decisiones usando juegos. En el capı́tulo 2, se introducen los conceptos básicos de la teorı́a de juegos ası́ como los tipos de juegos que se tienen; como son: aleatorios, no aleatorios y de información perfecta, ası́ mismo se introduce el concepto de juegos de suma cero y las valoraciones que se tienen de acuerdo a un juego establecido. En el capı́tulo 3, tenemos la parte central del trabajo, pues se define y se explica a detalle algunas de las metodologı́as para la solución a un problema de teorı́a de juegos, ası́ como las diferentes aplicaciones a las que conducen. En el capı́tulo 4, se lleva a cabo una solución mediante programación lineal, un tema muy importante en el contexto de la teorı́a de juegos, además de un bosquejo de la demostración del importante teorema del Minimax aplicable a la teorı́a de juegos; haciendo uso de teoremas muy importantes, tales como: Teorema de Dualidad, Teorema de Holgura Complementaria. Todos estos resultados nos conllevan a la solución de problemas de teorı́a de juegos por medio de programación lineal. 7 En el capı́tulo 5, se tiene un breve estudio de los juegos diferente de cero, y se explica el famoso Dilema del prisionero, y las semejanzas que existe entre éste juego y las técnicas de mercadeo, en donde dı́ficilmente se conocen las pérdidas o ganancias que puede tener nuestro oponente. Finalmente, de acuerdo a la metodologı́a empleada en el transcurso de la investigación nos conlleva a la conclusión y a algunas recomendaciones para el uso de teorı́a de juegos. El presente trabajo se desarrolla por medio de la metodologı́a, ilustrando con ejemplos partiendo desde las técnicas básicas (técnica de punto de silla, dominancia y geométricos) hasta llegar a el planteamiento y solución de aquellos juegos de m×n, los cuales son imposibles de resolver utilizando técnicas comunes, para ello se implementa la programación lineal la cual es útil y práctica para resolver estos juegos, haciendo uso del método simplex. 8 Capı́tulo 1 Esquema Conceptual y Contexto de la Teorı́a de Juegos 1.1. Aportaciones La Teorı́a de Juegos es un tipo de análisis matemático orientado a predecir cuál será el resultado cierto o el resultado más probable de una disputa entre dos individuos. Fue diseñada y elaborada por el matemático John von Neumann y el economista Oskar Morgenstern en 1939, con el fin de realizar el análisis económico de ciertos procesos de negociación. von Neumann y Morgenstern, escribieron el libro The Theory of Games and Economic Behaviour1 (1944). A.W. Tucker es quien diseñó el famosı́simo problema del “Dilema del Prisionero”. El matemático John Forbes Nash, Jr. (1928-) creó en 1950 la noción de “Equilibrio Nash”, que corresponde a una situación en la que dos partes rivales están de acuerdo con determinada situación del juego o negociación, cuya alteración ofrece desventajas a ambas partes. Otros importantes representantes de la teorı́a de juegos fueron el húngaro nacionalizado estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten, Nash, Harsanyi y Selten recibieron el Premio Nobel de Economı́a de 1994 por sus contribuciones a la Teorı́a de Juegos. 1 referencia completa. 9 1.2. La importancia de la Teorı́a de Juegos 1.2. La importancia de la Teorı́a de Juegos Un juego es un proceso en que dos o más personas toman decisiones y acciones, la estructura de las cuales está inscrita en un conjunto de reglas (que pueden ser formales o informales), a fines de obtener beneficio. Cada combinación de decisiones y acciones determina una situación particular, y, dado que las decisiones y acciones de los agentes involucrados (llamados los jugadores) pueden ser combinadas de numerosas formas, las situaciones generadas también serán numerosas y su magnitud igual a las de las combinaciones de decisiones y acciones de los agentes. El conjunto total de situaciones posibles es el cuadro incidental del juego. Siguiendo con este razonamiento, encontramos que cada situación (es decir, cada punto del cuadro incidental) genera una combinación de premios determinada. El premio que le da a un jugador una situación particular puede ser comparado con los premios que le ofrecen las otras situaciones. Un concepto importante es el de pago. Como se dijo, cada situación particular ofrece una combinación de premios, de la manera siguiente: si se trata de dos jugadores, la situación ofrece un premio para el primero y otro para el segundo. Si se trata de tres jugadores, la situación genera un premio para cada jugador. Ésta es la lógica de los premios y las situaciones. A cada premio se le llama pago. La Teorı́a de juegos nos ayuda a analizar juegos en los que dos o más personas compiten por un único premio o pago situación o conjunto de situaciones que en lo adelante se les llamará la solución del juego. La solución del juego se sustenta en que la conducta de cada jugador llega a engancharse con la de los otros, derivando todo esto en situaciones más fuertes que otras. Las situaciones más fuertes son las que se producen con la mayor probabilidad, y debido a esto es que se considera que la solución o desenlace del problema del juego corresponde a la situación o situaciones más fuertes, más probables. El análisis de un juego lleva muchas veces a que se determine cuál va a ser el punto final de solución de dicho juego a este resultado se le denominará resultado inminente o fatal del juego. No obstante, en realidad existen muchos juegos cuyo final es imposible de determinar, incluso con la ayuda de la Teorı́a de Juegos: estos juegos no tienen resultados inminentes, o, si es que los tienen, éstos no son previsibles y la Teorı́a de Juegos no puede predecirlos. Tal es el caso de un juego de ajedrez, el cual es un juego de suma cero: todo lo que la Teorı́a de Juegos nos puede decir acerca de este juego es que uno de los dos jugadores ganará y el otro perderá el juego. Al margen Avila Garcia 10 1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos de esta grave circunstancia, la Teorı́a de Juegos sı́ puede ayudarnos a determinar los resultados de otros muchos importantes juegos y situaciones de negociaciones e intereses en conflicto. La Teorı́a de Juegos es importante porque permite hallar los resultados inminentes o fatales de numerosos juegos diversos que debemos enfrentar cotidianamente en el mundo real. La Teorı́a de Juegos no deja de ser importante sólo porque no puede analizar la totalidad de los juegos que jugamos en el mundo real. 1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos La Teorı́a de Juegos es una disciplina que involucra en grado alto la capacidad analı́tica y proyectiva del ser humano. Es, a la vez, una disciplina susceptible de ser aplicada a diversidad de casos. Para mostrar ambas cosas simultáneamente, se hará mención de la conocida historia de las madres y el rey Salomón. Salomón recibió a dos mujeres que declaraban ser las madres de un bebé (1 Reyes 3, 16-28)2 . Ante la ausencia de datos o indicios tangibles, debı́a creerse bien a una o a la otra, luego de lo cual el bebé serı́a entregado a la mujer considerada la madre de éste. Demostrando que su gran sabidurı́a lo relevaba de la necesidad de mayor información, Salomón elaboró un juego, el cual tomó la forma de una propuesta: “Con esta espada habrá de partirse al bebé, luego de lo cual se dará una mitad del niño a cada mujer”. “Inteligentemente”, el sabio rey recurrió a una proposición perfectamente aceptable si ella era aplicada a juicios sobre materias y objetos comerciales. Este juego exaltarı́a la voluntad “competitiva” de obtener ganancia en grado máximo. El truco de Salomón consistı́a en que una valoración primordial de competencia rivalizada con la valoración dictada por el amor maternal. El criterio de optimización individual llevó a una de las madres a aceptar la peculiar propuesta salomónica. El criterio de amor maternal llevó a la otra madre a pedir una solución inscrita en la optimización colectiva: Preferı́a que el niño siguiera entero, contentándose con sólo saber que él seguı́a vivo, aún si no pudiera nunca más volver a verlo. 2 veáse [5] Avila Garcia 11 1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos Salomón observó la siguiente escala de valores: Primero: Que su hijo exista, que conserve su vida. Segundo: Tener a su hijo consigo. Salomón hizo la suposición de que sólo la verdadera madre podrı́a instintivamente conocer y respetar esta escala. Trabajando en base a dicha suposición, las sometió a una crisis, cuya solución evidente le permitirı́a acceder a sólo una parte del premio, o renunciar completamente el premio. Este premio era la tenencia del hijo, es decir, un pago correspondiente al segundo nivel de la escala de valores. La falsa madre, por su parte, tenı́a la siguiente escala de valores: Primero: Tener al hijo consigo. Segundo: Conservar por lo menos una parte del hijo consigo. Esto, traducido a términos análogos a los de la escala de valores de una verdadera madre, toma la forma de: Primero: Tener al hijo consigo. Segundo: Aunque eso conllevara la pérdida de su vida, conservar una parte del hijo consigo. Sin embargo, eso mismo llevado a una escala de valores materiales, equivale a: Primero: Ganar todo el premio. Segundo: Ganar al menos una parte del premio. Es decir que la lógica de la falsa madre era materialista, mientras que la lógica de la verdadera madre era “lógica de madre”. De hecho, Salomón supusó que la falsa madre seguirı́a la lógica materialista que es apropiada para la mayorı́a de problemas de obtención de premios, en tanto que la verdadera madre seguirı́a la lógica de madre. El problema impuesto por Salomón, de cumplirse las suposiciones de sabio, quitarı́a el disfraz de madre a la falsa madre. Avila Garcia 12 1.4. Aplicación de la Teorı́a de Juegos 1.4. Aplicación de la Teorı́a de Juegos Para usar la Teorı́a de Juegos como una aplicación para una situación real, se requiere construir modelos simplificados de la realidad. En estos modelos, se tendrá que representar a cada jugador con sus respectivas formas de conducta. Cuando se trata de un juego en el que se enfrenta a un único rival, normalmente se puede decir que se conoce perfectamente cuál es su propia forma de actuar, pero ignora o conoce sólo en parte la de su rival u oponente. Por esto se hace más fácil representar simplificadamente su propia conducta que representar la conducta del rival. En cualquier caso, se requiere representar adecuadamente las conductas de los dos (o más) jugadores que intervienen. A veces se necesitarı́a plantear dos o más representaciones de la conducta probable del rival. Cada representación recibe el nombre de escenario. Cada escenario es un juego simple. El conjunto de dos o más escenarios es un juego compuesto. Avila Garcia 13 Capı́tulo 2 Tipologı́as y Fundamentos Matemáticos de la Teorı́a de Juegos 2.1. Conceptos En un juego; puede haber dos o más oponentes; entonces se habla de juegos para dos personas o, en general, para n personas. Los jugadores en un juego para n personas pueden formar coaliciones permanentes o temporales durante el curso del juego; todos los miembros de una coalición permanente se consideran en conjunto como un jugador, puesto que tienen los mismos intereses. A los juegos de dos personas también se les llama bipersonales. Considérense dos jugadores I y II, con intereses opuestos. Por juego, se entiende un curso de eventos que consisten de una sucesión de acciones por parte de I y II. Para que el juego sea susceptible de análisis matemático, también debe tenerse un sistema de reglas establecidas sin ambigüedad, es decir, un sistema de condiciones que regulen las acciones permisibles para cada jugador en cada etapa del juego, la cantidad de información que tiene cada bando acerca del comportamiento del otro, la sucesión de jugadas (es decir, las decisiones que se toman en el curso del juego) y también el resultado del juego, que se obtiene de la totalidad de las jugadas realizadas por cada bando. Se dice que un juego es de suma cero si la suma de las ganancias es cero, es 14 2.2. Tipos de jugadas 15 decir, si uno de los bandos pierde exactamente tanto como lo que el otro gana. En los juegos de suma cero, las metas que persiguen los jugadores son totalmente opuestas. La teorı́a de juegos se divide en cuanto a: a) Jugadores - Juego de dos personas - Juego de n personas b) Número de estrategias disponibles a cada decisor - Juegos finitos - Juegos infinitos c) Objetivos del juego - Juegos de suma - cero - Juegos suma diferente de cero o metajuegos. 2.2. Tipos de jugadas Un juego se realiza mediante jugadas sucesivas; cada jugada es una elección de una de las alternativas posibles especificadas por las reglas. Una jugada puede ser personal o aleatoria. Una jugada personal es una elección y ejecución consciente, por parte de uno de los jugadores, de una de las jugadas que sean posibles en la situación dada. Un ejemplo de una jugada personal es cualquier jugada en un juego de ajedrez. Cuando le corresponde su turno, el jugador hace una elección consciente de entre las jugadas posibles, dependiendo de la posición de las piezas sobre el tablero. El conjunto de posibilidades disponibles para una jugada personal está determinado por las reglas del juego y depende de la totalidad de las jugadas previas realizadas por ambos jugadores. Una jugada aleatoria es la elección de una posibilidad de entre un cierto número de ellas, no por la decisión de un jugador, sino por el resultado de algún evento aleatorio (lanzamiento de una moneda, lanzamiento de dados, baraja y reparto de cartas, etc.). Por ejemplo, si el juego requiere que se extraiga una carta al azar de una baraja completa, ésta es una jugada aleatoria con 52 resultados posibles, cada uno con la misma probabilidad. Para que el juego sea matemáticamente determinado, las reglas del juego deben aclarar cuál es la distribución de probabilidad de los diversos resultados posibles de cada una de las jugadas aleatorias. Algunos juegos sólo contienen jugadas aleatorias y, con propiedad, se les da el nombre de ”juegos de azar”. Otros sólo contienen jugadas personales (ajedrez, damas). La mayorı́a de los juegos de cartas son mixtos, contienen tanto jugadas personales como aleatorias. Avila Garcia 2.3. Juegos de información perfecta 2.3. 16 Juegos de información perfecta Los juegos también se clasifican según el tipo y cantidad de la información disponible -para cada jugador- acerca de las jugadas del oponente. Un juego en el cual cada participante, al hacer una jugada, conoce los resultados de todas las jugadas hechas previamente, sean éstas personales o aleatorias, se llama juego de información perfecta. Ejemplos de tales juegos son el ajedrez, las damas y el juego de tres en raya. En otros juegos, los jugadores no tienen esa información perfecta; en el póker, por ejemplo, los jugadores no saben cuáles cartas han recibido sus oponentes. En la vida real la mayorı́a de las situaciones antagónicas no son juegos de información perfecta, dado que la ignorancia de las acciones del oponente, generalmente, es un elemento esencial de tales situaciones. 2.4. Juegos de suma-cero para 2 oponentes Los elementos en la formulación de un juego normal son los siguientes: 1. Un conjunto finito de estrategias puras E1 = {I1 , I2 , . . . , In }, para el jugador I y un conjunto finito de estrategias puras E2 = {II1 , II2 , . . . , IIm } para el jugador II. 2. Una matriz real de orden n × m A = (aij ). Cada elemento de esta matriz es el pago para el jugador I cuando elige la estrategia Ii y el jugador II escoge la estrategia IIj . El pago para el jugador II en estas circunstancias es −aij . La representación de la matriz, es: Estrategia del jugador de renglones, Estrategia del jugador de columnas, jugador I jugador II columna 1 columna 2 · · · columna n renglón 1 a11 a12 ··· a1n renglón 2 .. . a21 .. . a22 .. . ··· ··· a2n .. . renglón m am1 am2 ··· amn Una solución de estos juegos especifı́ca las estrategias óptimas que los jugadores racionales usarán y el pago que se obtiene con ellas. La solución o soluciones de un Avila Garcia 2.4. Juegos de suma-cero para 2 oponentes juego de 2 personas de suma nula pueden caracterizarse de dos formas: mediante las estrategias de seguridad y con el concepto de punto de equilibrio. Ejemplo 1.1 O.G. Haywood (1954)1 . En el desembarco aliado, en agosto de 1944, se ha abierto una brecha por mar Avranches (Francia). La cabeza de playa ha expuesto el flanco oeste del noveno ejército alemán, mandado por el general von Kluge. Este tiene dos posibles formas de actuar: (1) Atacar hacia al oeste para llegar al mar, asegurándose su flanco occidental y dividir a las fuerzas americanas. (2) Retirarse hacia el este para llegar a una mejor posición defensiva cerca del rı́o Sena. El general americano Bradley tiene al primer ejército americano conteniendo al ejército alemán desde la cabeza de playa, y más al interior tiene al tercer ejército, bajo las órdenes del general Patton, en reserva, haciendo misiones de limpieza del terreno hacia el este, sur y oeste. Bradley consideró tres posibilidades: (1) Ordenar a la reserva volver a defender la brecha abierta. (2) Enviar la reserva hacia el este para intentar cortar la retirada del noveno ejército alemán. (3) Mantener las reservas en su posición durante un dı́a y decidir después si ordenar ayudar a la cabeza de playa si era atacada o enviarlas hacia el este. El análisis completo de la situación le llevó a valorar los diferentes resultados de acuerdo con la tabla siguiente, en la que las filas representan las estrategias del general Bradley, y las columnas las estrategias del general von Kluge. 1. Atacar 2. Retirarse 1. Reforzar Se mantiene la brecha Débil presión sobre la retirada alemana 2. Mover Se produce el corte alemán Se mantiene la brecha y los alemanes son rodeados Fuerte presión en la retirada alemana 3. Esperar Moderada presión en la retirada alemana Lógicamente, la resolución del conflicto dependerá de la valoración de los resultados v (i, j), i = 1, 2, 3 y j = 1, 2. El orden de preferencias de mejor a peor según la doctrina del ejército americano era: v (3, 1) > v (2, 2) > v (3, 2) > v (1, 2) > v (2, 1) , por lo que al buscar la estrategia menos mala, maximin, el general Bradley escogió la tercera estrategia. Las valoraciones alemanas debı́an ser similares, pues el general von 1 veáse [3] Avila Garcia 17 2.4. Juegos de suma-cero para 2 oponentes Kluge decidió retirarse, pero nunca ejecutó su decisión. Hitler, a cientos de kilómetros del campo de batalla, debió tener otras valoraciones del conflicto y ordenó atacar y cerrar la brecha. El resultado fue que Bradley resistió el ataque alemán; y mantuvo la reserva en el sur, lo que permitió enviarla el segundo dı́a hacia el este; los alemanes comenzaron la retirada, siendo rodeados por las armadas americana y francesa, lo que llevó al suicidio al general alemán. Cada jugador puede ordenar las valoraciones y dar valores numéricos a las consecuencias v(i, j) (vI(i, j), vII(i, j)) En el caso de que las valoraciones se consideren de forma totalmente opuesta por los jugadores para uno supone ganancias y para el otro implique pérdidas éstas pueden expresarse se dice que la situación corresponde a un juego de suma nula. Cuando esto no ocurre la valoración del juego vendrá dada para cada resultado por dos números no necesariamente relacionados pues suponen el reflejo de dos valoraciones independientes llamándose a estos juegos por oposición a los anteriores juegos de suma no nula. En otras ocasiones las valoraciones no pueden ordenarse, e incluso valorar las estrategias pueden tenerse en cuenta diferentes aspectos. En el ejemplo anterior, los generales podı́an valorar los resultados no sólo dependiendo del curso de la guerra sino también del impacto que se podrı́a producir en la población civil y su entorno. De hecho muchos modelos se consideran con objetivos escalares debido a la dificultad de resolver el modelo con objetivos múltiples. Hay situaciones en las que una misma estrategia debe ser empleada en diferentes escenarios por ejemplo las polı́ticas de producción de dos empresas que compiten en su mercado pueden valorarse escalarmente, pero si compiten simultáneamente en varios mercados debe emplearse la valoración vectorial. Avila Garcia 18 Capı́tulo 3 Metodologı́a para la solución de problemas 3.1. Estrategias Uno de los conceptos fundamentales de la teorı́a de juegos es la de estrategias. Representaremos por Ii , 1 ≤ i ≤ n las estrategias puras del jugador I y por IIj , 1 ≤ j ≤ m las estrategias puras del jugador II. El juego permite determinar la valoración que ocasiona el que cada jugador utilice una de sus estrategias por lo que representaremos por v (i, j) la valoración de las consecuencias del empleo de la estrategia Ii por el primer jugador y la estrategia IIj por parte del segundo. Al variar i y j en sus respectivos campos se tiene una estructura de matriz aunque los valores no sean números reales por lo que a estos juegos se les denomina juegos matriciales. Estas valoraciones pueden ser interpretadas de muy diversas formas por los jugadores que intervienen en el juego. 3.2. Estrategias de Seguridad En los juegos de suma nula cuando un jugador intenta maximizar su pago a la vez esta intentando minimizar el pago de su oponente. Cada jugador considera el peor resultado que puede conseguir con cada una de sus estrategias y después escoge la estrategia que le proporciona el mejor de los peores resultados. 19 3.2. Estrategias de Seguridad 20 Definición 3.2.1 Para cada estrategia pura Ii ∈ E1 , el nivel de seguridad del jugador I es el pago que puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II: vI (Ii ) = mı́n aij . (3.1) j Para cada estrategia pura IIj ∈ E2 el nivel de seguridad del jugador II es el pago que puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I: vII (IIj ) = máx aij . (3.2) i Definición 3.2.2 i) El valor maximin (o valor inferior del juego) del jugador I es: vI = máx vi (Ii ) = máx mı́n aij . i i j (3.3) Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su valor maximin. ii) El valor minimax (o valor superior del juego) del jugador II es vII = mı́n vII (IIj ) = mı́n máx aij . j j i (3.4) Una estrategia de seguridad o estrategia minimax es la que proporciona al jugador su valor minimax. Teorema 3.2.1 Para cada juego matricial de matriz A = (aij ) se tiene: i) Los valores vI y vII son únicos. ii) Existe al menos una estrategia de seguridad para cada jugador. iii) vI ≤ vII . Avila Garcia 3.3. Estrategias Mixtas 21 Definición 3.2.3 Un juego matricial, de matriz A = (aij ) tiene un punto de silla en estrategias puras cuando se cumple la igualdad: vI = vII . Este valor común se llama valor del juego y es el menor elemento de su fila y el máximo de su columna. Se denota por v. Observación 3.2.1 Un punto de silla, si existe, es el pago correspondiente a una pareja de estrategias de seguridad. Dichas estrategias, junto con el valor del juego, constituyen una solución del juego. 3.3. Estrategias Mixtas Definición 3.3.1 Una estrategia mixta para un jugador es una distribución de probabilidad en el conjunto de sus estrategias puras. En general, si un jugador tiene n estrategias puras, una estrategia mixta para n X él es una n-tupla x = (x1 , . . . , xn ) tal que xi = 1, 0 ≤ xi ≤ 1, en donde xi i=1 indica la probabilidad con que el jugador seleccionará su i-ésima estrategia pura. El conjunto de estrategias mixtas siempre incluye a todas las estrategias puras porque estas últimas pueden considerarse como un caso especial de estrategia mixta en que la correspondiente estrategia pura se juega con probabilidad 1 y todas las demás con probabilidad cero. Observación 3.3.1 Sea A = (aij ), 1 ≤ i ≤ n, 1 ≤ j ≤ m, la matriz de pagos de un juego. Sean X e Y los conjuntos de estrategias mixtas de los jugadores I y II respectivamente. ( ) n X X = x ∈ Rn : xi = 1, xi ≥ 1, i = 1, . . . , n . i=1 ( Y = m y∈R : m X ) yj = 1, yj ≥ 1, j = 1, . . . , m . j=1 Avila Garcia 3.3. Estrategias Mixtas 22 Para analizar el resultado del juego cuando uno o ambos jugadores utilizan estrategias mixtas podemos utilizar el concepto de valor esperado. En este caso la función de pagos del juego es: v (x, y) = n X m X xi aij yj , x ∈ X, y ∈ Y i=1 j=1 que es el valor esperado de conseguir los pagos del juego con la combinación de estrategias mixtas x ∈ X, y ∈ Y . Los distintos conceptos estudiados en estrategias puras pueden extenderse al caso de las estrategias mixtas. Definición 3.3.2 Para cada estrategia mixta x ∈ X, el nivel de seguridad del jugador I es el valor esperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II. v I (x) = mı́n v (x, y) . y∈Y Para cada estrategia mixta y ∈ Y , el nivel de seguridad del jugador II es el valor esperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I. v II (y) = máx v (x, y) . x∈X Definición 3.3.3 El valor maximin en estrategias mixtas del jugador I es: vIM = máx mı́n v (x, y) . x∈X y∈Y (3.5) Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su valor maximin. Definición 3.3.4 El valor mı́nimax en estrategias mixtas del jugador II es: M vII = mı́n máx v (x, y) . y∈Y x∈X (3.6) Una estrategia de seguridad o estrategia mı́nimax es la que proporciona al jugador su valor mı́nimax. Avila Garcia 3.4. Uso de estrategias mixtas 23 Teorema 3.3.1 En un juego matricial de suma nula se tiene: M i) Los valores vIM y vII son únicos. ii) Al menos existe una estrategia mixta de seguridad para cada jugador. iii) Los niveles de seguridad en estrategias puras y mixtas cumplen: vI ≤ vIM 3.4. y M vII ≤ vII . Uso de estrategias mixtas Supóngase que nuestra estrategia mixta consta de la aplicación de las estrategias puras I1 , I2 , I3 en las razones p1 : p 2 : p 3 , donde las p están normalizadas de modo que p1 + p 2 + p 3 = 1; entonces esta estrategia se escribe: ! I1 I2 I3 SI = . p1 p2 p3 Análogamente, SII = II1 II2 II3 II4 q1 q2 q3 q4 ! . designa una estrategia mixta de nuestro oponente, en la cual se usan las estrategias puras II1 , II2 , II3 , II4 en la razón q1 : q2 : q3 : q4 , donde q1 + q2 + q3 + q4 = 1; esto significa que II1 se usa una fracción q1 de las partidas, II2 una fracción q2 , etc. Supóngase que se ha encontrado una solución de un juego, que consta de las ∗ . En general no todas las estrategias puras dos estrategias mixtas óptimas SI∗ y SII disponibles para un jugador dado se usarán en sus estrategias mixtas óptimas. Aquellas estrategias puras que se usan, en esta sección se denominarán “convenientes”. Resulta que la solución de un juego tiene otra propiedad notable que se probará a continuación. Si uno de los jugadores se adhiere a su estrategia mixta S ∗ (S ∗ ), enI II tonces la ganancia se mantendrá igual al valor del juego, v, sin importar lo que haga el otro jugador siempre que él sólo use estrategias convenientes. Por tanto, el segundo jugador puede usar cualesquiera de sus estrategias“convenientes” como una estrategia pura o puede combinarla en proporciones arbitrarias. Avila Garcia 3.5. Métodos para resolver juegos matriciales 24 ∗ ) de un juego de mxn. Ahora Supóngase que se tiene una solución SI∗ , (SII bien supongamos que la estrategia óptima SI∗ es una mezcla de las tres estrategias “convenientes”, I , I , I y S ∗ es una mezcla de las tres estrategias “convenientes”, 1 2 3 II II1 , II2 , II3 : SI = I1 I2 ! I3 p1 p 2 p 3 , II1 II2 II3 SII = q1 q2 q3 ! . donde p1 +p2 +p3 = 1 y q1 +q2 +q3 +q4 = 1. Nótese que si nos adherimos a la estrategia S ∗ , nuestro oponente puede mezclar las estrategias II , II , II , en proporción que 1 I 2 3 desee y la ganancia permanecerá inalterada e igual a v, el valor del juego. Sean v1 , v2 y v3 las ganancias para las estrategias de nuestro oponente II1 , II2 y II3 cuando las juega contra nuestra estrategia S ∗ . De la definición de estrategia óptima se deduce I ∗ no puede aumentar que cualquier desviación de II respecto a su estrategia óptima SII sus ganancias. Esto significa que: v1 ≥ v, v2 ≥ v, v3 ≥ v. (3.7) Ahora, bien obsérvese que no pueden cumplirse los signos de desigualdad de la ecuación (3.7); considérese que v representa v1 , v2 y v3 combinadas en las proporciones q1 , q2 y q3 : v 1q 1 + v 2q 2 + v 3q 3, q 1 + q2 + q3 = 1 (3.8) A partir de (3.7), se deduce que si cualquiera de los v1 , v2 , v3 fuera mayor que v, el segundo miembro de (3.8), también serı́a mayor que v, lo cual no puede ser cierto. Por lo tanto: v1 + v2 = v3 = v de modo que no importa cómo se combinan v1 , v2 , v3 , su valor promedio será igual a v. Esta importante propiedad de las estrategias óptimas se usa constantemente cuando se trata de hallar las soluciones de juegos finitos. 3.5. Métodos para resolver juegos matriciales La teorı́a de juegos se ha desarrollado básicamente de acuerdo con el juego suma-cero para 2 participantes. En cuanto a los métodos que utiliza la teorı́a de juegos para alcanzar el objetivo propuesto por los jugadores se tienen: Avila Garcia 3.6. Técnica de punto de silla de montar ♣ Técnica de punto de silla. ♣ Simplificación de Matrices (técnica de dominación). ♣ Método algebraico. ♣ Métodos gráficos. ♣ Método de subjuegos. ♣ Programación Lineal. ♣ Metajuegos. 3.6. Técnica de punto de silla de montar Ejemplo 3.6.1 Aplicación de un problema con punto de silla: El general George C. Kenney, comandante de las fuerzas aéreas aliadas del pacı́fico suroriental durante la Segunda Guerra Mundial, utilizó la teorı́a de juegos para ganar una de las batallas más importantes en dicha zona.1 Ese conflicto se conoce como la “batalla del mar de Bismark”. Este evento histórico ocurrió en los últimos dı́as de febrero de 1943. Las fuerzas japonesas agrupadas en Rabaul, Isla de Nueva Inglaterra, pretendı́an apoderarse de 1 Véase [6]. Avila Garcia 25 3.6. Técnica de punto de silla de montar 26 Lae, Nueva Guinea, que estaba en manos de los aliados. El general Kenney dedujo, mediante el análisis de ciertos reportes de inteligencia, que los japoneses tenı́an sólo dos estrategias disponibles (figura 1): atacar por la ruta 1 (mar de Coral) o por la 2, (mar de Bismarck). Ambas rutas requerı́an de 3 dı́as (aproximadamente 72 horas) para alcanzar Lae. El general Kenney querı́a bombardear el convoy japonés antes de su llegada a Lae. La ruta 2 ofrecı́a poca visibilidad; la de la ruta 1 era buena. Su función objetivo 2 fue la de maximizar el número de horas efectivas de bombardeo del convoy enemigo. El general Kenney pensó ası́: 3 “Si concentro un ataque aéreo en la ruta 2 y, en efecto, los japoneses eligen esa ruta, la búsqueda del convoy será obstaculizada por una visibilidad pobre y esto se descubrirá hasta el segundo dı́a, permitiéndonos dos dı́as de bombardeo; si, por el contrario, el convoy elige la ruta 1 (mientras yo concentro mi búsqueda en la 2), una pequeña escuadrilla aérea de reconocimiento descubrirı́a al convoy después de 1 dı́a, permitiendo, también, dos dı́as de bombardeo. Por el contrario, si concentro el ataque en la ruta 1 y los japoneses eligen esa ruta, serán descubiertos de inmediato permitiendo 3 dı́as de bombardeo; en cambio, si eligen la ruta 2, una pequeña escuadrilla de reconocimiento descubrirı́a al convoy tras 2 dı́as de búsqueda, permitiendo un solo dı́a de bombardeo”. La decisión del general Kenney se puede traducir a la siguiente matriz de consecuencias Convoy Japonés Concentración del bombardeo aliado Ruta 1 Ruta 2 Ruta 1 3 1 Ruta 2 2 2 Dı́as de bombardeo La decisión del general Kenney fue la entrada a 22 , idéntica a la que seleccionó el comandante japonés (la entrada a 22 es un punto de silla).El resultado de esta decisión fue una derrota para el ejército japonés, en la épica conocida en la historia bélica como la ”batalla del mar Bismark”. El nombre se deriva de que tanto el comandante aliado como el japonés eligieron la ruta 2, la del mar de Bismark. Esta batalla junto con la 2 3 intuitiva. veáse[6]. Avila Garcia 3.7. Técnica de dominación 27 de Buna y Guadalcanal marcan el inicio de la derrota japonesa en la Segunda Guerra Mundial [27]. Como vI = vII = 2 entonces existe un punto de silla que es el valor del juego, es decir; v = 2 3.7. 3.7.1. Técnica de dominación Reducción de orden de Matrices No en todos los juegos existe punto de silla, para este tipo de juegos se utiliza la siguiente metodologı́a. Por lo general, es difı́cil encontrar una solución, cuando un juego de m × n no tiene punto de silla, en especial, si m y n son grandes. A veces puede simplificarse el problema, reduciendo el número de estrategias en la matriz de ganancias. Las estrategias que pueden eliminarse de una matriz son: a) Aquellas que están duplicadas. b) Aquellas que son dominadas. Ejemplo 3.7.1 Considérese la siguiente matriz de 4 × 4: II1 II2 II3 II4 I1 1 2 4 3 I2 0 2 3 2 I3 1 2 4 3 I4 4 3 1 0 Primeramente, se hallan las estrategias duplicadas. Obsérvese que las ganancias para las estrategias I1 y I3 son idénticas, término a término; ninguna de ella es preferible a la otra y cualquiera podrı́a ser eliminada, en este caso eliminemos I3 . Ahora se buscan las estrategias dominantes. Cada elemento del renglón I2 es menor que (o igual a) el elemento correspondiente del renglón I1 . Obsérvese que, nunca debe usarse la estrategia I2 , ya que siempre es menos ventajosa que la I1 y, para Avila Garcia 3.7. Técnica de dominación 28 los propósitos del análisis, también se puede eliminar la I2 . Se dice que la estrategia I1 domina a la estrategia I2 o que la I2 es dominada por la I1 . Después de eliminar las estrategias I2 y I3 , queda una matriz más sencilla: II1 II2 II3 II4 I1 1 2 4 3 I4 4 3 1 0 Además, se nota que, para nuestro oponente, la estrategia II3 es dominada por la II4 , la cual es menor, elemento por elemento. Ası́, la matriz original de 4 × 4 se ha reducido a una matriz de 2 × 3: II1 II2 II4 I1 1 2 3 I4 4 3 0 En general, todas las estrategias duplicadas y dominadas deben eliminarse en esta forma, antes de buscar una solución. Ejemplo 3.7.2 Aplicación en Técnicas de guerra El bando I desea destruir un objetivo defendido por el bando II. I tiene dos aviones y II tiene tres cañones antiaéreos. Cada avión lleva explosivo suficiente para destruir él solo el objetivo. Para llegar al objetivo, únicamente existen tres posibles vı́as de acceso (A, B, C). II puede emplazar cualquiera de sus cañones antiaéreos en cualquiera de las vı́as de aproximación, pero un cañon sólo puede cubrir la vı́a de acceso en la cual quedó ubicado. Cada cañon sólo puede atacar a uno de los aviones, pero si ataca a un avión tiene la certeza de derribarlo. El bando I no sabe cómo éstan dispuestos los cañones y el bando II no sabe que vı́as de acceso tomarán los aviones. El propósito de II es evitarlo. Solución: Este problema puede representarse en la forma de un juego de 2×3. La ganancia consiste en la probabilidad de destruir el blanco. Las estrategias posibles de I son: Avila Garcia 3.7. Técnica de dominación 29 I1 - Enviar cada avión por vı́as de acceso diferentes; I2 - Enviar ambos aviones a lo largo de la misma vı́a de acceso. Las estrategias de II son: II1 - Emplazar cada uno de sus cañones para cubrir una vı́a de acceso diferente; II2 - Emplazar dos cañones para cubrir una vı́a de acceso y uno para cubrir otra diferente; II3 - Emplazar los tres cañones para cubrir la misma vı́a de acceso. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ......... ... ......... ... ......... .. ......... ......... ....................................... . . . . . . . . ......... . . . ........ ...... ......... . . . ...... . . . ......... ... .... . ......... . . . .... ......... ......... ...... ... ........... ... ... .. . ... .... .. .. ... .. .. .. .. .. .. ... ... . ... . ... ... .... .... .... .... ............. .... . . . . . . . . . . . ......... . .............. ......... ........ .................................. ....... ....... . ........ ..... ....... . . . . . . . . . . ........ ..... ....... ... ....... ........ .... ........ . . . . . .... . .... . . . . . . .... . . .... ... .... ... .... ... A B objetivo C A continuación se construirá la matriz del juego. i) I1 II1 (Los aviones vuelan a lo largo de vı́as de acceso diferentes; cada cañón cubre una vı́a diferente). Claramente ningún avión puede llegar al objetivo. La ganancia será: a11 = 0 ii) I2 II1 (Los aviones vuelan juntos a lo largo de una de las vı́as; cada cañón cubre una vı́a diferente). Aquı́, un avión llegará ileso al objetivo: a21 = 1 iii) I1 II2 (Los aviones vuelan a lo largo de vı́as diferentes; se tienen dos cañones en una de las vı́as y uno en otra; la tercera vı́a no está defendida). La probabilidad de que uno de los aviones llegue al objetivo es igual a la probabilidad de que uno de ellos elija la vı́a no defendida: a12 = 2 3 Avila Garcia 3.7. Técnica de dominación 30 iv) I2 II2 (Los aviones vuelan a lo largo de uno de las vı́as; dos cañones cubren una de las vı́as, el tercer cañón cubre otra y la tercera vı́a se deja indefensa; esto significa que, en efecto, sólo una de las vı́as está cubierta, mientras que dos quedan indefensas). La probabilidad de que por lo menos un avión pasará es igual a la probabilidad de que la vı́a elegida no sea la que está cubierta por los dos cañones: 2 3 a22 = v) I1 II3 (Los aviones vuelan a lo largo de vı́as diferentes; todos los cañones cubren la misma vı́a). Es seguro que uno de los aviones llega hasta el blanco: a13 = 1 vi) I2 II3 (Los aviones vuelan a lo largo de una vı́a de acceso; todos los cañones cubren la misma vı́a) Para que el objetivo sea destruido, los aviones deben elegir una vı́a no defendida: 2 3 a23 = La matriz de 2 × 3 se muestra aquı́. II1 II2 II3 I1 0 1 I2 1 2 3 2 3 2 3 Es claro, que la estrategia II3 es dominada por la estrategia II2 . Por lo tanto, podemos eliminar II3 y reducir la matriz a un juego de 2 × 2. La matriz de 2 × 2 se muestra aquı́. Esta matriz tiene un punto de silla: los valores inferior y superior del juego son los mismos: v= 2 3 II1 II2 I1 0 I2 1 2 3 2 3 Nótese también que la estrategia I1 es dominada por la estrategia I2 . La solución del juego es que ambos jugadores deben usar estrategias puras, la I2 y la II2 . Es decir,el Avila Garcia 3.8. Método Algebraico 31 jugador I siempre debe enviar ambos aviones juntos, eligiendo al azar la vı́a de acceso particular, mientras que el jugador II debe cubrir una vı́a con dos cañones y otra con el tercero, también eligiendo al azar las dos vı́as. Nótese que, en este caso, aun las estrategias “puras” contienen elecciones que rige al azar. Con estas estrategias óptimas, la ganancia media siempre será v = 32 ; es decir, el objetivo será destruido con una probabilidad de v = 23 . Hay un rango contı́nuo de estrategias mixtas que son óptimas para I, yendo desde p1 = 0 hasta p1 = 13 . 3.8. Método Algebraico Los juegos finitos más sencillos, que siempre pueden resolverse por medio de métodos elementales, son los juegos de 2 × 2 y los de 2 × n. Considérese un juego de 2 × 2 con la matriz que se muestra. Si este juego tiene un punto de silla, la solución consiste de la pareja de estrategias puras que se intersectan en el punto silla. II1 II2 I1 a11 a12 I2 a21 a22 Supóngase que el juego no tiene punto de silla, de modo que los valores inferior y superior del juego son desiguales. Se desea hallar nuestra estrategia mixta óptima ! I I 1 2 Si∗ = (3.9) p1 p2 la cual tiene la propiedad de que no importa lo que haga el oponente (en tanto que sólo use sus estrategias convenientes) la ganancia promedio será igual a v, el valor del juego. En un juego de 2 × 2 sin punto de silla, ambas estrategias de nuestro oponente son puras convenientes. En caso contrario, la solución consistirı́a de estrategias puras, lo cual significa que tendrá un punto de silla. De aquı́ que si nos adherimos a nuestra estrategia óptima el oponente puede usar cualquiera de sus estrategias puras II1 , II2 sin cambiar la ganancia media v. Esto proporciona dos ecuaciones: a11 p1 + a21 p 2 = v, a12 p1 + a22 p 2 = v, Avila Garcia (3.10) 3.8. Método Algebraico 32 Puesto que p1 + p2 = 1, a partir de estas ecuaciones se ve que: a11 p1 + a21 (1 − p1 ) = a12 p1 + a22 (1 − p1 ) , o bien p1 = a22 − a21 , a11 + a22 − a12 − a21 p 2 = 1 − p1 (3.11) (3.12) El valor v del juego se encuentra substituyendo los valores de p1 y p 2 en cualquiera de las ecuaciones 3.10. Análogamente se puede aplicar para q1 , q2 , que nos proporciona dos ecuaciones: a11 q1 + a12 q 2 = v, a21 q1 + a22 q 2 = v, (3.13) Puesto que q1 + q2 = 1, a partir de estas ecuaciones se ve que: a11 q1 + a12 (1 − q1 ) = a21 q1 + a22 (1 − q1 ) , o bien q1 = a22 − a12 , a11 − a12 − a21 + a22 q 2 = 1 − q1 (3.14) (3.15) Por otro lado, también se puede calcular el valor de q1 y q2 , conociendo el valor del juego, digamos: a11 q1 + a12 q2 = v. Puesto que q1 + q2 = 1, se tiene: q1 = v − a12 , a11 + a12 q 2 = 1 − q1 . Avila Garcia (3.16) (3.17) 3.8. Método Algebraico 33 Ejemplo 3.8.1 El grupo de administración de la empresa Pascual, ha recibido el encargo de preparar una estrategia que pueda seguir la empresa durante las próximas negociaciones. En su experiencia anterior, el grupo ha desarrollado las siguientes estrategias para la empresa Pascual: C1 = Se esperan negociaciones muy difı́ciles con los trabajadores C2 = Se considera que las peticiones de los trabajadores son prácticas. C3 = Se considera que las peticiones de los trabajadores son poco prácticas. C4 = Amplias variaciones en las peticiones de los trabajadores. De acuerdo con su historia pasada, los trabajadores sugieren las siguientes estrategias: U1 = Peticiones muy costosas de parte de los trabajadores U2 = Peticiones costosas de parte de los trabajadores U3 = Peticiones normales de parte de los trabajadores U4 = Peticiones favorables a la empresa, pero no para los trabajadores El problema de cuál estrategia debe emplear el grupo de administración de la empresa Pascual, depende de la estrategia que adopten los trabajadores (que es difı́cil conocer). Sin embargo, con ayuda de la Secretarı́a del Trabajo y Previsión Social (STPS - de donde han solicitado apoyo en vista de las perspectivas de unas negociaciones muy difı́ciles con los trabajadores, y la posibilidad de una huelga prolongada), el grupo de administración preparó una tabla de costos de un aumento condicional de salarios (tabla 1). La STPS indicó que los trabajadores prepararon una tabla semejante, porque se les ha proporcionado la misma información. La tabla de costos del aumento condicional de salarios se interpretará como sigue: si la administración de la empresa Pascual adopta la estrategia C1 y el sindicato adopta la estrategia U1 el contrato final estipulará que la compañı́a concederı́a un aumento de $25.00. Las demás anotaciones de la tabla 1 tienen el mismo significado. En vista de esas cifras, ¿qué harán los negociadores?. Avila Garcia 3.8. Método Algebraico 34 Tabla de costos de un aumento condicional de salarios (matriz de 4 × 4) Estrategias de la esmpresa Pascual C1 Estrategias de los trabajadores C2 C3 C4 U1 +$25.00 +$14.00 +$15.00 +$32.00 U2 +$40.00 +$17.00 +$13.00 +$16.00 U3 +$30.00 +$5.00 +$12.00 +$15.00 U4 −$1.00 +$8.00 +$11.00 +$3.00 En cualquier problema de la teorı́a de juegos, el primer paso consiste en hacer la prueba del punto de silla, que en este caso especial no es aplicable. El siguiente consiste en examinar la matriz para buscar si hay algún dominio que pueda aplicarse, y entonces puede preguntarse: ¿por qué deben jugar los trabajadores el renglón U4 , ya que esto darı́a a la empresa la posibilidad de ganar, o aceptar un aumento menor?. Es claro, que los trabajadores nunca jugarán el renglón U4 , porque pueden obtener mejores resultados jugando los renglones U1 y U2 . Por lo tanto, el renglón U4 está dominado y se desecha, porque una o más estrategias siempre proporcionarán a los trabajadores un mejor pago que el de la estrategia dominada, independientemente de lo que haga la empresa respecto a la regla de renglones, todas las anotaciones de los renglones U1 y U2 , son iguales o mayores que la anotación correspondiente del renglón U4 , desde el punto de vista de la S.T.P.S, lo que reduce la matriz original 4 × 4, a la de 3 × 4 que se muestra en la siguiente tabla. Tabla de costos de un aumento condicional de salarios (matriz de 3 × 4) Estrategias de la empresa Pascual C1 Estrategias de los trabajadores C2 C3 C4 U1 +$25.00 +$14.00 +$15.00 +$32.00 U2 +$40.00 +$17.00 +$13.00 +$16.00 U3 +$30.00 +$5.00 +$12.00 +$15.00 Una inspección adicional revela que la columna C4 está dominada por la columna C3 , porque la empresa está tratando de reducir al mı́nimo sus pérdidas. Todas las entradas de la columna C3 son iguales o menores que la anotación correspondiente de la columna C4 , de acuerdo con la regla de columnas. La nueva matriz de 3 × 3 aparece en la tabla. Avila Garcia 3.8. Método Algebraico 35 Tabla 3: Costos de un aumento condicional de salarios (matriz de 3 × 3) Estrategias de la empresa Pascual Estrategias de los trabajadores C1 C2 C3 U1 +$25.00 +$14.00 +$15.00 U2 +$40.00 +$17.00 +$13.00 U3 +$30.00 +$5.00 +$12.00 La inspección de la tabla 3 revela que el renglón U3 está dominado por el renglón U2 . Los aumentos de salarios del renglón U2 ($40.00, $17.00 y $13.00), son iguales o mayores que las anotaciones correspondientes del renglón U3 ($30.00, $5.00 y $12.00). La nueva matriz de 2 × 3 aparece en la tabla 4. Tabla 4: Costos de un aumento condicional de salarios (matriz de 2 × 3) Estrategias de la empresa Pascual Estrategias de los trabajadores C1 C2 C3 U1 +$25.00 +$14.00 +$15.00 U2 +$40.00 +$17.00 +$13.00 La última oportunidad para aplicar el dominio ocurre en la columna C1 . Desde el punto de vista de la empresa, los aumentos propuestos, que se muestran en la columna C2 (+$14.00 y +$17.00), son iguales o menores que los de la columna C1 (+$25.00 y +$40.00). La matriz resultante es de 2 × 2 (tabla 5). Hay que notar que el procedimiento de dominio puede emplearse para remover más de un renglón o una columna en el mismo paso. Tabla de costos de un aumento condicional de salarios (matriz de 2 × 2) Estrategias de la empresa Pascual Estrategias de los trabajadores C2 C3 U1 +$14.00 +$15.00 U2 +$17.00 +$13.00 Avila Garcia 3.8. Método Algebraico 36 Obsérvese que después de realizar la técnica de dominación, ésta última matriz tampoco tiene punto de silla, se aplicará el método algebraico para la solución de este juego. Aplicando (3.11), se calcula el valor de p, obtenemos: p1 = 13 − 17 4 = 14 + 13 − 15 − 17 5 Por lo tanto 4 1 = 5 5 El cálculo anterior indica que los trabajadores jugarán el primer renglón p2 = 1 − p2 = 1 − del tiempo y el segundo renglón = 5 4 partes = 5 1 Analogamente, aplicando (3.14) y (3.15), se calcula q1 y q2 , obteniendo: q1 = 2 5 y 2 3 = 5 5 Luego, podemos encontrar el valor del juego v, haciendo uso de las ecuaciones (3.10). q2 = 1 − q2 = 1 − a11 p1 + a21 p2 = v 4 1 56 17 73 14 + 17 = + = 5 5 5 5 5 73 El valor del juego es $ o bien $14.60, que es el aumento que pueden esperar 5 los trabajadores. Los trabajadores deben ganar, porque el valor del juego es positivo; si fuera negativo la empresa ganarı́a. Sin embargo, en la matriz original sólo se presentó un valor negativo contra 15 positivos. A continuación se ilustra está técnica para el caso de 2 jugadores, con 2 estrategias de juego para cada uno e inexistencia de un punto silla. Ejemplo 3.8.2 Supóngase la siguiente matriz de consecuencias: II1 II2 Probabilidades I1 5 35 p1 I2 20 10 p2 Probabilidades q1 q2 Avila Garcia 3.8. Método Algebraico 37 Solución. Si el jugador I selecciona la estrategia I1 , su consecuencia esperada será: 5q1 + 35q2 , mientras que si selecciona la I2 , ésta será: 20q1 + 10q2 . Como ambos valores esperados deben ser los mismos, se tiene que: 5q1 + 35q2 = 20q1 + 10q2 . Dado que qi ≤ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que: q1 + q2 = 1. Las dos ecuaciones anteriores con dos incógnitas generan los valores q1 = 0.625 q2 = 0.375 Análogamente, si el jugador II selecciona la estrategia II1 , su consecuencia esperada será 5p1 + 20p 2 , mientras que si selecciona la II2 , ésta será: 35p1 + 10p 2 y, como ambas deben ser iguales, se tiene que: 5p1 + 20p 2 = 35p1 + 10p 2 . Dado que pi ≥ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que: p1 + p 2 = 1. Las dos ecuaciones anteriores con dos incógnitas generan: p1 = 0.25 p 2 = 0.75 Avila Garcia 3.9. Método Geométrico para los juegos 2 × n 38 El valor del juego será, entonces: V = 5 (0.25) + 20 (0.75) = 35 (0.25) + 10 (0.75) = 5 (0.625) + 35 (0.375) = 20 (0.625) + 10 (0.375) = 16.25 Nótese que existen cuatro posibilidades diferentes para calcular el mismo valor V . Lo anterior se interpreta diciendo que las estrategias mixtas para el jugador I son (0.25, 0.75) y para II (0.625, 0.375). La consecuencia esperada es que I gane 16.25 y II pierda la misma cantidad. La técnica anterior se complica cuando cada jugador tiene más de dos estrategias a elegir. La solución para un caso más general se proporcionará, con técnicas de programación lineal. Para el caso en que un jugador tiene dos estrategias y el otro m (m > 2), entonces los métodos gráficos trabajan adecuadamente. Éstos enseguida se explican. 3.9. Método Geométrico para los juegos 2 × n Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo menos uno de los jugadores, tiene solamente dos estrategias. Considérese el siguiente juego 2 × n. II I y1 y2 ... yn x1 a11 a12 ... a1n x2 = 1 − x1 a21 a22 ... a2n Supóngase que este juego no tiene un punto de silla. Puesto que I tiene dos estrategias, se deduce que x2 = 1 − x1 ; x1 ≥ 0, x2 ≥ 0. Los pagos esperados correspondientes a las estrategias puras de II se muestran en la siguiente tabla. Estrategia pura de II Pago esperado de I 1 (a11 − a21 )x1 + a21 2 .. . (a12 − a22 ) x1 + a22 n (a1n − a2n ) x1 + a2n Avila Garcia 3.9. Método Geométrico para los juegos 2 × n Esto muestra que el pago promedio de I varı́a linealmente con x1 . Según el criterio minimax de juegos de estrategias mixtas, el jugador I debe seleccionar el valor de x1 que maximice sus pagos mı́nimos esperados. Esto se hace mediante el trazo de lı́neas rectas como funciones de x1 . El siguiente ejemplo ilustra esta técnica. Considere el siguiente juego (2 × 4) II I 1 2 3 4 1 2 2 3 -1 2 4 3 2 6 Este juego no tiene un punto de silla. Consecuentemente, los pagos esperados de I correspondientes a las estrategias puras de II están dados de la siguiente forma. Estrategia pura de II Pago esperado de I 1 −2x1 + 4 2 −x1 + 3 3 x1 + 2 4 −7x1 + 6 Estas cuatro rectas se deben trazar como funciones de x1 como se muestran en la figura. Gráficamente el maximin ocurre en x ∗ = 1 . Este es el punto de intersección de 1 2 dos rectas 2, 3 y 4. Consecuentemente, la estrategia óptima de I es (x1∗ = 12 , x2∗ = 21 ), y el valor del juego se obtiene sustituyendo x1 en la ecuación de cualesquiera de las lı́neas que pasan por el punto maximin. De aquı́ obtenemos, 5 1 − + 3 = 2 2 1 5 v∗ = +2= 2 2 1 5 −7 + 6 = 2 2 A fin de determinar las estrategias óptimas de II se debe observar que 3 rectas pasan por el punto maximin. Lo cual nos indica que II puede combinar las tres estrategias. Avila Garcia 39 3.9. Método Geométrico para los juegos 2 × n 6 5 4 3 Pago promedio 2 1 x1 = 0 −1 −2 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .............................. ........................... ... ....... ... ... ..... ............. ... ....... ... ... ....... ... ... . . ....... . ....... .......................... . . . . . . . . . . . . . . . . . . . . . . . ... ....... ... ... ....... ... . ... . . ....... ... ....... ..... ... ....... ... ... ....... ....... ....................................... . . . . . . . . . . . . . . . . . . . . . . . ... ....... .................... ... .... ....... .................... ... ....... .................... ... ... .................... ....... ... ........................... ... ... ................... ... ....... .................... . . . . . . . . . . . . . . . . . . . . . . . ................................................. . . ....... .................... ... ................. . . . . . . . ....................................... . . . . . . . . . . . . . . . . . ... . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . .................................................. ....... ....................................... ... . . ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....... . ... ....... ... ... ........................................................................................................... ........................................ . . ....................................... ................... ....... ....................................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . ......................................................... ..... ....... .............. ....... ........ . . . . . . . . . . . . . . . . ............................................... ....... .... ... ....... ... ... . . . ....... .... .... ....... ....... ..... ..... ....... ....... ......................... . . . . . . . . . . . . . . . . . . . . . . . . ....... .... ... ....... ... ... ....... ....... .... .... ....... ... ... . . . .. ........................................................................................................................................................................................................................................................................................................................ ....... ... ... ....... ....... ..... ..... ....... ... ....... .... ....... ... .... ......................... ........................... ... ... ..... ..... ... ... ... .... ......................... .......................... ... ... ... ... .... .... ... ... ... ... 4 40 Maximin 1 2 3 ? 1 x1∗ = 2 v∗ = 5 2 x1 = 1 Dos rectas cualesquiera que tengan signos opuestos en sus pendientes definen una solución óptima alternativa. Por consiguiente, de las tres combinaciones (2, 3), (2, 4) y (3, 4), la combinación (2, 4) debe excluirse como no óptima. La primera combinación (2, 3) implica que y1∗ = y4∗ = 0. En consecuencia, y3 = 1 − y2 y los pagos promedios dde II correspondientes a las estrategias puras I están dadas como sigue: Estrategia pura de I Pago esperado de II 1 −y2 + 3 2 y2 + 2 Por consiguiente,y2∗ (correspondiente al punto minimax) puede determinarse de −y2∗ + 3 = y2∗ + 2 Esto da por resultado y2∗ = 12 . 1 Obsérvese que si sustituimos y2∗ = en los pagos esperados de II dados an2 5 teriormente, el valor minimax es , el que es igual al valor del juego v ∗ como es de 2 esperarse. La combinación restante (3, 4) puede ser tratada da manera similar para obtener una solución óptima alternativa. Cualquier promedio ponderado de las combinaciones (2, 3) y (3, 4) proporcionará también una nueva solución óptima que mezcle las tres estrategias 2, 3 y 4. Avila Garcia 3.10. Solución de juegos 2 x 2 con engaño 3.10. Solución de juegos 2 x 2 con engaño Considérese a continuación un juego más complicado, uno cuya solución no es tan obvia. Es un ejemplo sencillo pero instructivo de juegos que contienen engaño. En las situaciones antagónicas que se presentan en la vida real, se usan muchos recursos para engañar al oponente (información falsa, representación falsa de objetivos, etc.). Ejemplo 3.10.1 Se tienen dos cartas, un as y un dos, con la cara hacia abajo sobre la mesa. El jugador I levanta una de ellas al azar, sin mostrarla al jugador II. Si la carta es el as, I debe decir “Tengo el as” y pedir $1.00 a II. Si la carta es el dos, I puede decir: “Tengo el dos” y pagar $1.00 a II, o bien, “tengo el as” y pedir $1.00 a II. Si se le ofrece un peso a II, debe tomarlo. Si se le pide un peso, puede: a) Creer que I tiene el as y pagarle, o bien, b) No creerle y exigir que se le muestre la carta. Si pide que se le muestre la carta y resulta que I tiene en efecto el as, debe pagar $2.00 a I. Si pide que le muestre la carta y I tiene el dos, I debe pagarle $2.00. A continuación se analiza este juego para hallar la estrategia óptima para cada bando. Solución. El juego tiene una estructura relativamente compleja, consiste de una jugada aleatoria y obligatoria -la elección de una carta por I- y de dos jugadas personales que pueden hacerse o no. Si I levanta el as, no tiene opción: sólo puede pedir $1.00 a II. Entonces II tiene una elección personal -creer a I o no creerle, (es decir, pagarle o pedirle que le muestre la carta). Si en la primera jugada aleatoria resulta que I levanta el dos, entonces tiene que hacer una elección -engañar o no engañar. Si I engaña, II tiene nuevamente la misma elección -creerle o no, (es decir, pagarle o pedir que le muestre la carta); si no engaña, II no tiene más que aceptar su $1.00. Las estrategias de los dos jugadores serán las reglas que adopten para determinar sus jugadas personales. Claramente I sólo tiene dos estrategias: • I1 -engañar; I2 -no engañar. Avila Garcia 41 3.10. Solución de juegos 2 x 2 con engaño 42 II también tiene dos estrategias: • II1 -creer a I; II2 -pedir que se le muestre la carta. Para construir la matriz del juego, se necesita calcular el valor medio de la ganancia para cada una de las combinaciones de estrategias. 1. I1 II1 I engaña; II le cree; se calcula la ganancia promedio. i) Si I extrae el as (la probabilidad de que suceda esto es 1 2 ), no tiene jugada personal; debe pedir $1.00 a II, y éste lo paga; la ganancia para I en pesos es 1. ii) Si I extrae el dos (la probabilidad de que suceda esto también es 12 ), engaña y pide $1.00 a II, quien lo paga; la ganancia es nuevamente 1. La ganancia promedio es a11 2. I1 II2 I engaña; 1 1 (1) + (1) = 1. = 2 2 (3.18) II pide que se le muestre la carta; hay que calcular a12 . i) Si I extrae el as, no tiene jugada personal; debe pedir $1.00 a II; II pide que se le muestre la carta y, como consecuencia, debe pagar $2.00 a I (la ganancia para I en pesos es 2). ii) Si I extrae el dos, engaña y pide $1.00 a II; II pide que se le muestre la carta y, como resultado, recibe $2.00 de I (la ganancia de I en pesos es −2). La ganancia promedio es a12 3. I2 II1 I no engaña; 1 1 = (+2) + (−2) = 0. 2 2 (3.19) II no le reta; calculemos: i) Si I extrae el as, pide $1.00; II lo paga y la ganancia para I en pesos es 1. ii) Si I extrae el dos, le paga $1.00 a II y II tiene que aceptarlo (la ganancia de I en pesos es −1). La ganancia promedio es: 1 1 a21 = (+1) + (−1) = 0. 2 2 Avila Garcia (3.20) 3.10. Solución de juegos 2 x 2 con engaño 4. I2 II2 I no engaña; 43 II le reta; calculemos: i) Si I extrae el as, pide $1.00; II pide que se le muestre la carta y, como resultado, debe pagar $2.00 a I (la ganancia en pesos es +2). ii) Si I extrae el dos, paga $1.00 a I, quien debe aceptarlo (la ganancia es −1). La ganancia promedio es: 1 1 1 = (+2) + (−1) = . 2 2 2 a22 (3.21) La matriz del juego se muestra aquı́. II1 II2 I1 1 0 I2 0 1 2 1 y el juego no tiene punto de 2 silla. Por tanto, la solución debe consistir de estrategias mixtas. Aplicando la ecuación El valor inferior del juego es 0, el valor superior es (3.11), se obtiene: p1 = 1 2 1+ 1 2 Es decir, I debe engañar en 1 = , 3 1 3 2 p2 = , 3 SI∗ = I1 I2 1 3 2 3 ! . de las ocasiones y no engañar en 2 3 de las mismas. Entonces podemos calcular la ganancia promedio o valor del juego: v= El hecho de que v = 1 3 1 . 3 > 0 significa que el juego tal y como se presenta no es equitativo para II. Aplicando su estrategia óptima, I siempre puede estar seguro de obtener una ganancia promedio de 13 . Nótese que aplicando su estrategia más cautelosa (maximin) (en este caso, tanto I1 como I2 son maximin) I puede garantizarse una ganancia de 0, de modo que según las reglas del juego, al aplicar una estrategia mixta, obtiene una ventaja sobre II. Hállese la estrategia óptima para II. Se tiene: (1) q1 + (0) q2 = 1 ; 3 q1 = 1 , 3 Avila Garcia q2 = 2 . 3 3.11. Método de subjuegos para encontrar el valor del juego 44 de aquı́ que: ∗= SII II1 II2 1 3 2 3 ! . Es decir, el jugador II debe creerle al jugador I en muestre la carta en 2 3 1 3 de los casos y pedir que le . Entonces perderá, en promedio, en 1 3 de las veces. Si aplica su estrategia pura minimax II2 (pedir que se le muestre la carta), perderı́a en promedio, 1 2 de las veces. 3.11. Método de subjuegos para encontrar el valor del juego Este método nos facilita el encontrar el valor del juego para un juego de 2 × 2, y muchos juegos más grandes pueden reducirse mediante el dominio a un juego de 2 × 2. Sin embargo, esto no incluirá todos los casos, porque esa reducción no siempre puede hacerse. Por ejemplo, dos lı́neas aéreas cubren la misma ruta, y ambas tratan de obtener la mayor porción posible del mercado. Una de las lı́neas aéreas I, parece más agresiva, porque su situación financiera es muy sólida y su departamento de mercadotecnia conoce mejor las condiciones del mercado. La matriz de pagos de la siguiente tabla muestra las pérdidas y las ganancias mensuales de pasajeros, basadas en ciertas condiciones del mercado. La matriz se lee de este modo: los valores positivos favorecen a la lı́nea aérea I, mientras que los negativos favorecen a la lı́nea aérea II. Tabla de matriz de pagos de 2 × 3 de dos lı́neas áereas Lı́nea: Mexicana de aviación (jugador II) Lı́nea: Aereoméxico (jugador I) A B C B 300 −25 −50 C 150 155 175 A: No hace nada. B: Anuncia tarifas ordinarias y especiales. Avila Garcia 3.11. Método de subjuegos para encontrar el valor del juego C: Anuncia caracterı́sticas especiales (pelı́culas cinematográficas y magnı́ficos alimentos. El juego de 2 × 3 expresado en la tabla anterior, puede considerarse como tres juegos de 2 × 2. Subjuego 1: M ! 300 −25 A columnas 1 y 2. 150 155 subjuego 2: M ! 300 −50 A columnas 1 y 3. 150 175 Subjuego 3: A M ! −25 −50 155 175 columnas 2 y 3. La lı́nea aérea II, que puede escoger no jugar una de las columnas, está tratando de determinar la combinación de una estrategia de dos columnas que sea la mejor para ella. Como se hizó notar anteriormente, el jugador que tenga el mayor número de columnas o renglones, tiene la mayor flexibilidad, lo que generalmente da por resultado una estrategia mejor. Sin embargo, en este juego hay cuatro valores positivos contra dos negativos. A fin de obtener la solución de la mejor estrategia para la lı́nea aérea II, habrá que resolver las estrategias y valores del juego de los tres subjuegos de 2×2. Nótese que cuando no se juega una columna, se representa con un cero. Después puede usarse cualquiera de los métodos anteriormente vistos. Subjuego 1: A M ! 300 −25 150 155 no se está jugando la tercera columna. Estrategias: A= M= 1 65 , 66 66 36 30 , , 0. 66 66 Avila Garcia 45 3.11. Método de subjuegos para encontrar el valor del juego Valor del juego: 152.27 Subjuego 2: A M ! 300 −50 150 175 no se está jugando la segunda columna. Estrategias: A= M= 1 14 , 15 15 9 6 , 0, . 15 15 Valor del juego: 160. Subjuego 3: A M ! −25 −50 155 175 no se está jugando la primera columna. Estrategias: A = 0, 1 M = 0, 1, 0. Valor del juego: 155. De acuerdo con los cálculos precedentes, se escoge el valor positivo más bajo, en este caso el subjuego 1, porque la lı́nea aérea II tiene más flexibilidad. Aunque la lı́nea aérea I debe jugar cualquier renglón, la lı́nea aérea II no tiene que jugar las tres columnas, sino dos solamente. La estrategia de la lı́nea aérea II consiste en jugar la primera columna del tiempo, y la segunda, del tiempo. La lı́nea aérea II no utilizará la tercera columna. Puede comprobarse que esta estrategia es la óptima si se observa detalladamente la matriz original. La solución (valor del juego de 152.52 en favor de la lı́nea aérea I), indica que I escoge su estrategia mixta de tal modo que gane (o pierda) lo mismo, independientemente de la selección de la columna de II. Como se expresó anteriormente sobre la forma de determinar una estrategia mixta, las expectaciones de I al jugar una Avila Garcia 46 3.11. Método de subjuegos para encontrar el valor del juego estrategia mixta (entre sus renglones), son las mismas, independientemente de lo que juegue II. Esto puede expresarse algebraicamente haciendo que el valor del juego del subjuego 1, sea igual a la columna que juegue II, lo que se demuestra como sigue: Las ecuaciones precedentes significan que I espera ganar 152.27 clientes, independientemente de la selección de II. El signo ≥ significa que I podrı́a ganar más de 152.27 clientes si II escogiera una estrategia incorrecta. Si las estrategias que hemos encontrado son óptimas, deben satisfacer las tres desigualdades anteriores. Substituyendo los valores de I1 (1 ) y de I2 ( ), los resultados son los siguientes. Las tres desigualdades se satisfacen con los valores insertados para las estrategias de I. Sin embargo, cuando II juega la columna 3, I gana más de 152.27 clientes, porque ésa es una mala estrategia para II, y ésta es la razón de que II no juegue la columna 3, porque darı́a a I una ventaja adicional en un juego que la favorece. Como los requerimientos de las estrategias de I se satisfacen, el paso siguiente es examinar las estrategias de II, para determinar si son óptimas. II ha sus escogido estrategias de tal modo que pueda reducir al mismo sus pérdidas, lo que puede expresarse algebraicamente haciendo que el valor del juego del subjuego 1 sea igual a los renglones que juegue I: Las desigualdades precedentes significan que II espera perder 152.27 clientes, independientemente de las selecciones de I. El signo ≤ indica que II puede perder menos, Si I escoge estrategias incorrectas. De nuevo, si las estrategias que hemos encontrado son óptimas, deben satisfacer las dos últimas desigualdades. Si substituimos los valores de II1 II2 y II3 , los resultados son los siguientes. Columna 1: 300 1 66 + 150 65 66 ≥ 152.27; 4.54 + 147.73 = 152.27 ≥ 152.27; −0.38 + 152.65 = 152.27 ≥ 152.27; −0.76 + 172.35 > 152.27 Columna 2: −25 1 66 1 66 + 155 65 66 65 66 Columna 3: −50 + 175 Avila Garcia 47 3.11. Método de subjuegos para encontrar el valor del juego Luego, 171.59 > 152.27 Las tres desigualdades se satisfacen con los valores insertados para las estrategias de A. Sin embargo, cuando M juega la columna 3, A gana más de 152.27 clientes, porque ésa es una mala estrategia para M , y ésta es la razón de que M no juegue la columna 3, porque darı́a a A una ventaja adicional en un juego que la favorece. Avila Garcia 48 Capı́tulo 4 Programación Lineal 4.1. Teorema del Mı́nimax Teorema 4.1.1 (Teorema del Mı́nimax) En todo juego bipersonal finito de suma cero, existen estrategias óptimas x ∗ ∈ X, y ∗ ∈ Y para cada jugador y se verifica v M = v M = v ∗ siendo v ∗ el valor del juego. I Demostración. II Considérense los siguientes Programas Lineales: Primal y Dual, respectivamente. Jugador I Jugador II Primal Dual − máx v Min v − a11 x1 + · · · + am1 xm ≥ v a11 y1 + · · · + a1n yn ≤ v ············ ············ − a1n x1 + · · · + amn xm ≥ v am1 y1 + · · · + amn yn ≤ v x1 + · · · + xm = 1 y1 + · · · + yn = 1 0 ≤ xi ≤ 1, i = 1, . . . , m 0 ≤ yj ≤ 1, j = 1, . . . , n Obsérvese que el nivel de seguridad para una estrategia mixta x b ∈ X viene dado por: vI (b x) = vII (b x) = mı́n x b t Ay, y∈Y 49 4.1. Teorema del Mı́nimax 50 cuyo valor puede obtenerse por medio del dual, es decir Máx λ (b x) sujeto a ~e λ (b x) ≤ x b tA x b ∈ X, λ (b x) ∈ R donde ~e = (1, . . . , 1) t Las estrategias que proporcionan los mejores niveles de seguridad son las que verifican, lo siguiente: vIM = máx vI (x) x∈X Estas estrategias ası́ como el valor del juego pueden obtenerse a través del siguiente problema de programación lineal: Máx vI sujeto a ~e vI ≤ xt A x∈X Este razonamiento también se puede aplicar para el segundo jugador. Pues al minimizar su nivel de seguridad de forma que limite al otro jugador se tiene otro problema de programación lineal de la siguiente forma: Min vII sujeto a Ay ≤ vII ~e y∈Y Comparando estos dos programas lineales, tenemos: Máx vI Min vII sujeto a ~e vI ≤ xt A sujeto a Ay ≤ vII ~e x∈X y∈Y Obsérvese que estos dos programas son duales. Si ambos programas lineales ∗ ∗ tienen soluciones óptimas x∗ , y ∗ ⇒ vI∗ = vII , es decir vI∗ = vII = v ∗ donde v ∗ es el valor del juego. Avila Garcia 4.2. Solución por medio de Programación Lineal 4.2. 51 Solución por medio de Programación Lineal Todos estos métodos se reducen esencialmente a la solución del problema mediante aproximaciones sucesivas, pero al sistematizar la sucesión de aproximaciones, se puede construir un algoritmo que conduzca a la solución más económica posible. Se presenta una breve explicación del método mediante programación lineal para resolver juegos de m × n. Primero se establece el planteamiento general del problema de hallar la solución de un juego de m × n. Supóngase que se tiene un juego de m × n en el cual el jugador I tiene m estrategias I1 , I2 , . . . , Im y el jugador II tiene n estrategias II1 , II2 , . . . , IIn y se da la matriz de ganancias aij . Se requiere hallar la solución del juego,es decir, las estrategias mixtas para cada jugador: ! I1 I2 . . . Im SI = , p1 p2 . . . pm SII = II1 II2 . . . IIn q1 q2 ... qn ! . donde p1 + p2 + . . . + p n = 1 q1 + q 2 + . . . + q n = 1 (Algunos de los números pi , qj pueden ser cero.) También cabe destacar que el concepto de dualidad en teorı́a de juegos es importante. Como anteriormente se describe las estrategias óptimas de I satisfacen ( !) m m m X X X máx mı́n ai1 xi , ai2 xi , . . . , an1 xi xi i=1 i=1 i=1 sujeta a las restricciones x1 + x2 + . . . + xm = 1 xi ≥ 0, i = 1, 2, . . . , m Este problema puede llevarse a la forma de programación lineal como sigue. Sea ! m m m X X X v = mı́n ai1 xi , ai2 xi , . . . , an1 xi i=1 i=1 Avila Garcia i=1 4.2. Solución por medio de Programación Lineal 52 entonces haciendo uso del teorema minimax, tenemos: maximizar: z=v m X ai1 xi ≥ v, sujeto a: j = 1, 2, . . . , n i=1 La formulación de programación lineal anterior puede simplificarse dividiendo entre v todas las (n + 1) restricciones. Esta división es correcta siempre que v > 0. De otra manera si v < 0, debe invertirse el sentido de las restricciones de desigualdad. Si v = 0 no está definida la división. Supóngase que v > 0, las restricciones del problema lineal son: x1 x2 xm + a21 + . . . + am1 ≥1 v v v x1 x2 xm a12 + a22 + . . . + am2 ≥1 v v v .. . a11 a1n Sea x̄i = x1 x2 xm + a2n + . . . + amn ≥1 v v v x1 x2 xm 1 + + ... + = v v v v xi , i = 1, 2, . . . , m. Pues v 1 máx v = mı́n = mı́nx̄1 + x̄2 + . . . + x̄m v El problema es minimizar z = x̄1 + x̄2 + . . . + x̄m Sujeto a a11 x̄1 + a21 x̄2 + . . . + am1 x̄m ≥ 1 a12 x̄1 + a22 x̄2 + . . . + am2 x̄m ≥ 1 .. . a1n x̄1 + a2n x̄2 + . . . + amn x̄m ≥ 1 x̄1 , x̄2 , . . . , x̄m ≥ 0 El problema del jugador II está dado como mı́n máx yj n X j=1 a1j yj , n X a2j yj , . . . , j=1 Avila Garcia n X j=1 ! amj yj 4.2. Solución por medio de Programación Lineal Sujeta a y1 + y2 + . . . + yn = 1 yj ≥ 0, j = 1, 2, . . . + n Esto también puede expresarse como un problema lineal como sigue: máx w = ȳ1 + ȳ2 + . . . + ȳn Sujeta a a11 ȳ1 + a12 ȳ2 + . . . + a1n ȳn ≤ 1 a21 ȳ1 + a22 ȳ2 + . . . + a2n ȳn ≤ 1 .. . am1 ȳ1 + am2 ȳ2 + . . . + amn ȳn ≤ 1 ȳ1 , ȳ2 , . . . , ȳm ≥ 0 donde 1 yj w = , ȳj = , j = 1, 2, . . . , n. v v Obsérvese que el problema del jugador II es el dual del problema del jugador I. Por lo tanto, la solución óptima de un problema automáticamente proporciona la solución óptima para el otro. El problema del jugador II puede resolverse con el método simplex regular, en tanto que el problema del jugador I se resuelve con el método dual simplex. La elección de uno u otro método dependerá de cuál problema tenga un número más pequeño de restricciones. Esto a su vez depende del número de estrategias puras para cada jugador. Ejemplo 4.2.1 (aplicación de programación lineal) Para demostrar el empleo de la programación lineal, se cita el caso de las dos compañı́as más grandes del mundo de bebidas de cola: PEPSICO Y LA COMPAÑÍA COCA-COLA. Éstas dos compañı́as son las más grandes y fuertes competidoras también dentro del paı́s. Las dos compañı́as están tratando de aumentar todavı́a más su participación en el mercado, una a costa de la otra. La compañı́a PEPSICO está considerando la posibilidad de disminuir los precios, regalando bebidas gaseosas en cada compra de un refresco de $12.00, o regalando un refresco familiar en la compra de 10 refrescos o más. Claramente, los gerentes de mercadotecnia de LA COMPAÑÍA Avila Garcia 53 4.2. Solución por medio de Programación Lineal 54 COCA-COLA no pueden desconocer la proporción creciente del mercado de PEPSICO, y de hecho, LA COMPAÑÍA COCA-COLA probablemente pondrá en práctica su propio programa, destinado a aumentar su participación en el mercado. Actualmente la calidad y el precio de los productos competidores son iguales, es difı́cil determinar lo que deba hacerse. La compañı́a PEPSICO ha preparado la siguiente matriz de pagos, desde el punto de vista de las participaciones crecientes o decrecientes del mercado. Matriz de pagos de 3 × 3 de dos Compañı́as refresqueras LA COMPAÑÍA COCA-COLA PEPSICO A B C A 4% 1% -3 % B 3 1 6 C -3 4 -2 A = Disminución de precios B = Regalo de bebidas gaseosas en compras de $12.00 C = Regalo de un refresco en compras de 10 refrescos o mas Aplicando programación lineal a éste juego tenemos las siguientes restricciones: 4y1 + y2 − 3y3 ≤ V 3y1 + y2 + 6y3 ≤ V −3y1 + 4y2 − 2y3 ≤ V y1 + y2 + y3 = 1 En la última restricción se representa el tiempo empleado para jugar las tres columnas, que se suma a la unidad y V representa el valor del juego. Ahora se divide ambos lados de la desigualdad entre V . 4y1 y2 3y3 + − ≤1 V V V 3y1 V − 3y1 V + + y2 V 4y2 V + − 6y3 V 2y3 V ≤1 ≤1 Avila Garcia 4.2. Solución por medio de Programación Lineal 55 A fin de remover las V del denominador, es necesario diseñar una nueva variable (ȳi ). Sea ȳi = yi V El juego se resolverá en términos de las (ȳi ), de modo que el resultado, se puede multiplicar las ȳ por V para determinar las y originales (yi = ȳi V ). Las nuevas desigualdades son: 4ȳ1 + ȳ2 − 3ȳ3 ≤ 1 3ȳ1 + ȳ2 + 6ȳ3 ≤ 1 −3ȳ1 + 4ȳ2 − 2ȳ3 ≤ 1 La ecuación (y1 + y2 + y3 = 1), también debe expresarse de nuevo en términos de las yb, teniendo ası́ las cuatro restricciones como sigue: 4ȳ1 + ȳ2 − 3ȳ3 ≤ 1 3ȳ1 + ȳ2 + 6ȳ3 ≤ 1 −3ȳ1 + 4ȳ2 − 2ȳ3 ≤ 1 1 ȳ1 + ȳ2 + ȳ3 = V Ahora bien podemos expresar las ecuaciones anteriores en términos de un problema de programación lineal, resolviendo las estrategias óptimas de y, y añadiendo una variable de holgura a cada desigualdad.1 Hay que recordar que el objetivo de y consiste en minimizar el valor del juego (V ), que es lo mismo que maximizar 1 V . Maximizar ȳ1 + ȳ2 + ȳ3 = 1 V Sujeto a: 4ȳ1 + ȳ2 − 3ȳ3 + ȳ4 + 0ȳ5 + 0ȳ6 = 1 3ȳ1 + ȳ2 + 6ȳ3 + 0ȳ4 + ȳ5 + 0ȳ6 = 1 −3ȳ1 + 4ȳ2 − 2ȳ3 + 0ȳ4 + 0ȳ5 + 1ȳ6 = 1 donde ȳ4 , ȳ5 e ȳ6 son variables de holgura. Aplicando el método simplex, obtenemos el siguiente tableau; la variable que entra a la base es ȳ1 . 1 Véase [1],página(5). Avila Garcia 4.2. Solución por medio de Programación Lineal 56 z ȳ1 ȳ2 ȳ3 ȳ4 ȳ5 ȳ6 L.D 0 -1 -1 -1 0 0 0 0 ȳ4 4 1 -3 1 0 0 1 ȳ5 3 1 -6 0 1 0 1 ȳ6 -3 4 -2 0 0 1 1 Realizando la iteración obtenemos el siguiente tableau: z ȳ1 ȳ2 ȳ3 ȳ4 ȳ5 ȳ6 L.D 0 0 − 23 1 0 0 0 1 3 ȳ4 0 − 13 -11 1 − 43 0 − 13 ȳ1 1 1 3 2 0 1 3 0 1 3 ȳ6 0 5 4 0 1 1 2 z ȳ1 ȳ2 ȳ3 ȳ4 ȳ5 ȳ6 L.D 0 0 0 0 0 0 ȳ1 1 0 ȳ2 0 1 2 15 - 19 15 4 15 1 5 2 15 1 15 1 - 15 1 5 3 5 ȳ4 23 15 161 - 15 26 15 4 5 1 0 0 − 15 1 5 2 5 La nueva variable a entrar a la base es ȳ3 y sale la variable ȳ4 z ȳ1 ȳ2 ȳ3 ȳ4 ȳ5 ȳ6 L.D 1 7 15 - 161 26 161 12 161 1 - 21 19 161 10 161 17 161 21 7 1 - 161 9 - 161 33 161 4 7 3 161 27 161 62 161 0 0 0 0 ȳ3 0 0 1 ȳ1 1 0 0 ȳ2 0 1 0 Aplicando el algoritmo Simplex, se obtienen las estrategias óptimas de ȳ de acuerdo al tableau final: 27 161 62 ȳ2 = 161 3 ȳ3 = 161 ȳ1 = Avila Garcia 4.2. Solución por medio de Programación Lineal 57 A continuación es necesario convertir ȳ1 , ȳ2 e ȳ3 en estrategias reales de columna y, lo que puede hacerse multiplicando por V . Sin embargo, lo que realmente hemos aumentado al máximo es 1 V . Si 1 V es igual a 47 . Entonces el valor de V = 74 , ası́ substituyendo el valor de V , las estrategias de columna de y son las siguientes: y1 = ȳ1 × V 27 7 × 161 4 97 y1 = 92 y1 = y2 = ȳ2 × V y3 = ȳ3 × V 62 7 × 161 4 62 y2 = 92 3 7 × 161 4 3 y3 = 92 y2 = y3 = Como ȳ4 es una variable de holgura no se jugará. El procedimiento anterior para calcular las estrategias de y (ası́ como el valor del juego), puede usarse para x. Las desigualdades siguientes representan las expectaciones de x: 4x1 + x2 − 3x3 ≥ V 3x1 + x2 + 6x3 ≥ V −3x1 + 4x2 − 2x3 ≥ V x1 + x2 + x3 = 1 Nuevamente dividiendo entre V , se obtiene: 4x1 x2 3x3 + − V V V 3x1 x2 6x3 + + V V V 3x1 4x2 2x3 − + − V V V x1 x2 x3 + + V V V ≥1 ≥1 ≥1 = 1 V xi , o bien xi = x̄i × V , podemos V expresar de nuevo las desigualdades y el valor del juego del modo siguiente: La definición de una nueva variable x̄i , que es igual a Avila Garcia 4.2. Solución por medio de Programación Lineal Minimizar x̄1 + x̄2 + x̄3 = 1 V Sujeto a: 4x̄1 + 3x̄2 − 3x̄3 ≥ 1 x̄1 + x̄2 + 4x̄3 ≥ 1 −3x̄1 + 6x̄2 − 2x̄3 ≥ 1 Las ecuaciones anteriores pueden expresarse nuevamente añadiendo variables de holgura y artificiales. El jugador x quiere aumentar al máximo V , o reducir al mı́nimo 1 V . Por lo tanto se tiene el siguiente programa lineal: Minimizar x̄1 + x̄2 + x̄3 = 1 V Sujeto a: 4x̄1 + 3x̄2 − 3x̄3 − x̄4 + 0x̄5 + 0x̄6 + x̄7 + 0x̄8 + 0x̄9 = 1 x̄1 + x̄2 + 4x̄3 − 0x̄4 − x̄5 + 0x̄6 + 0x̄7 + x̄8 + 0x̄9 = 1 −3x̄1 + 6x̄2 − 2x̄3 + 0x̄4 + 0x̄5 − x̄6 + 0x̄7 + 0x̄8 + x̄9 = 1 donde x̄4 , x̄5 y x̄6 son variables de holgura, y x̄7 , x̄8 y x̄9 son variables artificiales. Aplicando el algoritmo Simplex se produce la siguiente solución: 1 7 2 x̄2 = 7 1 x̄3 = 7 x̄1 = Sin embargo, xi = x̄i × V , dan por resultado las siguientes estrategias de renglón para x: 1 7 1 × = 7 4 4 2 7 1 x2 = × = 7 4 2 1 7 1 x3 = × = 7 4 4 x1 = Avila Garcia 58 Capı́tulo 5 Juegos No Cooperativos 5.1. Juegos suma diferente de cero o metajuegos Los juegos que se han visto hasta ahora son de suma cero, en donde las ganancias de un jugador equivalen a las pérdidas de su oponente. En este capı́tulo vamos a ver juegos con suma no nula. En los juegos cuya suma es diferente de cero, la ganancia de un jugador no necesariamente implica pérdida para el otro; por el contrario puede implicar ganancia. Las situaciones en la que la ganancia de uno no necesariamente implica la pérdida de otro, se denominan juegos diferente de cero. Estos juegos han sido estudiados matemáticamente, bajo el nombre de metajuegos o juegos entre dos personas con suma no constante y su solución es generalmente un dilema. La mayor parte de los modelos teóricos de juegos para situaciones en los negocios no son de suma constante, porque es poco común que las empresas competidoras estén en conflicto total entre sı́. Ejemplo 5.1.1 Dilema del Prisionero. Dos prisioneros que escaparon y participaron en un robo fueron recapturados y esperan el juicio por su nuevo délito. Aunque ambos son culpables, el fiscal de Gotham City no tiene las pruebas suficientes para condenarlos. Para provocar que testifiquen uno contra el otro, el fiscal les dice lo siguiente a cada uno: ”si sólo confiesa uno de ustedes y testifica contra su socio, el que confiese será liberado, mientras que el que no confiese será condenado a una sentencia de 20 años. Si ambos confiesan, ambos serán condenados y pasarán 5 años en prisión. Por último, si nadie confiesa, los puedo acusar de mal comportamiento y pasarán 1 año en prisión”. 59 5.1. Juegos suma diferente de cero o metajuegos ¿Qué debe hacer cada prisionero? A continuación se presenta la matriz de recompensa para el dilema del prisionero. Matriz de recompensa para el Dilema del Prisionero Prisionero 1 Prisionero 2 Confeso No confeso Confeso (−5, −5) (0, −20) no confeso (−20, 0) (−1, −1) Solución: Si suponemos que los prisioneros no se pueden comunicar entre sı́, las estrategias y recompensas aparecen en la tabla anterior. El primer número en cada lugar de esta matriz es la recompensa (negativa, ya que los años de prisión no se desean) al prisionero 1, y el segundo elemento de cada lugar es la recompensa al prisionero 2. Es importante hacer notar que la suma de las recompensas en cada lugar varı́a desde un máximo de -2(-1 -1) hasta un número de -20(-20 + 0). Por lo tanto, no se trata de un juego de dos jugadores con suma constante. Supongamos que cada prisionero trata de no tener en cuenta cualquier estrategia dominada. Para cada prisionero, la estrategia “confesar” domina a la “no confesar”. Sin embargo, si cada prisionero sigue su estrategia no dominada (“confesar”), pasará 5 años en prisión. Por otro lado, si cada prisionero escoge la estrategia “no confesar”, pasará 1 año en prisión. Ası́, si cada prisionero escoge su estrategia dominada, ambos estarán mejor que si cada uno escoge su estrategia no dominada. Definición 5.1.1 Como en un juego de dos personas con suma cero, la elección de estrategia por parte de cada jugador (prisionero) es un punto de equilibrio si ningún jugador puede sacar provecho de un cambio unilateral de estrategia. Por la definición anterior (-5, -5) es un punto de equilibrio, porque si cada prisionero cambia su estrategia, su recompensa disminuye (de -5 a -20). Sin embargo, es evidente que cada prisionero esta mejor en el punto (-1, -1). Para ver que el resultado (-1, -1) quizá no suceda, obsérvese que no es punto de equilibrio, porque si en realidad estamos en el resultado (-1, -1), cada prisionero puede aumentar su recompensa de -1 a 0, cambiando su estrategia de “no confesar” a “confesar”. Es decir, cada prisionero puede sacar provecho si traiciona a su oponente. Esto ilustra un aspecto importante de los Avila Garcia 60 5.1. Juegos suma diferente de cero o metajuegos juegos del tipo del Dilema del prisionero; si los jugadores cooperan (si cada prisionero escoge “no confesar”), pueden salir ganando al traicionar a su cómplice (suponiendo que la estrategia del cómplice permanece invariable). Sin embargo, si ambos jugadores se traicionan mutuamente, ambos estarán peor que si hubieran escogido su estrategia de cooperación. Esta anomalı́a no puede suceder en un juego de dos personas con suma constante. Veamos el caso del dilema del prisionero para un problema general. Matriz de recompensa para un problema general del Dilema del Prisionero Jugador 1 Jugador 2 NC C NC (P, P ) (T, S) C (S, T ) (R, R) De modo más formal, un juego del tipo del Dilema del Prisionero se puede describir como en la tabla anterior donde N C = No Cooperativa la acción C = Acción con cooperación P = castigo por no cooperar S = Pago a la persona que es traicionada R = Recompensa por cooperar si ambos jugadores ası́ lo hacen T = Tentación de traicionar al cómplice En un juego del tipo del Dilema del Prisionero, (P, P ) es un punto de equilibrio. Esto requiere que P > S. Para que (R, R) no sea punto de equilibrio se necesita que T > R. Esto da a cada jugador la tentación de cambiar con respecto a su oponente. El juego sólo es razonable si R > P . Ası́ que para que la tabla anterior represente el juego del Dilema del Prisionero, necesitamos que T > R > P > S. Este juego es interesante porque explica porqué dos adversarios no pueden cooperar entre sı́ con frecuencia. Avila Garcia 61 5.1. Juegos suma diferente de cero o metajuegos 62 Ejemplo 5.1.2 Hay dos restaurantes en competencia, Burger King y Mc Donalds, que tratan de determinar sus presupuestos de propaganda para el próximo año. Las ventas combinadas de las dos empresas son de 240 millones de pesos y pueden gastar de 6 a 10 millones de pesos en propaganda. Si una de las empresas gasta más que la otra, tendrá ventas de 190 millones de pesos. Si ambas empresas gastan la misma cantidad en propaganda tendrán ventas iguales. Cada peso de ventas produce 10 centavos de ganancia. Supóngase que a cada restaurante le interesa maximizar sus ventas, vamos a determinar el punto de equilibrio para este juego. Solución La matriz de recompensas correspondiente a este juego aparece en la siguiente tabla. Matriz de recompensa para el juego de propaganda Burger King Mc Donalds Gastar 106 Gastar 6 × 106 Gastar 106 (2, 2) (9, −1) Gastar 6 × 106 (−1, 9) (6, 6) Nótese el gasto de 10 millones de pesos en propaganda como acción no cooperativa y gastar 6 millones de pesos como acción cooperativa, entonces (2,2), que corresponde a mucha propaganda por parte de ambos restaurantes, es un punto de equilibrio. Sin embargo ambos restaurantes se encuentran mejor en (6,6) que en (2,2), (6,6) es inestable porque cualquier restaurante puede ganar si cambia su estrategia. Ası́ para proteger sus ganancias en el mercado, cada restaurante debe invertir mucho en la propaganda. Otro ejemplo que sigue el modelo del Dilema del prisionero es el caso que se ilustra en la siguiente figura, para tres empresas comerciales. Empresa Comercial Mexicana Mantiene precios altos Baja precios ................................................................................................................................................................. ......... ..... .... ..... ......... ........ ........ ......... .... ........ ........ ......... . . . . ........ ........ . . .... . . ..... ........ ........ . . . . . . . . . . . . . . . . . . . .... . . . ................................................................................................................................................................ . . . . . . . .... . ..... .... ...... ...... . . . . . . . . . . . . . . . . . . . ... . . . . .... ..... ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... ..... ..... ..... ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... ..... ..... ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... ... ............................................................................................................................................................... ..... ............... .... ... ... ... ... ... ... ... ............ .... . . . . . .... .... .... .... . ......... . . . . . . . .... .... .... .... ..... .... . . . . . . . . .... .... .... . . . .... ...... . . . . . .... ............... .... .... .... . .... . . . . . . ... ........... ... ... .... . ..... . . . . . . ................................................................................................................................................................ .... . .... s a .... .... .... .... .............. a j io ....... .... .... .... B rec ........ .... .... .... ........ p . . . . . ... ... ... . . e ........ .... .... .... ....... en l ... ............ .... ... ti s ia ....................................................................................................................................................................... rc an io Mantiene precios altos Baja precios M rec s p lt o a Empresa comercial Aurrera Avila Garcia E e pr m sa co e m te an ig G 5.1. Juegos suma diferente de cero o metajuegos Para el caso de 2 jugadores, el contenido de la matriz de consecuencias en un juego cuya suma es diferente de cero podrı́a ser la siguiente: Gigante (II) Aurrera (I) A B A C1 C2 B D1 D2 A = Mantiene precio B = Baja precios C1 = Status quo C2 = II gana más clientela y utilidades D1 = I gana más clientela y utilidades D2 = Mantienen misma clientela, pero pierden utilidades Avila Garcia 63 Conclusiones y Recomendaciones Esta investigación fue desarrollada para ilustrar los distintos métodos que hay en el campo de la teorı́a de juegos. Se inicio desde un problema básico de suma cero en donde se aplica el método más sencillo: punto de silla de montar, en donde cabe destacar su uso desde tiempos remotos; conforme el avance de los capı́tulos se van desarrollando las técnicas de dominación y el método gráfico, como ejemplos de juegos sencillos y de la vida diaria. Sin embargo con estos métodos, no es posible dar solución a ciertos problemas cotidianos tales como; la competencia en los mercados. Es por ello que se emplea un análisis por programación lineal el cual es de indispensable ayuda para la representación de un problema de teorı́a de juegos. En esta sección se logra el propósito, pues mediante ejercicios propuestos se hace uso del método simplex, ası́ como el teorema de dualidad. Este método es el más usual entre los problemas de teorı́a de juegos pues resulta muy útil para juegos con muchas estrategias por cada jugador. El teorema de Dualidad es de suma importancia ya que su principal implicación es que el valor de la solución óptima para el jugador 1 coincide con la solución óptima del jugador 2, lo cual representa una gran ventaja. Finalmente se concluye con una breve explicación del empleo de la teorı́a de juegos con suma diferente de cero o metajuegos, en donde se hace mención del famoso problema “dilema del prisionero”, el cual se toma como modelo para la solución a otros problemas. En la actualidad las técnicas siguen vigentes, sugiriendo el análisis del juego con mayor número de participantes, también se puede hacer uso en juegos como: el ajedrez, cartas en computadora y juegos más especı́ficos. Para juegos no cooperativos el análisis de la toma de decisiones se sugiere por objetivos múltiples. 64 Bibliografı́a [1] Bazaraa, M. S., Programación Lineal y Flujo de Redes, Grupo Editorial Iberoamericana., México, 1998. [2] Davis M. D., Teorı́a de Juegos Alianza., Madrid, 1977. [3] Fernández, F. R., et. al., Advances in games theory with economics and social applications, J. M. Bilbao, Universidad de Sevilla, 2000. [4] Hillier, Frederick, y Lieberman, Gerald, J., Introducción a la investigación de operaciones, Mc–Graw Hill., Stanford, 2000. [5] Reyna, Casiodoro & De Valera, Cipriano (revisores) La Santa Biblia, Antiguo y Nuevo Testamento, El mundo hispano, El Paso–Texas, 1989. [6] Prawda, Witenberg, Juan, Métodos y modelos estocásticos, Vol. II, Noriega, editores., México, 2000. [7] Taha, Hamdy, A., Investigación de operaciones, (5a edición) Alfa Omega., México, 2000. [8] Thierauf, Robert, J., Toma de decisiones por medio de investigación de operaciones, Mc–Graw Hill., México, 2000. [9] Ventel, Elena Sergeevna., Elementos de la Teorı́a de Juegos, MIR., Moscú, 2000. [10] Winston, Wayne, L., Investigación de Operaciones, Grupo Editorial Iberoame– ricana., México, 2000. 65 Índice alfabético cuadro incidental, 10 escenario, 13 estrategia mixta, 21 información perfecta, 16 juego compuesto, 13 simple, 13 jugada aleatoria, 15 personal, 15 punto de silla, 21 valor del juego, 21 maximim, 20 minimax, 20 66