4 Teorí a de juegos y herramientas del ana lisis estrate gico de negocios 4.1 Introducción a la teoría de juegos La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados «juegos») y llevar a cabo procesos de decisión. Sus investigadores estudian las estrategias óptimas así como el comportamiento previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos pueden, en realidad, presentar estructura de incentivo similar y, por lo tanto, se puede representar mil veces conjuntamente un mismo juego. Desarrollada en sus comienzos como una herramienta para entender el comportamiento de la economía, la teoría de juegos se usa actualmente en muchos campos, como en la biología, sociología, psicología y filosofía. Experimentó un crecimiento sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y Oskar Morgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia militar, en particular a causa del concepto de destrucción mutua garantizada. Desde los setenta, la teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo generalizado perjudica a los jugadores, la teoría de juegos ha atraído también la atención de los investigadores en informática, usándose en inteligencia artificial y cibernética. 4.1.1 Elementos esenciales del juego Los 4 elementos esenciales en el juego de azar, tal como usamos el término: 1. Un juego de suerte - una competencia de éxito incierto. Este podría ser un evento inventado por los jugadores de manera que puedan jugar sobre este, o podría ser un evento que habría ocurrido de alguna forma, pero los jugadores usan este como un evento para apostar (tal como el éxito de una elección o los eventos deportivos). 2. Las apuestas - Cada jugador originalmente posee algún artículo(s) de valor material, el cual está deseando arriesgar a perder a cambio de una oportunidad para tratar de tomar lo que los otros poseen. 3. El convenio o trato - Cada jugador acuerda, con previo conocimiento del éxito del juego, lo que está deseando arriesgar a perder para tener a cambio de esto la oportunidad de tratar de tomar lo que los demás tienen. 4. La falta de compensación favorable - Ningún bien o servicio de beneficio material es producido o dado a cambio de lo que se pierde, ni hay ninguna intención para que esto sea así. Este no es un caso de producción y luego de canje de los bienes o servicios de valor favorable. Es entendido desde antes que el juego empiece que el perdedor del juego perderá sus posesiones sin ser recompensado adecuadamente , y el ganador obtendrá las posesiones del perdedor sin restituírselo. Por tanto, el único propósito del juego son los acuerdos, mas la emoción y el estímulo del riesgo. 4.1.2 Reglas del juego Existen dos tipos de reglas, las primeras, llamadas reglas normativas poseen una doble característica, por un lado se declaran públicamente y de manera rimbombante, como solo los hombres de política lo pueden hacer, y por otro lado el saborcillo de ambigüedad que queda plasmada en los paladares de la ciudadanía, un ejemplo de estas reglas podrían ser la honestidad y la transparencia. En el fondo son los planteamientos éticos que pretenden regular la competencia. La segunda categoría de reglas son las llamadas reglas pragmáticas, según Bailey estas reglas son determinantes a la hora de ganar el juego, por eso, el, pone especial atención en ellas. Las reglas pragmáticas se presentan como lo antagónico a las normativas, es decir; quedan en lo privado. Para Bailey, lo importante no es recibir la aprobación del público, sino, desde un punto de vista funcional, que las acciones sean eficaces. Esto último puede tener múltiples lecturas, en el mejor de los casos es simplemente eso, buscar una acción eficaz, en el peor de los casos sería adquirir el principio de “el fin justifica los medios”. “…La separación de lo público y lo privado constituyen aspectos fundamentales de concepción occidental, pero es producto de la historia, y no de hechos universales” (Gledhill, 2000) Podemos intentar comprender la lógica de raciocinio de Bailey, en el sentido de su especial atención acerca de la segunda clasificación de las normas. Obviamente el juego de la política posee una pretensión de status y poder, eso sí, oculta tras una fachada construida en base a reglas normativas. Por tanto la primera clasificación de las reglas es solo un condimento practicante insípido, al contrario que las reglas pragmáticas, que vendrían a ser el ingrediente principal de una competencia política 4.1.3 Información La Teoría de Juegos tiene una relación muy lejana con la estadística. Su objetivo no es el análisis del azar o de los elementos aleatorios sino de los comportamientos estratégicos de los jugadores. En el mundo real, tanto en las relaciones económicas como en las políticas o sociales, son muy frecuentes las situaciones en las que, al igual que en los juegos, su resultado depende de la conjunción de decisiones de diferentes agentes o jugadores. Se dice de un comportamiento que es estratégico cuando se adopta teniendo en cuenta la influencia conjunta sobre el resultado propio y ajeno de las decisiones propias y ajenas. La Teoría de Juegos ha alcanzado un alto grado de sofisticación matemática y ha mostrado una gran versatilidad en la resolución de problemas. Muchos campos de la Economía (Equilibrio General, Distribución de Costos, etc.), se han visto beneficiados por las aportaciones de este método de análisis. En el medio siglo transcurrido desde su primera formulación el número de científicos dedicados a su desarrollo no ha cesado de crecer. Y no son sólo economistas y matemáticos sino sociólogos, biólogos o psicólogos. Existen también aplicaciones jurídicas: asignación de responsabilidades, adopción de decisiones de pleitear o conciliación, etc. Desarrollada en sus comienzos como una herramienta para entender el comportamiento de la economía, la teoría de juegos se usa actualmente en muchos campos, como en la biología, sociología, psicología y filosofía. Experimentó un crecimiento sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y OskarMorgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia militar —en particular a causa del concepto de destrucción mutua garantizada. Desde los setenta, la teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo generalizado perjudica a los jugadores, la teoría de juegos ha atraído también la atención de los investigadores en informática, usándose en inteligencia artificial y cibernética. 4.1.4 Estrategias En teoría de juegos, la estrategia de un jugador es un plan de acción completo para cualquier situación que pueda acaecer; determina completamente la conducta del jugador. La estrategia de un jugador determinará la acción que tomará el jugador en cualquier momento del juego, para cualquier secuencia de acontecimientos hasta ese punto. Un perfil de estrategia es un conjunto de estrategias para cada jugador que especifica completamente todas las acciones en un juego. Un perfil de estrategia debe incluir solamente una estrategia para cada jugador. La descripción matemática de una conducta tiene relación con la programación y los algoritmos. El concepto de estrategia se confunde (erróneamente) en ocasiones con el de movimiento. Un movimiento es una acción que toma un jugador en un determinado momento en el juego (por ejemplo, en el ajedrez, al mover el alfil blanco de a2 a b3). Una estrategia, por otra parte, es un algoritmo completo para jugar al juego, enumerando implícitamente todos los movimientos de todos los jugadores para cada situación del juego. El número de movimientos en el tres en raya es 4 o 5 (dependiendo de si el jugador empieza o no, y considerando que ninguno de los jugadores puede saltarse un turno), mientras que el número de estrategias es superior a 6 billones. Tipos de estrategias Una estrategia pura proporciona una definición completa para la forma en que un jugador puede jugar a un juego. En particular, define, para cada elección posible, la opción que toma el jugador. El espacio de estrategia de un jugador es el conjunto de estrategias puras disponible al jugador. Una estrategia mezclada es una asignación de probabilidad a cada estrategia pura. Define una probabilidad sobre las estrategias y refleja que, en lugar de elegir una estrategia pura particular, el jugador elegirá al azar una estrategia pura en función de la distribución dada por la estrategia mezclada. Por supuesto, cada estrategia pura es una estrategia mezclada que elige esa estrategia pura con probabilidad 1 y cualquier otra con probabilidad 0. 4.1.5 Pagos Debe existir un pago determinado. Indica la utilidad que alcanza el jugador, una vez que la naturaleza y el resto de los jugadores han seleccionado sus acciones y se ha desarrollado el juego. 6.1.6 Equilibrios Propiedad de la solución expresada en términos de las estrategias seguidas por cada jugador. Nociones de equilibrio básicas: * Equilibrio de Estrategias Dominantes * Equilibrio de Nash * Equilibrio de Estrategias Dominadas Equilibrios en estrategias puras Dado un juego rectangular (N,Dj,φj), se dice que es un equilibrio de Nash en estrategias puras (ep) si para cada jugador en N se cumple: y donde representa el pago para el jugador j cuando éste decide cambiar su estrategia por cualquier otra , mientras que los demás jugadores mantienen la estrategia dada por el perfil σ. Equilibrios en estrategias mixtas Decimos que un perfil de estrategias mixtas X es un equilibrio de Nash en estrategias mixtas (em) si para cada jugador j∈N se cumple: Donde Ej(X) es el pago esperado (o pago promedio) que obtendrá el jugador j al jugarse siempre el perfil de estrategias mixtas X. Intuitivamente, un perfil de estrategias mixtas es equilibrio de Nash si, en promedio, ningún jugador puede mejorar su pago cambiando sus estrategias mixtas cuando el resto de los jugadores se mantenga con la estrategia actual. Equilibrios de Nash para juegos extensivos A menudo no es posible modelar un problema de la teoría de juegos a través de un juego rectangular y se hace necesario modelarlo como un juego extensivo. En estos casos pueden buscarse los equilibrios de Nash a través de la forma normal del juego o usando diversos algoritmos en el juego extensivo, como la inducción hacia atrás. Equilibrios Eficientes e Ineficientes Un equilibrio es eficiente si no hay un resultado alternativo que deje a algunos jugadores mejor y a ninguno peor. Un equilibrio no es eficiente si hay algún otro resultado que todos encuentren preferible. En un juego puede haber tanto equilibrios eficientes como equilibrios ineficientes. Un equilibrio ineficiente puede corresponderse con una conducta perfectamente racional desde el punto de vista individual 4.2 El dilema del prisionero La enunciación clásica del dilema del prisionero es: La policía arresta a dos sospechosos. No hay pruebas suficientes para condenarlos y, tras haberlos separado, los visita a cada uno y les ofrece el mismo trato. Si uno confiesa y su cómplice no, el cómplice será condenado a la pena total, diez años, y el primero será liberado. Si uno calla y el cómplice confiesa, el primero recibirá esa pena y será el cómplice quien salga libre. Si ambos confiesan, ambos serán condenados a seis años. Si ambos lo niegan, todo lo que podrán hacer será encerrarlos durante seis meses por un cargo menor. Lo que puede resumirse como: Tú confiesas Él confiesa Ambos son condenados a 6 años. Él lo Él es condenado a 10 años y tú niega sales libre. Tú lo niegas Él sale libre y tú eres condenado a 10 años. Ambos son condenados a 6 meses. Vamos a suponer que ambos prisioneros son completamente egoístas y su única meta es reducir su propia estancia en la cárcel. Como prisioneros tienen dos opciones: cooperar con su cómplice y permanecer callado, o traicionar a su cómplice y confesar. El resultado de cada elección depende de la elección del cómplice. Por desgracia, uno no conoce qué ha elegido hacer el otro. Incluso si pudiesen hablar entre sí, no podrían estar seguros de confiar mutuamente. Si uno espera que el cómplice escoja cooperar con él y permanecer en silencio, la opción óptima para el primero sería confesar, lo que significaría que sería liberado inmediatamente, mientras el cómplice tendrá que cumplir una condena de 10 años. Si espera que su cómplice decida confesar, la mejor opción es confesar también, ya que al menos no recibirá la condena completa de 10 años, y sólo tendrá que esperar 6, al igual que el cómplice. Y, sin embargo, si ambos decidiesen no cooperar y permanecer en silencio, ambos serían liberados en sólo 6 meses. Confesar es una estrategia dominante para ambos jugadores. Sea cual sea la elección del otro jugador, pueden reducir siempre su sentencia confesando. Por desgracia para los prisioneros, esto conduce a un resultado regular, en el que ambos confiesan y ambos reciben largas condenas. Aquí se encuentra el punto clave del dilema. El resultado de las interacciones individuales produce un resultado que no es óptimo -en el sentido de eficiencia de Pareto-; existe una situación tal que la utilidad de uno de los detenidos podría mejorar (incluso la de ambos) sin que esto implique un empeoramiento para el resto. En otras palabras, el resultado en el cual ambos detenidos no confiesan domina al resultado en el cual los dos eligen confesar. Si se razona desde la perspectiva del interés óptimo del grupo (de los dos prisioneros), el resultado correcto sería que ambos cooperasen, ya que esto reduciría el tiempo total de condena del grupo a un total de un año. Cualquier otra decisión sería peor para ambos si se consideran conjuntamente. A pesar de ello, si siguen sus propios intereses egoístas, cada uno de los dos prisioneros recibirá una sentencia dura. Una opción es considerar este dilema como una simple "máquina de la verdad". El jugador puede tomar no dos, sino tres opciones: cooperar, no cooperar o, sencillamente, no jugar. La respuesta lógica en este caso es "no jugar", pues el prisionero carece de información suficiente para jugar correctamente: no sabe cuál será la opción de su compañero. No hay tal dilema, pues no es posible el juego. Si juega, se trata de una "apuesta", más que de una solución lógica. Pensemos también que el prisionero en realidad está "jugando" con su carcelero, no con el otro prisionero. El carcelero le ofrece una opción. Para él, la mayor ganancia sería condenar al prisionero a la pena mayor, pues ése es su trabajo. Si logra condenar a los dos a la máxima pena, doble ganancia. El prisionero sabe eso, en el fondo. Sólo "jugaría" si supiera con toda certeza que el policía cumpliría su palabra a pesar de su confesión. Pero tampoco lo sabe. En realidad, prisionero-carcelero y prisionero-prisionero están jugando al mismo juego: encubrir o traicionar (en el caso del ejemplo de los prisioneros, no concuerda el verdad o mentira puesto que decir la verdad sería traicionar). Tú encubres Él encubre Él traiciona Máximo común beneficio Él gana, tú pierdes Tú traicionas Tú ganas, él pierde Máximo común perjuicio En este caso, decir la verdad equivale a cooperar, a callarse. Pero un jugador sólo optará por la casilla "verdad" si sabe que el otro jugador también opta por la misma solución. En la vida real, eso no lo sabemos: hay que "jugar", es decir, arriesgarse. Todo se basa en la "relación de confianza" existente entre los dos jugadores. Pongamos, por ejemplo, que los dos prisioneros son hermanos, con una relación de confianza muy estrecha. O que lo son uno de los prisioneros y el carcelero. Entonces sí sabrían (casi con toda seguridad, pero nunca completa) cuál sería la opción de su compañero, y entonces siempre jugarían correctamente: cooperarían. La única solución lógica es, por tanto, decir la verdad. Y además será la que dará el máximo beneficio común. Este planteamiento nos lleva a la correcta solución del dilema, que es decir la verdad, cooperar. Pero en este caso el error estaba en el planteamiento correcto del dilema, que no es pensar en nuestro beneficio (ser egoísta) sino en el del "otro" (ser generoso). En este caso, jugando a "verdad" siempre conseguiremos que el "otro" gane. Si el objetivo del juego es que siempre gane el rival, hay pues una única solución lógica, y que no depende de la jugada del rival. Dilema resuelto. 4.3 Juegos cooperativos y no cooperativos Juego cooperativo Es un juego en el cual dos o más jugadores no compiten, sino más bien se esfuerzan por conseguir el mismo objetivo y por lo tanto ganan o pierden como un grupo. En otras palabras, es un juego donde grupos de jugadores o coaliciones pueden tomar comportamientos cooperativos, pues el juego es una competición entre coaliciones de jugadores más que entre jugadores individuales. Es como un juego de coordinación, donde los jugadores escogen las estrategias por un proceso de toma de decisiones consensuada. La solución a los juegos cooperativos consiste en el reparto de los pagos que garantice estabilidad, es decir, en la que ninguno de los participantes de una coalición vencedora pueda estar interesado en romper el acuerdo. Se llama "valor del juego" al pago que un jugador tiene garantizado que puede recibir de un juego si toma una decisión racional, independientemente de las decisiones de los demás jugadores. Ningún jugador racional aceptará formar parte de una coalición si no recibe como pago al menos el valor del juego. Un ejemplo de juego cooperativo es el es el “juego de contar”, en donde los jugadores como un grupo intentan contar hasta 20 sin que dos participantes digan el mismo número dos veces. Juegos no cooperativos Los juegos no cooperativos, también llamados juegos sin transferencia de utilidad, son los modelos de la teoría de juegos en los que los jugadores no pueden hacer acuerdos previos. Éstos indagan sobre qué tan inteligentemente un individuo interactúa con otros para lograr sus propósitos. Los juegos no cooperativos suelen ser bipersonales, es decir, con sólo dos jugadores. Pueden ser simétricos o asimétricos según que los resultados sean idénticos desde el punto de vista de cada jugador. Pueden ser de suma cero, cuando el aumento en las ganancias de un jugador implica una disminución por igual cuantía en las del otro, o de suma no nula en caso contrario, es decir, cuando la suma de las ganancias de los jugadores puede aumentar o disminuir en función de sus decisiones. Cada jugador puede tener opción sólo a dos estrategias, en los juegos biestratégicos, o a muchas. Las estrategias pueden ser puras o mixtas; éstas consisten en asignar a cada estrategia pura una probabilidad dada. En el caso de los juegos con repetición, los que se juegan varias veces seguidas por los mismos jugadores, las estrategias pueden ser también simples o reactivas, si la decisión depende del comportamiento que haya manifestado el contrincante en jugadas anteriores. Como ejemplo de juegos no cooperativos, se destacan “el halcón y la paloma” y “la guerra de los sexos”. 4.4 JUEGO DE SUMA CERO Término económico empleado para describir cualquier tipo de transacción financiera en la que los beneficios de los ganadores igualan exactamente a las pérdidas de los perdedores. La contratación de futuros y de opciones es un ejemplo de juegos de suma cero, si se pasan por alto los gastos de transacción. Lo mismo sucede con la mayoría de los juegos de azar. Juego donde la ganancia de uno de los jugadores se compensa con la pérdidade otro jugador. Zero-sum gome. Este término se aplica a los mercados de futuros, donde el conjunto de laspérdidas de los participantes iguala al conjunto de las ganancias obtenidas, descontando las comisiones y los gastos. Situación en la cual el valor de las pérdidas es igual al valor de las ganancias. La Suma cero describe una situación en la que la ganancia o pérdida de un participante se equilibra con exactitud con las pérdidas o ganancias de los otros participantes. Se llama así; porque si se suma el total de las ganancias de los participantes y se resta las pérdidas totales el resultado es cero. El los juegos como , el ajedrez, el póker y el juego del oso son ejemplos de juegos de suma cero. La suma cero es un caso especial del caso más general de suma constante donde los beneficios y las pérdidas de todos los jugadores suman el mismo valor, porque se gana exactamente la cantidad que pierde el oponente. Cortar una tarta es de suma constante o cero porque llevarte un trozo más grande reduce la cantidad de tarta que le queda a los demás. Situaciones donde los participantes pueden beneficiarse o perder al mismo tiempo, como el intercambio de productos entre una nación que produce un exceso de naranjas y otra que produce un exceso de manzanas, en la que ambas se benefician de la transacción, se denominan de"suma no nula". El concepto fue desarrollado en la Teoría de juegos, por lo que a menudo a las situaciones de suma cero se les llama "juegos de suma cero". Esto no implica que el concepto, o la teoría de juegos misma, se aplique únicamente a lo que normalmente se conoce como juegos. Las estrategias óptimas para juegos de suma cero de dos jugadores suelen emplear estrategias minimax. Las situaciones de suma no nula son una parte importante de la actividad económica debido a la producción, utilidad marginal y subjetividad del valor. La mayoría de las situaciones económicas son de suma no nula, ya que se pueden crear, destruir, o asignar bienes y servicios valiosos, y cualquiera de éstos creará una ganancia o pérdida neta. Si un granjero consigue una cosecha abundante, se beneficia al ser capaz de vender una mayor cantidad de comida y obtener más dinero. Los consumidores a los que sirven se benefician también, ya que hay más comida en el mercado, así que el precio de cada unidad sería menor. Otros granjeros que no hayan tenido cosechas tan buenas perderán algo, pero probablemente sus pérdidas serán menores que los beneficios que obtienen los demás, de modo que en general la abundante cosecha ha generado un beneficio neto. El mismo argumento se aplica a otros tipos de actividad productiva. El comercio es una actividad de suma no nula ya que todas las partes en una transacción voluntaria creen que su situación mejorará tras ella, o si no, no participarían. Es posible que estén equivocados al creer esto, pero la experiencia sugiere que la gente suele acertar a la hora de juzgar si una transacción les beneficia, y por ello continúan realizándolas a lo largo de sus vidas. No siempre sucede que todos los participantes se beneficien de igual forma. Aun así, un intercambio es una situación de suma no nula cada vez que deriva en un beneficio neto, sin importar cómo de desigual sea la distribución de las ganancias. La complejidad y la suma no nula. Algunos autores, como Robert Wright, han teorizado sobre la evolución de la sociedad hacia formas crecientes de suma o aditividad no nula a medida que se va haciendo más compleja, especializada e interdependiente. Bill Clinton, uno de los que apoyan esta teoría sostiene: Cuanto más complejas se vuelven las sociedades, y más complejas son las redes de interdependencia dentro y fuera de los límites de las comunidades y las naciones, un mayor número de gente estará interesada en encontrar soluciones de suma no nula. Esto es, soluciones ganancia-ganancia en lugar de soluciones ganancia-pérdida... Porque descubrimos que cuanto más crece nuestra interdependencia, generalmente prosperamos cuando los demás también prosperan - Bill Clinton, entrevista en Wired, Diciembre de 2000 4.5 Equilibrio de Nash El equilibrio de Nash es, en la teoría de los juegos, un “concepto de solución” para juegos con dos o más jugadores, el cual asume que: Cada jugador conoce y ha adoptado su mejor estrategia, y Todos conocen las estrategias de los otros. Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demás jugadores. En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente su estrategia. Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción. En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia. Ejemplo Quizás el mejor ejemplo de un equilibrio de Nash es una variación del conocido “dilema del prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores (más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación (equilibrio) en la cual cada uno minimiza su posible pérdida. Historia El concepto de equilibrio de Nash comienza su desarrollo con Antoine Augustin Cournot y su trabajo sobre oligopolios (1838). En éste se plantea el modelo de varias empresas que compiten por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia en función de la producción de las otras. Se establece un equilibrio de Cournot cuando la producción de cada empresa maximiza sus beneficios, dada la producción de las otras empresas, lo que es una situación de estrategia pura en el equilibrio de Nash.