TEORÍA DE JUEGOS ¿Cómo Có jjugar?? ¿Estrategias puras o mixtas? Parte I J g de Juegos d suma cero Bart y Lisa aplican p maximin: L1 = 0 L2 = 1 L3 = 2 B1 = 0 B2 = 1 B3 = 2 −5 2 3 2 3 3 −5 −5 2 B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2 i ⎝ j ⎠ L * = min max (π ij ) = min (3,3, 2 ) = 2 j ( i ) J g de Juegos d suma cero Bart y Lisa aplican p maximin: Solución estrategias puras: B*=B3, L*=L3, Л=2 Punto de Silla : ( max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij ) j i ⎝ j i ⎠ ) J g de Juegos d suma constante t t y Punto de silla: condición necesaria y suficiente para encontrar equilibrio en estrategias puras ⎧⎪π io , j ≥ π io , jo ∀j = 1K m ∃io , jo / ⎨ ⎪⎩π i , jo ≤ π io , jo ∀i = 1K n Punto de silla ¿Y si no hay un punto de silla? Lisa Papel Tijeras Piedra Papel 0,0 -1,1 1,1 1,-1 1, 1 Tijeras 1,-1 1, 1 0,0 -1,1 1,1 Piedra -1,1 1,1 1,-1 1, 1 0,0 Bart Definiciones y y y Estrategia mixta: jugada con una probabilidad p E t t i pura: Estrategia jugada con una probabilidad p=1 Distribución de probabilidad subjetiva: un jugador cree que el otro elegirá la estrategia k con probabilidad лk, ¿Y si no hay un punto de silla? Estrategia mixta: y Distribución de p probabilidad asociada con el conjunto j de estrategias puras de un jugador. P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1; i pi es la probabilidad de jugar la estrategia Ai Estrategias mixtas y Juego bipersonal y B jjuega g Bi con p probabilidad pi ((P)) y L juega Lj con probabilidad qj (Q) Def. Valor esperado del juego: ( ) E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j j i i j p, q son probabilidades subjetivas Piedra, papel Piedra, papel,, tijeras tijeras:: deja que adivine… adivine… Pb(rock)=1 "Good ol' rock. Nuthin' beats that!" TEORÍA DE JUEGOS ¿Cómo Có jjugar?? Parte II Ejemplo: cara / cruz Fila y Columna escriben cara o cruz en un papel y Si escriben ib llo mismo, i Columna C l lle paga 1 a Fila Fil y Si escriben algo diferente, Fila le paga 1 a Columna y Ejemplo: cara / cruz Estrategia mixta: y Fila juega cara con probabilidad 2/3 y Columna juega cruz cru ¿Cuál es el valor esperado d ddell juego dde Fila? Columna Cara Cruz Cara 1,-1 -1,1 Cruz -1,1 1,-1 Fil Fila Teorema Minimax (I) y En un juego bipersonal de suma constante, el valor p del juego j g tiene siempre, p , al menos un esperado punto de silla: ( ) max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠ Todo juego bipersonal de suma constante tiene solución Equilibrio en estrategias mixtas Teorema: y En un juego bipersonal de suma constante, El valor esperado del juego tiene siempre, al menos un punto de silla: ( ) max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠ Todo juego bipersonal de suma constante tiene solución Juegos y Cooperativos: y Coalición y Negociación de las reglas del juego y Coordinación y Amenazas y promesas confiables y No cooperativos: y N personas actúan independientemente y No hay coaliciones posibles y Acciones racionales Solución ó juegos no cooperativos y Minimax y Todo juego bipersonal de suma cero tiene una estrategia mixta óptima p para p cada jugador j g y Espera lo mejor, prepárate para lo peor y Equilibrio de Nash y Solución a una clase más amplia de juegos no cooperativos y Muestra que puede haber más de una solución y La extiende a un número finito de jugadores ¿Cómo jugar? jugar? ¿Cuál es la solución del juego? juego? y Minimax y Equilibrio de Nash y Equilibrio en estrategias dominantes y Eliminación de estrategias dominadas y Inducción hacia atrás ¿Qué é es un equilibrio? Columna Cara Cruz Cara 2,1 0,0 Cruz 0,0 1,2 Fila Juego bipersonal, bipersonal, no cooperativo Definiciones: F: conjunto de estrategias mixtas de Fila pf = probabilidad de jugar la estrategia f Є F C: conjunto de estrategias mixtas de Columna pc = probabilidad de jugar la estrategia c Є C Objetivo: Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye un equilibrio S l ió Solución pf pc y Función F ió pagos Fil Fila: uf(f,c) (f ) y Лc , Лf,f son las probabilidades subjetivas que f y c tienen sobre las decisiones del otro y pf,pc: estrategias t t i mixtas i t y pfЛc: probabilidad –desde desde el punto de vista de f- de que se juegue la estrategia (f,c) S l ió Solución y Fila escoge la distribución de probabilidad (pf) que maximiza el valor esperado de sus pagos: E[pagosf] = ∑f∑cpfЛcuf(f,c) (f c) y Columna busca maximizar: E[pagosc] = ∑f∑cpcЛfuc(f,c) Equilibrio de Nash Equilibrio de Nash: El equilibrio de Nash consiste en las conjeturas sobre la probabilidad de ocurrencia de las estrategias (Лc ,Л Лf, ) y la probabilidad de que dichas estrategias sean elegidas (pf, pc), tal que: 1 1. L conjeturas Las j t son correctas: t pf = Лf, pc = Лc; y 2. Cada jugador escoge (pf) y (pc) de forma que maximiza su utilidad esperada, dadas sus conjeturas. E ilib i d Equilibrio de N Nash h Estrategias puras Un equilibrio de Nash en estrategias puras es un par (f*, (f , cc*)) tal que uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y uc(f*, (f* c*) *) ≥ uc(f*,c) (f* ) para cada d estrategia t t i c dde C C. ¿Cuál es el equilibrio de Nash en estrategias puras? Columna Cara Cruz Cara 20,80 70,30 Cruz 90,10 30,70 Fila Teorema Existencia (Nash) y Suponga que un juego tiene un número finito de estrategias para cada jugador. Entonces existe al menos un equilibrio de Nash as en e estrategias est ateg as mixtas tas ¿Cuál es la estrategia mixta de equilibrio? Columna Cara Cruz Cara 20,80 70,30 Cruz 90,10 30,70 Fila Equilibrio en estrategias mixtas Columna c s c 20,80 70,30 s 90,10 30,70 Fila Estrategias E i Fila: Cara, pc; Sello, ps Columna: Cara, Лc; Sello Лs E[ pagos fila ] = ∑∑ prπ c u (r , c) r c E[ pagos fila fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30) E[ pagoscol ] = ∑∑ prπ c u (r , c) r c E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70) Planteamiento del problema fila : max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30) s.t pc + p s = 1 pc , p s ≥ 0 columna : max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70) s.t πc +πs =1 π c ,π s ≥ 0 Planteamiento del problema (II) fila : fil max [ pc (π c * 20 + π s * 70) columna : max [π c ( pc * 80 + ps *10) + ps (π c * 90 + π s * 30)] + π s ( pc * 30 + ps * 70)] s.t p s = 1 − pc π s = 1− π c [ pc (π c * 20 + π s * 70)} + (1 − pc )(π c * 90 + π s * 30)] ∂u ∂π ≤ 0, =0 ∂pc ∂pc − 70π c + 40π s ≤ 0 s.t max [π c ( pc * 80 + ps *10) + (1 − π c )( pc * 30 + ps * 70)] ∂u ∂p ≤ 0, =0 ∂π c ∂π c 50 pc − 60 ps ≤ 0 Función de reacción (Mejor respuesta) Лs Mejor respuesta de fila a cualquier l i estrategia t t i d de columna -70Л c+40Л s=0 fila : − 70π c + 40π s = 0 πc,π s ≥ 0 πc + πs = 1 7/11 4/11 Лc Л c+ Л s=1 Equilibrio en estrategias mixtas ps Mejor respuesta de columna l a cualquier l i estrategia de fila 50p c-60p s=0 columna : 50 pc − 60 ps = 0 5/11 pc + p s = 1 pc , p s ≥ 0 6/11 pc p c+ p s=1 Equilibrio de Nash Columna Л c=4/11 cara cruz cara 20,80 70,30 cruz 90,10 30,70 p c=6/11 Fila Batalla de los sexos: sexos: ¿Cuántos equilibrios de Nash hay? Ananías misa fútbol misa 4,1 0,0 fútbol 00 0,0 14 1,4 Tola El dilema del prisionero II y Wally y Dilbert son compañeros de trabajo y Cada uno debe evaluar el desempeño del otro y La calificación determinará un aumento de sueldo y El aumento será mayor si el propio desempeño es superior al del otro Dilbert Wally El dilema del prisionero II Dilbert Wally “Rat out” (denigrar) Alabar “Rat out” (denigrar) 0,0 5,-1 Alabar -1,5 1,1 Solución ó por dominación ó y Definiciones: y Estrategia dominante y Estrategia débilmente dominante y Estrategia dominada y Eliminación iterada de estrategias dominadas Dominación ó y ss’i domina estrictamente a si si y solo sí: ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i z s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ) ∀ s− i ∈ S −i y u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i Dominación ó estricta y s’i es una estrategia estrictamente dominante ppara el jjugador g i si: ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i s’i es superior a todas las otras estrategias de i E t t gi estrictamente Estrategia ti t t dominante d i t Dilbert W ll Wally “Rat out” (denigrar) Alabar “Rat Rat out” out (denigrar) 0,0 5,-1 Alabar -1,5 1,1 Solución: {Rat-out, Rat-out} Equilibrio y estrategias dominantes y Dilema del prisionero II: y Rat-Out estrictamente dominante para Wally y Dilbert y {Rat-out, Rat-out} es el equilibrio y El equilibrio q en estrategias g dominantes es el equilibrio q de Nash El dilema del prisionero II Dominación ó débil é y s’i es una estrategia débilmente dominante para el jugador i si s’i domina débilmente a todas las otras estrategias de i z s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i y u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i Ejemplo: estrategia débilmente dominante 2 1 Arriba Izquierda Derecha 7,3 5,3 Solución: {Arriba, Izquierda} Abajo 7,0 3,-1 Estrategias dominantes y Las estrategias dominantes definen la solución del juego y Racionalidad: y Los jugadores prefieren las estrategias dominantes, dominantes si existen M h jjuegos no ti Muchos tienen estrategias t t i dominantes Dominación ó Et t i d Estrategia dominada: i d s**i es dominada d i d por s’i si: i ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ), ) ∀si ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ) ∃sˆ−i Estrategia no dominada s*i es no dominada si no existe s’i tal que: ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i Solución ó por dominación ó y Estrategias no dominadas preferibles a las dominadas y Un jugador racional no juega estrategias dominadas y Un U jugador j d racional i l no espera que los l otros t jjuegen estrategias dominadas Elimine estrategias indeseables Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna Izquierda Derecha Arriba 11 1,1 01 0,1 Medio 0,2 1,0 Abajo 0,-1 0,0 Fila Problemas de la eliminación iterativa de estrategias dominadas y Capas de racionalidad y Una estrategia se vuelve dominada en la ronda de eliminación # #15? y El orden de eliminación importa y Estrategias débilmente dominantes y Múltiples resultados y Estrategias débilmente dominantes y No existencia de estrategias dominadas Ejemplo: eliminación iterativa de estrategias dominadas Columna Izquierda Centro Derecha Arriba 4,5 1,6 5,6 Medio 3,5 2,5 5,4 Abajo j 2,5 , 2,0 , 7,0 , Fil Fila Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna Izquierda Centro Mala Arriba 1,-1 -1,1 0,-2 Medio -1,1 1,-1 0,-2 Mala -2,0 , -2,0 , -2,-2 , Fil Fila ¿Cuál es la estrategia dominante? dominante? Columna C Cara S ll Sello Cara 1,-1 -1,1 Sello -1,1 1,-1 Fila ¿Porqué podemos determinar las estrategias dominadas usando únicamente los pagos? Competencia a la Bertrand y Dos firmas en un mercado pueden cargar precios alto, alto medio, bajo y Si cargan el mismo precio precio, comparten el mercado equitativamente y Quien cargue el menor precio, precio gana todo el mercado Competencia a la Bertrand Firma 2 Alto Medio Bajo Alto o 6,6 0,10 0, 0 0,8 Medio 10,0 5,5 0,8 Bajo 8,0 8,0 4,4 Firma 1