Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Juegos estáticos con información completa El dilema del prisionero Preso 1 Callarse Confesar Preso 2 Callarse Confesar -1, -1 -9, 0 0, -9 -6, -6 Representación de juegos en forma normal: { } 1 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Es decir: conjuntos de estrategias y ganancias . Aplicado al dilema del prisionero: { } Estrategias posibles del preso 1 { } Estrategias posibles del preso 2 ( ( confiesa. ) Ganancia de preso 1 si ambos callan ) Ganancia de preso 1 si se calla y el preso 2 2 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ( se calla ( ) Ganancia de preso 1 si confiesa y el preso 2 ) Ganancia de preso 1 si ambos confiesan. Análogo para preso 2. Notar: las ganancias son función de las estrategias elegidas por ambos jugadores: ( ) 3 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Dominancia En el dilema del prisionero: (i) Preso 1 está mejor confesando, con independencia de lo que haga el preso 2. Decimos entonces que confesar domina a callarse. (ii) Idem para preso 2. Conclusión: ambos confiesan. 4 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza En general, está estrictamente dominada por ( ) si: ( ( ) ) Ejemplo 2: Jugador 1 Alta Baja Izquierda 1, 0 0, 3 Jugador 2 Centro 1, 2 0, 1 Derecha 0, 1 2, 0 5 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Jugador 1 no tiene estrategia dominada: o Alta mejor que baja, si 2 juega izq o centro o Baja mejor que alta, si 2 juega derecha Jugador 2: Derecha dominada por centro anulamos derecha: Jugador 1 Alta Baja Jugador 2 Izquierda Centro 1, 0 1, 2 0, 3 0, 1 6 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Jugador 1: Alta domina a baja Jugador 2 Izquierda Centro Jugador 1 Alta 1, 0 1, 2 Jugador 2: Izquierda dominada por centro. Conclusión: eliminación iterativa de estrategias estrictamente dominadas conduce a seleccionar un par de estrategias en este ejemplo: (Alta, Centro). 7 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Problemas con este procedimiento: Información del dominio público (common knowledge) No siempre permite seleccionar un único perfil de estrategias. 8 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Ejemplo 3: A M B I 0, 4 4, 0 3, 5 C 4, 0 0, 4 3, 5 D 5, 3 5, 3 6, 6 No hay estrategias dominadas en este caso. 9 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Equilibrio de Nash La mejor respuesta de jugador i frente al perfil de estrategias de los demás jugadores es una estrategia que maximiza la ganancia de i, dado que los demás juegan las estrategias indicadas. Ejemplos: 1) Dilema del prisionero: Mejor respuesta de preso 1 si preso 2 decide callarse es confesar: si confiesa obtiene 0 y si se calla obtiene -1. Mejor respuesta de preso 1 si preso 2 decide confesar es confesar: si confiesa obtiene -6 y si se calla obtiene -9. 10 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Análogo para preso 2. Ejemplo 2: Jugador 1 Alta Baja Izquierda 1, 0 0, 3 Jugador 2 Centro 1, 2 0, 1 Derecha 0, 1 2, 0 Mejor respuesta de jugador 1 si jugador 2 elige izquierda es alta. Mejor respuesta de jugador 1 si jugador 2 elige derecha es baja. Etc. 11 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Equilibrio de Nash = perfil de estrategias en que todas las estrategias son mejores respuestas. ) es un equilibrio de Nash de Decimos que ( { } si para cada jugador i es la mejor respuesta frente a las estrategias de los otros n-1 jugadores ( ). En otros términos: ( ) ( ) 12 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Una tercera forma de decir lo mismo: ( ) Justificación de la noción de equilibrio de Nash: cada uno hace lo mejor que puede, dado lo que hacen los otros. 13 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Ejemplo: A M B I 0, 4 4, 0 3, 5 C 4, 0 0, 4 3, 5 D 5, 3 5, 3 6, 6 Conclusión: hay un equilibrio de Nash: (Bajo, Derecha) Relación con eliminación de estrategias dominadas: 1) Equilibrio de Nash resiste eliminación de estrategias dominadas. 14 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza 2) Puede haber estrategias que sobrevivan a la eliminación de estrategias dominadas y no sean equilibrios de Nash (todas las combinaciones salvo B,D en la diapositiva anterior). 15 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Equilibrios múltiples de Nash Ejemplo: la batalla de los sexos Pedro María Teatro Fútbol Teatro 2, 1 0, 0 Fútbol 0, 0 1, 2 Mejores respuestas de María: Teatro, si Pedro juega Teatro Fútbol, si Pedro juega fútbol 16 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Mejores respuestas de Pedro: Teatro, si María juega Teatro Fútbol, si María juega fútbol (Teatro, Teatro) es un equilibrio de Nash, pero… (Fútbol, Fútbol) también es un equilibrio de Nash. 17 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Aplicaciones 1: Duopolio de Cournot El ambiente: Dos empresas producen mismo bien, cantidades Precio: ( ) ( ) ( y ) Gráficamente: 18 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza P a Q a Costo de producir cantidad : ( ) Las dos empresas eligen cantidades en forma simultánea. 19 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Representación del juego: Jugadores: las dos empresas Estrategias factibles: Ganancias: ( ) ( ) ( ) Mejor respuesta de empresa i = cantidad que maximiza ganancias de i, dada la cantidad producida por j. 20 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Surge de resolver: ( ) ( ( ) ) ( ) O, lo que es lo mismo: ( ) Mejor respuesta de empresa i: elegir producción que maximiza su utilidad, dada la producción de empresa j. 21 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Ver ejemplo en archivo Excel: Duopolio de Cournot.xls Notar: las utilidades de la empresa son cero cuando la producción es cero, crecen para algunos valores de la producción y luego empiezan a caer en el máximo, las utilidades no cambian cuando cambia la cantidad producida. Condición del máximo: ( ) 22 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ( ) Es análogo para la otra empresa: ( ) Un par ( ) que resuelve estas dos ecuaciones es un equilibrio de Nash. Resolviendo: 23 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza 𝑞𝑖 𝑎 𝑐 𝑎 𝑐 (𝑞𝑖 𝑞𝑗 ) 𝑎 𝑐 𝑎 𝑐 𝑞𝑗 24 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Producción total en el equilibrio: ( ) Precio en el equilibrio: ( ) ( ) ( ) Beneficios en el equilibrio: ( ( ) ( ) ( )( ) ) 25 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Empresas enfrentan situación “parecida” a la de un dilema del prisionero… Si coludieran y actuaran como un monopolista, elegirían producir: Y cada una produciría la mitad de esto: 26 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Obtendrían beneficios: ( Notar: a) b) ( ) ) < Colusión: empresas producen menos, elevan precio y ganan más. 27 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Sin embargo, si no hay capacidad de hacer cumplir un acuerdo entre las empresas y j elige la cantidad óptima en un contexto de colusión, entonces es óptimo para i elegir una cantidad mayor: ( ) ( ) ( ) Individualmente, las empresas tienen incentivos a desviarse del acuerdo colusivo. 28 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Aplicaciones 2: La tragedia de los comunes Hay tendencia a sobreexplotar los recursos comunes: recursos pesqueros, contaminación, etc. Ejemplo: N ganaderos comparten un campo de pastoreo. Ganadero i lleva a pastar animales. El valor de cada novillo depende de cuantos novillos pasten en total: ̅ ( ) Donde: ̅ Utilidades que obtiene ganadero i: 29 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ( ) Notar: dado ( ), el ganadero i gana más cuanto más novillos lleva a pastar. Pero, cuantos más novillos lleva a pastar, menos engorda cada uno, es decir que ( ) es decreciente en . ¿Cuál es la mejor respuesta del ganadero i a las estrategias de los restantes N-1 ganaderos? Optimo: 30 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ( ) ̅ ̅ ( ) ̅ ( ) ( Equilibrio de Nash: ̅ ) ( ) 31 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ̅ Total de ganado pastando en el equilibrio de Nash: ̅ Optimo social: planificador central elige el nivel de G, resolviendo: ( ) Condiciones de primer orden: 32 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza ( ) ( ) ̅ ̅⁄ Comparamos resultados en el equilibrio de Nash y el óptimo social: ̅ ̅ Conclusión: en el equilibrio de Nash hay sobrepastoreo del campo común. 33 Facultad de Ciencias Sociales, Universidad de la República, Uruguay Teoría de Juegos 2013. Alvaro Forteza Posibles soluciones: Privatización Regulación Imposición (“el que contamina paga”) Otros ejemplos de la tragedia de los comunes: a) Agua caliente central en el edificio (no tanto como “tragedia”, pero problema al fin…) b) Pesca (ver ejercicio) c) Crecimiento poblacional d) Contaminación: calentamiento global, capa de ozono, etc. Fuerte debate. Algunas “puntas”: 34