Juegos Dinámicos: Info Completa Profesor: Carlos R. Pitta Tema 05

Anuncio
Universidad Austral de Chile
Escuela de Ingeniería Comercial
Análisis de Sectores Económicos
Tema 05
Juegos Dinámicos:
Info Completa
Profesor: Carlos R. Pitta
Análisis de Sectores Económicos, Prof. Carlos R. Pitta, Universidad Austral de Chile
Introducción
Hemos estudiado juegos estáticos, es decir, juegos en que
los jugadores deciden simultáneamente qué hacer.
Como es obvio, en muchas situaciones esto no es así,
como por ejemplo: el juego de ajedrez, cuando una
empresa decide si entrar o no al mercado, lanzar un
producto, etc. En estos juegos, es indispensable
considerar que, a veces, un jugador mueve antes que
otro, y que los otros jugadores observan su decisión
antes de jugar. A estos juegos se les conoce como juegos
dinámicos.
2
Ejemplo 16: El juego de Entrar o no entrar
Suponga que Almacenes Paris
(Jugador 2) está considerando entrar
(e) en el negocio de vender seguros o
no (n). Falabella (Jugador 1) observa a
Paris, y actuará solo en caso que éste
decida entrar. En ese caso puede: a)
Declara una guerra de precios (G) con
lo que ganaría 0 (es decir, perdería los
20 que actualmente gana) o aceptar la
nueva competencia (A) con lo que
ambos se repartirían las ganancia.
¡Pensemos por un par de
minutos cuál es la solución!
3
Dinámicos significa…
Ahora analizaremos juegos en los que cada jugador
sabe qué han hecho los jugadores que han movido
antes que él.
Se dice que estos juegos son de información perfecta, lo
cual es más estricto que información completa.
4
Elementos a Considerar en este nuevo contexto
1. ¿Qué es una estrategia?
2. ¿Qué equilibrios son razonables?
3. ¿Qué información tiene cada jugador cada vez que le
toca decidir?
5
Inducción hacia atrás
Sería prematuro tratar de responder las preguntas
anteriores sin algunos preliminares. A continuación,
definiremos el concepto de Inducción hacia Atrás
(Backwards Induction) a través de un ejemplo sencillo:
6
Ejemplo: el Juego de la Confianza
Suponga un juego que comienza
con el jugador 1 eligiendo entre
confiar o no confiar en el
jugador 2.
Si 1 elige no confiar el juego
termina
Si 1 elige confiar, 2 juega y puede
mantener su promesa, o
traicionar.
7
Inducción hacia atrás en el juego de la Confianza
Analicemos ahora de atrás para
adelante: si el jugador 2 mueve
(es decir, si el jugador 1 decidió
CONFIAR) elegirá entre los
pagos 1 (honrar su palabra) ó 2
(traicionar). Como 2 es mayor
que 1, el Jugador 2 eligirá
TRAICIONAR (Marcado en
negrito)
8
Inducción hacia atrás en el juego de la Confianza
Ante esta perspectiva, el jugador 1
debe elegir entre NO
CONFIAR con un pago de 0, ó
CONFIAR con un pago de -1
(ya que el jugador 2 no elegirá
CUMPLIR SU PALABRA).
Entre 0 y -1 eligirá 0, NO
CONFIAR (Marcada en
negrito)
9
Algoritmo de Inducción hacia atrás
Comienza en el final del juego, y “regresa” hacia atrás, eligiendo en
cada movimiento la mejor respuesta del individuo.
El método funciona siempre y cuando no exista:
a) Movimientos simultáneos
b) Secuencias infinitas
En estos casos, usaremos el concepto de EQUILIBRIO DE
NASH PERFECTO EN SUBJUEGOS que veremos más
adelante.
10
El algoritmo en acción: el juego del ciempies…
Ilustra una situación en la que es benéfico para ambos continuar
una relación, aun cuando uno de los jugadores querría terminarla
hoy, si supiese que el otro está dispuesto a terminarla mañana.
El juego ocurre en tres etapas, en cada una de las cuales el jugador
elige seguir ir hacia abajo (D, d, δ) ó seguir derecho (A, a, α)
11
Juego del ciempies: Paso 1 (Etapa 3)
Primero, situémonos en el final del juego (en la etapa 3) donde el
jugador 1 debe elegir entre α con pago 2, ó δ con pago 3.
Evidentemente, elegirá δ.
12
Juego del ciempies: Paso 2 (Etapa 2)
En la Segunda Etapa, el jugador 2 (Qué sabe que el jugador 1 jugó
δ en la tercera etapa) tiene que decidir entonces entre d con un
pago de 4, ó a con un pago de 3. Evidentemente, elegirá el
mayor pago, es decir, jugará d.
13
Juego del ciempies: Paso 3 (Etapa 1)
El “final” del juego es en realidad en donde comenzamos, el
jugador 1 debe elegir D con un pago de 1, o A con un pago de 0.
Evidentemente, elegirá D.
14
Equilibrio de Nash para el Juego del ciempies
Moraleja: ¡Miedo al Compromiso!
Los resultados del tercer día ó etapa, (3,3) ó (2,5), son ambos
estrictamente mejores que la solución de equilibrio (1,1). Pero
esos resultados no se pueden alcanzar, dado que el jugador 2 no
se comprometerá a jugar a por lo que el jugador 1, anticipándolo,
resuelve terminar el juego en el primer día tirando D.
15
Equilibrio de Nash para el Juego del ciempies
Finalmente, el equilibrio de Nash que hemos encontrado es
(D, d, δ). Gráficamente:
16
Intuición de Subjuego
Antes de dar una definición formal de subjuego
daremos una definición intuitiva. En cada juego,
pueden existir pequeños mini juegos.
Recordemos de nuevo nuestro ejemplo del juego
del ciempiés. En el existen 3 subjuegos:
17
Intuición de Subjuego
18
Intuición de Subjuego
En dónde a los últimos 2 los llamamos subjuegos
propios.
Observe cómo en cada subjuego, el equilibrio
hallado mediante inducción hacia atrás es un
equilibrio del subjuego (incorporamos el último
n-ésimo equilibrio como un hecho en el
equilibrio n-1).
19
Definición: Forma extensiva de un juego dinámico
con información … (comienza)
20
Definición: Forma extensiva de un juego dinámico con
información … (termina)
Después de cada historia no terminal h, el jugador P(h) elige una acción
del set:
21
Observación sobre la Historia:
Suponga el siguiente juego dinámico
llamado “matching pennies”: Dos
jugadores tiran monedas, uno
después del otro. Si el segundo
jugador iguala el resultado del
jugador uno, gana 1 peso (y por lo
tanto el jugador 1 pierde un peso);
en caso contrario, el jugador 1 es
quien gana un peso (siendo el
jugador 2 quien paga el peso). El
juego en forma extendida es:
22
Singletons
En este juego, todos los nodos se
encuentran en su propio conjunto
informativo. Cuando esto ocurre, se
dice el nodo es singleton (tiene un
solo elemento). Esto implica que no
hay incertidumbre en relación a la
historia pasada del juego. Además,
como cada nodo tiene solo una
rama entrante, cada jugador es
capaz de reconstruir toda la
historia del juego.
23
Usando Inducción hacia Atrás en Matching Pennies
En caso de que el jugador 1 elija
HEAD, el jugador 2 eligirá HEAD
también.
En caso de que el jugador 1 elija
TAIL, el jugador 2 eligirá TAIL
también.
24
Usando Inducción hacia Atrás en Matching Pennies
En tal caso, el jugador 1 estará
indiferente entre HEAD y
TAIL, y escogerá cualquiera de
ellos al azar (estrategia pura) o
una combinación aleatoria de
ellos (estrategia mixta)
Obviamente, este no es el fin de
la historia.
25
Información Perfecta
Juegos cómo el anterior, en
donde todos los conjuntos
informativos son singletons, son
llamados juegos de
“información perfecta”
26
“Reconstruyendo” un juego
de Información Perfecta
¿Cómo podemos representar el juego de
matching pennies en forma normal?
El jugador 1 tiene 2 estrategias(H, T).
El jugador 2, en cambio, tiene las
siguientes estrategias:
HH
HT
HEAD si 1 juega HEAD, y HEAD si 1 juega TAIL
HEAD si 1 juega HEAD, y TAIL si 1 juega TAIL
TH
TT
TAIL si 1 juega HEAD, y HEAD si 1 juega TAIL
TAIL si 1 juega HEAD, y TAIL si 1 juega TAIL
27
“Reconstruyendo” un juego de Información
Perfecta
Entonces, la representación en forma
matricial del juego es:
28
Información Completa
Por el contrario, si un set informativo
se encuentra poblado por más de
un nodo (Es decir, no todos los
nodos son singletons), aunque
ambos jugadores conocen todos los
pagos (propios y ajenos), no son
capaces de reconstruir de manera
perfecta la historia del juego. Tales
juegos se llaman de “información
imperfecta” o “información
completa”
29
Backward Induction en Juegos de
Información Completa
Dado que en los juegos de
información completa los jugadores
no pueden reconstruir la historia del
juego, es incorrecto utilizar para
ellos el método de backward
induction.
30
Observe qué:
De la definición de juego en forma extensiva,
se tiene que dos historias distintas no
pueden terminar en la misma acción.
31
FIN DE
CLASE
32
Definición: Estrategias
33
Ejemplo 17: Un juego dinámico
S2((A))=c
S2((B))=f
Es una estrategia del
jugador 2
34
Ejemplo 17: Un juego
dinámico
Lista completa de
estrategias para 2:
ce
c si 1 juega A, y e si 1 juega B
cf
c si 1 juega A, y f si 1 juega B
de
d si 1 juega A, y e si 1 juega B
df
d si 1 juega A, y f si 1 juega B
35
Ejemplo 17: Un juego dinámico…
Para entender mejor lo que es una
estrategia, consideremos la representación
en forma normal del juego:
ce
c si 1 juega A, y e si 1 juega B
cf
c si 1 juega A, y f si 1 juega B
de
d si 1 juega A, y e si 1 juega B
df
d si 1 juega A, y f si 1 juega B
36
Resultado de un Juego
¿Cómo procedemos si no podemos usar inducción hacia
atrás? Supongamos el siguiente juego:
El juego tiene 2 subjuegos:
1) El que comienza después de
que 1 tira E (subjuego propio)
2) El juego en sí mismo
37
¿Cómo procedemos?
1. Computamos el equilibrio de Nash en el subjuego
2. Fijamos la acción encontrada en 1 para el subjuego
tomando los pagos de equilibrio
3. Computamos el equilibrio del juego entero
38
Resultado de un Juego
1. En el subjuego R domina a L para el jugador 2
2. El subjuego queda con pagos (3,2) si 1 tira T; (1,5) si 1
tira B
3. Como es turno del J1, escogerá T con pagos: (3,2)>
(1,5) para J1
39
Resultado de un Juego
3. El juego total, traspasando los pagos de equilibrio, es:
40
Resultado de un Juego
3. Con lo que el equilibrio de Nash final para el juego total
queda entonces como:
41
Otros Equilibrios de Nash
NOTE que existen otros equilibrios de Nash (PISTA: para
hallar los otros equilibrios de Nash, encuentre la forma
normal del juego y siga el método de mejor respuesta)
Sin embargo, dichos equilibrios no
son creíbles pues involucran
que el jugador 2 adopte
estrategias dominadas (L es
dominada por R)
42
Intuición de Equilibrio Perfecto en Subjuegos
Esto significa que hay un grupo de Equilibrios qué, aun
cuando son equilibrios de Nash en TODOS y cada uno
de los subjuegos, no se basan en estrategias dominadas.
Llamamos a este tipo de equilibrios “Equilibrios
Perfectos en Subjuegos”.
Algunos de estos pueden estar basados
en estrategias dominadas
NO se encuentran basados en
estrategias dominadas
43
Definición: Resultado del Juego R(s)
44
Definición: Subjuego
45
Equilibrio Perfecto en Subjuegos
El equilibrio perfecto en subjuegos es un equilibrio de Nash
al que se le exige además que cada jugador optimice
después de cada historia, llegue a ella o no el juego, dada la
combinación de estrategias que están utilizando el resto de
los jugadores. La condición de optimalidad luego de cada
historia es equivalente a exigir que en cada subjuego la
combinación de estrategias elegida induzca un equilibrio de
Nash.
46
Definición: Equilibrio Perfecto en Subjuegos
47
Ejemplo: Perfección en Subjuegos
Encuentre el Equilibrio Perfecto en Subjuegos del siguiente
juego en forma extendida
48
Ejemplo: Perfección en Subjuegos
1) ¿Cuántos subjuegos?
49
Ejemplo: Perfección en Subjuegos
2) Inducción en cada Nodo
50
Ejemplo: Perfección en Subjuegos
3) Equilibrio Perfecto en Subjuegos
51
FIN DE
CLASE
52
Ejemplo 19: Negociación
Dos jugadores deben repartirse $ 1.000.000. Las reglas son
las siguientes: el jugador 1 (J1) parte ofreciendo una
división, luego el jugador 2 (J2) decide si la acepta o no. Si
la acepta, el juego termina ahí. Si no acepta, en el siguiente
periodo el J2 ofrece una nueva partición y entonces es J1
quien decide si acepta o no. Esto continúa hasta que se
logre el acuerdo. El factor de descuento de J1 y de J2 es el
mismo e igual a δ ϵ(0, 1). Sea x la cantidad con la que se
queda 1.
53
Ejemplo 19: Negociación
1. Forma Extensiva del Juego
54
Ejemplo 19: Negociación
2. UNA Combinación de Estrategias
55
Ejemplo 19: Negociación
3. La estrategia en (2) es Equilibrio Perfecto en
Subjuegos… (comienza)
56
Ejemplo 19: Negociación
3. La estrategia en (2) es Equilibrio Perfecto en Subjuegos
… (termina)
57
Descargar