Representación de Juegos Existen diferentes formas de representar

Anuncio
Representación de Juegos
Existen diferentes formas de representar matemáticamente un juego.
Veremos dos formas:
 Forma extensiva
 Forma Estratégica (o Normal)
Independientemente de la representación, los juegos tienen los siguientes elementos
comunes:




Una lista de jugadores
Una descripción completa de las acciones que puede tomar cada jugador.
Una descripción de la información que poseen los jugadores cuando ellos actúan.
Una especificación de los resultados (outcomes) a los cuales llevan las acciones de
los jugadores.
 Una especificación de los pagos que obtendrán los jugadores en cada uno de los
diferentes resultados.
1
I. Forma Extensiva
Ejemplo 1: Versión ampliada de un Entry Game
Existen dos firma 1 (entrant) y 2 (incumbent):
 La firma 1 decide si entrar (E) o no (N) en la industria de la firma 2.
 La firma 2 observa si 1 entra o no en su industria.
 Si la firma 1 entra, entonces las dos firmas deben decidir simultáneamente si hacer
publicidad (P) o no (NP).
 Si la firma 1 no entra, entonces la firma 2 decide si hacer publicidad o no.
Si las dos firmas están en el mercado y:
 Ninguna hace publicidad, entonces cada una recibe beneficios por $5 millones.
 Las dos hacen publicidad, entonces los beneficios serán de $3 millones.
 Solo una publicita, entonces esta gana $6 millones y la otra $1 millón.
Si 1 no entra su pago es de 0. Los pagos de 2 en este caso están dados por:
 Si hace publicidad, gana $4 millones
 Si no hace publicidad, gana $3.5 millones
(Ver Figura)
2
Ejemplo1: Representación en forma extensiva
1
P
3,3
NP
1,6
P
6,1
NP
5,5
P
2
E
NP
1
P´
N
0,4
2
NP´
0 , 3.5
3
Formalmente
Usaremos árboles para representar gráficamente la interacción estratégica entre los
jugadores: Representación en Forma Extensiva (v-N & M, 1944).
Cada juego en forma extensiva debe incluir:
1. El conjunto de jugadores
Cuántos y quiénes son los jugadores. Se representan por letras o números (i=1,..,n).
2. El orden de los eventos
Un árbol está compuesto por nodos y ramas:
 Los nodos representan lugares donde alguien debe tomar una decisión.
 Las ramas indican las diferentes acciones que un jugador puede escoger.
Existen nodos sucesores, inmediatamente sucesores, predecesores e inmediatamente
predecesores.
4
Toda representación en forma extensiva tiene exactamente un nodo inicial.
Cada nodo es sucesor del nodo inicial y el nodo inicial es el único con esta propiedad.
Los otros nodos son llamados nodos de decisión y nodos terminales (los cuales
representan outcomes del juego).
Cada nodo, excepto el inicial, tiene exactamente un nodo inmediatamente predecesor.
El nodo inicial no tiene predecesor.
Cada nodo terminal corresponde a una única senda en el árbol, es decir, existe una
relación uno a uno entre sendas y nodos terminales.
3. El orden de los movimientos
Debe especificar el orden en el cual los jugadores toman sus decisiones.
4. Acciones disponibles
Debe especificar las acciones que cada jugador puede tomar en cada nodo de acción.
5
5. Conjuntos de información
La forma extensiva debe representar la información con la que cuenta cada jugador a la
hora de tomar una decisión.
Cuando un jugador posee la misma información en más de un nodo, estos nodos se
unen con una línea discontinua.
Así, en estos nodos un jugador no puede distinguir su ubicación exacta en el juego.
Formalmente: Un conjunto de información es un conjunto formado por nodos entre los
cuales un jugador no puede distinguir su posición en el juego cuando toma una
decisión (aquellos conectados mediante líneas discontinuas).
Esto usualmente ocurre cuando el jugador no puede observar las acciones tomadas por
otros jugadores en los nodos predecesores.
Todo nodo de decisión pertenece a un conjunto de información y algunos conjuntos de
información poseen un solo nodo
6
Dos características de los conjuntos de información:
 Cada conjunto de información contiene nodos de decisión para solamente uno de los
jugadores.
 Todos los nodos que pertenecen al mismo conjunto de información poseen el mismo
número de sucesores inmediatos y deben tener el mismo conjunto de acciones sobre
las ramas que conducen a estos (De no ser así, el jugador podría distinguir entre los
nodos).
En general, supondremos que existe memoria perfecta (Perfect recall).
6. Payoffs
Los resultados de cada juego (nodos terminales) son reemplazados por los pagos que
recibe cada jugador en cada outcome.
Estos pagos pueden estar medidos en términos de utilidades o pagos monetarios. De
esta forma más es mejor!
7
Más ejemplos y convenciones
Escogiendo precios (H= alto, L=bajo) con líder y de forma simultánea:
H
1,1
L
H´
0,2
L´
1/2,1/2
H
1,1
L
H
0,2
L
1/2,1/2
2
H
1
2
L
2,0
2
H
1
L
8
2,0
II. Estrategia
Estrategia: Es un plan de acciones completo y contingente para un jugador en el juego.
Completo y contingente significa que hay una especificación exhaustiva del
comportamiento del jugador, la cual describe las acciones que éste debería tomar en
cada uno de sus conjuntos de información, independientemente de que los alcance o no
los alcance.
En otras palabras, una estrategia es un conjunto de acciones que indica la acción
particular que un jugador puede tomar en cada uno de sus conjuntos de información.
9
Ejemplo 1:
2
H
1
2
1,1
L
H´
0,2
2,0
L´
1/2,1/2
b
a
L
H
c
El conjunto completo de estrategias del jugador 1 es: H, L.
Una estrategia para el jugador 2 es escoger H en el nodo b y L´ en el nodo c. Esta
estrategia se escribe: H L´.
El conjunto completo de estrategias del jugador 2 es: HH´, HL´, LH´, LL´.
10
Espacio (Conjunto) de Estrategias: S i es el conjunto de todas las posibles estrategias
del jugador i en el juego.
Del ejemplo anterior: S1  H , L, S 2  HH´, HL´, LH´, LL´ .
si  S i es una estrategia del jugador i en el juego: s1  L , s 2  HL´ .
Perfil de estrategia: (strategy profile): Es un vector de estrategias, una para cada
jugador, es decir s  s1 , s2 ,..., s n .
S denota el conjunto de perfiles de estrategia: S  S1  S 2  ... S n .
Ej: Si S1  A, B y S 2  X ,Y , entonces S  S1  S 2   A, X , A,Y , B , X , B ,Y .
s i es un perfil de estrategia para todos los jugadores excepto para el i.
Así, también podemos escribir s  si , si .
11
Ejemplo 2:
Firma 1 decide entre ser agresivo (A), pasivo (P) o retirarse del mercado (R)
Si 1 se retira, la firma 2 disfruta de un monopolio.
Si 1 no se retira, 2 decide entre A y P.
2
A
3,3
P
4,2
A
2,4
P
2,2
A
1
P
2
R
0,4
S 1  A, P , R, S 2  A, P
Importante: Contar el número de conjuntos de información de cada jugador!
12
Ejemplo 3: I: in, O: out.
1
I
2
I
1
A
4,2
O
2,2
O
1,3
B
3,4
S 2  I ,O
S1  IA, IB ,OA,OB
Note que S1  IA, IB, O ¿Por qué si 1 ha decidido salir del juego en su primer
conjunto de información y no llegará a su segundo conjunto tiene sentido incluir estas
estrategias?
Por definición de estrategia (plan contingente completo), S 1  IA, IB ,OA,OB. Esto
ayuda a analizar el juego en cualquier punto y tener contingencia ante cualquier error.
13
III. Forma Normal (Estratégica)
La otra forma de describir un juego se basa en la idea de Estrategia.
Basados en las estrategias de los jugadores y en las funciones de pagos (payoffs) que
estos reciben, se puede escribir de forma compacta la información del juego (Algunas
veces de forma matricial).
Función de pagos: Tiene como dominio el conjunto del perfil de estrategias ( S ) y se
define así:
ui : S  
Así, para cada perfil de estrategia s  S que los jugadores escojan, ui es el pago que el
jugador i recibe.
14
Formalmente, un juego en Forma Normal posee (v-N & M, 1944):
 Un conjunto de jugadores, 1,2 ,..., n
 Conjuntos de estrategia para los jugadores, S1 , S 2 ,…, S n .
 Funciones de pagos de los jugadores, u1 , u 2 ,…, u n .
Juegos de dos jugadores (y más) con conjuntos finitos de estrategias pueden ser
descritos matricialmente:




Cada fila corresponde a una estrategia del jugador l.
Cada columna corresponde a una estrategia del jugador 2.
Cada celda corresponde a un perfil de estrategias.
En cada celda se escriben los payoffs de cada jugador asociados al perfil de
estrategia.
Algunos juegos ya fueron descritos en su forma normal en la introducción: Dilema del
prisionero, la batalla de los sexos,…
15
Ejemplo 1:
Forma Extensiva:
1
I
2
O
2,2
Forma Normal:
I
1
O
A
4,2
B
1,3
3,4
1/ 2
I
O
OA
2,2
2,2
OB
2,2
2,2
IA
4,2
1,3
IB
3,4
1,3
16
Comentarios
Cada juego en forma extensiva posee una representación en forma normal.
Sin embargo, cada juego en forma normal puede poseer más de una representación en
forma extensiva (ver ejemplo abajo).
Así, existe una discusión sobre si en realidad los juegos en forma normal contienen
toda la información requerida.
Cuando veamos conceptos de solución discutiremos más en detalle esto.
Sin embargo, los juegos estáticos (one-shot games) poseen una buena representación
en forma normal ya que no existe discrepancia en la información entre esta
representación y la forma extensiva.
17
Ejemplo 2:
1,2
A
1 \ 2
A
B
C
1, 2
3, 1
D
1
2
B
1, 2
C
3,1
D
2,4
2, 4
A
1
B
18
2
C
1,2
D
1,2
C
3,1
D
2,4
IV. Creencias (Beliefs) y Estrategias Mixtas
Usaremos el término creencias (beliefs) para mencionar las convicciones de un jugador
sobre las estrategias que tomarán los otros jugadores.
Creencia: una creencia del jugador i es una distribución de probabilidad sobre las
estrategias de los otros jugadores.
Denotaremos esta distribución de probabilidades como   i  S  i , donde S  i es el
conjunto de distribuciones de probabilidad sobre las estrategias de todos los jugadores
excepto el jugador i.
La creencia de i respecto a las estrategias de los demás jugadores es una función
  i  S  i tal que:
 Para cada perfil de estrategia s i  S  i ,   i s i  es la probabilidad con la que el
jugador i piensa que los demás jugadores jugará s i .
   i s i   0 para cada s i  S  i y  s
i
S
 ij
  i s i   1
19
Estrategia mixta: Una estrategia mixta para un jugador es una estrategia que se elige de
acuerdo con una distribución de probabilidad.
Formalmente, las estrategias mixtas también se expresan en términos de probabilidades
(como las beliefs).
Denotaremos las estrategias mixtas del jugador i como  i  Si .
Las estrategias que se juegan con probabilidad 1 son llamadas estrategias puras (Así el
conjunto de estrategias puras está contenido en el conjunto de estrategias mixtas).
Cuando los jugadores usan estrategias mixtas o juegan con cierto vector de beliefs sus
pagos los llamaremos pagos esperados (expected payoffs)
20
Pagos esperados:
Note que si i juega la estrategia si y el resto de jugadores juegan según   i , el pago
esperado de i será:
ui si ,  i    s  iS   i s i ui si , s i 
i
Note que si i juega  i y el resto de jugadores juegan si , el pago esperado de i será:
ui  i , si   s
i
S  i
21
 i ui  i , si 
Ejemplo
1/ 2
I
O
OA
2,2
2,2
OB
2,2
2,2
IA
4,2
1,3
IB
3,4
1,3
Creencias del jugador 2 sobre las decisiones de 1:
  2    2 OA,   2 OB ,   2  IA,   2  IB   1 / 2,0,1 / 4,1 / 4 
El pago esperado de 2 de jugar O está dado por:
u 2   2 , O   1 / 2 2  0 2  1 / 4 3  1 / 4 3  5 / 2
22
V. Supuestos adicionales
Racionalidad
Los agentes escogerán las acciones que conducen al resultado que más prefieren
(maximizar su pago esperado).
Conocimiento común (Common knowledge)
Un hecho particular F se define de conocimiento común entre los jugadores si cada
jugador conoce F, cada jugador sabe que los otros conocen F, cada jugador sabe que
los otros jugadores saben que cada jugador conoce F…
Supondremos que los juego son de conocimiento común.
23
Descargar