Documento Completo

Anuncio
Imitación y Juegos Evolutivos en Economía*
Imitation and Evolutionary Games in Economics
Elvio Accinelli
Edgar J. Sánchez Carrera
Facultad de Economía de la UASLP.
Av. Pintores S/N Fraccionamiento Burócratas del Estado, CP 78263.
San Luis Potosí, SLP, México.
Tel. oficina (52-444) 8131238 ext. 120.
E-mails: elvio.accinell@eco.uaslp.mx, edgar.carrera@uaslp.mx
www.econ-pol.unisi.it/carrera
Recibido el 6 de marzo de 2012.
Aceptado el 22 de mayo de 2012.
Resumen
El presente es un artículo de divulgación científica basado en Sanchez Carrera (2012),
Accinelli y Carrera (2011a,b), donde se argumenta que los agentes económicos optan
por imitar el comportamiento de sus pares más exitosos. Se muestra que bajo estas
condiciones la evolución económica, dependerá de las reglas de imitación seguidas,
así como de qué y a quién se imita con mayor probabilidad. Esto dependerá de las
condiciones iniciales existentes en el momento en que los agentes deben decidir, y de
acuerdo a lo dicho anteriormente, sobre estas condiciones, es que debe influir la
política económica. Se concluye que la intervención de un planificador central es
crucial para corregir situaciones iniciales, dado que las mismas determinan las
estrategias estables.
Abstract
Following Sanchez Carrera (2012) and Accinelli & Carrera (2011a,b), we argue that
agents without enough information to determine the expected value of their strategic
actions, then they choose to imitate the behavior of their peers. Under these conditions,
economic developments will depend on the imitation rules followed and what and who
are most likely mimics. This will depend on the initial conditions existing at the time the
agents must decide, and hence it should influence economic policy. We conclude that
*
Agradecimientos. A Vicente German-Soto por su estimulación y apoyo. Al dictaminador anónimo por sus comentarios tan útiles
para mejorar la comprensión del texto. Por supuesto, cualquier error que prevalece es debido a la testarudez de los autores que toman
completa responsabilidad.
1
policy maker’s intervention is crucial to arrange the initial state of the economy.
Keywords: Dinámica del replicador; Imitación y Racionalidad; Teoría de Juegos
Evolutivos; Trampas de pobreza; Valor umbral.
JEL classification: C70; C72; C73; I30; O10; O40.
2
1
Introducción
La teoría de juegos se ha desarrollado como un instrumento para entender el
conflicto y sus posibles soluciones. Ciertamente no es tanto predictiva como
normativa. Explica más como deberían ser o pueden ser las soluciones a los
conflictos que como son o serán realmente. Recordemos que
la teoría de
juegos es básicamente una teoría que se basa en la racionalidad. Esto es,
describe el comportamiento de individuos que eligen estrategias, elaboran
planes buscando maximizar el resultado obtenido al resolverse el conflicto. Por
una parte la elección estratégica racional, es el concepto central de la teoría de
juegos y para ser racional, debe tener en cuenta no sólo, lo que cada uno
quiere lograr, sino también lo que puede lograr dado que la acción de los otros
lo limita. No hay maldad ni bondad preestablecida, no se busca en principio
castigar
o
premiar al
otro u
otros,
sino tomar
la
mejor
opción
independientemente del efecto que esto pueda tener sobre los demás
individuos, a no ser que beneficiar o perjudicar a alguien sea parte del objetivo
buscado, o sea parte de la solución.
Por otra parte, en teoría de juegos, la racionalidad supone que cada uno de los
participantes del conflicto, sabe que los demás saben que él sabe que todos
buscan lo mejor sabiendo que los demás hacen lo mismo. Yo sé que tú sabes,
que yo sé que tú sabes; repetido hasta el infinito y actuar tomado esto en
consideración, es ser racional. Si la cadena se rompe, la racionalidad se ve
limitada en principio.
¿Cómo entonces una teoría basada en la racionalidad de los individuos
participantes, en castigos y premios posibles, en alianzas estratégicas, etc.,
puede transportarse a conflictos que enfrentan a individuos no racionales?
Ciertamente esto no tiene en principio una respuesta trivial. Si bien podemos
aceptar que la naturaleza resuelve la evolución mediante el conflicto, no parece
claro que fuera un conflicto entre individuos que operan en la forma supuesta
por la teoría de juegos. No obstante la teoría de los juegos evolutivos es una
3
teoría que básicamente pretende explicar el conflicto en el mundo animal y
natural. ¿Cómo logra traducir estas reglas racionales a conflictos de individuos
que actúan en principio de otra forma? En teoría de juegos evolutivos, el
concepto de racionalidad es suplantado por el de la selección natural. Los
individuos actúan en el mundo natural respondiendo directamente a su código
genético, no eligen, al menos no en el sentido de elegir de acuerdo a un plan en
el que se prevén resultados posibles.
Se supone que los individuos (animales o vegetales) disponen de un plan
preestablecido (genotípicamente), entre todas aquellas posibilidades triunfan,
es decir se reproducen con mayor facilidad aquellos, cuyo código genético les
impone actuar de determinada forma y no de otra. Es decir, el individuo que
obtiene una solución maximizadora es aquel que es capaz de trasmitir su
código genético a un mayor número de descendientes. Mientras que el
individuo racional elige entre diversos planes posibles; los individuos pueden
representar determinados planes posibles, determinadas estrategias que cada
uno sigue imperiosamente, y solamente triunfan entre éstos, aquellos individuos
cuyo código genético les permite la respuesta más adecuada para sobrevivir y
reproducirse. En tanto que una supervivencia prolongada implica mayor número
de posibles descendientes, estos dos conceptos son equivalentes en el sentido
de la preservación de la especie. Individuos mas longevos tienen mayor
probabilidad de tener descendientes, en este sentido podemos decir que una
estrategia que permita a un individuo una vida más larga es también una
estrategia que le permitirá un mayor número de descendientes. Esta es la
respuesta maximizadora, es decir aquella que permite al individuo que se
comporta acorde a ella, o que es portador del genotipo que a tal conducta
obliga, vivir más tiempo o tener más descendientes, es decir ser mas exitoso.
De esta forma, el objetivo del juego es tener descendencia, preservar la especie
o sobrevivir. La estrategia mejor, está definida por la presión natural, en el
sentido de que el individuo más exitoso será aquel que siga un comportamiento
de mejor adaptación, todos los individuos se ven igualmente presionados, y del
4
comportamiento de cada uno dependerá el éxito propio. Es la selección natural
la fuerza encargada de “maximizar”, es decir de elegir aquella conducta más
exitosa, en el sentido de la preservación de la especie, la que en definitiva
prevalecerá en las generaciones futuras. La sección 2 de este artículo explicará de
manera más formal el concepto de racionalidad en la teoría de juegos evolutivos.
Además de la divulgación científica, como propósito, este trabajo muestra que
la teoría de juegos evolutivos es una herramienta adecuada, alternativa y
moderna para analizar la evolución de un sistema económico social donde los
agentes económicos se comportan de acuerdo al aprendizaje por imitación, y la
economía evoluciona por los principios de la selección natural de aquellos
agentes más exitosos. En particular, son las posibles sendas de crecimiento
económico, las que en última instancia, como un resultado de conductas
individuales de los agentes económicos darán la dirección de la economía.
Sabemos que el camino por el cual la economía transita (como sistema) es el
resultado de la acción de diferentes individuos o grupos con objetivos y
comportamientos diversos, que interactúan en un mismo lugar y tiempo. Como
resultado de esta interacción social, propia de cada economía o país, se
concretarán solo aquellas sendas de crecimiento económico, basadas en
estrategias evolutivamente estables seguidas por los agentes económicos,
quienes eligen bajo la presión de condiciones iniciales determinadas y propias
de cada país o economía en particular (véase Accinelli, Brida and Carrera,
2009; Accinelli et al., 2010; Accinelli & Carrera, 2011a 2011b; Sanchez Carrera,
2012). Por tanto, el objetivo primordial es dar una revisión bibliográfica y una
difusión de conceptos básicos de una teoría novedosa, que puede aplicarse de
manera exitosa para el estudio de los fenómenos económicos como las trampas
de pobreza (Sanchez Carrera, 2012).
Consideramos que en situaciones de información imperfecta, la imitación por
parte de los agentes económicos racionales, de aquellas conductas
consideradas las más exitosas, se transforma en una de las claves para
entender la evolución futura de una determinada economía. Según que, y a
5
quienes se imite, la economía evolucionará por una senda de alto crecimiento
hacia un estado estacionario Pareto superior, o hacia un estado estacionario
bajo.
Es de notar que extendemos el concepto de comportamiento racional, a aquel
que bajo información imperfecta, supone la imitación del comportamiento
considerado, por el individuo que debe elegir su comportamiento futuro, como el
más exitoso. El éxito de las diferentes conductas seguidas por los agentes
económicos
dependerá
de
las
condiciones
iniciales
existentes.
Estas
determinan cuál es la conducta que con mayor probabilidad, en un momento
determinado, los agentes económicos imitarán. Por tanto, el éxito de conductas
que tiendan al perfeccionamiento del capital humano o de la inversión en
investigación y desarrollo, dependerá de condiciones económicas subyacentes,
bien determinadas, imperantes en la economía, en el momento en que la
elección se lleva a cabo (ver Accinelli-Carrera 2011a, b). La acción del
planificador central es considerada en el trabajo mencionado, como un
elemento determinante para definir las condiciones iniciales que hacen que el
comportamiento individualmente racional de los agentes económicos sea
consistente con la evolución de la economía por una senda de alto desempeño
social.
Precisamente es la imitación del más exitoso, el que define el tipo de
crecimiento o senda (ruta) de la economía, por lo que el punto está en crear
aquellas condiciones que hagan que el más exitoso, sea el individuo que se
capacita (mayor educación con calidad), o el empresario que invierte en
desarrollo e investigación. El proceso que permite el crecimiento de estos
grupos se retroalimente, unos precisan de los otros para desarrollarse.
Trabajadores y empresarios imitarán el comportamiento de aquellos individuos,
que resultan más exitosos, o al menos entiendan, dada la información
disponible. Al aumentar el beneficio esperado de la educación, esto hará que
los trabajadores no especializados aumenten la frecuencia con que se
pregunten si deben cambiar o no de actitud, así como la frecuencia con que
6
obtienen una respuesta afirmativa, análogamente los empresarios.
El resto del presente trabajo se desarrolla de la siguiente forma. En la siguiente
sección 2, nos referimos al concepto de juegos evolutivos y sus posibilidades
para explicar el crecimiento económico. Introduciremos la dinámica del
replicador, como sustrato matemático para explicar la dinámica económica en el
marco de la teoría del crecimiento a partir de conceptos microeconómicos,
agentes maximizadores de beneficios y firmas que interactúan. En la sección 3
se analiza la dinámica por imitación y su posibilidad de modelarla a partir de la
dinámica del replicador, esto es el centro de este trabajo, ya que es el que
muestra la posibilidad de describir las trampas de pobreza como resultado de la
acción de agentes racionales, en un marco de incertidumbre, que concluye en
un resultado socialmente bajo, aunque pueda ser individualmente maximizador.
Finalmente se ofrecen consideraciones generales sobre los principales
resultados del análisis.
2
Juegos Evolutivos
Referencias básicas sobre la teoría de juegos evolutivos son los siguientes
libros: Gintis (2009), Hofbauer & Sigmund (2002), Vega-Redondo (1996) y
Weibull (1995).
La teoría de juegos no-cooperativos es ya una herramienta estándar para la
modelación de conflictos entre agentes económicos racionales, donde el
equilibrio de Nash ( NE ) es la piedra angular como predicción y resultado del
juego. En un equilibrio de Nash la estrategia de cada jugador maximiza sus
beneficios dadas las estrategias adoptadas por los otros jugadores. Ningún
jugador, por lo tanto, tiene un incentivo para desviarse (unilateralmente) del
resultado de Nash, ya que es la mejor situación para cada jugador y para el
propio grupo. Sin embargo en muchas situaciones, el equilibrio de Nash no es
único, esto a dado lugar a múltiples refinamientos del concepto de NE , ver por
7
ejemplo E. Van Damme (1996). Un refinamiento clave del concepto de equilibrio
de Nash, en la teoría de juegos evolutivos, es la noción de "estrategia
evolutivamente estable" ( ESS por sus siglas en ingles: evolutionarily stable
strategy). El concepto fue concebido por Maynard Smith y Price (1973), véase
también Maynard Smith (1972, 1974). El concepto se refiere fundamentalmente
a la permanencia intergeneracional de cierto comportamiento en una población
de individuos, (originariamente bacterias). Una
ESS
representa un
comportamiento poblacional, que se trasmite de generación en generación y
que es capaz de contrarrestar la aparición de comportamientos mutantes.
Rigurosamente se trata de un comportamiento estable frente a mutaciones y
que es a su vez, asintóticamente estable con respecto a la llamada dinámica del
replicador.
Este último resultado muestra que el comportamiento racional no es necesario
para obtener un equilibrio estable. El comportamiento heredado por una
población de individuos y que es capaz de trasmitirlo, puede representar una
ESS
cuando su desempeño es más exitoso que el de los posibles
comportamientos mutantes. Esto es independiente de toda consideración sobre
el desarrollo de la población hacia niveles superiores. En tanto que el
comportamiento asegure a cada individuo de la población un desempeño
elevado, estos mantendrán su comportamiento y sus características como
especie o población. Naturalmente este éxito individual, esta soportado en las
condiciones iniciales existentes, de modificarse estas suficientemente, el
comportamiento mutante puede ser mas exitoso.
Los juegos evolutivos toman en cuenta: i) un proceso de selección que favorece
a algunas especies o poblaciones sobre las demás, y ii) un proceso que crea
esta especie, llamada el proceso de mutación. En la teoría de juegos evolutivos,
las variedades en cuestión se representan por comportamientos diferentes, y
dentro de una población hay diferentes tipos de comportamientos posibles
donde aquellos más exitosos tienden a hacerse más frecuentes, no obstante
pueden
convivir
dentro
de
una
especie
8
individuos
con
diferentes
comportamientos.
En términos de la teoría de juegos, son comportamientos las estrategias puras
que un jugador puede elegir. En la naturaleza, el mecanismo de selección de
base es la supervivencia y la reproducción biológica, y el proceso de mutación
es básicamente una genética. En la economía el éxito se mide, ya no por la
cantidad de descendientes, sino por beneficios y utilidades, la mutación es la
experimentación de los agentes económicos, sus externalidades y sus errores
que dan lugar a un proceso de aprendizaje.
Así, el punto de partida en un modelo evolutivo, aplicado a modelos
económicos, es la creencia de que la gente no siempre actúa de manera
perfectamente racional. Las estrategias, más que surgir como resultado de un
proceso de razonamiento perfectamente racional, en el que cada jugador
resuelve el juego, a partir del supuesto de conocimiento común, surgen de un
proceso de ensayo y error de aprendizaje, en el que los jugadores encuentran
que algunas estrategias funcionan mejor que otras, proceso este en el que la
imitación juega un papel importante. La toma de decisiones individuales, si bien
afectada por la sociedad o el entorno en el que los agentes económicos se
desempeñan, en principio atiende a objetivos propiamente individuales, que
pueden o no coincidir con el interés social. Al adoptar este enfoque, la teoría de
juegos evolutivos supone que el comportamiento de los agentes aun en el caso
de no ser perfectamente racional, puede llevar a un resultado ''perfectamente
racional'' en equilibrio, o contrariamente, decisiones perfectamente racionales,
desde el punto de vista individual, pueden dar lugar análogamente al hecho de
que no es la especie mas evolucionada la que sobrevive, sino la que mejor que
se adapta, a un comportamiento social pobre.
2.1
El juego poblacional y la dinámica del replicador
Describiremos lo que significa un juego poblacional, pero primero permítanos
recordar algunas nociones básicas de los juegos en forma normal o estratégica.
Sea I = {1, 2,...n} el conjunto de jugadores, para cada jugador i ∈ I
9
sea S i
su conjunto (finito) de acciones disponibles. La elección determinística de una
acción si ∈ S i por un jugador i ∈ I , es llamada una estrategia pura para i .
Un vector s = ( s1 ,..., s n ) ∈ ×i∈I S i , donde si ∈ S i es la estrategia pura adoptada
por
i ∈ I , es llamado un perfil de estrategias puras o una configuración. El
espacio de todos los perfiles de estrategias puras en el juego es el producto
cartesiano S = ×i∈I S i del conjunto de acciones de los jugadores (usualmente
llamado el espacio de configuraciones).
Para cualquier configuración s ∈ S y cualquier jugador i, el número real π i (s )
indica el beneficio, pago o utilidad correspondiente a la estrategia si ∈ S i del
i − ésimo jugador dada la configuración
s ∈ S.
Así la función
πi : S → R
define la función de pagos para cada jugador. El vector, π ( s ) = (π 1 ( s )),.... p n ( s ))
corresponde a los pagos recibidos por los diferentes jugadores, cuando se
adopta el perfil s.
Definición 1. Un juego estratégico se describe por la lista Γ = ( I , S , π ) donde
I
es el conjunto de jugadores, S es su espacio de configuraciones y π el
vector de funciones de pagos de los jugadores.
Una estrategia mixta para cada jugador
i∈I
es una distribución de
probabilidad sobre el conjunto de acciones o estrategias puras
Si .
Representamos el conjunto de estrategias mixtas por ∆nii −1 esto es el simplex
ni − 1 dimensional. Este conjunto está formado por todas las distribuciones de
probabilidad sobre el conjunto de estrategias puras, siendo cada uno
representada por un vector xi = ( xi1 ,..., ximi ), donde mi =| S i |, mientras
xi (s j )
(a veces para abreviar usaremos la notación xij ) representa la probabilidad de
que el
i − ésimo jugador utilice la
j − ésima estrategia pura. Una estrategia
pura es una distribución de probabilidades concentrada. Estrategias puras son
10
sólo casos extremos de estrategias mixtas con probabilidad uno y el resto cero.
Estas pueden ser representadas por los vectores canónicos
e ij = (0,...,1,...0)
cuyas coordenadas son todas nulas con excepción de la j − ésima que vale 1,
indicando que es esta la estrategia que el jugador i esta siguiendo.
Definición 2. Un perfil de estrategias mixtas es un vector
distribuciones de probabilidad, es decir
(
∆ = ×i∈I ∆mii −1
)
m
∀i ∈ I ,
x = ( x1 ,..., xn )
de
xi ∈ ∆mii −1 . Denotamos por
el producto cartesiano de los conjuntos de estrategias mixtas de
todos los jugadores. Llamamos a este conjunto, espacio de estrategias mixtas.
Escribimos como
( x i , y −i )
el perfil estratégico en el cual el jugador i ∈ I juega
la estrategia xi ∈ ∆ i y todos los otros juegan de acuerdo al perfil y ∈ ∆ .
Los pagos del jugador i ∈ I
asociados con el perfil de estrategias mixtas x
están dados por el pago esperado:
ui ( x ) = ∑ x( s ) pi (s ),
s∈S
donde
x(s ) = ×in=1 xisi
es el producto de probabilidades asignado por cada
estrategia mixta del jugador xi ∈ ∆mii −1 a la estrategia pura s i ∈ S .
El juego
Γ = (I , S ,π )
se extiende considerando estrategias mixtas y pagos
esperados, como ϒ = (I , ∆, u ).
2.2 Estado o perfil poblacional y ESS
La teoría de juegos evolutivos considera poblaciones de agentes tomadores de
decisiones. Cada individuo o agente, puede elegir actuar en cada momento de
acuerdo a uno de los comportamientos posibles para su población.
Consideraremos
a cada población como un jugador,
que sigue un
comportamiento mixto, donde la estrategia mixta seguida por la población,
corresponde a una distribución de los individuos sobre el conjunto de
11
estrategias puras. La elección estratégica divide a cada una de las poblaciones
en subconjuntos de individuos caracterizados por la estrategia adoptada. Estos
subgrupos o subpoblaciones, pueden denominarse clubes. La adherencia de un
individuo a un club u otro se determina por la estrategia o comportamiento
adoptado. Cada individuo podrá pertenecer a más de un club, representando
una estrategia mixta la probabilidad de encontrar a un individuo determinado en
un club dado, o bien el porcentaje de individuos que adhieren a uno u otro club.
Ambas caracterizaciones dan los mismos resultados, si consideramos el
comportamiento del individuo promedio en cada población. Ambas representan
la probabilidad de encontrar un individuo de la población, siguiendo una
estrategia determinada en un momento determinado.
i ∈= {1, 2,..., n}
Formalmente, si por
Si
1, . . . m i
representamos a cada población, y por
al conjunto de comportamientos posibles, o estrategias puras,
para cada población,
mi
corresponde a la cantidad de comportamientos
posibles para la población i − ésima, por lo que mi =| S i |=# S i . El conjunto de
estrategias mixtas será entonces, el conjunto de distribuciones posibles de los
individuos de cada población sobre
xi = ( xi1..., ximi ).
De esta forma
xij (t ),
Si
y lo representaremos por
representa la probabilidad de que, el
individuo típico de la i − ésima población siga, en un momento t , el j − ésimo
comportamiento posible, por lo que xi (t ) ∈ ∆mii −1 siendo:

∆mii −1 =  xi ∈ R+ni :

ni
∑x
ij
j =1

= 1

el simplex mi −1 − dimensional.
Definición 3. Equivalentemente, xij (t ) representa el porcentaje de individuos,
dentro de la
i − ésima población, que siguen en el momento
comportamiento j , o que están afiliados al j − ésimo club.
12
t
el
Consideremos que la economía la forman un conjunto finito de poblaciones
I = {1,..., n},
las que a su vez, se dividen, en una cantidad finita de
subpoblaciones, las que corresponden al comportamiento seguido por los
individuos, es decir, Pij será la subpoblación de los individuos que siguen el
comportamiento j ∈ S i dentro de la población i ∈ I .
Si
por
π i : S i × S −i → R
correspondiente a la
representamos
la
i − ésima población, siendo
representar un juego, o una economía, por
función
de
beneficios
S −i = × j =/i S j ,
podemos
Γ = ( I , S i , π i ) , donde
I = 1,..., n
representa a los jugadores, o poblaciones y S i el espacio de estrategias puras
posibles para cada población.
Definición 4. Un estado poblacional o perfil poblacional en un instante t del
juego o de la economía
{x1 (t ),..., xm (t )}
Γ , se representa por un vector de distribuciones
donde cada xi (t ) ∈ ∆mii −1 , ∀i ∈{1,..., n}
En lo siguiente asumiremos siempre que las poblaciones son constantes, así no
aparecen problemas derivados por consideraciones demográficas. Además
asumiremos que todas las poblaciones son del mismo tamaño.
En lo que sigue utilizaremos la notación:
•
s −i
o x −i
para representar las estrategias puras o mixtas, seguidas por
todos los jugadores que no son i .
•
n −1
S −i = × j =/i S j y ∆ −i = × j =/i ∆ jj .
Hay dos tipos de modelado de juegos poblacionales:
1) Juegos en contra del campo. Estos juegos tienen las siguientes
características: i) no hay un oponente específico para un agente dado, y ii)
los pagos dependen de lo que todos en la población están haciendo.
13
2) Juego por emparejamiento. Describe las situaciones en que un
determinado agente juega contra oponentes que han sido seleccionado al
azar (por naturaleza) entre las otras poblaciones.
Juegos en contra del campo
Consideremos una economía con n poblaciones, para simplificar la notación
consideremos que cada población se divide en m subpoblaciones. El estado
de la economía, en un momento dado, representado por un vector de
x ∈ (∆m−1 ) n .
distribuciones
Supongamos
i∈I
perteneciente a una cierta población,
que
un
agente
económico
(firmas, trabajadores, científicos,
estudiantes, etc.) puede elegir entre un conjunto
S
de estrategias puras,
adopta una estrategia xi ∈ ∆m −1 . Por xi (s ) representaremos la probabilidad de
que el individuo se comporte de acuerdo a la estrategia pura s ∈ S i . Su pago
esperado será denotado por:
π i (xi , x ) = ∑ xi ( s )π ( s, x).
s∈S
Este pago esperado, representa el éxito esperado de la estrategia adoptada, la
que puede ser medidos en términos de utilidad esperada, beneficios esperados,
o en el caso de poblaciones animales la esperanza de sobrevida, cuando el
individuo sigue el comportamiento
σ
y se enfrenta a individuos que se
comportan de acuerdo a x.
Estamos interesados en la conducta individual que maximice el pago esperado
para cada agente dado el campo vectorial x . Es decir, una condición necesaria
para la estabilidad evolutiva es σ ∗ ∈ arg max π (σ , x ∗ ).
σ ∈∆
Así, un vector x ∗ es un equilibrio, si la distribución xi∗ correspondiente a la
población
promedio,
I − ésima corresponde a una mejor respuesta del comportamiento
al
estado
poblacional,
x∗.
Es
decir
si
π i ( xi∗ , x ∗ ) ≥ π i ( xi , x ∗ )∀xi ∈ ∆mi −1 , y ∀i ∈ I .
i
Equivalentemente un estado poblacional será un equilibrio, si corresponde a un
14
perfil estratégico tal que, cada estrategia seguida por el jugador promedio
dentro de cada población, maximiza el retorno esperado dado el estado
poblacional. Obsérvese que, en tanto que cada jugador de cada población elige
aquella estrategia que maximiza su retorno esperado, dado que, las diferentes
x,
poblaciones se distribuyen de acuerdo al vector
entonces todos los
individuos de una población determinada optarán por la misma estrategia. Es en
definitiva,
el
comportamiento
individual
el
que
acaba
definiendo
el
comportamiento de la economía. Este comportamiento corresponde al equilibrio
de Nash.
La condición de estabilidad es de gran importancia, en tanto que ella determina
si un determinado equilibrio es o no observable. Considere un perfil estratégico
x∗
tal que la distribución
xi∗
dentro de cada población corresponde a una
estrategia maximizadora contra el campo
x∗.
Ahora, suponga que una
mutación ocurre y el campo se modifica, pasando a ser xε . Entendemos por
mutación, un cambio en el comportamiento de algunos individuos, respecto al
seguido en
x ∗ que afecta solo a una parte relativamente pequeña de ellos.
Después de que la mutación ocurre, nos encontraremos ante un nuevo perfil de
distribuciones, el cual será denotado por xε . Sólo consideraremos en principio
mutaciones que no afecten mas que a un grupo pequeño de individuos, de
forma tal que | xε − x |< ε .
Definición 5.
Diremos que una estrategia
xi∗
es evolutivamente estable
contra el campo x ∗ si verifica:
1) π i ( xi∗ , x ∗ ) ≥ π i ( xi , x), ∀ xi ∈ ∆mi −1 ∀i ∈ I y si a la vez se verifica la condición de
estabilidad:
2) Existe
ε >0
tal que
π i ( xi∗ , xε ) ≥ π i ( xi , xε ), ∀ x i ∈ ∆mi−1 y ∀ 0 < ε < εˆ ,
verificándose la desigualdad estricta para al menos un i ∈ I .
15
xi∗
En otras palabras
es una ESS contra el campo, si continua siendo
maximizadora del valor esperado de los individuos de la población i − ésima
aun, luego de que una mutación (no muy grande) en el comportamiento de la
economía, ocurre.
En algunos casos consideraremos como determinadas las distribuciones
correspondientes a todas las poblaciones menos una, y nos ocuparemos de
encontrar la estrategia maximizadora de esta población actuando contra x i .
Es decir buscaremos aquella estrategia mixta xi∗ de la población i − ésima tal
que π i ( y ∗ i , x−i ) ≥ π i ( yi , x−i ) ∀yi ∈ ∆mii −1 y que verifique la condición de estabilidad
frente a mutaciones de x −i . Diremos entonces que la estrategia y i∗ seguida
por la i
ésima población es ESS contra el campo determinado por x i .
Por otro lado, un juego por emparejamiento describe una situación en la cual un
cierto agente juega contra oponentes que son seleccionados aleatoriamente
entre los individuos de cada población y para lo cual los pagos dependen
únicamente de las estrategias seguidas por cada uno de ellos. Entonces, el
valor esperado asociado a una distribución o estrategia mixta xi ∈ ∆mi−1 cuando
el estado poblacional es x quedará definido por:
π i (xi , x ) = π i ( xi , x −i ) = ∑ xi ( s i ) x −i ( s −i )π (si , s −i ).
s∈S
donde el vector s de estrategias puras se escribe como s = ( si , s −i ) ∈ S i × S −i ,
mientras
que
el
perfil
x = ( xi , x−i ) ∈ ∆mi −1 × ∆ −i .
Consecuentemente
x −i ( s −i ) p ( s i , s −i ) = Π j =/i x j ( s j ) p ( si , s j ).
A los efectos de no desviar la atención consideremos que dentro de cada
población existen
m
conductas posibles de ser elegidas por cada agente,
S i = ( si1 ,..., sim ), una proporción xij de los agentes en la población i adoptan
la conducta s j a ellos los llamaremos
j − estrategas, de forma tal que una
estrategia mixta, corresponde a una distribución porcentual de los individuos de
16
cada población en clubes.
Supongamos una economía en la que cada población actúa de acuerdo a un
perfil estratégico
x.
Diremos que el comportamiento poblacional muta, si
algunos de los individuos cambian de manera inesperada su comportamiento.
Llamaremos al perfil posterior a la mutación perfil mutante y será representado
por xε . Supondremos que estas mutaciones no afectan muchos individuos por
lo que
| x − xε |< ε .
definiremos a continuación estrategias evolutivamente
estables ( EES .
Definición 6. Una estrategia x ∗ es ESS para un juego de emparejamiento de
n poblaciones, si y sólo si ∀ xi ≠ xi∗ se tiene que:
(
)
(
)
1) La condición de equilibrio, π i xi∗ , x−∗i ≥ π i xi , x−∗i ∀i ∈ I y además se verifica
la siguiente condición de estabilidad:
2) Para
toda
y∈∆
estrategia
π i (xi∗ , x−iε ) ≥ pi ( yi , x−iε ) ∀ 0 < ε ≤ ε y siendo
εy
existe
xε = εy + (1 − ε ) x
tal
que
el perfil pos-
mutación, con estricta desigualdad para al menos una población i ∈ I .
La condición de estabilidad indica que para ser ESS una estrategia
x = ( x1 ,..., xn ) debe verificar que, para cada población i ∈ I , la estrategia mixta
correspondiente, definida por
x
debe continuar siendo una mejor respuesta
cuando una mutación ocurre en el perfil poblacional. Más aun el desempeño
correspondiente a alguna de las estrategias mixtas
xi ,
existentes antes de
que la mutación ocurriera, debe ser mejor que el de la mutante correspondiente
yi .
Una gran parte de la literatura de juegos evolutivos, fundamentalmente
aplicados a la biología, se basa en los llamados juegos simétricos, los que se
refieren a individuos que se aparean con otros individuos de su propia
17
población.
El
éxito
de
cada
tipo
de
comportamiento
(determinado
genéticamente) depende del número de descendientes que el portador del tipo
genético determinado es capaz de alcanzar y por lo tanto la capacidad de
trasmisión de los genes que determinan tal comportamiento. en este caso, las
fuerzas de la naturaleza seleccionan el comportamiento s ∗ ∈ S si dado que la
población se distribuye de acuerdo al vector de probabilidades x el número de
descendientes del individuo que sigue este comportamiento u i ( s ∗ , x) es mayor
o igual que el que obtendría siguiendo cualquier otro tipo de comportamiento, o
estrategia pura, esto es u i ( s ∗ , x) ≥ u i ( s, x) ∀s ∈ S . Sin embargo en economía los
juegos anti-simétricos son mas frecuentes, pues es resultado económico
depende de los comportamientos seguidos por diferentes poblaciones, firmas y
trabajadores por ejemplo, compradores y vendedores, etc.
En lo que sigue nos dedicaremos a analizar juegos asimétricos de dos
poblaciones.
Consideremos dos poblaciones polimórficas, esto es poblaciones compuestas
por individuos que siguen diferentes comportamientos. Dichas poblaciones
serán representadas por el índice τ ∈ {1, 2}. Estas poblaciones se dividen a su
vez en subpoblaciones, cada individuo pertenece en un instante t a una y sólo
una de estas subpoblaciones.
Intuitivamente, decimos que x es una ESS si y sólo si después de darse una
mutación en alguna población
τ , cada
xi
continua siendo una mejor
respuesta a la distribución poblacional, post-mutación
w . A partir de la
definición se concluye que una ESS de un juego asimétrico debe ser un
equilibrio de Nash estricto.
2.3
La dinámica del replicador
La dinámica del replicador ( RD ) modela explícitamente un proceso de
selección, especificando como un perfil poblacional, evoluciona en el tiempo. La
formulación matemática de la dinámica del replicador se debe a Taylor y Jonker
18
(1978). En el caso en el que se consideran poblaciones animales, la utilidad
asociada a una determinada estrategia, que en estos casos esta determinada
genéticamente corresponde a capacidad de adaptación, sobrevida o número de
descendientes del portador de los genes que determinan la conducta
observada. En definitiva mas descendientes tendrán aquellos individuos mejor
adaptados o con esperanzas de sobrevida mayor, por lo que en definitiva es
este número el que determina la eficiencia evolutiva de una determinada
composición genética. La tasa de crecimiento de la fracción poblacional que
adopta una estrategia pura i es igual a la diferencia entre el número esperado
de descendientes de los individuos que manifiestan una determinada conducta
menos el pago promedio que hay en la población. En otras palabras, la
proporción (fracción) de agentes que adoptan la estrategia s i crece (decrece)
si su pago es mayor (menor) que el pago promedio dado en la población. En
términos matemáticos, esto puede expresarse mediante el sistema dinámico:
x&i = [π ( si , x) − π ( x, x)] xi .
Que corresponde a individuos que sea aparean con individuos de su propia
población.
Las mejores respuestas al estado actual
x , corresponden a aquellas
estrategias que tienen la mayor tasa de crecimiento en la población, las
segundas mejores respuestas tienen la segunda tasa de crecimiento más alta, y
así sucesivamente. Aunque las estrategias puras más exitosas crecen más
rápido que los de menos éxito, el pago promedio de la población no tiene
porque crecer con el tiempo. La razón de esta posibilidad es que si un agente
se sustituye por un agente con una mejor estrategia, entonces los opositores
enfrentando a este nuevo agente pueden recibir pagos más bajos, lo cual no
afectará el promedio.
Como ya fue dicho en la teoría económica es más común enfrentarnos a juegos
poblacionales
asimétricos.
En
este
caso
analizaremos
la
evolución
correspondiente a un juego de dos poblaciones diferentes. En forma similar al
19
caso de los juegos simétricos podemos plantear el sistema dinámico siguiente,
para explicar la evolución porcentual de una determinada subpoblación de una
población dada:
m
x֠i t
xi t
si , x
t
xj t
sj , x
t
, #
j 1
para cada estrategia xτ = ( x1τ ,...xmτ τ ) con poblaciones τ ∈ {1, 2}.
Es natural pensar que los agentes económicos racionales, se guían por el
comportamiento o estrategia que en cada momento suponga mayores
beneficios esperados. Aseveración esta, que justifica la utilización de la
dinámica del replicador en economía para explicar la evolución poblacional.
Esta dinámica garantiza el incremento del porcentaje de individuos que siguen
comportamientos cuyos beneficios esperados son mayores que el promedio.
Este incremento supone la existencia de un proceso aprendizaje a lo largo del
tiempo.
Consecuentemente, se deduce del sistema definido por la dinámica del
replicador que un estado poblacional x ∈ ∆ es estacionario si y sólo si, para
cada población τ
y cada estrategia pura siτ ∈ S τ
τ ,τ ′ ∈ {1, 2}, τ ≠ τ ′,
pago. Así, ∀i ∈ I ,
{
(
)
en uso obtiene el mismo
el conjunto común de estados
}
estacionarios es: ∆o := x ∈ ∆ : π τ siτ , xτ ′ = π ( x) .
La relación entre el replicador
ESS
RD y las estrategias evolutivamente estables
es que éstas son un punto asintóticamente estable de la dinámica del
replicador, pero no todos los puntos asintóticamente estables tienen por qué ser
una ESS .
Zeeman (1992) muestra el siguiente resultado:
Una ESS es un punto atractor en su correspondiente dinámica del replicador,
pero no todo punto atractor de la dinámica del replicador corresponde a una
ESS .
Este resultado es formalmente probado por Zeeman (1992) y se demostró por
20
primera vez por Taylor y Jonker (1978) y está en Hofbauer et al. (1979) bajo el
supuesto de que una
ESS
es regular, llegando a la conclusión de que la
atracción es hiperbólica.
3.
Aprendizaje por imitación
Blackmore (1999) no sólo se refiere a la efectividad que la imitación tiene para
el proceso de aprendizaje, sino también a la sofisticación requerida para
considerar el momento de imitar. La imitación lejos de contradecir la
racionalidad, es una manera a través de la cual se expresa. Para explicar la
imitación como regla de conducta de los agentes económicos, podemos partir
de que lo hacen de manera racional. La imitación racional puede ser explicada
de la siguiente manera: Un agente, A, se dice que imita la conducta de otro
agente, B, cuando las observaciones de la conducta de B afectan a A, de
manera tal que la conducta subsiguiente de este se asemeja cada vez más a la
conducta observada de B. Un agente puede decirse que actúa racionalmente
cuando, enfrentado a una elección entre diferentes cursos comportamientos,,
elige aquel que es mejor a sus intereses. En el momento de esta decisión
tendrá en cuenta sus creencias acerca de las posibles consecuencias de tales
acciones y los efectos que de estas acciones bajo las restricciones que
imponen las acciones seguidas por el resto de los agentes económicos (para
más detalles sobre teoría de la imitación, Sanditov, 2006).
Durlauf (2001) muestra que la conducta por imitación se debe a:
1) Factores psicológicos, un deseo intrínseco de comportarse como los demás.
2) Interdependencia en las restricciones que los agentes enfrentan, esto es
porque los costos de una conducta dada dependen de si los demás se
comportan similarmente, o bien:
3) Interdependencia en la transmisión de la información, así que la conducta de
otros altera la información acerca de los efectos de tales conductas
disponibles a un agente dado.
21
En este trabajo consideramos la imitación como un proceso con las siguientes
características:
1) Suponemos que en cada momento t con cierta probabilidad los individuos
tienen el impulso de revisar su estrategia o conducta (pura) actual. Estos
impulsos llegan de acuerdo a un proceso de Poisson, así la probabilidad de
tener impulsos simultáneos de los agentes en la población es simplemente
cero, y las probabilidades con que diferentes individuos se transforman en
revisores de sus propias conductas, son independientes. Por lo que el
proceso global es también un Proceso de Poisson, tal que la intensidad del
proceso global es la suma de las intensidades de los procesos individuales.
2) Una vez que un agente es revisor, deberá decidir si cambia o no su
conducta, y en caso de decidir cambiar, cuál elegir.
3) De esta forma el proceso de cambio de comportamiento de los diferentes
agentes se compone de dos elementos básicos. El primero es una
especificación la probabilidad con la cual los agentes de la población revisan
su conducta actual. El segundo elemento es una especificación de la
probabilidad de elección de cambio de conducta por parte de un agente
revisor que debe elegir su comportamiento futuro.
4) Una posibilidad es que el revisor decida seguir la regla de la mayoría, o
imitar el comportamiento de sus vecinos, o bien del primero con quien se
encuentre.
Björnerstedt y Weibull (1996) fueron de los primeros en estudiar este tipo de
modelos de conducta por imitación, donde aquellos agentes revisores de su
conducta deciden imitar a otros dentro de su población, y así mostraron que se
puede llegar a una dinámica del tipo replicador bien estudiada por la teoría de
juegos evolutivos. En particular, son bien conocidos los procesos de imitación
por insatisfacción, esto es la frecuencia con que un individuo se transforma en
revisor, disminuye con los resultados obtenidos. Es este un supuesto natural,
que consideraremos en este trabajo. Además, si cada agente revisor selecciona
su próxima estrategia o conducta por imitación de la mayoría, es coherente
22
considerar que este elegirá por ejemplo imitar la conducta seguida por el
primero con el que se tope, pues la probabilidad de que el comportamiento del
primer individuo con el que se encuentre sea el de la mayoría es la máxima.
Avances teóricos para el desarrollo de la teoría de imitación han sido las
aportaciones cruciales de Vega-Redondo (1997) y Schlag (1998, 1999).1
Así, la imitación define un proceso dinámico dentro de una población o conjunto
de poblaciones, tal que una vez definidas las reglas de conducta (es decir cómo
se imita) es pasible de ser modelado mediante un sistema de ecuaciones
diferenciales, cuya solución determina la evolución futura de la economía o de
las poblaciones que la definen, una vez que las distribuciones iniciales quedan
determinadas.
A medida que el tiempo transcurre los agentes, frecuentemente se preguntarán
si la conducta por ellos seguida hasta el momento es o no la mejor posible.
Cambiar de estrategia o de club es una posibilidad posterior a la realización de
tal interrogante. Este proceso sigue una regla de conducta, la que a su vez
define un sistema de ecuaciones diferenciales, que describe la evolución de la
frecuencia relativa con la cual alguna estrategia pura ocurre en una población.
Hay una ecuación diferencial para cada estrategia pura disponible para cada
población y cada ecuación diferencial describe la evolución del porcentaje
poblacional que adoptó tal estrategia pura, esto es el número
1
N
y 1
i
xiτ
para todo
n . Esta ecuación representa el flujo esperado neto de
individuos hacia cada clase, subpoblación o club de estrategistas.
Para cada población
representamos el conjunto de perfiles de estrategias
1
Schlag (1998) analiza cuál es la regla de imitación que un agente debe seguir, cuando él tiene la
oportunidad de imitar a los demás dentro de su conjunto poblacional pero está restringido por memoria e
información. Schlag considera que si un agente desea una regla de aprendizaje por imitación que
conduzca a la no disminución de beneficios esperados (en el tiempo) bajo todas las situaciones de estado
estacionario, entonces tal agente debe (i) siempre imitar (no experimentar) al cambiar de estrategia, (ii) no
imitar nunca a un agente cuyo beneficio esperado es menor que el suyo, e (iii) imitar a los agentes cuyos
beneficios esperados son mejores que los suyos con una probabilidad que es proporcional a esta
diferencia en beneficios.
23
como anteriormente, m
mixtas por
es la cardinalidad del conjunto de
estrategias puras disponibles para al población
1, . . . , N .
Definición 6. Una regla de conducta es un mapeo para la presente conducta
agregada, en cada población τ = 1,..., N por el campo vectorial ϕτ : ∆ → R nτ ×nτ ,
a tasas de cambio condicionadas, definido como
φτ ( x) =
(
τ
= r1τ ( x ) p11
( x),..., r1τ ( x ) p1τnτ ( x),..., rnττ ( x ) pτnτ 1 ( x ),..., rnττ ( x ) pnτ τ nτ ( x )
siendo
nτ
el número de clubes diferentes, en la población
τ.
)
Los dos
elementos básicos son:
1) La tasa de probabilidad riτ ( x ) de revisión con la que agentes evalúan su
conducta presente. Esta tasa depende del performance de la estrategia pura
del agente y de otros aspectos relacionados con el actual estado
poblacional,2 x .
2) La probabilidad p ijτ (x) con la que un agente revisor i
a
j ≠ i . El vector de estas probabilidades es:
estratega cambiará
(
)
piτ ( x) = pi11 ( x),..., pikN ( x) ,
piτ ( x) ∈ ∆τ . Esta distribución depende del performance de la actual
donde
estrategia comparada con sus opuestas y otros aspectos como el actual
estado poblacional, x .
Como ya fue dicho podemos suponer que los tiempos de revisión de un agente
son tiempos de llegada de un proceso de Poisson, con tasa
riτ ( x).
Si
suponemos que el número de individuos en cada club es alto, y las
probabilidades de que se pregunten si deben o no cambiar su estrategia
2
Esta es la conocida "tasa de conducta con inercia" (ver Bjornerstedt & Weibull, 1996; Weibull, 1995 y
Schlag, 1998; 1999) que indica como un agente reconsidera su actual conducta o estrategia con una
probabilidad
r
0, 1
en cada periodo.
24
variables aleatorias independientes, resulta que podemos suponer que en
agregado, a los largo de la población entera, tenemos un proceso de Poisson
con tiempo de llegada xiτ riτ ( x) pijτ ( x). Luego por la ley de los grandes números,
modelamos este proceso estocástico agregado como un flujo determinista: La
salida de subpoblación o del club i es:
x i r i x p ij x . #
j i
La entrada a la subpoblación o al club i es:
x j r j x p ji x . #
j i
El flujo es la diferencia entre la entrada y salida y determina cuando la
frecuencia con la cual observamos individuos siguiendo una estrategia dada,
dentro de una población aumenta o disminuye.
Agrupando términos, obtenemos:
n
x֠i
n
x j r j x p ji x
i
Donde
riτ (x )
x i r i x p ij x . #
i
depende del beneficio actual del agente
depende del estado poblacional,
agentes. A su vez
p ji (x)
i
que a su vez
x , comprendiendo los diferentes tipos de
depende de los beneficios comparados entre los
agentes i y j . Lo análogo vale para el agente j . Así:
•
riτ ( x) ∈ [0,1] es una función decreciente de los beneficios esperados del
agente i . Esto es, a mayores beneficios de i menor la probabilidad, riτ ,
de realización de la pregunta sobre la actual estrategia seguida.
•
pij ( x) ∈ [0,1]
define la probabilidad con que un agente revisor decide
cambiar su estrategia actual
i
por la
25
j − ésima. Es una función de la
percepción individual de la diferencia de beneficios,
probabilidad de que un agente que sigue la
adoptar la estrategia
π τj ( x) − π iτ .
la
i − ésima estrategia decida
j − ésima será positiva, cuando la percepción del
agente de esta diferencia, sea positiva. Es natural pensar que esta
percepción dependa directamente de los verdaderos valores. Sera más
ajustada a la realidad, cuanta más información el agente posea.
El valor de p ijτ se modifica con el tiempo y el estado actual de la economía o
población. El porcentaje de agentes está dado por xτj que naturalmente varía
con el tiempo. Obsérvese que el sistema de ecuaciones que definen la
evolución poblacional, es un sistema acoplado, este hecho dificulta su
resolución analítica. Ante esto se presentan dos alternativas: i) buscar
soluciones numéricas, o ii) realizar hipótesis significativas que permitan resolver
el sistema de manera analítica. Esta segunda opción ha sido explorada en
Accinelli, Brida & Carrera (2009) y Accinelli & Carrera (2011), mientras que la
primera aproximación es parte de líneas actuales de investigación de los
referidos autores. En el caso de existir incertidumbre sobre los beneficios
esperados, cada revisor
( j =/ i ) ∈{c, nc}
, debe elegir formas de estimarlos. Esta
elección influirá directamente en la forma y complejidad del sistema dinámico
que resume la evolución poblacional.
Definición 7. Un agente económico i que es revisor,
imitará a un estratega
j con probabilidad p ijτ , igual a:
ej , x
P
ej ,
ei,
x j if
0
xj
#
0
donde λ = |uτ ( e , x −τ ) +1uτ ( e , x −τ )| , ∀
i
ej, x
j
if
ej, x
0
− τ =/ τ ∈ {R, M } y i =/ j ∈ {c, nc} .
26
Por lo tanto la dinámica del replicador puede escribirse como:
x֠i
fj
ej , x
donde la función
revisión de
ei, x
( )
f iτ π iτ = riτ (x)
xi xj
fi
ei , x
ej, x
xj xi
#
es simplemente la tasa de probabilidad de
i − estratega. Consideramos tal función ser específica en pagos
propios, así, la propensión de cambio de conducta es decreciente en el pago
propio del agente i , esto es (ver Weibull, 1995):
f iτ (π iτ ) = riτ ( x) = α τ − βτi π iτ ,
con α τ , β τ ≥ 0 y
ατ
βτ
≥ π iτ asegurando que f iτ (π iτ ) ∈ [0,1] . Así, con respecto al
pago del i − estratega, π iτ si éste crece en promedio, su tasa de probabilidad
de revisión,
riτ ( x) = f iτ (π iτ ) , decrecerá. Para simplificar, etiquetemos la
notación π τ (ei , x −τ ) = π iτ y u τ (e j , x −τ ) = π τj , entonces, podemos escribir:
[
]
x&iτ = (1 − xiτ ) xiτ λ f jτ (π τj )u iτ − f iτ (π iτ )u τj .
Por lo tanto, considerando la anterior regla de imitación, obtenemos el sistema
de ecuaciones de la dinámica del replicador para agentes económicos
impulsados por imitación, i.e.:
x֠i
xi 1
☺
xi
i
j
i
j
. #
Tal sistema describe la dinámica del replicador como un proceso dinámico en el
que sólo las estrategias más eficientes son replicadas. EL sistema
todo
i, j = 1, 2,..., mτ ,
con poblaciones
τ , τ ′ ∈ {1, 2},
(x&
τ
i
x&τj ′
)
para
τ ≠ τ ′ , admite cinco
estados estacionarios o equilibrios dinámicos, i.e. estados o perfiles
poblacionales:
(0, 0), (0,1), (1, 0), (1,1) y P = ( xc1 , xc2 )
27
donde xc1 es el porcentaje umbral de aquellos agentes de la población 1 que
c
deciden imitar y adoptar la conducta
(ej. cooperación); siendo
x c2
el
porcentaje umbral de aquellos agentes de la población 2 que deciden imitar y
adoptar la conducta c . Note que,
P = ( xc1 , xc2 ) es un equilibrio de Nash en
estrategias mixtas interior al cuadrado C = [0,1] × [0,1] .
La siguiente proposición resume las principales características de las
posibilidades evolutivas, de una economía en la que los agentes económicos,
imitan la conducta seguida por aquellos individuos que, dada la distribución
poblacional y la información disponible, aparecen como los más exitosos. En
este nuestro último caso, si las condiciones iníciales de la economía son tales
que se está por encima del umbral, xi > P , entonces la cooperación se dará
como conducta única y la economía evolucionará hacia una senda con
equilibrio sostenido y de crecimiento. Caso contrario cuando el número de
agentes económicos está por debajo del umbral, entonces estos agentes por
imitación deciden no cooperar y la economía va encaminada a una trampa de
pobreza con agentes no cooperativos, estado (0, 0) .
Proposición 1 (Accinelli et al. (2010) y Sanchez Carrera (2012)). Cuando los
agentes
económicos
revisores
de
su
propia
conducta,
cambian
de
comportamiento o estrategia, de acuerdo con las normas de imitación de sus
pares, dada la información disponible y el actual estado o perfil poblacional,
como más exitosos, entonces:
• Los equilibrios
(0, 0)
y
(1,1)
son atractores para el sistema dinámico
replicador y por lo tanto definen perfiles estratégicos evolutivamente
estables ( ESS ), que son respectivamente equilibrios de Nash: (0,1; 0,1) y
(1, 0;1, 0) .
•
El equilibrio
(
P = xc1 , xc2
)
define un valor umbral de agentes económicos
cooperativos con el crecimiento sostenido, en el sentido de que si las
28
condiciones iniciales están por encima de tal umbral, la trayectoria como
solución del sistema dinámico converge hacia el atractor alto (1,1), de
crecimiento sostenido. Mientras que si los valores iniciales se encuentran
por debajo de tal umbral, se convergirá hacia el atractor bajo,
(0, 0) , de
equilibrio no-cooperativo.
La demostración generalizada de éste teorema se puede encontrar en
Sanchez-Carrera (2012), y una aplicación para juego de firmas y trabajadores
se encuentra en Accinelli et al. (2010).
Por lo tanto, la imitación tiende entonces a replicar el comportamiento de la
mayoría. Si se quiere modificar este proceso, deben cambiarse suficientemente
las condiciones que hacen que tal comportamiento sea una mejor respuesta,
para así tener una economía con crecimiento sostenido de largo plazo.
Así, la economía puede converger a un equilibrio con nivel bajo aun basándose
en elecciones racionales de los agentes, entendiendo por nivel bajo una
situación en la que predominan los perfiles no deseables como la nocooperación. La economía requiere un número límite de agentes con perfil alto
o deseable para librar la trampa de pobreza. El número de agentes económicos
con nivel alto, inicialmente existentes, que permite a la economía seguir una
senda de alto crecimiento, debe ser mayor al umbral P.
4.
Comentarios finales
Actualmente existen innumerables aplicaciones de la teoría de juegos
evolutivos a la teoría económica y a la dinámica de poblaciones humanas.
Estos modelos permiten conocer las posibles tendencias de la evolución en el
comportamiento de poblaciones humanas con respecto, por ejemplo a su medio
ambiente, y alertan sobre la fragilidad de determinados comportamientos
deseables y la consecuente necesidad de crear leyes e incentivos para
mantener conductas y/ o costumbres destinadas a desaparecer por la acción de
29
una dinámica inexorable. Cuáles son estas leyes, o cómo crearlas en principio
no son temas de la teoría de juegos, aunque una vez definidas, su
implementación pueda serlo.
En conclusión, la teoría de juegos evolutivos nos ayuda a modelar como la
racionalidad individual de los agentes económicos puede dar lugar a resultados
socialmente eficientes o ineficientes, dependiendo de qué sea lo que con mayor
probabilidad imitarán los individuos. Tal probabilidad depende de condiciones
iniciales, que determinan cuál comportamiento individual es más exitoso en un
momento determinado. A partir de fijadas las reglas de conducta, y establecido
el sistema dinámico que las representa, las soluciones de este corresponderán
a trayectorias posibles por las que evolucionará la economía. Las condiciones
iníciales determinan por cuál de ellas la economía evolucionará. Esta trayectoria
corresponde a una sucesión continua de distribuciones de probabilidad en el
conjunto de los comportamientos posibles de los individuos de cada población,
que evoluciona con el tiempo y que converge a atractores determinados por el
sistema dinámico. La acción del planificador central, debe entonces dirigirse
hacia la evaluación correcta de las condiciones iniciales imperantes,
modificarlas si es necesario para quitar a la economía de la trampa de pobreza.
Debe atenderse a que una mala evaluación de estas condiciones o el
establecimiento de una política de incentivos incorrecta, puede agravar la
situación existente, en la medida que puede hacer aparecer aun como mas
exitoso, el comportamiento menos deseado socialmente.
Se concluye entonces que cuando las condiciones iniciales no eran las
deseables; la elección racional libre de los agentes económicos no es suficiente
para salir de la cuenca de atracción de una trampa de pobreza, más aun, esta
convergencia puede verse acelerada, precisamente por el comportamiento
racional de los agentes económicos. Es aquí cuando es válida la intervención
de un planificador central o hacedor de políticas económicas, ya que una vez
identificadas las variables que determinan el umbral es entonces que se tienen
que diseñar mecanismos para disminuir tal umbral con el objetivo de que las
30
condiciones iniciales de la economía se encuentre por encima del umbral y así
los agentes económicos lleven a la economía a una senda de crecimiento
sostenido. Note que una vez superado el umbral, la intervención del planificador
debe necesariamente desaparecer. A partir de la superación de estos valores,
la economía por sí sola, bajo la acción de sus propias leyes, y la racionalidad
los agentes económicos, evolucionará por una senda de crecimiento económico
alto y sostenido, alcanzando un estado estacionario de alto desempeño. La
incapacidad para detectar estos valores umbrales y definir una correcta política
económica, puede explicar por qué se observan índices tan dispares en el
bienestar social de diferentes países, aún bajo la globalidad creciente de la
economía actual.
31
Referencias
•
Accinelli, E. Brida, G. and Carrera, E. (2009), "Imitative Behavior in a Two
Population Model," Annals of the International Society of Dynamic
Games, vol. XI..
•
Accinelli, E. and E. Sánchez Carrera (2010), Los fundamentos estratégicos
de las trampas de pobreza PERSPECTIVAS Revista de Análisis de
Economía, Comercio y Negocios Internacionales 4(1), pp. 3-43.
•
E. Accinelli, London S., Punzo L. and E. Sánchez Carrera (2010), “Dynamic
Complementarities, Efficiency and Nash Equilibria for Populations of Firms
and Workers”, Journal of Economics and Econometrics 53(1), pp. 90110.
•
Accinelli, E. and E. Sánchez Carrera (2011a), "The Evolutionary Game of
Poverty
Traps"
Forthcoming
in
The
Manchester
School.
DOI:
10.1111/j.1467-9957.2011.02262.x
•
Accinelli, E. and E. Sánchez Carrera (2011b), "Strategic complementarities
between innovative firms and skilled workers: the poverty trap and the
policymaker's intervention" Structural Change and Economic Dynamics
22(1), pp.30-40.
•
Apesteguia, J., S. Huck and J. Oechssler (2007), "Imitation-theory and
experimental evidence," Journal of Economic Theory 136, pp. 217-235.
•
Axelrod, Robert (1984), The Evolution of Cooperation, New York: Basic
Books, ISBN 0-465-02122-2.
•
Blackmore, S. (1999), The Meme Machine, Oxford; Oxford University Press.
•
Björnerstedt, J. and J.W. Weibull (1996), "Nash Equilibrium and evolution by
imitation," The Rational Foundations of Economic Behaviour, Eds. K.
Arrow et al., Macmillan, London, pp. 155--171.
•
Border, Kim (1985), Fixed point theorems with applications to
economics and game theory. Cambridge University Press. Reprinted
32
version 1999.
•
Durlauf, S. (2001), "The Memberships Theory of Poverty: The Role of Group
Affiliations in Determining Socioeconomic Outcomes," in Understanding
Poverty in America, S. Danziger and R. Haveman eds., Cambridge:
Cambridge: Harvard University Press.
•
Gaunersdorfer, A. J. Hofbauer and K. Sigmund (1991), "On the Dynamics of
Assymetric Games," Theoretical Population Biology 39, pp. 345-357.
•
Gintis, H. (2009), Game Theory Evolving, Second Edition, Princeton
University Press.
•
Hofbauer, J. Schuster, P. and Sigmund, K. (1979), "A note on evolutionary
stable strategies and game dynamics," Journal of Theoretical Biology 81,
pp. 609-612.
•
Hofbauer, J. and K. Sigmund, (2002), Evolutionary Games and Population
Dynamics, Cambridge University Press.
•
Maynard Smith, J. (1972), On Evolution. Edinburgh University Press.
•
Maynard Smith, J. and Price, G.R. (1973), “The Logic of Animal Conflict”,
Nature 246, pp. 15-18.
•
Maynard Smith, J. (1974), "The theory of games and the evolution of animal
conflict," Journal of Theoretical Biology 47, pp. 209--22.
•
Maynard Smith, J. (1982), Evolution and the Theory of Games, Cambridge
University Press.
•
Nachbar, J. H. (1990), "Evolutionary selection in dynamic games,"
International Journal of Game Theory 19, pp. 59-90.
•
Sanditov, B. (2006), "Essays on Social Learning and Imitation," Ph.D. thesis,
Maastrictht University.
•
Sanchez Carrera, E. (2012), “Imitation and evolutionary stability of poverty
traps,” Journal of Bioeconomics 14, pp. 1-20.
•
Schlag, K. H. (1998), "Why Imitate, and if so, How?" A Boundedly Rational
Approach to Multi-Armed Bandits", Journal of Economic Theory 78(1), pp.
33
130-156.
•
Schlag, K. H. (1999), "Which One Should I Imitate", Journal of
Mathematical Economics 31(4), pp. 493-522.
•
Selten, R. (1975), "Reexamination of the Perfectness Concept for
Equilibrium Points in Extensive Games," International Journal of Game
Theory 4(1), pp. 25-55.
•
Selten, R. (1980), "A note on evolutionarily stable strategies in asymmetrical
animal conflicts," Journal of Theoretical Biology 84, pp. 93-101.
•
Taylor, P.D. and L.B. Jonker, (1978), "Evolutionary Stable Strategies and
Game Dynamics", Math. Biosci., 40, pp. 145-156.
•
Van Dame, E. (1991) Stability and Perfectin of Nash Equilibrium SpringerVerlag.
•
Vega-Redondo, F. (1996), Evolution, Games, and Economic Behavior,
Oxford University Press.
•
Vega-Redondo,
F.
(1997),
"The
evolution
of
Walrasian
behavior,"
Econometrica 65, pp. 375--384.
•
Weibull, W. J. (1995), Evolutionary Game Theory, The Mit Press.
•
Zeeman, A. C. (1992), "Population Dynamics from Game Theory", in Z.
Nitecki and C. Robinson, eds., Global Theory of Dynamical Systems, pp.
471-497. Springer-Verlag. Lecture Notes in Mathematics 819.
34
Descargar