Imitación y Juegos Evolutivos en Economía* Imitation and Evolutionary Games in Economics Elvio Accinelli Edgar J. Sánchez Carrera Facultad de Economía de la UASLP. Av. Pintores S/N Fraccionamiento Burócratas del Estado, CP 78263. San Luis Potosí, SLP, México. Tel. oficina (52-444) 8131238 ext. 120. E-mails: elvio.accinell@eco.uaslp.mx, edgar.carrera@uaslp.mx www.econ-pol.unisi.it/carrera Recibido el 6 de marzo de 2012. Aceptado el 22 de mayo de 2012. Resumen El presente es un artículo de divulgación científica basado en Sanchez Carrera (2012), Accinelli y Carrera (2011a,b), donde se argumenta que los agentes económicos optan por imitar el comportamiento de sus pares más exitosos. Se muestra que bajo estas condiciones la evolución económica, dependerá de las reglas de imitación seguidas, así como de qué y a quién se imita con mayor probabilidad. Esto dependerá de las condiciones iniciales existentes en el momento en que los agentes deben decidir, y de acuerdo a lo dicho anteriormente, sobre estas condiciones, es que debe influir la política económica. Se concluye que la intervención de un planificador central es crucial para corregir situaciones iniciales, dado que las mismas determinan las estrategias estables. Abstract Following Sanchez Carrera (2012) and Accinelli & Carrera (2011a,b), we argue that agents without enough information to determine the expected value of their strategic actions, then they choose to imitate the behavior of their peers. Under these conditions, economic developments will depend on the imitation rules followed and what and who are most likely mimics. This will depend on the initial conditions existing at the time the agents must decide, and hence it should influence economic policy. We conclude that * Agradecimientos. A Vicente German-Soto por su estimulación y apoyo. Al dictaminador anónimo por sus comentarios tan útiles para mejorar la comprensión del texto. Por supuesto, cualquier error que prevalece es debido a la testarudez de los autores que toman completa responsabilidad. 1 policy maker’s intervention is crucial to arrange the initial state of the economy. Keywords: Dinámica del replicador; Imitación y Racionalidad; Teoría de Juegos Evolutivos; Trampas de pobreza; Valor umbral. JEL classification: C70; C72; C73; I30; O10; O40. 2 1 Introducción La teoría de juegos se ha desarrollado como un instrumento para entender el conflicto y sus posibles soluciones. Ciertamente no es tanto predictiva como normativa. Explica más como deberían ser o pueden ser las soluciones a los conflictos que como son o serán realmente. Recordemos que la teoría de juegos es básicamente una teoría que se basa en la racionalidad. Esto es, describe el comportamiento de individuos que eligen estrategias, elaboran planes buscando maximizar el resultado obtenido al resolverse el conflicto. Por una parte la elección estratégica racional, es el concepto central de la teoría de juegos y para ser racional, debe tener en cuenta no sólo, lo que cada uno quiere lograr, sino también lo que puede lograr dado que la acción de los otros lo limita. No hay maldad ni bondad preestablecida, no se busca en principio castigar o premiar al otro u otros, sino tomar la mejor opción independientemente del efecto que esto pueda tener sobre los demás individuos, a no ser que beneficiar o perjudicar a alguien sea parte del objetivo buscado, o sea parte de la solución. Por otra parte, en teoría de juegos, la racionalidad supone que cada uno de los participantes del conflicto, sabe que los demás saben que él sabe que todos buscan lo mejor sabiendo que los demás hacen lo mismo. Yo sé que tú sabes, que yo sé que tú sabes; repetido hasta el infinito y actuar tomado esto en consideración, es ser racional. Si la cadena se rompe, la racionalidad se ve limitada en principio. ¿Cómo entonces una teoría basada en la racionalidad de los individuos participantes, en castigos y premios posibles, en alianzas estratégicas, etc., puede transportarse a conflictos que enfrentan a individuos no racionales? Ciertamente esto no tiene en principio una respuesta trivial. Si bien podemos aceptar que la naturaleza resuelve la evolución mediante el conflicto, no parece claro que fuera un conflicto entre individuos que operan en la forma supuesta por la teoría de juegos. No obstante la teoría de los juegos evolutivos es una 3 teoría que básicamente pretende explicar el conflicto en el mundo animal y natural. ¿Cómo logra traducir estas reglas racionales a conflictos de individuos que actúan en principio de otra forma? En teoría de juegos evolutivos, el concepto de racionalidad es suplantado por el de la selección natural. Los individuos actúan en el mundo natural respondiendo directamente a su código genético, no eligen, al menos no en el sentido de elegir de acuerdo a un plan en el que se prevén resultados posibles. Se supone que los individuos (animales o vegetales) disponen de un plan preestablecido (genotípicamente), entre todas aquellas posibilidades triunfan, es decir se reproducen con mayor facilidad aquellos, cuyo código genético les impone actuar de determinada forma y no de otra. Es decir, el individuo que obtiene una solución maximizadora es aquel que es capaz de trasmitir su código genético a un mayor número de descendientes. Mientras que el individuo racional elige entre diversos planes posibles; los individuos pueden representar determinados planes posibles, determinadas estrategias que cada uno sigue imperiosamente, y solamente triunfan entre éstos, aquellos individuos cuyo código genético les permite la respuesta más adecuada para sobrevivir y reproducirse. En tanto que una supervivencia prolongada implica mayor número de posibles descendientes, estos dos conceptos son equivalentes en el sentido de la preservación de la especie. Individuos mas longevos tienen mayor probabilidad de tener descendientes, en este sentido podemos decir que una estrategia que permita a un individuo una vida más larga es también una estrategia que le permitirá un mayor número de descendientes. Esta es la respuesta maximizadora, es decir aquella que permite al individuo que se comporta acorde a ella, o que es portador del genotipo que a tal conducta obliga, vivir más tiempo o tener más descendientes, es decir ser mas exitoso. De esta forma, el objetivo del juego es tener descendencia, preservar la especie o sobrevivir. La estrategia mejor, está definida por la presión natural, en el sentido de que el individuo más exitoso será aquel que siga un comportamiento de mejor adaptación, todos los individuos se ven igualmente presionados, y del 4 comportamiento de cada uno dependerá el éxito propio. Es la selección natural la fuerza encargada de “maximizar”, es decir de elegir aquella conducta más exitosa, en el sentido de la preservación de la especie, la que en definitiva prevalecerá en las generaciones futuras. La sección 2 de este artículo explicará de manera más formal el concepto de racionalidad en la teoría de juegos evolutivos. Además de la divulgación científica, como propósito, este trabajo muestra que la teoría de juegos evolutivos es una herramienta adecuada, alternativa y moderna para analizar la evolución de un sistema económico social donde los agentes económicos se comportan de acuerdo al aprendizaje por imitación, y la economía evoluciona por los principios de la selección natural de aquellos agentes más exitosos. En particular, son las posibles sendas de crecimiento económico, las que en última instancia, como un resultado de conductas individuales de los agentes económicos darán la dirección de la economía. Sabemos que el camino por el cual la economía transita (como sistema) es el resultado de la acción de diferentes individuos o grupos con objetivos y comportamientos diversos, que interactúan en un mismo lugar y tiempo. Como resultado de esta interacción social, propia de cada economía o país, se concretarán solo aquellas sendas de crecimiento económico, basadas en estrategias evolutivamente estables seguidas por los agentes económicos, quienes eligen bajo la presión de condiciones iniciales determinadas y propias de cada país o economía en particular (véase Accinelli, Brida and Carrera, 2009; Accinelli et al., 2010; Accinelli & Carrera, 2011a 2011b; Sanchez Carrera, 2012). Por tanto, el objetivo primordial es dar una revisión bibliográfica y una difusión de conceptos básicos de una teoría novedosa, que puede aplicarse de manera exitosa para el estudio de los fenómenos económicos como las trampas de pobreza (Sanchez Carrera, 2012). Consideramos que en situaciones de información imperfecta, la imitación por parte de los agentes económicos racionales, de aquellas conductas consideradas las más exitosas, se transforma en una de las claves para entender la evolución futura de una determinada economía. Según que, y a 5 quienes se imite, la economía evolucionará por una senda de alto crecimiento hacia un estado estacionario Pareto superior, o hacia un estado estacionario bajo. Es de notar que extendemos el concepto de comportamiento racional, a aquel que bajo información imperfecta, supone la imitación del comportamiento considerado, por el individuo que debe elegir su comportamiento futuro, como el más exitoso. El éxito de las diferentes conductas seguidas por los agentes económicos dependerá de las condiciones iniciales existentes. Estas determinan cuál es la conducta que con mayor probabilidad, en un momento determinado, los agentes económicos imitarán. Por tanto, el éxito de conductas que tiendan al perfeccionamiento del capital humano o de la inversión en investigación y desarrollo, dependerá de condiciones económicas subyacentes, bien determinadas, imperantes en la economía, en el momento en que la elección se lleva a cabo (ver Accinelli-Carrera 2011a, b). La acción del planificador central es considerada en el trabajo mencionado, como un elemento determinante para definir las condiciones iniciales que hacen que el comportamiento individualmente racional de los agentes económicos sea consistente con la evolución de la economía por una senda de alto desempeño social. Precisamente es la imitación del más exitoso, el que define el tipo de crecimiento o senda (ruta) de la economía, por lo que el punto está en crear aquellas condiciones que hagan que el más exitoso, sea el individuo que se capacita (mayor educación con calidad), o el empresario que invierte en desarrollo e investigación. El proceso que permite el crecimiento de estos grupos se retroalimente, unos precisan de los otros para desarrollarse. Trabajadores y empresarios imitarán el comportamiento de aquellos individuos, que resultan más exitosos, o al menos entiendan, dada la información disponible. Al aumentar el beneficio esperado de la educación, esto hará que los trabajadores no especializados aumenten la frecuencia con que se pregunten si deben cambiar o no de actitud, así como la frecuencia con que 6 obtienen una respuesta afirmativa, análogamente los empresarios. El resto del presente trabajo se desarrolla de la siguiente forma. En la siguiente sección 2, nos referimos al concepto de juegos evolutivos y sus posibilidades para explicar el crecimiento económico. Introduciremos la dinámica del replicador, como sustrato matemático para explicar la dinámica económica en el marco de la teoría del crecimiento a partir de conceptos microeconómicos, agentes maximizadores de beneficios y firmas que interactúan. En la sección 3 se analiza la dinámica por imitación y su posibilidad de modelarla a partir de la dinámica del replicador, esto es el centro de este trabajo, ya que es el que muestra la posibilidad de describir las trampas de pobreza como resultado de la acción de agentes racionales, en un marco de incertidumbre, que concluye en un resultado socialmente bajo, aunque pueda ser individualmente maximizador. Finalmente se ofrecen consideraciones generales sobre los principales resultados del análisis. 2 Juegos Evolutivos Referencias básicas sobre la teoría de juegos evolutivos son los siguientes libros: Gintis (2009), Hofbauer & Sigmund (2002), Vega-Redondo (1996) y Weibull (1995). La teoría de juegos no-cooperativos es ya una herramienta estándar para la modelación de conflictos entre agentes económicos racionales, donde el equilibrio de Nash ( NE ) es la piedra angular como predicción y resultado del juego. En un equilibrio de Nash la estrategia de cada jugador maximiza sus beneficios dadas las estrategias adoptadas por los otros jugadores. Ningún jugador, por lo tanto, tiene un incentivo para desviarse (unilateralmente) del resultado de Nash, ya que es la mejor situación para cada jugador y para el propio grupo. Sin embargo en muchas situaciones, el equilibrio de Nash no es único, esto a dado lugar a múltiples refinamientos del concepto de NE , ver por 7 ejemplo E. Van Damme (1996). Un refinamiento clave del concepto de equilibrio de Nash, en la teoría de juegos evolutivos, es la noción de "estrategia evolutivamente estable" ( ESS por sus siglas en ingles: evolutionarily stable strategy). El concepto fue concebido por Maynard Smith y Price (1973), véase también Maynard Smith (1972, 1974). El concepto se refiere fundamentalmente a la permanencia intergeneracional de cierto comportamiento en una población de individuos, (originariamente bacterias). Una ESS representa un comportamiento poblacional, que se trasmite de generación en generación y que es capaz de contrarrestar la aparición de comportamientos mutantes. Rigurosamente se trata de un comportamiento estable frente a mutaciones y que es a su vez, asintóticamente estable con respecto a la llamada dinámica del replicador. Este último resultado muestra que el comportamiento racional no es necesario para obtener un equilibrio estable. El comportamiento heredado por una población de individuos y que es capaz de trasmitirlo, puede representar una ESS cuando su desempeño es más exitoso que el de los posibles comportamientos mutantes. Esto es independiente de toda consideración sobre el desarrollo de la población hacia niveles superiores. En tanto que el comportamiento asegure a cada individuo de la población un desempeño elevado, estos mantendrán su comportamiento y sus características como especie o población. Naturalmente este éxito individual, esta soportado en las condiciones iniciales existentes, de modificarse estas suficientemente, el comportamiento mutante puede ser mas exitoso. Los juegos evolutivos toman en cuenta: i) un proceso de selección que favorece a algunas especies o poblaciones sobre las demás, y ii) un proceso que crea esta especie, llamada el proceso de mutación. En la teoría de juegos evolutivos, las variedades en cuestión se representan por comportamientos diferentes, y dentro de una población hay diferentes tipos de comportamientos posibles donde aquellos más exitosos tienden a hacerse más frecuentes, no obstante pueden convivir dentro de una especie 8 individuos con diferentes comportamientos. En términos de la teoría de juegos, son comportamientos las estrategias puras que un jugador puede elegir. En la naturaleza, el mecanismo de selección de base es la supervivencia y la reproducción biológica, y el proceso de mutación es básicamente una genética. En la economía el éxito se mide, ya no por la cantidad de descendientes, sino por beneficios y utilidades, la mutación es la experimentación de los agentes económicos, sus externalidades y sus errores que dan lugar a un proceso de aprendizaje. Así, el punto de partida en un modelo evolutivo, aplicado a modelos económicos, es la creencia de que la gente no siempre actúa de manera perfectamente racional. Las estrategias, más que surgir como resultado de un proceso de razonamiento perfectamente racional, en el que cada jugador resuelve el juego, a partir del supuesto de conocimiento común, surgen de un proceso de ensayo y error de aprendizaje, en el que los jugadores encuentran que algunas estrategias funcionan mejor que otras, proceso este en el que la imitación juega un papel importante. La toma de decisiones individuales, si bien afectada por la sociedad o el entorno en el que los agentes económicos se desempeñan, en principio atiende a objetivos propiamente individuales, que pueden o no coincidir con el interés social. Al adoptar este enfoque, la teoría de juegos evolutivos supone que el comportamiento de los agentes aun en el caso de no ser perfectamente racional, puede llevar a un resultado ''perfectamente racional'' en equilibrio, o contrariamente, decisiones perfectamente racionales, desde el punto de vista individual, pueden dar lugar análogamente al hecho de que no es la especie mas evolucionada la que sobrevive, sino la que mejor que se adapta, a un comportamiento social pobre. 2.1 El juego poblacional y la dinámica del replicador Describiremos lo que significa un juego poblacional, pero primero permítanos recordar algunas nociones básicas de los juegos en forma normal o estratégica. Sea I = {1, 2,...n} el conjunto de jugadores, para cada jugador i ∈ I 9 sea S i su conjunto (finito) de acciones disponibles. La elección determinística de una acción si ∈ S i por un jugador i ∈ I , es llamada una estrategia pura para i . Un vector s = ( s1 ,..., s n ) ∈ ×i∈I S i , donde si ∈ S i es la estrategia pura adoptada por i ∈ I , es llamado un perfil de estrategias puras o una configuración. El espacio de todos los perfiles de estrategias puras en el juego es el producto cartesiano S = ×i∈I S i del conjunto de acciones de los jugadores (usualmente llamado el espacio de configuraciones). Para cualquier configuración s ∈ S y cualquier jugador i, el número real π i (s ) indica el beneficio, pago o utilidad correspondiente a la estrategia si ∈ S i del i − ésimo jugador dada la configuración s ∈ S. Así la función πi : S → R define la función de pagos para cada jugador. El vector, π ( s ) = (π 1 ( s )),.... p n ( s )) corresponde a los pagos recibidos por los diferentes jugadores, cuando se adopta el perfil s. Definición 1. Un juego estratégico se describe por la lista Γ = ( I , S , π ) donde I es el conjunto de jugadores, S es su espacio de configuraciones y π el vector de funciones de pagos de los jugadores. Una estrategia mixta para cada jugador i∈I es una distribución de probabilidad sobre el conjunto de acciones o estrategias puras Si . Representamos el conjunto de estrategias mixtas por ∆nii −1 esto es el simplex ni − 1 dimensional. Este conjunto está formado por todas las distribuciones de probabilidad sobre el conjunto de estrategias puras, siendo cada uno representada por un vector xi = ( xi1 ,..., ximi ), donde mi =| S i |, mientras xi (s j ) (a veces para abreviar usaremos la notación xij ) representa la probabilidad de que el i − ésimo jugador utilice la j − ésima estrategia pura. Una estrategia pura es una distribución de probabilidades concentrada. Estrategias puras son 10 sólo casos extremos de estrategias mixtas con probabilidad uno y el resto cero. Estas pueden ser representadas por los vectores canónicos e ij = (0,...,1,...0) cuyas coordenadas son todas nulas con excepción de la j − ésima que vale 1, indicando que es esta la estrategia que el jugador i esta siguiendo. Definición 2. Un perfil de estrategias mixtas es un vector distribuciones de probabilidad, es decir ( ∆ = ×i∈I ∆mii −1 ) m ∀i ∈ I , x = ( x1 ,..., xn ) de xi ∈ ∆mii −1 . Denotamos por el producto cartesiano de los conjuntos de estrategias mixtas de todos los jugadores. Llamamos a este conjunto, espacio de estrategias mixtas. Escribimos como ( x i , y −i ) el perfil estratégico en el cual el jugador i ∈ I juega la estrategia xi ∈ ∆ i y todos los otros juegan de acuerdo al perfil y ∈ ∆ . Los pagos del jugador i ∈ I asociados con el perfil de estrategias mixtas x están dados por el pago esperado: ui ( x ) = ∑ x( s ) pi (s ), s∈S donde x(s ) = ×in=1 xisi es el producto de probabilidades asignado por cada estrategia mixta del jugador xi ∈ ∆mii −1 a la estrategia pura s i ∈ S . El juego Γ = (I , S ,π ) se extiende considerando estrategias mixtas y pagos esperados, como ϒ = (I , ∆, u ). 2.2 Estado o perfil poblacional y ESS La teoría de juegos evolutivos considera poblaciones de agentes tomadores de decisiones. Cada individuo o agente, puede elegir actuar en cada momento de acuerdo a uno de los comportamientos posibles para su población. Consideraremos a cada población como un jugador, que sigue un comportamiento mixto, donde la estrategia mixta seguida por la población, corresponde a una distribución de los individuos sobre el conjunto de 11 estrategias puras. La elección estratégica divide a cada una de las poblaciones en subconjuntos de individuos caracterizados por la estrategia adoptada. Estos subgrupos o subpoblaciones, pueden denominarse clubes. La adherencia de un individuo a un club u otro se determina por la estrategia o comportamiento adoptado. Cada individuo podrá pertenecer a más de un club, representando una estrategia mixta la probabilidad de encontrar a un individuo determinado en un club dado, o bien el porcentaje de individuos que adhieren a uno u otro club. Ambas caracterizaciones dan los mismos resultados, si consideramos el comportamiento del individuo promedio en cada población. Ambas representan la probabilidad de encontrar un individuo de la población, siguiendo una estrategia determinada en un momento determinado. i ∈= {1, 2,..., n} Formalmente, si por Si 1, . . . m i representamos a cada población, y por al conjunto de comportamientos posibles, o estrategias puras, para cada población, mi corresponde a la cantidad de comportamientos posibles para la población i − ésima, por lo que mi =| S i |=# S i . El conjunto de estrategias mixtas será entonces, el conjunto de distribuciones posibles de los individuos de cada población sobre xi = ( xi1..., ximi ). De esta forma xij (t ), Si y lo representaremos por representa la probabilidad de que, el individuo típico de la i − ésima población siga, en un momento t , el j − ésimo comportamiento posible, por lo que xi (t ) ∈ ∆mii −1 siendo: ∆mii −1 = xi ∈ R+ni : ni ∑x ij j =1 = 1 el simplex mi −1 − dimensional. Definición 3. Equivalentemente, xij (t ) representa el porcentaje de individuos, dentro de la i − ésima población, que siguen en el momento comportamiento j , o que están afiliados al j − ésimo club. 12 t el Consideremos que la economía la forman un conjunto finito de poblaciones I = {1,..., n}, las que a su vez, se dividen, en una cantidad finita de subpoblaciones, las que corresponden al comportamiento seguido por los individuos, es decir, Pij será la subpoblación de los individuos que siguen el comportamiento j ∈ S i dentro de la población i ∈ I . Si por π i : S i × S −i → R correspondiente a la representamos la i − ésima población, siendo representar un juego, o una economía, por función de beneficios S −i = × j =/i S j , podemos Γ = ( I , S i , π i ) , donde I = 1,..., n representa a los jugadores, o poblaciones y S i el espacio de estrategias puras posibles para cada población. Definición 4. Un estado poblacional o perfil poblacional en un instante t del juego o de la economía {x1 (t ),..., xm (t )} Γ , se representa por un vector de distribuciones donde cada xi (t ) ∈ ∆mii −1 , ∀i ∈{1,..., n} En lo siguiente asumiremos siempre que las poblaciones son constantes, así no aparecen problemas derivados por consideraciones demográficas. Además asumiremos que todas las poblaciones son del mismo tamaño. En lo que sigue utilizaremos la notación: • s −i o x −i para representar las estrategias puras o mixtas, seguidas por todos los jugadores que no son i . • n −1 S −i = × j =/i S j y ∆ −i = × j =/i ∆ jj . Hay dos tipos de modelado de juegos poblacionales: 1) Juegos en contra del campo. Estos juegos tienen las siguientes características: i) no hay un oponente específico para un agente dado, y ii) los pagos dependen de lo que todos en la población están haciendo. 13 2) Juego por emparejamiento. Describe las situaciones en que un determinado agente juega contra oponentes que han sido seleccionado al azar (por naturaleza) entre las otras poblaciones. Juegos en contra del campo Consideremos una economía con n poblaciones, para simplificar la notación consideremos que cada población se divide en m subpoblaciones. El estado de la economía, en un momento dado, representado por un vector de x ∈ (∆m−1 ) n . distribuciones Supongamos i∈I perteneciente a una cierta población, que un agente económico (firmas, trabajadores, científicos, estudiantes, etc.) puede elegir entre un conjunto S de estrategias puras, adopta una estrategia xi ∈ ∆m −1 . Por xi (s ) representaremos la probabilidad de que el individuo se comporte de acuerdo a la estrategia pura s ∈ S i . Su pago esperado será denotado por: π i (xi , x ) = ∑ xi ( s )π ( s, x). s∈S Este pago esperado, representa el éxito esperado de la estrategia adoptada, la que puede ser medidos en términos de utilidad esperada, beneficios esperados, o en el caso de poblaciones animales la esperanza de sobrevida, cuando el individuo sigue el comportamiento σ y se enfrenta a individuos que se comportan de acuerdo a x. Estamos interesados en la conducta individual que maximice el pago esperado para cada agente dado el campo vectorial x . Es decir, una condición necesaria para la estabilidad evolutiva es σ ∗ ∈ arg max π (σ , x ∗ ). σ ∈∆ Así, un vector x ∗ es un equilibrio, si la distribución xi∗ correspondiente a la población promedio, I − ésima corresponde a una mejor respuesta del comportamiento al estado poblacional, x∗. Es decir si π i ( xi∗ , x ∗ ) ≥ π i ( xi , x ∗ )∀xi ∈ ∆mi −1 , y ∀i ∈ I . i Equivalentemente un estado poblacional será un equilibrio, si corresponde a un 14 perfil estratégico tal que, cada estrategia seguida por el jugador promedio dentro de cada población, maximiza el retorno esperado dado el estado poblacional. Obsérvese que, en tanto que cada jugador de cada población elige aquella estrategia que maximiza su retorno esperado, dado que, las diferentes x, poblaciones se distribuyen de acuerdo al vector entonces todos los individuos de una población determinada optarán por la misma estrategia. Es en definitiva, el comportamiento individual el que acaba definiendo el comportamiento de la economía. Este comportamiento corresponde al equilibrio de Nash. La condición de estabilidad es de gran importancia, en tanto que ella determina si un determinado equilibrio es o no observable. Considere un perfil estratégico x∗ tal que la distribución xi∗ dentro de cada población corresponde a una estrategia maximizadora contra el campo x∗. Ahora, suponga que una mutación ocurre y el campo se modifica, pasando a ser xε . Entendemos por mutación, un cambio en el comportamiento de algunos individuos, respecto al seguido en x ∗ que afecta solo a una parte relativamente pequeña de ellos. Después de que la mutación ocurre, nos encontraremos ante un nuevo perfil de distribuciones, el cual será denotado por xε . Sólo consideraremos en principio mutaciones que no afecten mas que a un grupo pequeño de individuos, de forma tal que | xε − x |< ε . Definición 5. Diremos que una estrategia xi∗ es evolutivamente estable contra el campo x ∗ si verifica: 1) π i ( xi∗ , x ∗ ) ≥ π i ( xi , x), ∀ xi ∈ ∆mi −1 ∀i ∈ I y si a la vez se verifica la condición de estabilidad: 2) Existe ε >0 tal que π i ( xi∗ , xε ) ≥ π i ( xi , xε ), ∀ x i ∈ ∆mi−1 y ∀ 0 < ε < εˆ , verificándose la desigualdad estricta para al menos un i ∈ I . 15 xi∗ En otras palabras es una ESS contra el campo, si continua siendo maximizadora del valor esperado de los individuos de la población i − ésima aun, luego de que una mutación (no muy grande) en el comportamiento de la economía, ocurre. En algunos casos consideraremos como determinadas las distribuciones correspondientes a todas las poblaciones menos una, y nos ocuparemos de encontrar la estrategia maximizadora de esta población actuando contra x i . Es decir buscaremos aquella estrategia mixta xi∗ de la población i − ésima tal que π i ( y ∗ i , x−i ) ≥ π i ( yi , x−i ) ∀yi ∈ ∆mii −1 y que verifique la condición de estabilidad frente a mutaciones de x −i . Diremos entonces que la estrategia y i∗ seguida por la i ésima población es ESS contra el campo determinado por x i . Por otro lado, un juego por emparejamiento describe una situación en la cual un cierto agente juega contra oponentes que son seleccionados aleatoriamente entre los individuos de cada población y para lo cual los pagos dependen únicamente de las estrategias seguidas por cada uno de ellos. Entonces, el valor esperado asociado a una distribución o estrategia mixta xi ∈ ∆mi−1 cuando el estado poblacional es x quedará definido por: π i (xi , x ) = π i ( xi , x −i ) = ∑ xi ( s i ) x −i ( s −i )π (si , s −i ). s∈S donde el vector s de estrategias puras se escribe como s = ( si , s −i ) ∈ S i × S −i , mientras que el perfil x = ( xi , x−i ) ∈ ∆mi −1 × ∆ −i . Consecuentemente x −i ( s −i ) p ( s i , s −i ) = Π j =/i x j ( s j ) p ( si , s j ). A los efectos de no desviar la atención consideremos que dentro de cada población existen m conductas posibles de ser elegidas por cada agente, S i = ( si1 ,..., sim ), una proporción xij de los agentes en la población i adoptan la conducta s j a ellos los llamaremos j − estrategas, de forma tal que una estrategia mixta, corresponde a una distribución porcentual de los individuos de 16 cada población en clubes. Supongamos una economía en la que cada población actúa de acuerdo a un perfil estratégico x. Diremos que el comportamiento poblacional muta, si algunos de los individuos cambian de manera inesperada su comportamiento. Llamaremos al perfil posterior a la mutación perfil mutante y será representado por xε . Supondremos que estas mutaciones no afectan muchos individuos por lo que | x − xε |< ε . definiremos a continuación estrategias evolutivamente estables ( EES . Definición 6. Una estrategia x ∗ es ESS para un juego de emparejamiento de n poblaciones, si y sólo si ∀ xi ≠ xi∗ se tiene que: ( ) ( ) 1) La condición de equilibrio, π i xi∗ , x−∗i ≥ π i xi , x−∗i ∀i ∈ I y además se verifica la siguiente condición de estabilidad: 2) Para toda y∈∆ estrategia π i (xi∗ , x−iε ) ≥ pi ( yi , x−iε ) ∀ 0 < ε ≤ ε y siendo εy existe xε = εy + (1 − ε ) x tal que el perfil pos- mutación, con estricta desigualdad para al menos una población i ∈ I . La condición de estabilidad indica que para ser ESS una estrategia x = ( x1 ,..., xn ) debe verificar que, para cada población i ∈ I , la estrategia mixta correspondiente, definida por x debe continuar siendo una mejor respuesta cuando una mutación ocurre en el perfil poblacional. Más aun el desempeño correspondiente a alguna de las estrategias mixtas xi , existentes antes de que la mutación ocurriera, debe ser mejor que el de la mutante correspondiente yi . Una gran parte de la literatura de juegos evolutivos, fundamentalmente aplicados a la biología, se basa en los llamados juegos simétricos, los que se refieren a individuos que se aparean con otros individuos de su propia 17 población. El éxito de cada tipo de comportamiento (determinado genéticamente) depende del número de descendientes que el portador del tipo genético determinado es capaz de alcanzar y por lo tanto la capacidad de trasmisión de los genes que determinan tal comportamiento. en este caso, las fuerzas de la naturaleza seleccionan el comportamiento s ∗ ∈ S si dado que la población se distribuye de acuerdo al vector de probabilidades x el número de descendientes del individuo que sigue este comportamiento u i ( s ∗ , x) es mayor o igual que el que obtendría siguiendo cualquier otro tipo de comportamiento, o estrategia pura, esto es u i ( s ∗ , x) ≥ u i ( s, x) ∀s ∈ S . Sin embargo en economía los juegos anti-simétricos son mas frecuentes, pues es resultado económico depende de los comportamientos seguidos por diferentes poblaciones, firmas y trabajadores por ejemplo, compradores y vendedores, etc. En lo que sigue nos dedicaremos a analizar juegos asimétricos de dos poblaciones. Consideremos dos poblaciones polimórficas, esto es poblaciones compuestas por individuos que siguen diferentes comportamientos. Dichas poblaciones serán representadas por el índice τ ∈ {1, 2}. Estas poblaciones se dividen a su vez en subpoblaciones, cada individuo pertenece en un instante t a una y sólo una de estas subpoblaciones. Intuitivamente, decimos que x es una ESS si y sólo si después de darse una mutación en alguna población τ , cada xi continua siendo una mejor respuesta a la distribución poblacional, post-mutación w . A partir de la definición se concluye que una ESS de un juego asimétrico debe ser un equilibrio de Nash estricto. 2.3 La dinámica del replicador La dinámica del replicador ( RD ) modela explícitamente un proceso de selección, especificando como un perfil poblacional, evoluciona en el tiempo. La formulación matemática de la dinámica del replicador se debe a Taylor y Jonker 18 (1978). En el caso en el que se consideran poblaciones animales, la utilidad asociada a una determinada estrategia, que en estos casos esta determinada genéticamente corresponde a capacidad de adaptación, sobrevida o número de descendientes del portador de los genes que determinan la conducta observada. En definitiva mas descendientes tendrán aquellos individuos mejor adaptados o con esperanzas de sobrevida mayor, por lo que en definitiva es este número el que determina la eficiencia evolutiva de una determinada composición genética. La tasa de crecimiento de la fracción poblacional que adopta una estrategia pura i es igual a la diferencia entre el número esperado de descendientes de los individuos que manifiestan una determinada conducta menos el pago promedio que hay en la población. En otras palabras, la proporción (fracción) de agentes que adoptan la estrategia s i crece (decrece) si su pago es mayor (menor) que el pago promedio dado en la población. En términos matemáticos, esto puede expresarse mediante el sistema dinámico: x&i = [π ( si , x) − π ( x, x)] xi . Que corresponde a individuos que sea aparean con individuos de su propia población. Las mejores respuestas al estado actual x , corresponden a aquellas estrategias que tienen la mayor tasa de crecimiento en la población, las segundas mejores respuestas tienen la segunda tasa de crecimiento más alta, y así sucesivamente. Aunque las estrategias puras más exitosas crecen más rápido que los de menos éxito, el pago promedio de la población no tiene porque crecer con el tiempo. La razón de esta posibilidad es que si un agente se sustituye por un agente con una mejor estrategia, entonces los opositores enfrentando a este nuevo agente pueden recibir pagos más bajos, lo cual no afectará el promedio. Como ya fue dicho en la teoría económica es más común enfrentarnos a juegos poblacionales asimétricos. En este caso analizaremos la evolución correspondiente a un juego de dos poblaciones diferentes. En forma similar al 19 caso de los juegos simétricos podemos plantear el sistema dinámico siguiente, para explicar la evolución porcentual de una determinada subpoblación de una población dada: m x֠i t xi t si , x t xj t sj , x t , # j 1 para cada estrategia xτ = ( x1τ ,...xmτ τ ) con poblaciones τ ∈ {1, 2}. Es natural pensar que los agentes económicos racionales, se guían por el comportamiento o estrategia que en cada momento suponga mayores beneficios esperados. Aseveración esta, que justifica la utilización de la dinámica del replicador en economía para explicar la evolución poblacional. Esta dinámica garantiza el incremento del porcentaje de individuos que siguen comportamientos cuyos beneficios esperados son mayores que el promedio. Este incremento supone la existencia de un proceso aprendizaje a lo largo del tiempo. Consecuentemente, se deduce del sistema definido por la dinámica del replicador que un estado poblacional x ∈ ∆ es estacionario si y sólo si, para cada población τ y cada estrategia pura siτ ∈ S τ τ ,τ ′ ∈ {1, 2}, τ ≠ τ ′, pago. Así, ∀i ∈ I , { ( ) en uso obtiene el mismo el conjunto común de estados } estacionarios es: ∆o := x ∈ ∆ : π τ siτ , xτ ′ = π ( x) . La relación entre el replicador ESS RD y las estrategias evolutivamente estables es que éstas son un punto asintóticamente estable de la dinámica del replicador, pero no todos los puntos asintóticamente estables tienen por qué ser una ESS . Zeeman (1992) muestra el siguiente resultado: Una ESS es un punto atractor en su correspondiente dinámica del replicador, pero no todo punto atractor de la dinámica del replicador corresponde a una ESS . Este resultado es formalmente probado por Zeeman (1992) y se demostró por 20 primera vez por Taylor y Jonker (1978) y está en Hofbauer et al. (1979) bajo el supuesto de que una ESS es regular, llegando a la conclusión de que la atracción es hiperbólica. 3. Aprendizaje por imitación Blackmore (1999) no sólo se refiere a la efectividad que la imitación tiene para el proceso de aprendizaje, sino también a la sofisticación requerida para considerar el momento de imitar. La imitación lejos de contradecir la racionalidad, es una manera a través de la cual se expresa. Para explicar la imitación como regla de conducta de los agentes económicos, podemos partir de que lo hacen de manera racional. La imitación racional puede ser explicada de la siguiente manera: Un agente, A, se dice que imita la conducta de otro agente, B, cuando las observaciones de la conducta de B afectan a A, de manera tal que la conducta subsiguiente de este se asemeja cada vez más a la conducta observada de B. Un agente puede decirse que actúa racionalmente cuando, enfrentado a una elección entre diferentes cursos comportamientos,, elige aquel que es mejor a sus intereses. En el momento de esta decisión tendrá en cuenta sus creencias acerca de las posibles consecuencias de tales acciones y los efectos que de estas acciones bajo las restricciones que imponen las acciones seguidas por el resto de los agentes económicos (para más detalles sobre teoría de la imitación, Sanditov, 2006). Durlauf (2001) muestra que la conducta por imitación se debe a: 1) Factores psicológicos, un deseo intrínseco de comportarse como los demás. 2) Interdependencia en las restricciones que los agentes enfrentan, esto es porque los costos de una conducta dada dependen de si los demás se comportan similarmente, o bien: 3) Interdependencia en la transmisión de la información, así que la conducta de otros altera la información acerca de los efectos de tales conductas disponibles a un agente dado. 21 En este trabajo consideramos la imitación como un proceso con las siguientes características: 1) Suponemos que en cada momento t con cierta probabilidad los individuos tienen el impulso de revisar su estrategia o conducta (pura) actual. Estos impulsos llegan de acuerdo a un proceso de Poisson, así la probabilidad de tener impulsos simultáneos de los agentes en la población es simplemente cero, y las probabilidades con que diferentes individuos se transforman en revisores de sus propias conductas, son independientes. Por lo que el proceso global es también un Proceso de Poisson, tal que la intensidad del proceso global es la suma de las intensidades de los procesos individuales. 2) Una vez que un agente es revisor, deberá decidir si cambia o no su conducta, y en caso de decidir cambiar, cuál elegir. 3) De esta forma el proceso de cambio de comportamiento de los diferentes agentes se compone de dos elementos básicos. El primero es una especificación la probabilidad con la cual los agentes de la población revisan su conducta actual. El segundo elemento es una especificación de la probabilidad de elección de cambio de conducta por parte de un agente revisor que debe elegir su comportamiento futuro. 4) Una posibilidad es que el revisor decida seguir la regla de la mayoría, o imitar el comportamiento de sus vecinos, o bien del primero con quien se encuentre. Björnerstedt y Weibull (1996) fueron de los primeros en estudiar este tipo de modelos de conducta por imitación, donde aquellos agentes revisores de su conducta deciden imitar a otros dentro de su población, y así mostraron que se puede llegar a una dinámica del tipo replicador bien estudiada por la teoría de juegos evolutivos. En particular, son bien conocidos los procesos de imitación por insatisfacción, esto es la frecuencia con que un individuo se transforma en revisor, disminuye con los resultados obtenidos. Es este un supuesto natural, que consideraremos en este trabajo. Además, si cada agente revisor selecciona su próxima estrategia o conducta por imitación de la mayoría, es coherente 22 considerar que este elegirá por ejemplo imitar la conducta seguida por el primero con el que se tope, pues la probabilidad de que el comportamiento del primer individuo con el que se encuentre sea el de la mayoría es la máxima. Avances teóricos para el desarrollo de la teoría de imitación han sido las aportaciones cruciales de Vega-Redondo (1997) y Schlag (1998, 1999).1 Así, la imitación define un proceso dinámico dentro de una población o conjunto de poblaciones, tal que una vez definidas las reglas de conducta (es decir cómo se imita) es pasible de ser modelado mediante un sistema de ecuaciones diferenciales, cuya solución determina la evolución futura de la economía o de las poblaciones que la definen, una vez que las distribuciones iniciales quedan determinadas. A medida que el tiempo transcurre los agentes, frecuentemente se preguntarán si la conducta por ellos seguida hasta el momento es o no la mejor posible. Cambiar de estrategia o de club es una posibilidad posterior a la realización de tal interrogante. Este proceso sigue una regla de conducta, la que a su vez define un sistema de ecuaciones diferenciales, que describe la evolución de la frecuencia relativa con la cual alguna estrategia pura ocurre en una población. Hay una ecuación diferencial para cada estrategia pura disponible para cada población y cada ecuación diferencial describe la evolución del porcentaje poblacional que adoptó tal estrategia pura, esto es el número 1 N y 1 i xiτ para todo n . Esta ecuación representa el flujo esperado neto de individuos hacia cada clase, subpoblación o club de estrategistas. Para cada población representamos el conjunto de perfiles de estrategias 1 Schlag (1998) analiza cuál es la regla de imitación que un agente debe seguir, cuando él tiene la oportunidad de imitar a los demás dentro de su conjunto poblacional pero está restringido por memoria e información. Schlag considera que si un agente desea una regla de aprendizaje por imitación que conduzca a la no disminución de beneficios esperados (en el tiempo) bajo todas las situaciones de estado estacionario, entonces tal agente debe (i) siempre imitar (no experimentar) al cambiar de estrategia, (ii) no imitar nunca a un agente cuyo beneficio esperado es menor que el suyo, e (iii) imitar a los agentes cuyos beneficios esperados son mejores que los suyos con una probabilidad que es proporcional a esta diferencia en beneficios. 23 como anteriormente, m mixtas por es la cardinalidad del conjunto de estrategias puras disponibles para al población 1, . . . , N . Definición 6. Una regla de conducta es un mapeo para la presente conducta agregada, en cada población τ = 1,..., N por el campo vectorial ϕτ : ∆ → R nτ ×nτ , a tasas de cambio condicionadas, definido como φτ ( x) = ( τ = r1τ ( x ) p11 ( x),..., r1τ ( x ) p1τnτ ( x),..., rnττ ( x ) pτnτ 1 ( x ),..., rnττ ( x ) pnτ τ nτ ( x ) siendo nτ el número de clubes diferentes, en la población τ. ) Los dos elementos básicos son: 1) La tasa de probabilidad riτ ( x ) de revisión con la que agentes evalúan su conducta presente. Esta tasa depende del performance de la estrategia pura del agente y de otros aspectos relacionados con el actual estado poblacional,2 x . 2) La probabilidad p ijτ (x) con la que un agente revisor i a j ≠ i . El vector de estas probabilidades es: estratega cambiará ( ) piτ ( x) = pi11 ( x),..., pikN ( x) , piτ ( x) ∈ ∆τ . Esta distribución depende del performance de la actual donde estrategia comparada con sus opuestas y otros aspectos como el actual estado poblacional, x . Como ya fue dicho podemos suponer que los tiempos de revisión de un agente son tiempos de llegada de un proceso de Poisson, con tasa riτ ( x). Si suponemos que el número de individuos en cada club es alto, y las probabilidades de que se pregunten si deben o no cambiar su estrategia 2 Esta es la conocida "tasa de conducta con inercia" (ver Bjornerstedt & Weibull, 1996; Weibull, 1995 y Schlag, 1998; 1999) que indica como un agente reconsidera su actual conducta o estrategia con una probabilidad r 0, 1 en cada periodo. 24 variables aleatorias independientes, resulta que podemos suponer que en agregado, a los largo de la población entera, tenemos un proceso de Poisson con tiempo de llegada xiτ riτ ( x) pijτ ( x). Luego por la ley de los grandes números, modelamos este proceso estocástico agregado como un flujo determinista: La salida de subpoblación o del club i es: x i r i x p ij x . # j i La entrada a la subpoblación o al club i es: x j r j x p ji x . # j i El flujo es la diferencia entre la entrada y salida y determina cuando la frecuencia con la cual observamos individuos siguiendo una estrategia dada, dentro de una población aumenta o disminuye. Agrupando términos, obtenemos: n x֠i n x j r j x p ji x i Donde riτ (x ) x i r i x p ij x . # i depende del beneficio actual del agente depende del estado poblacional, agentes. A su vez p ji (x) i que a su vez x , comprendiendo los diferentes tipos de depende de los beneficios comparados entre los agentes i y j . Lo análogo vale para el agente j . Así: • riτ ( x) ∈ [0,1] es una función decreciente de los beneficios esperados del agente i . Esto es, a mayores beneficios de i menor la probabilidad, riτ , de realización de la pregunta sobre la actual estrategia seguida. • pij ( x) ∈ [0,1] define la probabilidad con que un agente revisor decide cambiar su estrategia actual i por la 25 j − ésima. Es una función de la percepción individual de la diferencia de beneficios, probabilidad de que un agente que sigue la adoptar la estrategia π τj ( x) − π iτ . la i − ésima estrategia decida j − ésima será positiva, cuando la percepción del agente de esta diferencia, sea positiva. Es natural pensar que esta percepción dependa directamente de los verdaderos valores. Sera más ajustada a la realidad, cuanta más información el agente posea. El valor de p ijτ se modifica con el tiempo y el estado actual de la economía o población. El porcentaje de agentes está dado por xτj que naturalmente varía con el tiempo. Obsérvese que el sistema de ecuaciones que definen la evolución poblacional, es un sistema acoplado, este hecho dificulta su resolución analítica. Ante esto se presentan dos alternativas: i) buscar soluciones numéricas, o ii) realizar hipótesis significativas que permitan resolver el sistema de manera analítica. Esta segunda opción ha sido explorada en Accinelli, Brida & Carrera (2009) y Accinelli & Carrera (2011), mientras que la primera aproximación es parte de líneas actuales de investigación de los referidos autores. En el caso de existir incertidumbre sobre los beneficios esperados, cada revisor ( j =/ i ) ∈{c, nc} , debe elegir formas de estimarlos. Esta elección influirá directamente en la forma y complejidad del sistema dinámico que resume la evolución poblacional. Definición 7. Un agente económico i que es revisor, imitará a un estratega j con probabilidad p ijτ , igual a: ej , x P ej , ei, x j if 0 xj # 0 donde λ = |uτ ( e , x −τ ) +1uτ ( e , x −τ )| , ∀ i ej, x j if ej, x 0 − τ =/ τ ∈ {R, M } y i =/ j ∈ {c, nc} . 26 Por lo tanto la dinámica del replicador puede escribirse como: x֠i fj ej , x donde la función revisión de ei, x ( ) f iτ π iτ = riτ (x) xi xj fi ei , x ej, x xj xi # es simplemente la tasa de probabilidad de i − estratega. Consideramos tal función ser específica en pagos propios, así, la propensión de cambio de conducta es decreciente en el pago propio del agente i , esto es (ver Weibull, 1995): f iτ (π iτ ) = riτ ( x) = α τ − βτi π iτ , con α τ , β τ ≥ 0 y ατ βτ ≥ π iτ asegurando que f iτ (π iτ ) ∈ [0,1] . Así, con respecto al pago del i − estratega, π iτ si éste crece en promedio, su tasa de probabilidad de revisión, riτ ( x) = f iτ (π iτ ) , decrecerá. Para simplificar, etiquetemos la notación π τ (ei , x −τ ) = π iτ y u τ (e j , x −τ ) = π τj , entonces, podemos escribir: [ ] x&iτ = (1 − xiτ ) xiτ λ f jτ (π τj )u iτ − f iτ (π iτ )u τj . Por lo tanto, considerando la anterior regla de imitación, obtenemos el sistema de ecuaciones de la dinámica del replicador para agentes económicos impulsados por imitación, i.e.: x֠i xi 1 ☺ xi i j i j . # Tal sistema describe la dinámica del replicador como un proceso dinámico en el que sólo las estrategias más eficientes son replicadas. EL sistema todo i, j = 1, 2,..., mτ , con poblaciones τ , τ ′ ∈ {1, 2}, (x& τ i x&τj ′ ) para τ ≠ τ ′ , admite cinco estados estacionarios o equilibrios dinámicos, i.e. estados o perfiles poblacionales: (0, 0), (0,1), (1, 0), (1,1) y P = ( xc1 , xc2 ) 27 donde xc1 es el porcentaje umbral de aquellos agentes de la población 1 que c deciden imitar y adoptar la conducta (ej. cooperación); siendo x c2 el porcentaje umbral de aquellos agentes de la población 2 que deciden imitar y adoptar la conducta c . Note que, P = ( xc1 , xc2 ) es un equilibrio de Nash en estrategias mixtas interior al cuadrado C = [0,1] × [0,1] . La siguiente proposición resume las principales características de las posibilidades evolutivas, de una economía en la que los agentes económicos, imitan la conducta seguida por aquellos individuos que, dada la distribución poblacional y la información disponible, aparecen como los más exitosos. En este nuestro último caso, si las condiciones iníciales de la economía son tales que se está por encima del umbral, xi > P , entonces la cooperación se dará como conducta única y la economía evolucionará hacia una senda con equilibrio sostenido y de crecimiento. Caso contrario cuando el número de agentes económicos está por debajo del umbral, entonces estos agentes por imitación deciden no cooperar y la economía va encaminada a una trampa de pobreza con agentes no cooperativos, estado (0, 0) . Proposición 1 (Accinelli et al. (2010) y Sanchez Carrera (2012)). Cuando los agentes económicos revisores de su propia conducta, cambian de comportamiento o estrategia, de acuerdo con las normas de imitación de sus pares, dada la información disponible y el actual estado o perfil poblacional, como más exitosos, entonces: • Los equilibrios (0, 0) y (1,1) son atractores para el sistema dinámico replicador y por lo tanto definen perfiles estratégicos evolutivamente estables ( ESS ), que son respectivamente equilibrios de Nash: (0,1; 0,1) y (1, 0;1, 0) . • El equilibrio ( P = xc1 , xc2 ) define un valor umbral de agentes económicos cooperativos con el crecimiento sostenido, en el sentido de que si las 28 condiciones iniciales están por encima de tal umbral, la trayectoria como solución del sistema dinámico converge hacia el atractor alto (1,1), de crecimiento sostenido. Mientras que si los valores iniciales se encuentran por debajo de tal umbral, se convergirá hacia el atractor bajo, (0, 0) , de equilibrio no-cooperativo. La demostración generalizada de éste teorema se puede encontrar en Sanchez-Carrera (2012), y una aplicación para juego de firmas y trabajadores se encuentra en Accinelli et al. (2010). Por lo tanto, la imitación tiende entonces a replicar el comportamiento de la mayoría. Si se quiere modificar este proceso, deben cambiarse suficientemente las condiciones que hacen que tal comportamiento sea una mejor respuesta, para así tener una economía con crecimiento sostenido de largo plazo. Así, la economía puede converger a un equilibrio con nivel bajo aun basándose en elecciones racionales de los agentes, entendiendo por nivel bajo una situación en la que predominan los perfiles no deseables como la nocooperación. La economía requiere un número límite de agentes con perfil alto o deseable para librar la trampa de pobreza. El número de agentes económicos con nivel alto, inicialmente existentes, que permite a la economía seguir una senda de alto crecimiento, debe ser mayor al umbral P. 4. Comentarios finales Actualmente existen innumerables aplicaciones de la teoría de juegos evolutivos a la teoría económica y a la dinámica de poblaciones humanas. Estos modelos permiten conocer las posibles tendencias de la evolución en el comportamiento de poblaciones humanas con respecto, por ejemplo a su medio ambiente, y alertan sobre la fragilidad de determinados comportamientos deseables y la consecuente necesidad de crear leyes e incentivos para mantener conductas y/ o costumbres destinadas a desaparecer por la acción de 29 una dinámica inexorable. Cuáles son estas leyes, o cómo crearlas en principio no son temas de la teoría de juegos, aunque una vez definidas, su implementación pueda serlo. En conclusión, la teoría de juegos evolutivos nos ayuda a modelar como la racionalidad individual de los agentes económicos puede dar lugar a resultados socialmente eficientes o ineficientes, dependiendo de qué sea lo que con mayor probabilidad imitarán los individuos. Tal probabilidad depende de condiciones iniciales, que determinan cuál comportamiento individual es más exitoso en un momento determinado. A partir de fijadas las reglas de conducta, y establecido el sistema dinámico que las representa, las soluciones de este corresponderán a trayectorias posibles por las que evolucionará la economía. Las condiciones iníciales determinan por cuál de ellas la economía evolucionará. Esta trayectoria corresponde a una sucesión continua de distribuciones de probabilidad en el conjunto de los comportamientos posibles de los individuos de cada población, que evoluciona con el tiempo y que converge a atractores determinados por el sistema dinámico. La acción del planificador central, debe entonces dirigirse hacia la evaluación correcta de las condiciones iniciales imperantes, modificarlas si es necesario para quitar a la economía de la trampa de pobreza. Debe atenderse a que una mala evaluación de estas condiciones o el establecimiento de una política de incentivos incorrecta, puede agravar la situación existente, en la medida que puede hacer aparecer aun como mas exitoso, el comportamiento menos deseado socialmente. Se concluye entonces que cuando las condiciones iniciales no eran las deseables; la elección racional libre de los agentes económicos no es suficiente para salir de la cuenca de atracción de una trampa de pobreza, más aun, esta convergencia puede verse acelerada, precisamente por el comportamiento racional de los agentes económicos. Es aquí cuando es válida la intervención de un planificador central o hacedor de políticas económicas, ya que una vez identificadas las variables que determinan el umbral es entonces que se tienen que diseñar mecanismos para disminuir tal umbral con el objetivo de que las 30 condiciones iniciales de la economía se encuentre por encima del umbral y así los agentes económicos lleven a la economía a una senda de crecimiento sostenido. Note que una vez superado el umbral, la intervención del planificador debe necesariamente desaparecer. A partir de la superación de estos valores, la economía por sí sola, bajo la acción de sus propias leyes, y la racionalidad los agentes económicos, evolucionará por una senda de crecimiento económico alto y sostenido, alcanzando un estado estacionario de alto desempeño. La incapacidad para detectar estos valores umbrales y definir una correcta política económica, puede explicar por qué se observan índices tan dispares en el bienestar social de diferentes países, aún bajo la globalidad creciente de la economía actual. 31 Referencias • Accinelli, E. Brida, G. and Carrera, E. (2009), "Imitative Behavior in a Two Population Model," Annals of the International Society of Dynamic Games, vol. XI.. • Accinelli, E. and E. Sánchez Carrera (2010), Los fundamentos estratégicos de las trampas de pobreza PERSPECTIVAS Revista de Análisis de Economía, Comercio y Negocios Internacionales 4(1), pp. 3-43. • E. Accinelli, London S., Punzo L. and E. Sánchez Carrera (2010), “Dynamic Complementarities, Efficiency and Nash Equilibria for Populations of Firms and Workers”, Journal of Economics and Econometrics 53(1), pp. 90110. • Accinelli, E. and E. Sánchez Carrera (2011a), "The Evolutionary Game of Poverty Traps" Forthcoming in The Manchester School. DOI: 10.1111/j.1467-9957.2011.02262.x • Accinelli, E. and E. Sánchez Carrera (2011b), "Strategic complementarities between innovative firms and skilled workers: the poverty trap and the policymaker's intervention" Structural Change and Economic Dynamics 22(1), pp.30-40. • Apesteguia, J., S. Huck and J. Oechssler (2007), "Imitation-theory and experimental evidence," Journal of Economic Theory 136, pp. 217-235. • Axelrod, Robert (1984), The Evolution of Cooperation, New York: Basic Books, ISBN 0-465-02122-2. • Blackmore, S. (1999), The Meme Machine, Oxford; Oxford University Press. • Björnerstedt, J. and J.W. Weibull (1996), "Nash Equilibrium and evolution by imitation," The Rational Foundations of Economic Behaviour, Eds. K. Arrow et al., Macmillan, London, pp. 155--171. • Border, Kim (1985), Fixed point theorems with applications to economics and game theory. Cambridge University Press. Reprinted 32 version 1999. • Durlauf, S. (2001), "The Memberships Theory of Poverty: The Role of Group Affiliations in Determining Socioeconomic Outcomes," in Understanding Poverty in America, S. Danziger and R. Haveman eds., Cambridge: Cambridge: Harvard University Press. • Gaunersdorfer, A. J. Hofbauer and K. Sigmund (1991), "On the Dynamics of Assymetric Games," Theoretical Population Biology 39, pp. 345-357. • Gintis, H. (2009), Game Theory Evolving, Second Edition, Princeton University Press. • Hofbauer, J. Schuster, P. and Sigmund, K. (1979), "A note on evolutionary stable strategies and game dynamics," Journal of Theoretical Biology 81, pp. 609-612. • Hofbauer, J. and K. Sigmund, (2002), Evolutionary Games and Population Dynamics, Cambridge University Press. • Maynard Smith, J. (1972), On Evolution. Edinburgh University Press. • Maynard Smith, J. and Price, G.R. (1973), “The Logic of Animal Conflict”, Nature 246, pp. 15-18. • Maynard Smith, J. (1974), "The theory of games and the evolution of animal conflict," Journal of Theoretical Biology 47, pp. 209--22. • Maynard Smith, J. (1982), Evolution and the Theory of Games, Cambridge University Press. • Nachbar, J. H. (1990), "Evolutionary selection in dynamic games," International Journal of Game Theory 19, pp. 59-90. • Sanditov, B. (2006), "Essays on Social Learning and Imitation," Ph.D. thesis, Maastrictht University. • Sanchez Carrera, E. (2012), “Imitation and evolutionary stability of poverty traps,” Journal of Bioeconomics 14, pp. 1-20. • Schlag, K. H. (1998), "Why Imitate, and if so, How?" A Boundedly Rational Approach to Multi-Armed Bandits", Journal of Economic Theory 78(1), pp. 33 130-156. • Schlag, K. H. (1999), "Which One Should I Imitate", Journal of Mathematical Economics 31(4), pp. 493-522. • Selten, R. (1975), "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games," International Journal of Game Theory 4(1), pp. 25-55. • Selten, R. (1980), "A note on evolutionarily stable strategies in asymmetrical animal conflicts," Journal of Theoretical Biology 84, pp. 93-101. • Taylor, P.D. and L.B. Jonker, (1978), "Evolutionary Stable Strategies and Game Dynamics", Math. Biosci., 40, pp. 145-156. • Van Dame, E. (1991) Stability and Perfectin of Nash Equilibrium SpringerVerlag. • Vega-Redondo, F. (1996), Evolution, Games, and Economic Behavior, Oxford University Press. • Vega-Redondo, F. (1997), "The evolution of Walrasian behavior," Econometrica 65, pp. 375--384. • Weibull, W. J. (1995), Evolutionary Game Theory, The Mit Press. • Zeeman, A. C. (1992), "Population Dynamics from Game Theory", in Z. Nitecki and C. Robinson, eds., Global Theory of Dynamical Systems, pp. 471-497. Springer-Verlag. Lecture Notes in Mathematics 819. 34