Ver/Abrir - Repositorio Digital

Anuncio
INSTITUTO POLITÉCNICO NACIONAL
Escuela Superior de Fı́sica y Matemáticas
Teorı́a de Juegos Matriciales y Aplicaciones
TESIS
QUE PARA OBTENER EL TÍTULO DE
LICENCIADO EN FÍSICA Y MATEMÁTICAS
PRESENTA:
Guillermina Ávila Garcı́a.
Director de Tesis:
Prof. Rubén Téllez Sánchez.
México D. F., agosto de 2006
A mi querida mamá, por todo el amor que me ha manifestado siempre, la
paciencia y confianza que deposita en mi, y sobre todo por que me ha mostrado lo
bello de la vida a través de sus dulces palabras y su tierna luz en la mirada.
A mi padre por el apoyo que me ha brindado.
A mis hermanos: Lety, Luı́s, Geovanni, Ricky y Nenita por el amor, cariño,
comprensión y alegrı́a que siempre me demuestran.
A Iván por su infinita paciencia, cariño, amor y comprensión que siempre me
expresa.
A Dios por permitirme ser hija, hermana y compañera de tan excelentes y
maravillosos seres humanos.
Con amor y agradecimiento.
2
Agradecimientos
Al M. en C. Rubén Mancio Toledo, docente de la Escuela Superior de Fı́sica y
Matemáticas, amigo y excelente profesor, que me ha brindado todo su apoyo incondicional durante y después del trayecto de la carrera, ası́ como su colaboración para la
escritura del presente trabajo.
Al M. en I. Rubén Téllez Sánchez asesor de la presente tésis, por su valioso
apoyo y paciencia para llevar a cabo éste trabajo.
A los integrantes del jurado: M. en C. Rubén Mancio Toledo, Dr. Isidro Romero
Medina, Lic. Francisco Quezada Campo, Lic. Armando Hernández Solis, por su valiosa
colaboración en la revisión y sugerencias de ésta tésis.
A todos los profesores de la Escuela Superior de Fı́sica y Matemáticas por
contribuir a mi formación académica.
Agradeciendo infinitamente la atención, apoyo y paciencia recibida.
3
Índice general
Introducción
6
1. Esquema Conceptual y Contexto de la Teorı́a de Juegos
9
1.1. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.2. La importancia de la Teorı́a de Juegos . . . . . . . . . . . . . . . . .
10
1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos . . . . . . . . .
11
1.4. Aplicación de la Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . .
13
2. Tipologı́as y Fundamentos Matemáticos de la Teorı́a de Juegos
14
2.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.2. Tipos de jugadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.3. Juegos de información perfecta
. . . . . . . . . . . . . . . . . . . . .
16
2.4. Juegos de suma-cero para 2 oponentes . . . . . . . . . . . . . . . . .
16
3. Metodologı́a para la solución de problemas
19
3.1. Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.2. Estrategias de Seguridad . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.3. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.4. Uso de estrategias mixtas
. . . . . . . . . . . . . . . . . . . . . . . .
23
3.5. Métodos para resolver juegos matriciales . . . . . . . . . . . . . . . .
24
3.6. Técnica de punto de silla de montar . . . . . . . . . . . . . . . . . . .
25
3.7. Técnica de dominación . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.7.1. Reducción de orden de Matrices . . . . . . . . . . . . . . . . .
27
3.8. Método Algebraico . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.9. Método Geométrico para los juegos 2 × n . . . . . . . . . . . . . . . .
38
3.10. Solución de juegos 2 x 2 con engaño . . . . . . . . . . . . . . . . . . .
41
4
ÍNDICE GENERAL
5
3.11. Método de subjuegos para encontrar el valor del juego . . . . . . . . .
4. Programación Lineal
44
49
4.1. Teorema del Mı́nimax . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
4.2. Solución por medio de Programación Lineal . . . . . . . . . . . . . .
51
5. Juegos No Cooperativos
59
5.1. Juegos suma diferente de cero o metajuegos . . . . . . . . . . . . . .
59
Conclusiones
64
Bibliografı́a
65
Indice Alfabético
66
Avila Garcia
Introducción
Antecedentes
Los inicios de lo que hoy se conoce como Teorı́a de Juegos se remontan al año 1759
cuando el economista Quesnay empieza a utilizar modelos primitivos de programación
matemática. Más tarde, otro economista de nombre Walras, hace uso, en 1874, de
técnicas similares. Los modelos lineales de la investigación de operaciones, tienen
como precursores a Jordan en 1873, Minkowsky en 1896 y a Farkas en 1903. La
teorı́a de juegos se cimentó en 1939 con el matemático von Neuman y el economista
Oskar Morgenstern. No fue sino hasta la Segunda Guerra Mundial cuando la Teorı́a
de Juegos empezó a tomar auge. Primero se le utilizó en la logı́stica estratégica para
vencer al enemigo y, más tarde al finalizar la guerra, en la logı́stica de distribución de
todos los recursos militares de los aliados por todo el mundo. Fue debido precisamente
a este último problema que el doctor George Datzing, el que en 1947, resumiendo el
trabajo de muchos de sus precursores, inventará el método simplex con lo cual dio
inicio a la programación lineal, que hoy en dı́a se utiliza con mucha frecuencia en la
teorı́a de juegos.1
Problemática
Los conflictos que se presentan hoy en dı́a, no sólo es en el sector privado, sino también en el sector de los servicios públicos, en contratos, guerras militares, guerras
comerciales, marketing para la competencia de los mercados, negociaciones domésticas, comerciales y colectivas, y en alianzas, tanto en los paı́ses desarrollados como en
los paı́ses del tercer mundo, lo cual ha dado lugar a que se aplique la teorı́a de juegos
constantemente. En México la Teorı́a de Juegos se utiliza dentro del sector público,
entre otros la Secretarı́a de Comunicaciones, Partidos Polı́ticos, Bancos, etc.
1
veáse [6]
6
Dado a que todos somos agentes económicos, conviene estudiar esta teorı́a,
a fin de entender qué operaciones teóricas y prácticas podrı́an ofrecernos premios
monetarios más grandes. Debe incluirse en la lista a cualquier otra situación en que
dos o más individuos requieran interactuar a fines de obtener ganancias económicas.
Como el ser humano es un homo economicus tanto como un homo ludicus, él
puede encontrar infinidad de aplicaciones a la Teorı́a de juegos.
Objetivo
El objetivo principal del presente trabajo es desarrollar la teorı́a de juegos y sus
aplicaciones en el ámbito laboral y en estrategias tanto militares como de mercadeo.
Hipótesis
La teorı́a de juegos constituye una herramienta adecuada para resolver racionalmente
situaciones de conflicto.
Presentación
En el Capı́tulo 1 se hace referencia a un texto biblı́co, donde se realiza un
análisis de cómo intuitivamente ya se usaba la teorı́a de juegos y que en la vida
cotidiana estamos estrechamente ligados con la toma de decisiones usando juegos.
En el capı́tulo 2, se introducen los conceptos básicos de la teorı́a de juegos
ası́ como los tipos de juegos que se tienen; como son: aleatorios, no aleatorios y de
información perfecta, ası́ mismo se introduce el concepto de juegos de suma cero y
las valoraciones que se tienen de acuerdo a un juego establecido.
En el capı́tulo 3, tenemos la parte central del trabajo, pues se define y se explica
a detalle algunas de las metodologı́as para la solución a un problema de teorı́a de
juegos, ası́ como las diferentes aplicaciones a las que conducen.
En el capı́tulo 4, se lleva a cabo una solución mediante programación lineal, un
tema muy importante en el contexto de la teorı́a de juegos, además de un bosquejo de
la demostración del importante teorema del Minimax aplicable a la teorı́a de juegos;
haciendo uso de teoremas muy importantes, tales como: Teorema de Dualidad, Teorema de Holgura Complementaria. Todos estos resultados nos conllevan a la solución
de problemas de teorı́a de juegos por medio de programación lineal.
7
En el capı́tulo 5, se tiene un breve estudio de los juegos diferente de cero, y se
explica el famoso Dilema del prisionero, y las semejanzas que existe entre éste juego
y las técnicas de mercadeo, en donde dı́ficilmente se conocen las pérdidas o ganancias
que puede tener nuestro oponente.
Finalmente, de acuerdo a la metodologı́a empleada en el transcurso de la investigación nos conlleva a la conclusión y a algunas recomendaciones para el uso de
teorı́a de juegos.
El presente trabajo se desarrolla por medio de la metodologı́a, ilustrando con
ejemplos partiendo desde las técnicas básicas (técnica de punto de silla, dominancia y
geométricos) hasta llegar a el planteamiento y solución de aquellos juegos de m×n, los
cuales son imposibles de resolver utilizando técnicas comunes, para ello se implementa
la programación lineal la cual es útil y práctica para resolver estos juegos, haciendo
uso del método simplex.
8
Capı́tulo 1
Esquema Conceptual y Contexto
de la Teorı́a de Juegos
1.1.
Aportaciones
La Teorı́a de Juegos es un tipo de análisis matemático orientado a predecir
cuál será el resultado cierto o el resultado más probable de una disputa entre dos
individuos. Fue diseñada y elaborada por el matemático John von Neumann y el
economista Oskar Morgenstern en 1939, con el fin de realizar el análisis económico
de ciertos procesos de negociación. von Neumann y Morgenstern, escribieron el libro
The Theory of Games and Economic Behaviour1 (1944). A.W. Tucker es quien
diseñó el famosı́simo problema del “Dilema del Prisionero”. El matemático John
Forbes Nash, Jr. (1928-) creó en 1950 la noción de “Equilibrio Nash”, que corresponde
a una situación en la que dos partes rivales están de acuerdo con determinada situación
del juego o negociación, cuya alteración ofrece desventajas a ambas partes. Otros
importantes representantes de la teorı́a de juegos fueron el húngaro nacionalizado
estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten, Nash, Harsanyi
y Selten recibieron el Premio Nobel de Economı́a de 1994 por sus contribuciones a la
Teorı́a de Juegos.
1
referencia completa.
9
1.2. La importancia de la Teorı́a de Juegos
1.2.
La importancia de la Teorı́a de Juegos
Un juego es un proceso en que dos o más personas toman decisiones y acciones,
la estructura de las cuales está inscrita en un conjunto de reglas (que pueden ser
formales o informales), a fines de obtener beneficio. Cada combinación de decisiones
y acciones determina una situación particular, y, dado que las decisiones y acciones
de los agentes involucrados (llamados los jugadores) pueden ser combinadas de numerosas formas, las situaciones generadas también serán numerosas y su magnitud
igual a las de las combinaciones de decisiones y acciones de los agentes. El conjunto total de situaciones posibles es el cuadro incidental del juego. Siguiendo con este
razonamiento, encontramos que cada situación (es decir, cada punto del cuadro incidental) genera una combinación de premios determinada. El premio que le da a un
jugador una situación particular puede ser comparado con los premios que le ofrecen las otras situaciones. Un concepto importante es el de pago. Como se dijo, cada
situación particular ofrece una combinación de premios, de la manera siguiente: si
se trata de dos jugadores, la situación ofrece un premio para el primero y otro para
el segundo. Si se trata de tres jugadores, la situación genera un premio para cada
jugador. Ésta es la lógica de los premios y las situaciones. A cada premio se le llama
pago. La Teorı́a de juegos nos ayuda a analizar juegos en los que dos o más personas
compiten por un único premio o pago situación o conjunto de situaciones que en lo
adelante se les llamará la solución del juego. La solución del juego se sustenta en que
la conducta de cada jugador llega a engancharse con la de los otros, derivando todo
esto en situaciones más fuertes que otras. Las situaciones más fuertes son las que
se producen con la mayor probabilidad, y debido a esto es que se considera que la
solución o desenlace del problema del juego corresponde a la situación o situaciones
más fuertes, más probables.
El análisis de un juego lleva muchas veces a que se determine cuál va a ser el
punto final de solución de dicho juego a este resultado se le denominará resultado
inminente o fatal del juego. No obstante, en realidad existen muchos juegos cuyo final
es imposible de determinar, incluso con la ayuda de la Teorı́a de Juegos: estos juegos
no tienen resultados inminentes, o, si es que los tienen, éstos no son previsibles y la
Teorı́a de Juegos no puede predecirlos. Tal es el caso de un juego de ajedrez, el cual es
un juego de suma cero: todo lo que la Teorı́a de Juegos nos puede decir acerca de este
juego es que uno de los dos jugadores ganará y el otro perderá el juego. Al margen
Avila Garcia
10
1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos
de esta grave circunstancia, la Teorı́a de Juegos sı́ puede ayudarnos a determinar
los resultados de otros muchos importantes juegos y situaciones de negociaciones e
intereses en conflicto. La Teorı́a de Juegos es importante porque permite hallar los
resultados inminentes o fatales de numerosos juegos diversos que debemos enfrentar
cotidianamente en el mundo real. La Teorı́a de Juegos no deja de ser importante sólo
porque no puede analizar la totalidad de los juegos que jugamos en el mundo real.
1.3.
El sabio rey Salomón hace uso de la Teorı́a de
Juegos
La Teorı́a de Juegos es una disciplina que involucra en grado alto la capacidad analı́tica y proyectiva del ser humano. Es, a la vez, una disciplina susceptible
de ser aplicada a diversidad de casos. Para mostrar ambas cosas simultáneamente,
se hará mención de la conocida historia de las madres y el rey Salomón. Salomón
recibió a dos mujeres que declaraban ser las madres de un bebé (1 Reyes 3, 16-28)2 .
Ante la ausencia de datos o indicios tangibles, debı́a creerse bien a una o a la otra,
luego de lo cual el bebé serı́a entregado a la mujer considerada la madre de éste. Demostrando que su gran sabidurı́a lo relevaba de la necesidad de mayor información,
Salomón elaboró un juego, el cual tomó la forma de una propuesta: “Con esta espada
habrá de partirse al bebé, luego de lo cual se dará una mitad del niño a cada mujer”.
“Inteligentemente”, el sabio rey recurrió a una proposición perfectamente aceptable si
ella era aplicada a juicios sobre materias y objetos comerciales. Este juego exaltarı́a la
voluntad “competitiva” de obtener ganancia en grado máximo. El truco de Salomón
consistı́a en que una valoración primordial de competencia rivalizada con la valoración
dictada por el amor maternal. El criterio de optimización individual llevó a una de
las madres a aceptar la peculiar propuesta salomónica. El criterio de amor maternal
llevó a la otra madre a pedir una solución inscrita en la optimización colectiva:
Preferı́a que el niño siguiera entero, contentándose con sólo saber que él
seguı́a vivo, aún si no pudiera nunca más volver a verlo.
2
veáse [5]
Avila Garcia
11
1.3. El sabio rey Salomón hace uso de la Teorı́a de Juegos
Salomón observó la siguiente escala de valores:
Primero: Que su hijo exista, que conserve su vida.
Segundo: Tener a su hijo consigo.
Salomón hizo la suposición de que sólo la verdadera madre podrı́a instintivamente conocer y respetar esta escala. Trabajando en base a dicha suposición, las
sometió a una crisis, cuya solución evidente le permitirı́a acceder a sólo una parte del
premio, o renunciar completamente el premio. Este premio era la tenencia del hijo,
es decir, un pago correspondiente al segundo nivel de la escala de valores.
La falsa madre, por su parte, tenı́a la siguiente escala de valores:
Primero: Tener al hijo consigo.
Segundo: Conservar por lo menos una parte del hijo consigo.
Esto, traducido a términos análogos a los de la escala de valores de una verdadera
madre, toma la forma de:
Primero: Tener al hijo consigo.
Segundo: Aunque eso conllevara la pérdida de su vida, conservar una parte del
hijo consigo.
Sin embargo, eso mismo llevado a una escala de valores materiales, equivale a:
Primero: Ganar todo el premio.
Segundo: Ganar al menos una parte del premio.
Es decir que la lógica de la falsa madre era materialista, mientras que la lógica de
la verdadera madre era “lógica de madre”. De hecho, Salomón supusó que la falsa
madre seguirı́a la lógica materialista que es apropiada para la mayorı́a de problemas
de obtención de premios, en tanto que la verdadera madre seguirı́a la lógica de madre.
El problema impuesto por Salomón, de cumplirse las suposiciones de sabio, quitarı́a
el disfraz de madre a la falsa madre.
Avila Garcia
12
1.4. Aplicación de la Teorı́a de Juegos
1.4.
Aplicación de la Teorı́a de Juegos
Para usar la Teorı́a de Juegos como una aplicación para una situación real, se requiere construir modelos simplificados de la realidad. En estos modelos, se tendrá que
representar a cada jugador con sus respectivas formas de conducta. Cuando se trata
de un juego en el que se enfrenta a un único rival, normalmente se puede decir que se
conoce perfectamente cuál es su propia forma de actuar, pero ignora o conoce sólo en
parte la de su rival u oponente. Por esto se hace más fácil representar simplificadamente su propia conducta que representar la conducta del rival. En cualquier caso, se
requiere representar adecuadamente las conductas de los dos (o más) jugadores que
intervienen. A veces se necesitarı́a plantear dos o más representaciones de la conducta
probable del rival. Cada representación recibe el nombre de escenario. Cada escenario
es un juego simple. El conjunto de dos o más escenarios es un juego compuesto.
Avila Garcia
13
Capı́tulo 2
Tipologı́as y Fundamentos
Matemáticos de la Teorı́a de
Juegos
2.1.
Conceptos
En un juego; puede haber dos o más oponentes; entonces se habla de juegos
para dos personas o, en general, para n personas. Los jugadores en un juego para
n personas pueden formar coaliciones permanentes o temporales durante el curso
del juego; todos los miembros de una coalición permanente se consideran en conjunto
como un jugador, puesto que tienen los mismos intereses. A los juegos de dos personas
también se les llama bipersonales.
Considérense dos jugadores I y II, con intereses opuestos. Por juego, se entiende
un curso de eventos que consisten de una sucesión de acciones por parte de I y II.
Para que el juego sea susceptible de análisis matemático, también debe tenerse un
sistema de reglas establecidas sin ambigüedad, es decir, un sistema de condiciones
que regulen las acciones permisibles para cada jugador en cada etapa del juego, la
cantidad de información que tiene cada bando acerca del comportamiento del otro,
la sucesión de jugadas (es decir, las decisiones que se toman en el curso del juego) y
también el resultado del juego, que se obtiene de la totalidad de las jugadas realizadas
por cada bando.
Se dice que un juego es de suma cero si la suma de las ganancias es cero, es
14
2.2. Tipos de jugadas
15
decir, si uno de los bandos pierde exactamente tanto como lo que el otro gana. En los
juegos de suma cero, las metas que persiguen los jugadores son totalmente opuestas.
La teorı́a de juegos se divide en cuanto a:
a) Jugadores - Juego de dos personas - Juego de n personas
b) Número de estrategias disponibles a cada decisor - Juegos finitos - Juegos
infinitos
c) Objetivos del juego - Juegos de suma - cero - Juegos suma diferente de cero
o metajuegos.
2.2.
Tipos de jugadas
Un juego se realiza mediante jugadas sucesivas; cada jugada es una elección de
una de las alternativas posibles especificadas por las reglas. Una jugada puede ser
personal o aleatoria. Una jugada personal es una elección y ejecución consciente, por
parte de uno de los jugadores, de una de las jugadas que sean posibles en la situación
dada. Un ejemplo de una jugada personal es cualquier jugada en un juego de ajedrez.
Cuando le corresponde su turno, el jugador hace una elección consciente de entre
las jugadas posibles, dependiendo de la posición de las piezas sobre el tablero. El
conjunto de posibilidades disponibles para una jugada personal está determinado por
las reglas del juego y depende de la totalidad de las jugadas previas realizadas por
ambos jugadores. Una jugada aleatoria es la elección de una posibilidad de entre un
cierto número de ellas, no por la decisión de un jugador, sino por el resultado de
algún evento aleatorio (lanzamiento de una moneda, lanzamiento de dados, baraja y
reparto de cartas, etc.). Por ejemplo, si el juego requiere que se extraiga una carta al
azar de una baraja completa, ésta es una jugada aleatoria con 52 resultados posibles,
cada uno con la misma probabilidad. Para que el juego sea matemáticamente determinado, las reglas del juego deben aclarar cuál es la distribución de probabilidad de
los diversos resultados posibles de cada una de las jugadas aleatorias. Algunos juegos
sólo contienen jugadas aleatorias y, con propiedad, se les da el nombre de ”juegos de
azar”. Otros sólo contienen jugadas personales (ajedrez, damas). La mayorı́a de los
juegos de cartas son mixtos, contienen tanto jugadas personales como aleatorias.
Avila Garcia
2.3. Juegos de información perfecta
2.3.
16
Juegos de información perfecta
Los juegos también se clasifican según el tipo y cantidad de la información
disponible -para cada jugador- acerca de las jugadas del oponente. Un juego en el
cual cada participante, al hacer una jugada, conoce los resultados de todas las jugadas
hechas previamente, sean éstas personales o aleatorias, se llama juego de información
perfecta. Ejemplos de tales juegos son el ajedrez, las damas y el juego de tres en raya.
En otros juegos, los jugadores no tienen esa información perfecta; en el póker, por
ejemplo, los jugadores no saben cuáles cartas han recibido sus oponentes.
En la vida real la mayorı́a de las situaciones antagónicas no son juegos de información perfecta, dado que la ignorancia de las acciones del oponente, generalmente,
es un elemento esencial de tales situaciones.
2.4.
Juegos de suma-cero para 2 oponentes
Los elementos en la formulación de un juego normal son los siguientes:
1. Un conjunto finito de estrategias puras E1 = {I1 , I2 , . . . , In }, para el jugador I y
un conjunto finito de estrategias puras E2 = {II1 , II2 , . . . , IIm } para el jugador
II.
2. Una matriz real de orden n × m A = (aij ). Cada elemento de esta matriz es el
pago para el jugador I cuando elige la estrategia Ii y el jugador II escoge la
estrategia IIj . El pago para el jugador II en estas circunstancias es −aij . La
representación de la matriz, es:
Estrategia del jugador de renglones,
Estrategia del jugador de columnas,
jugador I
jugador II
columna 1 columna 2 · · · columna n
renglón 1
a11
a12
···
a1n
renglón 2
..
.
a21
..
.
a22
..
.
···
···
a2n
..
.
renglón m
am1
am2
···
amn
Una solución de estos juegos especifı́ca las estrategias óptimas que los jugadores
racionales usarán y el pago que se obtiene con ellas. La solución o soluciones de un
Avila Garcia
2.4. Juegos de suma-cero para 2 oponentes
juego de 2 personas de suma nula pueden caracterizarse de dos formas: mediante las
estrategias de seguridad y con el concepto de punto de equilibrio.
Ejemplo 1.1 O.G. Haywood (1954)1 . En el desembarco aliado, en agosto de
1944, se ha abierto una brecha por mar Avranches (Francia). La cabeza de playa ha
expuesto el flanco oeste del noveno ejército alemán, mandado por el general von Kluge.
Este tiene dos posibles formas de actuar: (1) Atacar hacia al oeste para llegar al mar,
asegurándose su flanco occidental y dividir a las fuerzas americanas. (2) Retirarse
hacia el este para llegar a una mejor posición defensiva cerca del rı́o Sena. El general
americano Bradley tiene al primer ejército americano conteniendo al ejército alemán
desde la cabeza de playa, y más al interior tiene al tercer ejército, bajo las órdenes del
general Patton, en reserva, haciendo misiones de limpieza del terreno hacia el este,
sur y oeste. Bradley consideró tres posibilidades: (1) Ordenar a la reserva volver a
defender la brecha abierta. (2) Enviar la reserva hacia el este para intentar cortar la
retirada del noveno ejército alemán. (3) Mantener las reservas en su posición durante
un dı́a y decidir después si ordenar ayudar a la cabeza de playa si era atacada o
enviarlas hacia el este.
El análisis completo de la situación le llevó a valorar los diferentes resultados
de acuerdo con la tabla siguiente, en la que las filas representan las estrategias del
general Bradley, y las columnas las estrategias del general von Kluge.
1. Atacar
2. Retirarse
1. Reforzar
Se mantiene la brecha
Débil presión sobre la retirada alemana
2. Mover
Se produce el corte alemán
Se mantiene la brecha
y los alemanes son rodeados
Fuerte presión en la retirada alemana
3. Esperar
Moderada presión en la retirada alemana
Lógicamente, la resolución del conflicto dependerá de la valoración de los resultados v (i, j), i = 1, 2, 3 y j = 1, 2. El orden de preferencias de mejor a peor según la
doctrina del ejército americano era:
v (3, 1) > v (2, 2) > v (3, 2) > v (1, 2) > v (2, 1) ,
por lo que al buscar la estrategia menos mala, maximin, el general Bradley escogió la
tercera estrategia. Las valoraciones alemanas debı́an ser similares, pues el general von
1
veáse [3]
Avila Garcia
17
2.4. Juegos de suma-cero para 2 oponentes
Kluge decidió retirarse, pero nunca ejecutó su decisión. Hitler, a cientos de kilómetros
del campo de batalla, debió tener otras valoraciones del conflicto y ordenó atacar y
cerrar la brecha. El resultado fue que Bradley resistió el ataque alemán; y mantuvo
la reserva en el sur, lo que permitió enviarla el segundo dı́a hacia el este; los alemanes
comenzaron la retirada, siendo rodeados por las armadas americana y francesa, lo que
llevó al suicidio al general alemán.
Cada jugador puede ordenar las valoraciones y dar valores numéricos a las
consecuencias
v(i, j) (vI(i, j), vII(i, j))
En el caso de que las valoraciones se consideren de forma totalmente opuesta
por los jugadores para uno supone ganancias y para el otro implique pérdidas éstas
pueden expresarse se dice que la situación corresponde a un juego de suma nula.
Cuando esto no ocurre la valoración del juego vendrá dada para cada resultado por dos
números no necesariamente relacionados pues suponen el reflejo de dos valoraciones
independientes llamándose a estos juegos por oposición a los anteriores juegos de
suma no nula.
En otras ocasiones las valoraciones no pueden ordenarse, e incluso valorar las
estrategias pueden tenerse en cuenta diferentes aspectos. En el ejemplo anterior, los
generales podı́an valorar los resultados no sólo dependiendo del curso de la guerra
sino también del impacto que se podrı́a producir en la población civil y su entorno.
De hecho muchos modelos se consideran con objetivos escalares debido a la
dificultad de resolver el modelo con objetivos múltiples. Hay situaciones en las que
una misma estrategia debe ser empleada en diferentes escenarios por ejemplo las
polı́ticas de producción de dos empresas que compiten en su mercado pueden valorarse
escalarmente, pero si compiten simultáneamente en varios mercados debe emplearse
la valoración vectorial.
Avila Garcia
18
Capı́tulo 3
Metodologı́a para la solución de
problemas
3.1.
Estrategias
Uno de los conceptos fundamentales de la teorı́a de juegos es la de estrategias.
Representaremos por Ii , 1 ≤ i ≤ n las estrategias puras del jugador I y por IIj ,
1 ≤ j ≤ m las estrategias puras del jugador II. El juego permite determinar la
valoración que ocasiona el que cada jugador utilice una de sus estrategias por lo
que representaremos por v (i, j) la valoración de las consecuencias del empleo de la
estrategia Ii por el primer jugador y la estrategia IIj por parte del segundo. Al variar
i y j en sus respectivos campos se tiene una estructura de matriz aunque los valores
no sean números reales por lo que a estos juegos se les denomina juegos matriciales.
Estas valoraciones pueden ser interpretadas de muy diversas formas por los jugadores
que intervienen en el juego.
3.2.
Estrategias de Seguridad
En los juegos de suma nula cuando un jugador intenta maximizar su pago a
la vez esta intentando minimizar el pago de su oponente. Cada jugador considera el
peor resultado que puede conseguir con cada una de sus estrategias y después escoge
la estrategia que le proporciona el mejor de los peores resultados.
19
3.2. Estrategias de Seguridad
20
Definición 3.2.1
Para cada estrategia pura Ii ∈ E1 , el nivel de seguridad del jugador I es el pago
que puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II:
vI (Ii ) = mı́n aij .
(3.1)
j
Para cada estrategia pura IIj ∈ E2 el nivel de seguridad del jugador II es el pago que
puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I:
vII (IIj ) = máx aij .
(3.2)
i
Definición 3.2.2
i) El valor maximin (o valor inferior del juego) del jugador I es:
vI = máx vi (Ii ) = máx mı́n aij .
i
i
j
(3.3)
Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su valor maximin.
ii) El valor minimax (o valor superior del juego) del jugador II es
vII = mı́n vII (IIj ) = mı́n máx aij .
j
j
i
(3.4)
Una estrategia de seguridad o estrategia minimax es la que proporciona al jugador su valor minimax.
Teorema 3.2.1
Para cada juego matricial de matriz A = (aij ) se tiene:
i) Los valores vI y vII son únicos.
ii) Existe al menos una estrategia de seguridad para cada jugador.
iii) vI ≤ vII .
Avila Garcia
3.3. Estrategias Mixtas
21
Definición 3.2.3
Un juego matricial, de matriz A = (aij ) tiene un punto de silla en estrategias
puras cuando se cumple la igualdad:
vI = vII .
Este valor común se llama valor del juego y es el menor elemento de su fila y el
máximo de su columna. Se denota por v.
Observación 3.2.1
Un punto de silla, si existe, es el pago correspondiente a una pareja de estrategias
de seguridad. Dichas estrategias, junto con el valor del juego, constituyen una solución
del juego.
3.3.
Estrategias Mixtas
Definición 3.3.1
Una estrategia mixta para un jugador es una distribución de probabilidad en
el conjunto de sus estrategias puras.
En general, si un jugador tiene n estrategias puras, una estrategia mixta para
n
X
él es una n-tupla x = (x1 , . . . , xn ) tal que
xi = 1, 0 ≤ xi ≤ 1, en donde xi
i=1
indica la probabilidad con que el jugador seleccionará su i-ésima estrategia pura. El
conjunto de estrategias mixtas siempre incluye a todas las estrategias puras porque
estas últimas pueden considerarse como un caso especial de estrategia mixta en que
la correspondiente estrategia pura se juega con probabilidad 1 y todas las demás con
probabilidad cero.
Observación 3.3.1
Sea A = (aij ), 1 ≤ i ≤ n, 1 ≤ j ≤ m, la matriz de pagos de un juego. Sean X e
Y los conjuntos de estrategias mixtas de los jugadores I y II respectivamente.
(
)
n
X
X = x ∈ Rn :
xi = 1, xi ≥ 1, i = 1, . . . , n .
i=1
(
Y =
m
y∈R :
m
X
)
yj = 1, yj ≥ 1, j = 1, . . . , m .
j=1
Avila Garcia
3.3. Estrategias Mixtas
22
Para analizar el resultado del juego cuando uno o ambos jugadores utilizan
estrategias mixtas podemos utilizar el concepto de valor esperado. En este caso la
función de pagos del juego es:
v (x, y) =
n X
m
X
xi aij yj ,
x ∈ X, y ∈ Y
i=1 j=1
que es el valor esperado de conseguir los pagos del juego con la combinación de estrategias mixtas x ∈ X, y ∈ Y .
Los distintos conceptos estudiados en estrategias puras pueden extenderse al
caso de las estrategias mixtas.
Definición 3.3.2
Para cada estrategia mixta x ∈ X, el nivel de seguridad del jugador I es el valor
esperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del
jugador II.
v I (x) = mı́n v (x, y) .
y∈Y
Para cada estrategia mixta y ∈ Y , el nivel de seguridad del jugador II es el valor
esperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del
jugador I.
v II (y) = máx v (x, y) .
x∈X
Definición 3.3.3
El valor maximin en estrategias mixtas del jugador I es:
vIM = máx mı́n v (x, y) .
x∈X y∈Y
(3.5)
Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su
valor maximin.
Definición 3.3.4
El valor mı́nimax en estrategias mixtas del jugador II es:
M
vII
= mı́n máx v (x, y) .
y∈Y x∈X
(3.6)
Una estrategia de seguridad o estrategia mı́nimax es la que proporciona al jugador su
valor mı́nimax.
Avila Garcia
3.4. Uso de estrategias mixtas
23
Teorema 3.3.1
En un juego matricial de suma nula se tiene:
M
i) Los valores vIM y vII
son únicos.
ii) Al menos existe una estrategia mixta de seguridad para cada jugador.
iii) Los niveles de seguridad en estrategias puras y mixtas cumplen:
vI ≤ vIM
3.4.
y
M
vII
≤ vII .
Uso de estrategias mixtas
Supóngase que nuestra estrategia mixta consta de la aplicación de las estrategias
puras I1 , I2 , I3 en las razones p1 : p 2 : p 3 , donde las p están normalizadas de modo
que p1 + p 2 + p 3 = 1; entonces esta estrategia se escribe:
!
I1 I2 I3
SI =
.
p1 p2 p3
Análogamente,
SII =
II1 II2 II3 II4
q1
q2
q3
q4
!
.
designa una estrategia mixta de nuestro oponente, en la cual se usan las estrategias
puras II1 , II2 , II3 , II4 en la razón q1 : q2 : q3 : q4 , donde q1 + q2 + q3 + q4 = 1; esto
significa que II1 se usa una fracción q1 de las partidas, II2 una fracción q2 , etc.
Supóngase que se ha encontrado una solución de un juego, que consta de las
∗ . En general no todas las estrategias puras
dos estrategias mixtas óptimas SI∗ y SII
disponibles para un jugador dado se usarán en sus estrategias mixtas óptimas. Aquellas estrategias puras que se usan, en esta sección se denominarán “convenientes”.
Resulta que la solución de un juego tiene otra propiedad notable que se probará a
continuación. Si uno de los jugadores se adhiere a su estrategia mixta S ∗ (S ∗ ), enI
II
tonces la ganancia se mantendrá igual al valor del juego, v, sin importar lo que haga
el otro jugador siempre que él sólo use estrategias convenientes. Por tanto, el segundo
jugador puede usar cualesquiera de sus estrategias“convenientes” como una estrategia
pura o puede combinarla en proporciones arbitrarias.
Avila Garcia
3.5. Métodos para resolver juegos matriciales
24
∗ ) de un juego de mxn. Ahora
Supóngase que se tiene una solución SI∗ , (SII
bien supongamos que la estrategia óptima SI∗ es una mezcla de las tres estrategias
“convenientes”, I , I , I y S ∗ es una mezcla de las tres estrategias “convenientes”,
1
2
3
II
II1 , II2 , II3 :
SI =
I1 I2
!
I3
p1 p 2 p 3
,
II1 II2 II3
SII =
q1
q2
q3
!
.
donde p1 +p2 +p3 = 1 y q1 +q2 +q3 +q4 = 1. Nótese que si nos adherimos a la estrategia
S ∗ , nuestro oponente puede mezclar las estrategias II , II , II , en proporción que
1
I
2
3
desee y la ganancia permanecerá inalterada e igual a v, el valor del juego. Sean v1 , v2
y v3 las ganancias para las estrategias de nuestro oponente II1 , II2 y II3 cuando las
juega contra nuestra estrategia S ∗ . De la definición de estrategia óptima se deduce
I
∗ no puede aumentar
que cualquier desviación de II respecto a su estrategia óptima SII
sus ganancias. Esto significa que:
v1 ≥ v,
v2 ≥ v,
v3 ≥ v.
(3.7)
Ahora, bien obsérvese que no pueden cumplirse los signos de desigualdad de la
ecuación (3.7); considérese que v representa v1 , v2 y v3 combinadas en las proporciones q1 , q2 y q3 :
v 1q 1 + v 2q 2 + v 3q 3,
q 1 + q2 + q3 = 1
(3.8)
A partir de (3.7), se deduce que si cualquiera de los v1 , v2 , v3 fuera mayor que v, el
segundo miembro de (3.8), también serı́a mayor que v, lo cual no puede ser cierto.
Por lo tanto:
v1 + v2 = v3 = v
de modo que no importa cómo se combinan v1 , v2 , v3 , su valor promedio será igual a v.
Esta importante propiedad de las estrategias óptimas se usa constantemente cuando
se trata de hallar las soluciones de juegos finitos.
3.5.
Métodos para resolver juegos matriciales
La teorı́a de juegos se ha desarrollado básicamente de acuerdo con el juego
suma-cero para 2 participantes. En cuanto a los métodos que utiliza la teorı́a de
juegos para alcanzar el objetivo propuesto por los jugadores se tienen:
Avila Garcia
3.6. Técnica de punto de silla de montar
♣ Técnica de punto de silla.
♣ Simplificación de Matrices (técnica de dominación).
♣ Método algebraico.
♣ Métodos gráficos.
♣ Método de subjuegos.
♣ Programación Lineal.
♣ Metajuegos.
3.6.
Técnica de punto de silla de montar
Ejemplo 3.6.1
Aplicación de un problema con punto de silla:
El general George C. Kenney, comandante de las fuerzas aéreas aliadas del
pacı́fico suroriental durante la Segunda Guerra Mundial, utilizó la teorı́a de juegos
para ganar una de las batallas más importantes en dicha zona.1 Ese conflicto se
conoce como la “batalla del mar de Bismark”.
Este evento histórico ocurrió en los últimos dı́as de febrero de 1943. Las fuerzas
japonesas agrupadas en Rabaul, Isla de Nueva Inglaterra, pretendı́an apoderarse de
1
Véase [6].
Avila Garcia
25
3.6. Técnica de punto de silla de montar
26
Lae, Nueva Guinea, que estaba en manos de los aliados. El general Kenney dedujo,
mediante el análisis de ciertos reportes de inteligencia, que los japoneses tenı́an sólo
dos estrategias disponibles (figura 1): atacar por la ruta 1 (mar de Coral) o por la
2, (mar de Bismarck). Ambas rutas requerı́an de 3 dı́as (aproximadamente 72 horas)
para alcanzar Lae. El general Kenney querı́a bombardear el convoy japonés antes de
su llegada a Lae. La ruta 2 ofrecı́a poca visibilidad; la de la ruta 1 era buena. Su
función objetivo
2
fue la de maximizar el número de horas efectivas de bombardeo del
convoy enemigo.
El general Kenney pensó ası́: 3 “Si concentro un ataque aéreo en la ruta 2 y, en
efecto, los japoneses eligen esa ruta, la búsqueda del convoy será obstaculizada por una
visibilidad pobre y esto se descubrirá hasta el segundo dı́a, permitiéndonos dos dı́as
de bombardeo; si, por el contrario, el convoy elige la ruta 1 (mientras yo concentro
mi búsqueda en la 2), una pequeña escuadrilla aérea de reconocimiento descubrirı́a
al convoy después de 1 dı́a, permitiendo, también, dos dı́as de bombardeo. Por el
contrario, si concentro el ataque en la ruta 1 y los japoneses eligen esa ruta, serán
descubiertos de inmediato permitiendo 3 dı́as de bombardeo; en cambio, si eligen la
ruta 2, una pequeña escuadrilla de reconocimiento descubrirı́a al convoy tras 2 dı́as
de búsqueda, permitiendo un solo dı́a de bombardeo”.
La decisión del general Kenney se puede traducir a la siguiente matriz de consecuencias
Convoy Japonés
Concentración
del bombardeo
aliado
Ruta 1
Ruta 2
Ruta 1
3
1
Ruta 2
2
2
Dı́as de bombardeo
La decisión del general Kenney fue la entrada a 22 , idéntica a la que seleccionó el
comandante japonés (la entrada a 22 es un punto de silla).El resultado de esta decisión
fue una derrota para el ejército japonés, en la épica conocida en la historia bélica como
la ”batalla del mar Bismark”. El nombre se deriva de que tanto el comandante aliado
como el japonés eligieron la ruta 2, la del mar de Bismark. Esta batalla junto con la
2
3
intuitiva.
veáse[6].
Avila Garcia
3.7. Técnica de dominación
27
de Buna y Guadalcanal marcan el inicio de la derrota japonesa en la Segunda Guerra
Mundial [27]. Como vI = vII = 2 entonces existe un punto de silla que es el valor del
juego, es decir; v = 2
3.7.
3.7.1.
Técnica de dominación
Reducción de orden de Matrices
No en todos los juegos existe punto de silla, para este tipo de juegos se utiliza
la siguiente metodologı́a.
Por lo general, es difı́cil encontrar una solución, cuando un juego de m × n no
tiene punto de silla, en especial, si m y n son grandes. A veces puede simplificarse
el problema, reduciendo el número de estrategias en la matriz de ganancias. Las
estrategias que pueden eliminarse de una matriz son:
a) Aquellas que están duplicadas.
b) Aquellas que son dominadas.
Ejemplo 3.7.1
Considérese la siguiente matriz de 4 × 4:
II1
II2
II3
II4
I1
1
2
4
3
I2
0
2
3
2
I3
1
2
4
3
I4
4
3
1
0
Primeramente, se hallan las estrategias duplicadas. Obsérvese que las ganancias
para las estrategias I1 y I3 son idénticas, término a término; ninguna de ella es
preferible a la otra y cualquiera podrı́a ser eliminada, en este caso eliminemos I3 .
Ahora se buscan las estrategias dominantes. Cada elemento del renglón I2 es
menor que (o igual a) el elemento correspondiente del renglón I1 . Obsérvese que,
nunca debe usarse la estrategia I2 , ya que siempre es menos ventajosa que la I1 y, para
Avila Garcia
3.7. Técnica de dominación
28
los propósitos del análisis, también se puede eliminar la I2 . Se dice que la estrategia
I1 domina a la estrategia I2 o que la I2 es dominada por la I1 .
Después de eliminar las estrategias I2 y I3 , queda una matriz más sencilla:
II1
II2
II3
II4
I1
1
2
4
3
I4
4
3
1
0
Además, se nota que, para nuestro oponente, la estrategia II3 es dominada por
la II4 , la cual es menor, elemento por elemento. Ası́, la matriz original de 4 × 4 se
ha reducido a una matriz de 2 × 3:
II1
II2
II4
I1
1
2
3
I4
4
3
0
En general, todas las estrategias duplicadas y dominadas deben eliminarse en
esta forma, antes de buscar una solución.
Ejemplo 3.7.2
Aplicación en Técnicas de guerra
El bando I desea destruir un objetivo defendido por el bando II. I tiene dos
aviones y II tiene tres cañones antiaéreos. Cada avión lleva explosivo suficiente para
destruir él solo el objetivo.
Para llegar al objetivo, únicamente existen tres posibles vı́as de acceso (A, B, C).
II puede emplazar cualquiera de sus cañones antiaéreos en cualquiera de las vı́as de
aproximación, pero un cañon sólo puede cubrir la vı́a de acceso en la cual quedó ubicado. Cada cañon sólo puede atacar a uno de los aviones, pero si ataca a un avión
tiene la certeza de derribarlo. El bando I no sabe cómo éstan dispuestos los cañones
y el bando II no sabe que vı́as de acceso tomarán los aviones. El propósito de II es
evitarlo.
Solución:
Este problema puede representarse en la forma de un juego de 2×3. La ganancia
consiste en la probabilidad de destruir el blanco. Las estrategias posibles de I son:
Avila Garcia
3.7. Técnica de dominación
29
I1 - Enviar cada avión por vı́as de acceso diferentes;
I2 - Enviar ambos aviones a lo largo de la misma vı́a de acceso.
Las estrategias de II son:
II1 - Emplazar cada uno de sus cañones para cubrir una vı́a de acceso diferente;
II2 - Emplazar dos cañones para cubrir una vı́a de acceso y uno para cubrir
otra diferente;
II3 - Emplazar los tres cañones para cubrir la misma vı́a de acceso.
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
.........
...
.........
...
.........
..
.........
.........
.......................................
.
.
.
.
.
.
.
.
.........
.
.
.
........
......
.........
.
.
.
......
.
.
.
.........
...
....
.
.........
.
.
.
....
.........
......... ......
...
...........
...
...
..
.
...
....
..
..
...
..
..
..
..
..
..
...
...
.
...
.
...
...
....
....
....
....
.............
....
.
.
.
.
.
.
.
.
.
.
.
.........
.
..............
.........
........
..................................
.......
.......
.
........
.....
.......
.
.
.
.
.
.
.
.
.
.
........
.....
.......
...
.......
........
....
........
.
.
.
.
.
....
.
....
.
.
.
.
.
.
....
.
.
....
...
....
...
....
...
A
B
objetivo
C
A continuación se construirá la matriz del juego.
i) I1 II1 (Los aviones vuelan a lo largo de vı́as de acceso diferentes; cada cañón
cubre una vı́a diferente). Claramente ningún avión puede llegar al objetivo. La
ganancia será:
a11 = 0
ii) I2 II1 (Los aviones vuelan juntos a lo largo de una de las vı́as; cada cañón cubre
una vı́a diferente). Aquı́, un avión llegará ileso al objetivo:
a21 = 1
iii) I1 II2 (Los aviones vuelan a lo largo de vı́as diferentes; se tienen dos cañones en
una de las vı́as y uno en otra; la tercera vı́a no está defendida). La probabilidad
de que uno de los aviones llegue al objetivo es igual a la probabilidad de que
uno de ellos elija la vı́a no defendida:
a12 =
2
3
Avila Garcia
3.7. Técnica de dominación
30
iv) I2 II2 (Los aviones vuelan a lo largo de uno de las vı́as; dos cañones cubren una
de las vı́as, el tercer cañón cubre otra y la tercera vı́a se deja indefensa; esto
significa que, en efecto, sólo una de las vı́as está cubierta, mientras que dos
quedan indefensas). La probabilidad de que por lo menos un avión pasará es
igual a la probabilidad de que la vı́a elegida no sea la que está cubierta por los
dos cañones:
2
3
a22 =
v) I1 II3 (Los aviones vuelan a lo largo de vı́as diferentes; todos los cañones cubren
la misma vı́a). Es seguro que uno de los aviones llega hasta el blanco:
a13 = 1
vi) I2 II3 (Los aviones vuelan a lo largo de una vı́a de acceso; todos los cañones
cubren la misma vı́a) Para que el objetivo sea destruido, los aviones deben
elegir una vı́a no defendida:
2
3
a23 =
La matriz de 2 × 3 se muestra aquı́.
II1
II2
II3
I1
0
1
I2
1
2
3
2
3
2
3
Es claro, que la estrategia II3 es dominada por la estrategia II2 . Por lo tanto,
podemos eliminar II3 y reducir la matriz a un juego de 2 × 2. La matriz de 2 × 2 se
muestra aquı́. Esta matriz tiene un punto de silla: los valores inferior y superior del
juego son los mismos:
v=
2
3
II1
II2
I1
0
I2
1
2
3
2
3
Nótese también que la estrategia I1 es dominada por la estrategia I2 . La solución del
juego es que ambos jugadores deben usar estrategias puras, la I2 y la II2 . Es decir,el
Avila Garcia
3.8. Método Algebraico
31
jugador I siempre debe enviar ambos aviones juntos, eligiendo al azar la vı́a de acceso
particular, mientras que el jugador II debe cubrir una vı́a con dos cañones y otra
con el tercero, también eligiendo al azar las dos vı́as. Nótese que, en este caso, aun
las estrategias “puras” contienen elecciones que rige al azar. Con estas estrategias
óptimas, la ganancia media siempre será v = 32 ; es decir, el objetivo será destruido
con una probabilidad de v = 23 . Hay un rango contı́nuo de estrategias mixtas que son
óptimas para I, yendo desde p1 = 0 hasta p1 = 13 .
3.8.
Método Algebraico
Los juegos finitos más sencillos, que siempre pueden resolverse por medio de
métodos elementales, son los juegos de 2 × 2 y los de 2 × n. Considérese un juego de
2 × 2 con la matriz que se muestra. Si este juego tiene un punto de silla, la solución
consiste de la pareja de estrategias puras que se intersectan en el punto silla.
II1
II2
I1
a11
a12
I2
a21
a22
Supóngase que el juego no tiene punto de silla, de modo que los valores inferior
y superior del juego son desiguales. Se desea hallar nuestra estrategia mixta óptima
!
I
I
1
2
Si∗ =
(3.9)
p1 p2
la cual tiene la propiedad de que no importa lo que haga el oponente (en tanto que
sólo use sus estrategias convenientes) la ganancia promedio será igual a v, el valor del
juego. En un juego de 2 × 2 sin punto de silla, ambas estrategias de nuestro oponente
son puras convenientes. En caso contrario, la solución consistirı́a de estrategias puras,
lo cual significa que tendrá un punto de silla. De aquı́ que si nos adherimos a nuestra
estrategia óptima el oponente puede usar cualquiera de sus estrategias puras II1 , II2
sin cambiar la ganancia media v. Esto proporciona dos ecuaciones:
a11 p1 + a21 p 2 = v,
a12 p1 + a22 p 2 = v,
Avila Garcia
(3.10)
3.8. Método Algebraico
32
Puesto que p1 + p2 = 1, a partir de estas ecuaciones se ve que:
a11 p1 + a21 (1 − p1 ) = a12 p1 + a22 (1 − p1 ) ,
o bien
p1 =
a22 − a21
,
a11 + a22 − a12 − a21
p 2 = 1 − p1
(3.11)
(3.12)
El valor v del juego se encuentra substituyendo los valores de p1 y p 2 en
cualquiera de las ecuaciones 3.10.
Análogamente se puede aplicar para q1 , q2 , que nos proporciona dos ecuaciones:
a11 q1 + a12 q 2 = v,
a21 q1 + a22 q 2 = v,
(3.13)
Puesto que q1 + q2 = 1, a partir de estas ecuaciones se ve que:
a11 q1 + a12 (1 − q1 ) = a21 q1 + a22 (1 − q1 ) ,
o bien
q1 =
a22 − a12
,
a11 − a12 − a21 + a22
q 2 = 1 − q1
(3.14)
(3.15)
Por otro lado, también se puede calcular el valor de q1 y q2 , conociendo el valor
del juego, digamos:
a11 q1 + a12 q2 = v.
Puesto que q1 + q2 = 1, se tiene:
q1 =
v − a12
,
a11 + a12
q 2 = 1 − q1 .
Avila Garcia
(3.16)
(3.17)
3.8. Método Algebraico
33
Ejemplo 3.8.1
El grupo de administración de la empresa Pascual, ha recibido el encargo de
preparar una estrategia que pueda seguir la empresa durante las próximas negociaciones. En su experiencia anterior, el grupo ha desarrollado las siguientes estrategias
para la empresa Pascual:
C1 = Se esperan negociaciones muy difı́ciles con los trabajadores
C2 = Se considera que las peticiones de los trabajadores son prácticas.
C3 = Se considera que las peticiones de los trabajadores son poco prácticas.
C4 = Amplias variaciones en las peticiones de los trabajadores.
De acuerdo con su historia pasada, los trabajadores sugieren las siguientes estrategias:
U1 = Peticiones muy costosas de parte de los trabajadores
U2 = Peticiones costosas de parte de los trabajadores
U3 = Peticiones normales de parte de los trabajadores
U4 = Peticiones favorables a la empresa, pero no para los trabajadores
El problema de cuál estrategia debe emplear el grupo de administración de la empresa
Pascual, depende de la estrategia que adopten los trabajadores (que es difı́cil conocer).
Sin embargo, con ayuda de la Secretarı́a del Trabajo y Previsión Social (STPS - de
donde han solicitado apoyo en vista de las perspectivas de unas negociaciones muy
difı́ciles con los trabajadores, y la posibilidad de una huelga prolongada), el grupo
de administración preparó una tabla de costos de un aumento condicional de salarios
(tabla 1). La STPS indicó que los trabajadores prepararon una tabla semejante, porque
se les ha proporcionado la misma información.
La tabla de costos del aumento condicional de salarios se interpretará como
sigue: si la administración de la empresa Pascual adopta la estrategia C1 y el sindicato
adopta la estrategia U1 el contrato final estipulará que la compañı́a concederı́a un
aumento de $25.00. Las demás anotaciones de la tabla 1 tienen el mismo significado.
En vista de esas cifras, ¿qué harán los negociadores?.
Avila Garcia
3.8. Método Algebraico
34
Tabla de costos de un aumento condicional de salarios (matriz de 4 × 4)
Estrategias de la esmpresa Pascual
C1
Estrategias
de los
trabajadores
C2
C3
C4
U1
+$25.00 +$14.00 +$15.00 +$32.00
U2
+$40.00 +$17.00 +$13.00 +$16.00
U3
+$30.00
+$5.00
+$12.00 +$15.00
U4
−$1.00
+$8.00
+$11.00
+$3.00
En cualquier problema de la teorı́a de juegos, el primer paso consiste en hacer
la prueba del punto de silla, que en este caso especial no es aplicable. El siguiente
consiste en examinar la matriz para buscar si hay algún dominio que pueda aplicarse,
y entonces puede preguntarse: ¿por qué deben jugar los trabajadores el renglón U4 , ya
que esto darı́a a la empresa la posibilidad de ganar, o aceptar un aumento menor?. Es
claro, que los trabajadores nunca jugarán el renglón U4 , porque pueden obtener mejores
resultados jugando los renglones U1 y U2 . Por lo tanto, el renglón U4 está dominado
y se desecha, porque una o más estrategias siempre proporcionarán a los trabajadores
un mejor pago que el de la estrategia dominada, independientemente de lo que haga
la empresa respecto a la regla de renglones, todas las anotaciones de los renglones U1
y U2 , son iguales o mayores que la anotación correspondiente del renglón U4 , desde
el punto de vista de la S.T.P.S, lo que reduce la matriz original 4 × 4, a la de 3 × 4
que se muestra en la siguiente tabla.
Tabla de costos de un aumento condicional de salarios (matriz de 3 × 4)
Estrategias de la empresa Pascual
C1
Estrategias
de los
trabajadores
C2
C3
C4
U1
+$25.00 +$14.00 +$15.00 +$32.00
U2
+$40.00 +$17.00 +$13.00 +$16.00
U3
+$30.00
+$5.00
+$12.00 +$15.00
Una inspección adicional revela que la columna C4 está dominada por la columna C3 , porque la empresa está tratando de reducir al mı́nimo sus pérdidas. Todas las
entradas de la columna C3 son iguales o menores que la anotación correspondiente de
la columna C4 , de acuerdo con la regla de columnas. La nueva matriz de 3 × 3 aparece
en la tabla.
Avila Garcia
3.8. Método Algebraico
35
Tabla 3: Costos de un aumento condicional de salarios (matriz de 3 × 3)
Estrategias de la empresa Pascual
Estrategias
de los
trabajadores
C1
C2
C3
U1
+$25.00
+$14.00
+$15.00
U2
+$40.00
+$17.00
+$13.00
U3
+$30.00
+$5.00
+$12.00
La inspección de la tabla 3 revela que el renglón U3 está dominado por el renglón
U2 . Los aumentos de salarios del renglón U2 ($40.00, $17.00 y $13.00), son iguales o
mayores que las anotaciones correspondientes del renglón U3 ($30.00, $5.00 y $12.00).
La nueva matriz de 2 × 3 aparece en la tabla 4.
Tabla 4: Costos de un aumento condicional de salarios (matriz de 2 × 3)
Estrategias de la empresa Pascual
Estrategias
de los
trabajadores
C1
C2
C3
U1
+$25.00
+$14.00
+$15.00
U2
+$40.00
+$17.00
+$13.00
La última oportunidad para aplicar el dominio ocurre en la columna C1 . Desde
el punto de vista de la empresa, los aumentos propuestos, que se muestran en la
columna C2 (+$14.00 y +$17.00), son iguales o menores que los de la columna C1
(+$25.00 y +$40.00). La matriz resultante es de 2 × 2 (tabla 5). Hay que notar que
el procedimiento de dominio puede emplearse para remover más de un renglón o una
columna en el mismo paso.
Tabla de costos de un aumento condicional de salarios (matriz de 2 × 2)
Estrategias de la empresa Pascual
Estrategias
de los
trabajadores
C2
C3
U1
+$14.00
+$15.00
U2
+$17.00
+$13.00
Avila Garcia
3.8. Método Algebraico
36
Obsérvese que después de realizar la técnica de dominación, ésta última matriz tampoco tiene punto de silla, se aplicará el método algebraico para la solución de este
juego.
Aplicando (3.11), se calcula el valor de p, obtenemos:
p1 =
13 − 17
4
=
14 + 13 − 15 − 17
5
Por lo tanto
4
1
=
5
5
El cálculo anterior indica que los trabajadores jugarán el primer renglón
p2 = 1 − p2 = 1 −
del tiempo y el segundo renglón
=
5
4
partes
=
5
1
Analogamente, aplicando (3.14) y (3.15), se calcula q1 y q2 , obteniendo:
q1 =
2
5
y
2
3
=
5
5
Luego, podemos encontrar el valor del juego v, haciendo uso de las ecuaciones (3.10).
q2 = 1 − q2 = 1 −
a11 p1 + a21 p2 = v
4
1
56 17
73
14
+ 17
=
+
=
5
5
5
5
5
73
El valor del juego es $
o bien $14.60, que es el aumento que pueden esperar
5
los trabajadores. Los trabajadores deben ganar, porque el valor del juego es positivo; si fuera negativo la empresa ganarı́a. Sin embargo, en la matriz original sólo se
presentó un valor negativo contra 15 positivos.
A continuación se ilustra está técnica para el caso de 2 jugadores, con 2 estrategias
de juego para cada uno e inexistencia de un punto silla.
Ejemplo 3.8.2
Supóngase la siguiente matriz de consecuencias:
II1
II2
Probabilidades
I1
5
35
p1
I2
20
10
p2
Probabilidades
q1
q2
Avila Garcia
3.8. Método Algebraico
37
Solución. Si el jugador I selecciona la estrategia I1 , su consecuencia esperada será:
5q1 + 35q2 ,
mientras que si selecciona la I2 , ésta será:
20q1 + 10q2 .
Como ambos valores esperados deben ser los mismos, se tiene que:
5q1 + 35q2 = 20q1 + 10q2 .
Dado que qi ≤ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:
q1 + q2 = 1.
Las dos ecuaciones anteriores con dos incógnitas generan los valores
q1 = 0.625
q2 = 0.375
Análogamente, si el jugador II selecciona la estrategia II1 , su consecuencia esperada
será
5p1 + 20p 2 ,
mientras que si selecciona la II2 , ésta será:
35p1 + 10p 2
y, como ambas deben ser iguales, se tiene que:
5p1 + 20p 2 = 35p1 + 10p 2 .
Dado que pi ≥ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:
p1 + p 2 = 1.
Las dos ecuaciones anteriores con dos incógnitas generan:
p1 = 0.25
p 2 = 0.75
Avila Garcia
3.9. Método Geométrico para los juegos 2 × n
38
El valor del juego será, entonces:
V = 5 (0.25) + 20 (0.75) = 35 (0.25) + 10 (0.75)
= 5 (0.625) + 35 (0.375) = 20 (0.625) + 10 (0.375)
= 16.25
Nótese que existen cuatro posibilidades diferentes para calcular el mismo valor V .
Lo anterior se interpreta diciendo que las estrategias mixtas para el jugador I son
(0.25, 0.75) y para II (0.625, 0.375). La consecuencia esperada es que I gane 16.25 y
II pierda la misma cantidad.
La técnica anterior se complica cuando cada jugador tiene más de dos estrategias
a elegir. La solución para un caso más general se proporcionará, con técnicas de
programación lineal. Para el caso en que un jugador tiene dos estrategias y el otro m
(m > 2), entonces los métodos gráficos trabajan adecuadamente. Éstos enseguida se
explican.
3.9.
Método Geométrico para los juegos 2 × n
Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo
menos uno de los jugadores, tiene solamente dos estrategias.
Considérese el siguiente juego 2 × n.
II
I
y1
y2
...
yn
x1
a11
a12
...
a1n
x2 = 1 − x1
a21
a22
...
a2n
Supóngase que este juego no tiene un punto de silla. Puesto que I tiene dos
estrategias, se deduce que x2 = 1 − x1 ; x1 ≥ 0, x2 ≥ 0.
Los pagos esperados correspondientes a las estrategias puras de II se muestran
en la siguiente tabla.
Estrategia pura de II
Pago esperado de I
1
(a11 − a21 )x1 + a21
2
..
.
(a12 − a22 ) x1 + a22
n
(a1n − a2n ) x1 + a2n
Avila Garcia
3.9. Método Geométrico para los juegos 2 × n
Esto muestra que el pago promedio de I varı́a linealmente con x1 . Según el criterio
minimax de juegos de estrategias mixtas, el jugador I debe seleccionar el valor de x1
que maximice sus pagos mı́nimos esperados. Esto se hace mediante el trazo de lı́neas
rectas como funciones de x1 . El siguiente ejemplo ilustra esta técnica.
Considere el siguiente juego (2 × 4)
II
I
1
2 3
4
1
2
2 3
-1
2
4
3 2
6
Este juego no tiene un punto de silla. Consecuentemente, los pagos esperados
de I correspondientes a las estrategias puras de II están dados de la siguiente forma.
Estrategia pura de II
Pago esperado de I
1
−2x1 + 4
2
−x1 + 3
3
x1 + 2
4
−7x1 + 6
Estas cuatro rectas se deben trazar como funciones de x1 como se muestran en la
figura. Gráficamente el maximin ocurre en x ∗ = 1 . Este es el punto de intersección de
1
2
dos rectas 2, 3 y 4. Consecuentemente, la estrategia óptima de I es (x1∗ = 12 , x2∗ = 21 ),
y el valor del juego se obtiene sustituyendo x1 en la ecuación de cualesquiera de las
lı́neas que pasan por el punto maximin. De aquı́ obtenemos,

5
1


−
+
3
=


2
2




1
5
v∗ =
+2=

2
2





1
5

 −7 + 6 =
2
2
A fin de determinar las estrategias óptimas de II se debe observar que 3 rectas
pasan por el punto maximin. Lo cual nos indica que II puede combinar las tres
estrategias.
Avila Garcia
39
3.9. Método Geométrico para los juegos 2 × n
6
5
4
3
Pago
promedio
2
1
x1 = 0
−1
−2
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..............................
...........................
... .......
...
...
..... .............
...
.......
...
...
.......
...
...
.
.
.......
.
.......
..........................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.......
...
...
.......
...
.
...
.
.
.......
...
.......
.....
...
.......
...
...
.......
.......
.......................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.......
....................
...
....
.......
....................
...
.......
....................
...
...
.................... .......
...
...........................
...
...
...................
...
....... ....................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.................................................
.
.
.......
....................
...
.................
.
.
.
.
.
.
.
.......................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
.
.
.
.
.
.
.
..................................................
.......
.......................................
...
.
.
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
....... .
...
.......
...
...
........................................................................................................... ........................................
.
.
....................................... ...................
.......
.......................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.....
.
.
.
.
......................................................... .....
.......
..............
.......
........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...............................................
.......
....
...
.......
...
...
.
.
.
.......
....
....
.......
.......
.....
.....
.......
.......
.........................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.......
....
...
.......
...
...
.......
.......
....
....
.......
...
...
.
.
.
..
........................................................................................................................................................................................................................................................................................................................
.......
...
...
.......
.......
.....
.....
.......
...
....... ....
....... ...
....
.........................
...........................
...
...
.....
.....
...
...
...
....
.........................
..........................
...
...
...
...
....
....
...
...
...
...
4
40
Maximin
1
2
3
?
1
x1∗ =
2
v∗ =
5
2
x1 = 1
Dos rectas cualesquiera que tengan signos opuestos en sus pendientes definen
una solución óptima alternativa. Por consiguiente, de las tres combinaciones (2, 3),
(2, 4) y (3, 4), la combinación (2, 4) debe excluirse como no óptima.
La primera combinación (2, 3) implica que y1∗ = y4∗ = 0. En consecuencia, y3 = 1 − y2
y los pagos promedios dde II correspondientes a las estrategias puras I están dadas
como sigue:
Estrategia pura de I
Pago esperado de II
1
−y2 + 3
2
y2 + 2
Por consiguiente,y2∗ (correspondiente al punto minimax) puede determinarse de
−y2∗ + 3 = y2∗ + 2
Esto da por resultado y2∗ = 12 .
1
Obsérvese que si sustituimos y2∗ = en los pagos esperados de II dados an2
5
teriormente, el valor minimax es , el que es igual al valor del juego v ∗ como es de
2
esperarse.
La combinación restante (3, 4) puede ser tratada da manera similar para obtener
una solución óptima alternativa. Cualquier promedio ponderado de las combinaciones
(2, 3) y (3, 4) proporcionará también una nueva solución óptima que mezcle las tres
estrategias 2, 3 y 4.
Avila Garcia
3.10. Solución de juegos 2 x 2 con engaño
3.10.
Solución de juegos 2 x 2 con engaño
Considérese a continuación un juego más complicado, uno cuya solución no es
tan obvia. Es un ejemplo sencillo pero instructivo de juegos que contienen engaño. En
las situaciones antagónicas que se presentan en la vida real, se usan muchos recursos
para engañar al oponente (información falsa, representación falsa de objetivos, etc.).
Ejemplo 3.10.1
Se tienen dos cartas, un as y un dos, con la cara hacia abajo sobre la mesa. El
jugador I levanta una de ellas al azar, sin mostrarla al jugador II. Si la carta es el
as, I debe decir “Tengo el as” y pedir $1.00 a II. Si la carta es el dos, I puede decir:
“Tengo el dos” y pagar $1.00 a II, o bien, “tengo el as” y pedir $1.00 a
II.
Si se le ofrece un peso a II, debe tomarlo. Si se le pide un peso, puede:
a) Creer que I tiene el as y pagarle, o bien,
b) No creerle y exigir que se le muestre la carta. Si pide que se le muestre la carta
y resulta que I tiene en efecto el as, debe pagar $2.00 a I. Si pide que le muestre
la carta y I tiene el dos, I debe pagarle $2.00. A continuación se analiza este
juego para hallar la estrategia óptima para cada bando.
Solución.
El juego tiene una estructura relativamente compleja, consiste de
una jugada aleatoria y obligatoria -la elección de una carta por I- y de dos jugadas
personales que pueden hacerse o no. Si I levanta el as, no tiene opción: sólo puede
pedir $1.00 a II. Entonces II tiene una elección personal -creer a I o no creerle, (es
decir, pagarle o pedirle que le muestre la carta). Si en la primera jugada aleatoria
resulta que I levanta el dos, entonces tiene que hacer una elección -engañar o no
engañar. Si I engaña, II tiene nuevamente la misma elección -creerle o no, (es decir,
pagarle o pedir que le muestre la carta); si no engaña, II no tiene más que aceptar
su $1.00.
Las estrategias de los dos jugadores serán las reglas que adopten para determinar
sus jugadas personales.
Claramente I sólo tiene dos estrategias:
• I1 -engañar;
I2 -no engañar.
Avila Garcia
41
3.10. Solución de juegos 2 x 2 con engaño
42
II también tiene dos estrategias:
• II1 -creer a I;
II2 -pedir que se le muestre la carta.
Para construir la matriz del juego, se necesita calcular el valor medio de la ganancia
para cada una de las combinaciones de estrategias.
1. I1 II1 I engaña;
II le cree; se calcula la ganancia promedio.
i) Si I extrae el as (la probabilidad de que suceda esto es
1
2
), no tiene jugada
personal; debe pedir $1.00 a II, y éste lo paga; la ganancia para I en pesos
es 1.
ii) Si I extrae el dos (la probabilidad de que suceda esto también es 12 ), engaña
y pide $1.00 a II, quien lo paga; la ganancia es nuevamente 1.
La ganancia promedio es
a11
2. I1 II2 I engaña;
1
1
(1) +
(1) = 1.
=
2
2
(3.18)
II pide que se le muestre la carta; hay que calcular a12 .
i) Si I extrae el as, no tiene jugada personal; debe pedir $1.00 a II; II pide
que se le muestre la carta y, como consecuencia, debe pagar $2.00 a I (la
ganancia para I en pesos es 2).
ii) Si I extrae el dos, engaña y pide $1.00 a II; II pide que se le muestre la
carta y, como resultado, recibe $2.00 de I (la ganancia de I en pesos es
−2).
La ganancia promedio es
a12
3.
I2 II1 I no engaña;
1
1
=
(+2) +
(−2) = 0.
2
2
(3.19)
II no le reta; calculemos:
i) Si I extrae el as, pide $1.00; II lo paga y la ganancia para I en pesos es 1.
ii) Si I extrae el dos, le paga $1.00 a II y II tiene que aceptarlo (la ganancia
de I en pesos es −1). La ganancia promedio es:
1
1
a21 =
(+1) +
(−1) = 0.
2
2
Avila Garcia
(3.20)
3.10. Solución de juegos 2 x 2 con engaño
4.
I2 II2 I no engaña;
43
II le reta; calculemos:
i) Si I extrae el as, pide $1.00; II pide que se le muestre la carta y, como
resultado, debe pagar $2.00 a I (la ganancia en pesos es +2).
ii) Si I extrae el dos, paga $1.00 a I, quien debe aceptarlo (la ganancia es
−1).
La ganancia promedio es:
1
1
1
=
(+2) +
(−1) = .
2
2
2
a22
(3.21)
La matriz del juego se muestra aquı́.
II1
II2
I1
1
0
I2
0
1
2
1
y el juego no tiene punto de
2
silla. Por tanto, la solución debe consistir de estrategias mixtas. Aplicando la ecuación
El valor inferior del juego es 0, el valor superior es
(3.11), se obtiene:
p1 =
1
2
1+
1
2
Es decir, I debe engañar en
1
= ,
3
1
3
2
p2 = ,
3
SI∗ =
I1 I2
1
3
2
3
!
.
de las ocasiones y no engañar en
2
3
de las mismas.
Entonces podemos calcular la ganancia promedio o valor del juego:
v=
El hecho de que v =
1
3
1
.
3
> 0 significa que el juego tal y como se presenta no es equitativo
para II. Aplicando su estrategia óptima, I siempre puede estar seguro de obtener una
ganancia promedio de 13 . Nótese que aplicando su estrategia más cautelosa (maximin)
(en este caso, tanto I1 como I2 son maximin) I puede garantizarse una ganancia de
0, de modo que según las reglas del juego, al aplicar una estrategia mixta, obtiene
una ventaja sobre II.
Hállese la estrategia óptima para II. Se tiene:
(1) q1 + (0) q2 =
1
;
3
q1 =
1
,
3
Avila Garcia
q2 =
2
.
3
3.11. Método de subjuegos para encontrar el valor del juego
44
de aquı́ que:
∗=
SII
II1 II2
1
3
2
3
!
.
Es decir, el jugador II debe creerle al jugador I en
muestre la carta en
2
3
1
3
de los casos y pedir que le
. Entonces perderá, en promedio, en
1
3
de las veces. Si aplica su
estrategia pura minimax II2 (pedir que se le muestre la carta), perderı́a en promedio,
1
2
de las veces.
3.11.
Método de subjuegos para encontrar el valor
del juego
Este método nos facilita el encontrar el valor del juego para un juego de 2 × 2,
y muchos juegos más grandes pueden reducirse mediante el dominio a un juego de
2 × 2. Sin embargo, esto no incluirá todos los casos, porque esa reducción no siempre
puede hacerse. Por ejemplo, dos lı́neas aéreas cubren la misma ruta, y ambas tratan
de obtener la mayor porción posible del mercado. Una de las lı́neas aéreas I, parece
más agresiva, porque su situación financiera es muy sólida y su departamento de
mercadotecnia conoce mejor las condiciones del mercado. La matriz de pagos de la
siguiente tabla muestra las pérdidas y las ganancias mensuales de pasajeros, basadas
en ciertas condiciones del mercado. La matriz se lee de este modo: los valores positivos
favorecen a la lı́nea aérea I, mientras que los negativos favorecen a la lı́nea aérea II.
Tabla de matriz de pagos de 2 × 3 de dos lı́neas áereas
Lı́nea: Mexicana de aviación (jugador II)
Lı́nea:
Aereoméxico
(jugador I)
A
B
C
B
300
−25
−50
C
150
155
175
A: No hace nada.
B: Anuncia tarifas ordinarias y especiales.
Avila Garcia
3.11. Método de subjuegos para encontrar el valor del juego
C: Anuncia caracterı́sticas especiales (pelı́culas cinematográficas y magnı́ficos alimentos.
El juego de 2 × 3 expresado en la tabla anterior, puede considerarse como tres
juegos de 2 × 2.
Subjuego 1:
M !
300 −25
A
columnas 1 y 2.
150 155
subjuego 2:
M !
300 −50
A
columnas 1 y 3.
150 175
Subjuego 3:
A
M !
−25 −50
155
175
columnas 2 y 3.
La lı́nea aérea II, que puede escoger no jugar una de las columnas, está tratando de
determinar la combinación de una estrategia de dos columnas que sea la mejor para
ella. Como se hizó notar anteriormente, el jugador que tenga el mayor número de
columnas o renglones, tiene la mayor flexibilidad, lo que generalmente da por resultado
una estrategia mejor. Sin embargo, en este juego hay cuatro valores positivos contra
dos negativos. A fin de obtener la solución de la mejor estrategia para la lı́nea aérea
II, habrá que resolver las estrategias y valores del juego de los tres subjuegos de 2×2.
Nótese que cuando no se juega una columna, se representa con un cero. Después puede
usarse cualquiera de los métodos anteriormente vistos.
Subjuego 1:
A
M !
300 −25
150 155
no se está jugando la tercera columna.
Estrategias:
A=
M=
1 65
,
66 66
36 30
,
, 0.
66 66
Avila Garcia
45
3.11. Método de subjuegos para encontrar el valor del juego
Valor del juego: 152.27
Subjuego 2:
A
M !
300 −50
150 175
no se está jugando la segunda columna.
Estrategias:
A=
M=
1 14
,
15 15
9
6
, 0,
.
15
15
Valor del juego: 160.
Subjuego 3:
A
M !
−25 −50
155
175
no se está jugando la primera columna.
Estrategias:
A = 0, 1
M = 0, 1, 0.
Valor del juego: 155.
De acuerdo con los cálculos precedentes, se escoge el valor positivo más bajo,
en este caso el subjuego 1, porque la lı́nea aérea II tiene más flexibilidad. Aunque
la lı́nea aérea I debe jugar cualquier renglón, la lı́nea aérea II no tiene que jugar
las tres columnas, sino dos solamente. La estrategia de la lı́nea aérea II consiste en
jugar la primera columna del tiempo, y la segunda, del tiempo. La lı́nea aérea II no
utilizará la tercera columna. Puede comprobarse que esta estrategia es la óptima si
se observa detalladamente la matriz original.
La solución (valor del juego de 152.52 en favor de la lı́nea aérea I), indica que
I escoge su estrategia mixta de tal modo que gane (o pierda) lo mismo, independientemente de la selección de la columna de II. Como se expresó anteriormente sobre
la forma de determinar una estrategia mixta, las expectaciones de I al jugar una
Avila Garcia
46
3.11. Método de subjuegos para encontrar el valor del juego
estrategia mixta (entre sus renglones), son las mismas, independientemente de lo que
juegue II. Esto puede expresarse algebraicamente haciendo que el valor del juego del
subjuego 1, sea igual a la columna que juegue II, lo que se demuestra como sigue:
Las ecuaciones precedentes significan que I espera ganar 152.27 clientes, independientemente de la selección de II. El signo ≥ significa que I podrı́a ganar más de
152.27 clientes si II escogiera una estrategia incorrecta. Si las estrategias que hemos
encontrado son óptimas, deben satisfacer las tres desigualdades anteriores. Substituyendo los valores de I1 (1 ) y de I2 ( ), los resultados son los siguientes.
Las tres desigualdades se satisfacen con los valores insertados para las estrategias de I. Sin embargo, cuando II juega la columna 3, I gana más de 152.27 clientes,
porque ésa es una mala estrategia para II, y ésta es la razón de que II no juegue la
columna 3, porque darı́a a I una ventaja adicional en un juego que la favorece.
Como los requerimientos de las estrategias de I se satisfacen, el paso siguiente
es examinar las estrategias de II, para determinar si son óptimas. II ha sus escogido
estrategias de tal modo que pueda reducir al mismo sus pérdidas, lo que puede expresarse algebraicamente haciendo que el valor del juego del subjuego 1 sea igual a
los renglones que juegue I:
Las desigualdades precedentes significan que II espera perder 152.27 clientes,
independientemente de las selecciones de I. El signo ≤ indica que II puede perder
menos, Si I escoge estrategias incorrectas. De nuevo, si las estrategias que hemos encontrado son óptimas, deben satisfacer las dos últimas desigualdades. Si substituimos
los valores de II1 II2 y II3 , los resultados son los siguientes.
Columna 1:
300
1
66
+ 150
65
66
≥ 152.27;
4.54 + 147.73 = 152.27
≥ 152.27;
−0.38 + 152.65 = 152.27
≥ 152.27;
−0.76 + 172.35 > 152.27
Columna 2:
−25
1
66
1
66
+ 155
65
66
65
66
Columna 3:
−50
+ 175
Avila Garcia
47
3.11. Método de subjuegos para encontrar el valor del juego
Luego,
171.59 > 152.27
Las tres desigualdades se satisfacen con los valores insertados para las estrategias de A. Sin embargo, cuando M juega la columna 3, A gana más de 152.27 clientes,
porque ésa es una mala estrategia para M , y ésta es la razón de que M no juegue la
columna 3, porque darı́a a A una ventaja adicional en un juego que la favorece.
Avila Garcia
48
Capı́tulo 4
Programación Lineal
4.1.
Teorema del Mı́nimax
Teorema 4.1.1 (Teorema del Mı́nimax)
En todo juego bipersonal finito de suma cero, existen estrategias óptimas x ∗ ∈ X,
y ∗ ∈ Y para cada jugador y se verifica v M = v M = v ∗ siendo v ∗ el valor del juego.
I
Demostración.
II
Considérense los siguientes Programas Lineales: Primal y
Dual, respectivamente.
Jugador I
Jugador II
Primal
Dual
−
máx v
Min v
−
a11 x1 + · · · + am1 xm ≥ v
a11 y1 + · · · + a1n yn ≤ v
············
············
−
a1n x1 + · · · + amn xm ≥ v
am1 y1 + · · · + amn yn ≤ v
x1 + · · · + xm = 1
y1 + · · · + yn = 1
0 ≤ xi ≤ 1, i = 1, . . . , m
0 ≤ yj ≤ 1, j = 1, . . . , n
Obsérvese que el nivel de seguridad para una estrategia mixta x
b ∈ X viene dado por:
vI (b
x) = vII (b
x) = mı́n x
b t Ay,
y∈Y
49
4.1. Teorema del Mı́nimax
50
cuyo valor puede obtenerse por medio del dual, es decir
Máx λ (b
x)
sujeto a ~e λ (b
x) ≤ x
b tA
x
b ∈ X,
λ (b
x) ∈ R
donde ~e = (1, . . . , 1) t
Las estrategias que proporcionan los mejores niveles de seguridad son las que
verifican, lo siguiente:
vIM = máx vI (x)
x∈X
Estas estrategias ası́ como el valor del juego pueden obtenerse a través del
siguiente problema de programación lineal:
Máx vI
sujeto a ~e vI ≤ xt A
x∈X
Este razonamiento también se puede aplicar para el segundo jugador. Pues al
minimizar su nivel de seguridad de forma que limite al otro jugador se tiene otro
problema de programación lineal de la siguiente forma:
Min vII
sujeto a Ay ≤ vII ~e
y∈Y
Comparando estos dos programas lineales, tenemos:
Máx vI
Min vII
sujeto a ~e vI ≤ xt A
sujeto a Ay ≤ vII ~e
x∈X
y∈Y
Obsérvese que estos dos programas son duales. Si ambos programas lineales
∗
∗
tienen soluciones óptimas x∗ , y ∗ ⇒ vI∗ = vII
, es decir vI∗ = vII
= v ∗ donde v ∗ es el
valor del juego.
Avila Garcia
4.2. Solución por medio de Programación Lineal
4.2.
51
Solución por medio de Programación Lineal
Todos estos métodos se reducen esencialmente a la solución del problema mediante aproximaciones sucesivas, pero al sistematizar la sucesión de aproximaciones,
se puede construir un algoritmo que conduzca a la solución más económica posible.
Se presenta una breve explicación del método mediante programación lineal para resolver juegos de m × n. Primero se establece el planteamiento general del problema
de hallar la solución de un juego de m × n. Supóngase que se tiene un juego de m × n
en el cual el jugador I tiene m estrategias
I1 , I2 , . . . , Im
y el jugador II tiene n estrategias
II1 , II2 , . . . , IIn
y se da la matriz de ganancias aij . Se requiere hallar la solución del juego,es decir, las
estrategias mixtas para cada jugador:
!
I1 I2 . . . Im
SI =
,
p1 p2 . . . pm
SII =
II1 II2 . . . IIn
q1
q2
...
qn
!
.
donde
p1 + p2 + . . . + p n = 1
q1 + q 2 + . . . + q n = 1
(Algunos de los números pi , qj pueden ser cero.)
También cabe destacar que el concepto de dualidad en teorı́a de juegos es importante. Como anteriormente se describe las estrategias óptimas de I satisfacen
(
!)
m
m
m
X
X
X
máx mı́n
ai1 xi ,
ai2 xi , . . . ,
an1 xi
xi
i=1
i=1
i=1
sujeta a las restricciones
x1 + x2 + . . . + xm = 1
xi ≥ 0, i = 1, 2, . . . , m
Este problema puede llevarse a la forma de programación lineal como sigue. Sea
!
m
m
m
X
X
X
v = mı́n
ai1 xi ,
ai2 xi , . . . ,
an1 xi
i=1
i=1
Avila Garcia
i=1
4.2. Solución por medio de Programación Lineal
52
entonces haciendo uso del teorema minimax, tenemos:
maximizar:
z=v
m
X
ai1 xi ≥ v,
sujeto a:
j = 1, 2, . . . , n
i=1
La formulación de programación lineal anterior puede simplificarse dividiendo entre
v todas las (n + 1) restricciones. Esta división es correcta siempre que v > 0. De
otra manera si v < 0, debe invertirse el sentido de las restricciones de desigualdad. Si
v = 0 no está definida la división. Supóngase que v > 0, las restricciones del problema
lineal son:
x1
x2
xm
+ a21 + . . . + am1
≥1
v
v
v
x1
x2
xm
a12 + a22 + . . . + am2
≥1
v
v
v
..
.
a11
a1n
Sea x̄i =
x1
x2
xm
+ a2n + . . . + amn
≥1
v
v
v
x1 x2
xm
1
+
+ ... +
=
v
v
v
v
xi
, i = 1, 2, . . . , m. Pues
v
1
máx v = mı́n = mı́nx̄1 + x̄2 + . . . + x̄m
v
El problema es
minimizar z = x̄1 + x̄2 + . . . + x̄m
Sujeto a
a11 x̄1 + a21 x̄2 + . . . + am1 x̄m ≥ 1
a12 x̄1 + a22 x̄2 + . . . + am2 x̄m ≥ 1
..
.
a1n x̄1 + a2n x̄2 + . . . + amn x̄m ≥ 1
x̄1 , x̄2 , . . . , x̄m ≥ 0
El problema del jugador II está dado como
mı́n máx
yj
n
X
j=1
a1j yj ,
n
X
a2j yj , . . . ,
j=1
Avila Garcia
n
X
j=1
!
amj yj
4.2. Solución por medio de Programación Lineal
Sujeta a
y1 + y2 + . . . + yn = 1
yj ≥ 0, j = 1, 2, . . . + n
Esto también puede expresarse como un problema lineal como sigue:
máx w = ȳ1 + ȳ2 + . . . + ȳn
Sujeta a
a11 ȳ1 + a12 ȳ2 + . . . + a1n ȳn ≤ 1
a21 ȳ1 + a22 ȳ2 + . . . + a2n ȳn ≤ 1
..
.
am1 ȳ1 + am2 ȳ2 + . . . + amn ȳn ≤ 1
ȳ1 , ȳ2 , . . . , ȳm ≥ 0
donde
1
yj
w = , ȳj = , j = 1, 2, . . . , n.
v
v
Obsérvese que el problema del jugador II es el dual del problema del jugador I.
Por lo tanto, la solución óptima de un problema automáticamente proporciona la
solución óptima para el otro. El problema del jugador II puede resolverse con el
método simplex regular, en tanto que el problema del jugador I se resuelve con el
método dual simplex. La elección de uno u otro método dependerá de cuál problema
tenga un número más pequeño de restricciones. Esto a su vez depende del número de
estrategias puras para cada jugador.
Ejemplo 4.2.1 (aplicación de programación lineal)
Para demostrar el empleo de la programación lineal, se cita el caso de las dos
compañı́as más grandes del mundo de bebidas de cola: PEPSICO Y LA COMPAÑÍA
COCA-COLA. Éstas dos compañı́as son las más grandes y fuertes competidoras también dentro del paı́s. Las dos compañı́as están tratando de aumentar todavı́a más su
participación en el mercado, una a costa de la otra. La compañı́a PEPSICO está considerando la posibilidad de disminuir los precios, regalando bebidas gaseosas en cada
compra de un refresco de $12.00, o regalando un refresco familiar en la compra de
10 refrescos o más. Claramente, los gerentes de mercadotecnia de LA COMPAÑÍA
Avila Garcia
53
4.2. Solución por medio de Programación Lineal
54
COCA-COLA no pueden desconocer la proporción creciente del mercado de PEPSICO, y de hecho, LA COMPAÑÍA COCA-COLA probablemente pondrá en práctica su
propio programa, destinado a aumentar su participación en el mercado. Actualmente
la calidad y el precio de los productos competidores son iguales, es difı́cil determinar lo
que deba hacerse. La compañı́a PEPSICO ha preparado la siguiente matriz de pagos,
desde el punto de vista de las participaciones crecientes o decrecientes del mercado.
Matriz de pagos de 3 × 3 de dos Compañı́as refresqueras
LA COMPAÑÍA COCA-COLA
PEPSICO
A
B
C
A
4%
1%
-3 %
B
3
1
6
C
-3
4
-2
A = Disminución de precios
B = Regalo de bebidas gaseosas en compras de $12.00
C = Regalo de un refresco en compras de 10 refrescos o mas
Aplicando programación lineal a éste juego tenemos las siguientes restricciones:
4y1 + y2 − 3y3 ≤ V
3y1 + y2 + 6y3 ≤ V
−3y1 + 4y2 − 2y3 ≤ V
y1 + y2 + y3 = 1
En la última restricción se representa el tiempo empleado para jugar las tres columnas,
que se suma a la unidad y V representa el valor del juego.
Ahora se divide ambos lados de la desigualdad entre V .
4y1 y2 3y3
+
−
≤1
V
V
V
3y1
V
−
3y1
V
+
+
y2
V
4y2
V
+
−
6y3
V
2y3
V
≤1
≤1
Avila Garcia
4.2. Solución por medio de Programación Lineal
55
A fin de remover las V del denominador, es necesario diseñar una nueva variable
(ȳi ). Sea
ȳi =
yi
V
El juego se resolverá en términos de las (ȳi ), de modo que el resultado, se puede
multiplicar las ȳ por V para determinar las y originales (yi = ȳi V ). Las nuevas
desigualdades son:
4ȳ1 + ȳ2 − 3ȳ3 ≤ 1
3ȳ1 + ȳ2 + 6ȳ3 ≤ 1
−3ȳ1 + 4ȳ2 − 2ȳ3 ≤ 1
La ecuación (y1 + y2 + y3 = 1), también debe expresarse de nuevo en términos de las
yb, teniendo ası́ las cuatro restricciones como sigue:
4ȳ1 + ȳ2 − 3ȳ3 ≤ 1
3ȳ1 + ȳ2 + 6ȳ3 ≤ 1
−3ȳ1 + 4ȳ2 − 2ȳ3 ≤ 1
1
ȳ1 + ȳ2 + ȳ3 =
V
Ahora bien podemos expresar las ecuaciones anteriores en términos de un problema de
programación lineal, resolviendo las estrategias óptimas de y, y añadiendo una variable
de holgura a cada desigualdad.1 Hay que recordar que el objetivo de y consiste en
minimizar el valor del juego (V ), que es lo mismo que maximizar
1
V
.
Maximizar
ȳ1 + ȳ2 + ȳ3 =
1
V
Sujeto a:
4ȳ1 + ȳ2 − 3ȳ3 + ȳ4 + 0ȳ5 + 0ȳ6 = 1
3ȳ1 + ȳ2 + 6ȳ3 + 0ȳ4 + ȳ5 + 0ȳ6 = 1
−3ȳ1 + 4ȳ2 − 2ȳ3 + 0ȳ4 + 0ȳ5 + 1ȳ6 = 1
donde ȳ4 , ȳ5 e ȳ6 son variables de holgura. Aplicando el método simplex, obtenemos
el siguiente tableau; la variable que entra a la base es ȳ1 .
1
Véase [1],página(5).
Avila Garcia
4.2. Solución por medio de Programación Lineal
56
z
ȳ1
ȳ2
ȳ3
ȳ4
ȳ5
ȳ6
L.D
0
-1
-1
-1
0
0
0
0
ȳ4
4
1
-3
1
0
0
1
ȳ5
3
1
-6
0
1
0
1
ȳ6
-3
4
-2
0
0
1
1
Realizando la iteración obtenemos el siguiente tableau:
z
ȳ1
ȳ2
ȳ3
ȳ4
ȳ5
ȳ6
L.D
0
0
− 23
1
0
0
0
1
3
ȳ4
0
− 13
-11
1
− 43
0
− 13
ȳ1
1
1
3
2
0
1
3
0
1
3
ȳ6
0
5
4
0
1
1
2
z
ȳ1
ȳ2
ȳ3
ȳ4
ȳ5
ȳ6
L.D
0
0
0
0
0
0
ȳ1
1
0
ȳ2
0
1
2
15
- 19
15
4
15
1
5
2
15
1
15
1
- 15
1
5
3
5
ȳ4
23
15
161
- 15
26
15
4
5
1
0
0
− 15
1
5
2
5
La nueva variable a entrar a la base es ȳ3 y sale la variable ȳ4
z
ȳ1
ȳ2
ȳ3
ȳ4
ȳ5
ȳ6
L.D
1
7
15
- 161
26
161
12
161
1
- 21
19
161
10
161
17
161
21
7
1
- 161
9
- 161
33
161
4
7
3
161
27
161
62
161
0
0
0
0
ȳ3
0
0
1
ȳ1
1
0
0
ȳ2
0
1
0
Aplicando el algoritmo Simplex, se obtienen las estrategias óptimas de ȳ de acuerdo
al tableau final:
27
161
62
ȳ2 =
161
3
ȳ3 =
161
ȳ1 =
Avila Garcia
4.2. Solución por medio de Programación Lineal
57
A continuación es necesario convertir ȳ1 , ȳ2 e ȳ3 en estrategias reales de columna y, lo
que puede hacerse multiplicando por V . Sin embargo, lo que realmente hemos aumentado al máximo es
1
V
. Si
1
V
es igual a 47 . Entonces el valor de V = 74 , ası́ substituyendo
el valor de V , las estrategias de columna de y son las siguientes:
y1 = ȳ1 × V
27
7
×
161 4
97
y1 =
92
y1 =
y2 = ȳ2 × V
y3 = ȳ3 × V
62
7
×
161 4
62
y2 =
92
3
7
×
161 4
3
y3 =
92
y2 =
y3 =
Como ȳ4 es una variable de holgura no se jugará.
El procedimiento anterior para calcular las estrategias de y (ası́ como el valor
del juego), puede usarse para x. Las desigualdades siguientes representan las expectaciones de x:
4x1 + x2 − 3x3 ≥ V
3x1 + x2 + 6x3 ≥ V
−3x1 + 4x2 − 2x3 ≥ V
x1 + x2 + x3 = 1
Nuevamente dividiendo entre V , se obtiene:
4x1 x2 3x3
+
−
V
V
V
3x1 x2 6x3
+
+
V
V
V
3x1 4x2 2x3
−
+
−
V
V
V
x1 x2 x3
+
+
V
V
V
≥1
≥1
≥1
=
1
V
xi
, o bien xi = x̄i × V , podemos
V
expresar de nuevo las desigualdades y el valor del juego del modo siguiente:
La definición de una nueva variable x̄i , que es igual a
Avila Garcia
4.2. Solución por medio de Programación Lineal
Minimizar
x̄1 + x̄2 + x̄3 =
1
V
Sujeto a:
4x̄1 + 3x̄2 − 3x̄3 ≥ 1
x̄1 + x̄2 + 4x̄3 ≥ 1
−3x̄1 + 6x̄2 − 2x̄3 ≥ 1
Las ecuaciones anteriores pueden expresarse nuevamente añadiendo variables de holgura y artificiales. El jugador x quiere aumentar al máximo V , o reducir al mı́nimo
1
V
. Por lo tanto se tiene el siguiente programa lineal:
Minimizar
x̄1 + x̄2 + x̄3 =
1
V
Sujeto a:
4x̄1 + 3x̄2 − 3x̄3 − x̄4 + 0x̄5 + 0x̄6 + x̄7 + 0x̄8 + 0x̄9 = 1
x̄1 + x̄2 + 4x̄3 − 0x̄4 − x̄5 + 0x̄6 + 0x̄7 + x̄8 + 0x̄9 = 1
−3x̄1 + 6x̄2 − 2x̄3 + 0x̄4 + 0x̄5 − x̄6 + 0x̄7 + 0x̄8 + x̄9 = 1
donde x̄4 , x̄5 y x̄6 son variables de holgura, y x̄7 , x̄8 y x̄9 son variables artificiales.
Aplicando el algoritmo Simplex se produce la siguiente solución:
1
7
2
x̄2 =
7
1
x̄3 =
7
x̄1 =
Sin embargo, xi = x̄i × V , dan por resultado las siguientes estrategias de renglón para
x:
1 7 1
× =
7 4 4
2 7 1
x2 = × =
7 4 2
1 7 1
x3 = × =
7 4 4
x1 =
Avila Garcia
58
Capı́tulo 5
Juegos No Cooperativos
5.1.
Juegos suma diferente de cero o metajuegos
Los juegos que se han visto hasta ahora son de suma cero, en donde las ganancias
de un jugador equivalen a las pérdidas de su oponente. En este capı́tulo vamos a ver
juegos con suma no nula.
En los juegos cuya suma es diferente de cero, la ganancia de un jugador no
necesariamente implica pérdida para el otro; por el contrario puede implicar ganancia.
Las situaciones en la que la ganancia de uno no necesariamente implica la pérdida
de otro, se denominan juegos diferente de cero. Estos juegos han sido estudiados
matemáticamente, bajo el nombre de metajuegos o juegos entre dos personas con
suma no constante y su solución es generalmente un dilema. La mayor parte de los
modelos teóricos de juegos para situaciones en los negocios no son de suma constante,
porque es poco común que las empresas competidoras estén en conflicto total entre
sı́.
Ejemplo 5.1.1
Dilema del Prisionero. Dos prisioneros que escaparon y participaron en un robo fueron
recapturados y esperan el juicio por su nuevo délito. Aunque ambos son culpables, el
fiscal de Gotham City no tiene las pruebas suficientes para condenarlos. Para provocar que testifiquen uno contra el otro, el fiscal les dice lo siguiente a cada uno: ”si
sólo confiesa uno de ustedes y testifica contra su socio, el que confiese será liberado,
mientras que el que no confiese será condenado a una sentencia de 20 años. Si ambos confiesan, ambos serán condenados y pasarán 5 años en prisión. Por último, si
nadie confiesa, los puedo acusar de mal comportamiento y pasarán 1 año en prisión”.
59
5.1. Juegos suma diferente de cero o metajuegos
¿Qué debe hacer cada prisionero?
A continuación se presenta la matriz de recompensa para el dilema del prisionero.
Matriz de recompensa para el Dilema del Prisionero
Prisionero 1
Prisionero 2
Confeso
No confeso
Confeso
(−5, −5)
(0, −20)
no confeso
(−20, 0)
(−1, −1)
Solución: Si suponemos que los prisioneros no se pueden comunicar entre sı́, las estrategias y recompensas aparecen en la tabla anterior. El primer número en cada lugar
de esta matriz es la recompensa (negativa, ya que los años de prisión no se desean)
al prisionero 1, y el segundo elemento de cada lugar es la recompensa al prisionero 2.
Es importante hacer notar que la suma de las recompensas en cada lugar varı́a desde
un máximo de -2(-1 -1) hasta un número de -20(-20 + 0). Por lo tanto, no se trata
de un juego de dos jugadores con suma constante. Supongamos que cada prisionero
trata de no tener en cuenta cualquier estrategia dominada. Para cada prisionero, la
estrategia “confesar” domina a la “no confesar”. Sin embargo, si cada prisionero sigue
su estrategia no dominada (“confesar”), pasará 5 años en prisión. Por otro lado, si
cada prisionero escoge la estrategia “no confesar”, pasará 1 año en prisión. Ası́, si
cada prisionero escoge su estrategia dominada, ambos estarán mejor que si cada uno
escoge su estrategia no dominada.
Definición 5.1.1
Como en un juego de dos personas con suma cero, la elección de estrategia por parte
de cada jugador (prisionero) es un punto de equilibrio si ningún jugador puede sacar
provecho de un cambio unilateral de estrategia.
Por la definición anterior (-5, -5) es un punto de equilibrio, porque si cada prisionero
cambia su estrategia, su recompensa disminuye (de -5 a -20). Sin embargo, es evidente
que cada prisionero esta mejor en el punto (-1, -1). Para ver que el resultado (-1, -1)
quizá no suceda, obsérvese que no es punto de equilibrio, porque si en realidad estamos
en el resultado (-1, -1), cada prisionero puede aumentar su recompensa de -1 a 0,
cambiando su estrategia de “no confesar” a “confesar”. Es decir, cada prisionero puede
sacar provecho si traiciona a su oponente. Esto ilustra un aspecto importante de los
Avila Garcia
60
5.1. Juegos suma diferente de cero o metajuegos
juegos del tipo del Dilema del prisionero; si los jugadores cooperan (si cada prisionero
escoge “no confesar”), pueden salir ganando al traicionar a su cómplice (suponiendo
que la estrategia del cómplice permanece invariable). Sin embargo, si ambos jugadores
se traicionan mutuamente, ambos estarán peor que si hubieran escogido su estrategia
de cooperación. Esta anomalı́a no puede suceder en un juego de dos personas con
suma constante.
Veamos el caso del dilema del prisionero para un problema general.
Matriz de recompensa para un problema general del Dilema del
Prisionero
Jugador 1
Jugador 2
NC
C
NC
(P, P ) (T, S)
C
(S, T ) (R, R)
De modo más formal, un juego del tipo del Dilema del Prisionero se puede
describir como en la tabla anterior donde
N C = No Cooperativa la acción
C = Acción con cooperación
P = castigo por no cooperar
S = Pago a la persona que es traicionada
R = Recompensa por cooperar si ambos jugadores ası́ lo hacen
T = Tentación de traicionar al cómplice
En un juego del tipo del Dilema del Prisionero, (P, P ) es un punto de equilibrio.
Esto requiere que P > S. Para que (R, R) no sea punto de equilibrio se necesita que
T > R. Esto da a cada jugador la tentación de cambiar con respecto a su oponente.
El juego sólo es razonable si R > P . Ası́ que para que la tabla anterior represente
el juego del Dilema del Prisionero, necesitamos que T > R > P > S. Este juego es
interesante porque explica porqué dos adversarios no pueden cooperar entre sı́ con
frecuencia.
Avila Garcia
61
5.1. Juegos suma diferente de cero o metajuegos
62
Ejemplo 5.1.2
Hay dos restaurantes en competencia, Burger King y Mc Donalds, que tratan de
determinar sus presupuestos de propaganda para el próximo año. Las ventas combinadas de las dos empresas son de 240 millones de pesos y pueden gastar de 6 a
10 millones de pesos en propaganda. Si una de las empresas gasta más que la otra,
tendrá ventas de 190 millones de pesos. Si ambas empresas gastan la misma cantidad
en propaganda tendrán ventas iguales. Cada peso de ventas produce 10 centavos de
ganancia. Supóngase que a cada restaurante le interesa maximizar sus ventas, vamos
a determinar el punto de equilibrio para este juego.
Solución La matriz de recompensas correspondiente a este juego aparece en la
siguiente tabla.
Matriz de recompensa para el juego de propaganda
Burger King
Mc Donalds
Gastar 106 Gastar 6 × 106
Gastar 106
(2, 2)
(9, −1)
Gastar 6 × 106
(−1, 9)
(6, 6)
Nótese el gasto de 10 millones de pesos en propaganda como acción no cooperativa y
gastar 6 millones de pesos como acción cooperativa, entonces (2,2), que corresponde
a mucha propaganda por parte de ambos restaurantes, es un punto de equilibrio.
Sin embargo ambos restaurantes se encuentran mejor en (6,6) que en (2,2), (6,6) es
inestable porque cualquier restaurante puede ganar si cambia su estrategia. Ası́ para
proteger sus ganancias en el mercado, cada restaurante debe invertir mucho en la
propaganda.
Otro ejemplo que sigue el modelo del Dilema del prisionero es el caso que se ilustra
en la siguiente figura, para tres empresas comerciales.
Empresa
Comercial
Mexicana
Mantiene
precios
altos
Baja
precios
.................................................................................................................................................................
.........
..... ....
.....
.........
........
........
.........
....
........
........
.........
.
.
.
.
........
........
.
.
....
.
.
.....
........
........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
....
.
.
.
................................................................................................................................................................
.
.
.
.
.
.
.
....
.
..... ....
......
......
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
.
....
.....
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
......
..... .....
.....
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.....
.....
.....
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
....
...
...............................................................................................................................................................
..... ...............
....
...
...
...
...
...
...
... ............
....
.
.
.
.
.
....
....
....
....
.
.........
.
.
.
.
.
.
.
....
....
....
....
..... ....
.
.
.
.
.
.
.
.
....
....
....
.
.
.
....
......
.
.
.
.
.
.... ...............
....
....
....
.
....
.
.
.
.
.
.
... ...........
...
...
....
.
.....
.
.
.
.
.
.
................................................................................................................................................................
....
.
....
s
a
....
....
....
.... ..............
a j io
.......
....
....
....
B rec
........
....
....
....
........
p
.
.
.
.
.
...
...
...
.
.
e
........
....
....
....
.......
en
l
... ............
....
...
ti s
ia
.......................................................................................................................................................................
rc
an io
Mantiene
precios altos
Baja precios
M rec s
p lt o
a
Empresa comercial Aurrera
Avila Garcia
E
e
pr
m
sa
co
e
m
te
an
ig
G
5.1. Juegos suma diferente de cero o metajuegos
Para el caso de 2 jugadores, el contenido de la matriz de consecuencias en un juego
cuya suma es diferente de cero podrı́a ser la siguiente:
Gigante (II)
Aurrera (I)
A
B
A
C1
C2
B
D1
D2
A = Mantiene precio
B = Baja precios
C1 = Status quo
C2 = II gana más clientela y utilidades
D1 = I gana más clientela y utilidades
D2 = Mantienen misma clientela, pero pierden utilidades
Avila Garcia
63
Conclusiones y Recomendaciones
Esta investigación fue desarrollada para ilustrar los distintos métodos que hay
en el campo de la teorı́a de juegos.
Se inicio desde un problema básico de suma cero en donde se aplica el método
más sencillo: punto de silla de montar, en donde cabe destacar su uso desde tiempos
remotos; conforme el avance de los capı́tulos se van desarrollando las técnicas de
dominación y el método gráfico, como ejemplos de juegos sencillos y de la vida diaria.
Sin embargo con estos métodos, no es posible dar solución a ciertos problemas
cotidianos tales como; la competencia en los mercados. Es por ello que se emplea
un análisis por programación lineal el cual es de indispensable ayuda para la representación de un problema de teorı́a de juegos.
En esta sección se logra el propósito, pues mediante ejercicios propuestos se
hace uso del método simplex, ası́ como el teorema de dualidad. Este método es el más
usual entre los problemas de teorı́a de juegos pues resulta muy útil para juegos con
muchas estrategias por cada jugador.
El teorema de Dualidad es de suma importancia ya que su principal implicación
es que el valor de la solución óptima para el jugador 1 coincide con la solución óptima
del jugador 2, lo cual representa una gran ventaja.
Finalmente se concluye con una breve explicación del empleo de la teorı́a de
juegos con suma diferente de cero o metajuegos, en donde se hace mención del famoso
problema “dilema del prisionero”, el cual se toma como modelo para la solución a
otros problemas.
En la actualidad las técnicas siguen vigentes, sugiriendo el análisis del juego
con mayor número de participantes, también se puede hacer uso en juegos como: el
ajedrez, cartas en computadora y juegos más especı́ficos. Para juegos no cooperativos
el análisis de la toma de decisiones se sugiere por objetivos múltiples.
64
Bibliografı́a
[1] Bazaraa, M. S., Programación Lineal y Flujo de Redes,
Grupo Editorial
Iberoamericana., México, 1998.
[2] Davis M. D., Teorı́a de Juegos Alianza., Madrid, 1977.
[3] Fernández, F. R., et. al., Advances in games theory with economics and social
applications, J. M. Bilbao, Universidad de Sevilla, 2000.
[4] Hillier, Frederick, y Lieberman, Gerald, J., Introducción a la investigación de
operaciones, Mc–Graw Hill., Stanford, 2000.
[5] Reyna, Casiodoro & De Valera, Cipriano (revisores) La Santa Biblia, Antiguo y
Nuevo Testamento, El mundo hispano, El Paso–Texas, 1989.
[6] Prawda, Witenberg, Juan, Métodos y modelos estocásticos, Vol. II, Noriega,
editores., México, 2000.
[7] Taha, Hamdy, A., Investigación de operaciones, (5a edición) Alfa Omega., México, 2000.
[8] Thierauf, Robert, J., Toma de decisiones por medio de investigación de operaciones, Mc–Graw Hill., México, 2000.
[9] Ventel, Elena Sergeevna., Elementos de la Teorı́a de Juegos, MIR., Moscú, 2000.
[10] Winston, Wayne, L., Investigación de Operaciones, Grupo Editorial Iberoame–
ricana., México, 2000.
65
Índice alfabético
cuadro
incidental, 10
escenario, 13
estrategia
mixta, 21
información perfecta, 16
juego
compuesto, 13
simple, 13
jugada
aleatoria, 15
personal, 15
punto
de silla, 21
valor
del juego, 21
maximim, 20
minimax, 20
66
Descargar