Proceedings Template - WORD - Universidad Carlos III de Madrid

Anuncio
JUEGO MANCALA CON ALGORITMO MINIMAX REALIZADO
CON INTERFAZ GRÁFICA EN JAVA
Lucia Ruiz Ruiz
Artem Motsarenko
Jose Angel Leon Calvo
Universidad Carlos III de Madrid
100079152@alumnos.uc3m.es
Universidad Carlos III de Madrid
100079058@alumnos.uc3m.es
Universidad Carlos III de Madrid
100079043@alumnos.uc3m.es
Inteligencia en Redes de
Comunicaciones
Ingeniería Sup. en
Telecomunicación
Quinto curso, 1º cuatrimestre
ABSTRACT
juego y elegir la mejor jugada en un momento determinado, sin
tener que examinar todas las posibles jugadas.
En este documento vamos a realizar un juego basado en Mancala
usando como algoritmo Minimax con poda alfa-beta y dos niveles
de búsqueda. Estará realizado con lenguaje de programación Java
y una interfaz gráfica para que el usuario pueda jugar contra un
usuario programado.
La motivación para el estudio de este tipo de juegos viene de lo
explicado en clase de Inteligencia en redes de comunicación y
especialmente de la parte de juegos con algoritmo Minimax [1].
Descriptores de los métodos
En nuestra implementación no hemos llevado a cabo todas las
reglas que existen para Mancala, sino que hemos hecho una
implementación con las reglas básicas.
[Java]: public Movimiento MiniMaxAB(int [][] tableroActual,int
turno, int prof)
2. HISTORIA DE MANCALA [2]
Este es el método fundamental del algoritmo Minimax que
detallaremos más adelante.
Mancala es el nombre de una familia de juegos de tablero muy
extendidos por toda África. Este juego se practicaba ya en el
antiguo Egipto, pues se han encontrado tableros en la pirámide de
Keops, y de allí debió extenderse a otros países de África y Asia.
[Java]: public class JugadorTotal{public static void main(String[]
args) {
Esta es la clase que tiene el metodo main, esto es la que usaremos
para ejecutar el Mancala.
Términos Generales
Algorithms, Design, Reliability, Human Factors, Languages,
Theory.
Keywords
Mancala, Minimax, Java, GUI, poda alfa-beta, Juegos de mesa,
1. INTRODUCCIÓN
Se desea implementar un jugador para una variante de la familia
de juegos Mancala. En nuestro caso, tendremos dos jugadores que
realizarán movimientos en turnos alternados. En cada uno de ellos
el jugador redistribuye (siembra) las piezas (semillas) de un hoyo
con el objetivo de capturar las piezas de su oponente.
El tablero del juego está formado por 2 filas de 6 hoyos cada una
y un contenedor. Una fila pertenece a un jugador y la otra a su
oponente. Una característica de este juego es que el número total
de semillas en el tablero permanece constante, y que cada jugador
sólo siembra en su fila. Por tanto, si un jugador captura semillas
del otro jugador está obligado a sembrar de nuevo estas semillas
en sus hoyos.
Para el desarrollo del algoritmo, se utilizará el procedimiento
minimax y una mejora de éste conocida como poda alfa-beta, el
cual permite generar un árbol de búsqueda para representar el
Forma parte desde tiempos muy remotos de la tradición cultural
de muchos pueblos y tribus, principalmente de África, y su
práctica ha estado ligada a diferentes hechos, como a ritos
funerarios, con motivo de mantener entretenido al espíritu del
difunto; a ceremonias nupciales, para asegurar la fertilidad de la
unión; y además, en casi todos los pueblos ha sido objeto de
adivinación. Hoy, sin embargo, se juega sobre todo por placer y se
ha convertido en el juego nacional de muchos países africanos,
donde es conocido bajo diversas denominaciones, conociéndose
casi doscientas variantes del juego, aunque todas ellas poseen
características comunes.
Los tableros varían ligeramente en cuanto material de
construcción en función de la zona a la que pertenecen, pero todos
cuentan con las dos filas de seis huecos, llamados pits de juego,
cada una, y las dos cavidades mayores, que se denominan Kalahs,
que sirven de depósito de las fichas capturadas por los jugadores.
El número de fichas con los que se comienza a jugar varía mucho
en función de la variante jugada, aunque lo más normal es
comenzar con 3 ó 4 fichas por hoyo de juego. Las reglas del juego
también varían en función de la variante jugada, aunque todas
ellas tienen una base común [3].
Las versiones de Mancala más corrientes en Europa, son el Awale
(también llamado Wari), el Kakua, el Mweso o Hus (que se juega
con 64 fichas en un tablero de 32 huecos), el Oware, que es una de
las variantes más sencilla, y el Kalah, Kalaha o conocido
simplemente como Mancala, que es la variante egipcia, la más
extendida y conocida en Occidente, y es la implementada en este
proyecto.
La filosofía en que se basa el Mancala es la siguiente: [4]
Las tiradas se desarrollan en 2 fases: sembrar y cosechar.
Se juega sobre un tablero con doce de agujeros, 6 por cada
jugador. Los agujeros es donde se siembra y donde se cosecha.
Las fichas del Mancala (normalmente semillas) son
indiferenciadas, todas iguales. Y no pertenecen a ningún jugador.
Se aplica el dicho “Las semillas son de quien las necesita. Quién
mejor siembra, mejor cosechará”.
En el Mancala hay 2 normas sagradas:
“No se puede eliminar al adversario”. Se entiende que cuando se
destruye al adversario, también se destruye la tierra que él cultiva.
Quien lo hiciera por error, perdería la partida. Se aplica el dicho
“Quien destruye la tierra donde cosecha, no podrá cosechar nunca
más”.
“No se puede dejar pasar hambre al adversario”. Esto significa
que si nuestro rival se queda sin semillas, debemos ceder de las
nuestras para que pueda seguir jugando.
3. ASPECTOS MATEMÁTICOS EN
MANCALA [5]
Los juegos de la familia Mancala son visto como algo simple ya
que son del tipo determinista (no influye el azar en forma de dado
u otro elemento aleatorio), tenemos información perfecta (excepto
por la dificultad de recordar todos los elementos del juegos) y no
hay demasiadas elecciones en cada movimiento, normalmente no
tenemos más posibilidades que el número de hoyos en una fila.
Sin embargo, el hecho que un solo movimiento tiene efecto en el
contenido de todos los hoyos del tablero, hace complicado ver las
consecuencias a largo a plazo o simplemente unos cuantos
movimientos hacia adelante.
Una propiedad matemática que nos permite ver la complejidad de
juegos como el Mancala es el número de posibles posiciones. Una
posición en Mancala consiste en un cierta distribución de las
semillas en los hoyos del tablero, pero también incluimos un
contador para las semillas que se pueden capturar o las que
mantenemos en nuestro poder sino tenemos nada que capturar. El
número de posibles posiciones depende del número de hoyos en
nuestro tablero y del número de semillas que tengamos en cada
uno. Este número, p, puede ser obtenido usando la siguiente
fórmula de combinatoria:
p =k*(
)
En este formula k, es el número de jugadores, m es el número
total de semillas y n es tanto el número total de hoyos y semillas
juntas o el número total de hoyos incrementado con el número
total de jugadores, sino almacenamos nada. El número p se
incrementa muy rápido con el incremento de hoyos y semillas. En
la tabla siguiente podemos ver el número de posibles posiciones
en un tablero de Mancala con dos filas de seis hoyos y dos
semillas para dos jugadores:
Tabla 1: Número de posibles movimientos en Mancala
Podemos ver como el número de posibles posiciones decrece,
cuando solo nos fijamos en las semillas que hay en el tablero.
Como podemos intuir solo un cierto número de estas posibles
posiciones aparecen durante el juego, ya que, esto depende de la
posición inicial del juego y de las normas que estemos usando. En
una variación del Mancala, el Kalah, solo un 5% de estas posibles
posiciones aparecen en un juego real [6].
4. INTELIGENCIA ARTIFICIAL EN
MANCALA
Inteligencia Artificial (IA) es una rama de la informática que
pretende que un ordenador pueda realizar lo que normalmente se
considera como inteligente o simular el comportamiento humano.
Hay dos motivos principales por las que se realiza esta
investigación: el primero es evitar esfuerzos a humanos con la
ayuda del ordenador. La segunda motivación es tratar de entender
cómo la inteligencia humana u operaciones mentales trabajan a
través de la simulación por ordenador. Los juegos han jugado un
papel importante en la inteligencia artificial, porque para jugar a
estos se considera como una tarea típicamente inteligente, pero
también porque los juegos casi siempre forman un ambiente
cerrado con posibilidades limitadas y reglas claramente definidas.
Esto último hace que para los investigadores en IA sea mucho
más fácil tratar con juegos que tratar, por ejemplo, con el mercado
de valores, pues este último está sometido a múltiples variables y
no se comporta según un conjunto de reglas cerradas. El resultado
más famoso de la IA en los juegos es, por supuesto, el hecho de
que en los ordenadores hoy en día se puede jugar al ajedrez a
nivel de gran maestro e incluso derrotando el ex campeón del
mundo. En la carrera competitiva entre ordenadores capaces de
jugar al ajedrez mediante programas, las técnicas se han
desarrollado mucho y se están aplicando actualmente estas
técnicas otras áreas de la IA y la informática. Se podría decir que
los juegos (y en especial el ajedrez) son la Fórmula 1 de la
informática.
La familia de juegos Mancala se ha introducido en Inteligencia
Artificial relativamente pronto, aunque la mayor parte de
investigación se limita a sólo dos juegos: Kalah y Awari.
Las instancias más pequeñas de Kalah fueron resueltos al
considerar todas las posiciones que en realidad pueden surgir
durante una partida de Kalah. Las bases de datos se han creado en
que cada posición y su valor de teoría de juegos se almacenan.
Los casos más grandes de Kalah se resolvieron mediante la
búsqueda de juegos de árbol (mismo mecanismo que usaremos
nosotros en nuestra implementación). Para estos casos, sólo se
conoces una estrategia ganadora partiendo de una posición inicial
en concreto. El programa es, sin embargo, capaz de encontrar una
estrategia óptima para cada posición que pueda ocurrir durante un
juego de Kalah.
Esto significa que Kalah no es de interés para los investigadores
ya que la IA desea que el equipo para jugar el juego de Kalah
como sustitutos o de forma superior a los humanos. Sin embargo,
para los investigadores de la IA del juego y psicólogos que estén
interesados en el aspecto humano del juego de los resultados que
se obtuvieron siguen haciendo de Kalah algo muy útil.
5. APLICACIONES EDUCATIVAS DE
MANCALA [7]
Los juegos basados en Mancala ofrecen la oportunidad de ver
fácilmente cómo se puede mejorar con la práctica, y por lo tanto
ayudan a aprender a trabajar en algo para obtener una meta. Estos
juegos de mesa también enseñan a los niños a seguir
instrucciones, a acatar las reglas, jugar limpio y hacer frente a las
derrotas. Ayudan con la interacción cara a cara, la cooperación y
la competencia, y a mejorar las habilidades sociales. Su herencia
multicultural va en contra de las actitudes racistas y enseña la
cooperación. También aumentan la conciencia y el respeto hacia
su propio patrimonio cultural, en particular entre los jugadores de
África y Asia.
El Mancala se ha considerado una herramienta pedagógica muy
útil en la educación de niños y adultos durante siglos.
El juego Mancala mejora la capacidad de observación, los
jugadores tienen que desarrollar habilidades cognitivas para
distinguir buenos movimientos de los malos y posiciones
favorables del tablero frente a las desfavorables. Son ejercicios
que fortalecen la memoria y la concentración.
Mancala enseña el pensamiento analítico, ya que los jugadores
deben aprender a planificar y desarrollar estrategias, para ser un
jugador ganador tienen que prever lo que va a pasar varios
movimientos por adelantado. El juego obliga a los jugadores a
anticipar los próximos movimientos de su oponente. Tienen que
ponerse en la posición de otra persona, ya que de lo contrario
pueden ser derrotados fácilmente.
También ayuda con el pensamiento matemático, ya que para
empezar, uno tiene que mantener un registro del número de
piedras en cada agujero. Ellos ayudan con las habilidades básicas
de cálculo, pero también ofrecen grandes retos para los
matemáticos y científicos informáticos. Una variación moderna
llamada Aritmética fue diseñada específicamente para enseñar
aritmética en las escuelas primarias. Mancala también han sido
utilizados por las escuelas en los EE.UU. para ayudar a los niños
con discalculia (dificultad en el aprendizaje de las matemáticas).
Los juegos de Mancala desarrollan la motricidad fina., estas
incluyen el seguimiento visual, la coordinación mano-ojo, y la
capacidad de manipular objetos pequeños mediante la
transferencia en un proceso conocido como "siembra" (poner las
semillas en el tablero).
6. INTRODUCCIÓN ALGORITMO
MINIMAX CON PODA ALFA-BETA
La idea principal del algoritmo es tomar como punto de partida
una posición y utilizar un generador de movimientos para generar
un conjunto de posiciones de posibles sucesores, por lo que se
aplica una función de evaluación estática y se selecciona el mejor
movimiento obteniendo el valor. Los pasos que usaremos son los
siguientes [1]:

Generar el árbol de juego, alternando movimientos de
MAX y MIN y asignándoles los valores apropiados
(MAX>0, MIN<0).

Calcular la función de utilidad de cada nodo final,
recorriendo recursivamente los nodos hasta el estado
inicial.

Elegir como jugada a realizar aquel primer movimiento
que conduce al nodo final con mayor función de
utilidad.
En el desarrollo de los juegos de dos jugadores, a uno se le
denominará MAX y al otro MIN, cada uno con su turno
correspondiente
Esta búsqueda realizada se puede definir en base a: un Estado
Inicial, Movimientos Posibles (Sucesores, luego de aplicar la
Función de evaluación), un Estado Final, Valor o Función de
Utilidad; los mismos que a su vez vienen a definir un árbol de
juego y donde se desarrollará primero una búsqueda en
profundidad, para nuestro caso profundidad limitada.
Usualmente se puede decir en una búsqueda cualquiera, que la
estrategia óptima se logra alcanzar cuando tras un conjunto de
movimientos posibles se llega a la meta u objetivo que viene a ser
el estado ganador; sin embargo, la estrategia óptima que aquí
vamos a implementar no va por ese camino, sino más bien
consideramos que tras la realización de una jugada MAX, viene
una jugada MIN y tras la misma viene otra MAX y puede ser vista
en el árbol de juego (generado dado una cierta profundidad),
evaluando la función de valor Mínimax en cada nodo.
Debido a que uno de los problemas que tiene implícito el
algoritmo es el gran uso que hace de la memoria, realizaremos una
poda alfa-beta que nos permitirá no expandir todo los caminos
posibles, sino solo aquellos que mejoran el camino por el que
vamos, donde alfa y beta representan, respectivamente, las cotas
inferior y superior de los valores que se van a ir buscando en la
parte del subárbol que queda por explorar. Si alfa llega a superar o
igualar a beta, entonces no será necesario seguir analizando las
ramas del subárbol.
En pseudocódigo el algoritmo Minimax para el juego de Mancala
sería [8]:
Entrada: nodoJuego (Mancala), Profundidad, turnoPC, Alfa
(inicialmente -inf), Beta (inicialmente +inf)
Salida: el nodo (Mancala) a Jugar
1. Si el estado del nodoJuego es un final (Juego Terminado) o la
profundidad de análisis restante es cero,
1.1. Devolver nodoJuego cuyo valor sea el valor calculado
mediante la función de Evaluación respectiva.
1.2. En caso contrario, hacer
1.2.1 Calcular los SUCESORES del nodoJuego
1.2.2 Si la lista de SUCESORES es vacía
1.2.2.1 Devolver nodoJuego cuyo valor sea el valor
calculado mediante la función de Evaluación respectiva.
1.2.2.2 En caso contrario, si el jugador del
nodoJuego es MAX
1.2.2.2.1 Devolver el nodo de la lista de
SUCESORES obtenido con la función MAXIMIZADOR-A-B
1.2.2.2.2 Sino Devolver el nodo de la lista de
SUCESORES obtenido con la función MINIMIZADOR-A-B
7. REGLAS DEL JUEGO [9]
El juego consiste en recolocar o redistribuir las semillas de un
hoyo en otros hoyos de la misma fila con el objetivo de capturar el
mayor número posible de semillas al oponente. El juego termina
cuando uno de los dos jugadores consiga que su oponente posea
una o ninguna semilla en su fila, en tal caso es el ganador de la
partida.
Figura 2: Estado de captura por jugador humano (parte inferior)
Como vemos en la figura 2, el jugador 2 tiene la posibilidad de
realizar una captura de las 2 semillas que tiene el oponente en el
cubilete 2 de su lado del tablero, por lo que realizando este
conseguirá 3 semillas más para su marcador (1 bola suya + las 2
que captura)

Cede semillas y cambio de turno: Si cae en un hoyo con
3 o más semillas que no cualifica para captura, y si el
contario tiene una o dos pero menos de 3 semillas en su
hoyo opuesto (en ambos casos, antes de depositar la
nueva), se ceden al hoyo contrario todas las semillas del
hoyo de última semilla y se pasa el turno al oponente.

Cambio de turno: En cualquier otro caso, se termina la
jugada y se pasa el turno al oponente.
7.1 Estado inicial
Se selecciona un hoyo que contenga semillas, y que
preferiblemente permita hacer una captura. Se siembran las
semillas del hoyo seleccionado en los sucesivos hoyos, yendo de
izquierda a derecha (relativas al jugador situado frente a su fila), y
depositando una semilla en cada hoyo. En el caso de que se
llegara sembrando al final de la fila (hoyo 5) se continúa
sembrando desde el principio (hoyo 1) y en la misma fila del
jugador.
7.3 Fin de turno
Un jugador finaliza su turno cuando se da alguno de los siguientes
casos:

después de la siembra inicial o captura, la última semilla
cae en un hoyo de su fila sin semillas.

cuando después de una captura no se puede realizar otra
captura.

cuando tiene que ceder semillas al contrario.
Figura 1. Estado inicial del tablero Mancala
7.2 Captura/cesión
Se da sólo cuando tras la siembra, la última semilla se deposita en
un hoyo que ya tenía semillas (hoyo de última siembra) y en el
hoyo opuesto del otro jugador también tiene semillas. En este
caso, se pueden dar las siguientes alternativas:

Captura semillas: Si cae en un hoyo con un número
impar de semillas (antes de depositar la nueva) y el
contrario en el hoyo opuesto también tiene un número
impar de semillas, se capturan las semillas del hoyo
opuesto y se siembran en la fila del jugador,
comenzando a sembrar a partir del siguiente hoyo a la
derecha del de última siembra. Tras la nueva siembra,
volverá a analizarse el nuevo hoyo de última siembra
para comprobar si de nuevo hay captura (en cuyo caso
se repetiría todo el proceso hasta que finalicen las
capturas) o cesión.
Figura 4. Estado del tablero Mancala cuando ha terminado el
turno del jugador 2
Si un usuario mete su última semilla en su recogedor puede repetir
turno como en el caso siguiente:
8.1 Estado inicial
Estado
Inicial
Figura 5. Estado del tablero Mancala antes de jugar el Jugador 2
Figura 8: Representación estado inicial del tablero de Mancala
El jugador 2 pulsará en el cubilete con 4 semillas por lo que podrá
volver a pulsar en otro sin tener que ceder el turno al contrincante
Representaremos como uno de los posibles estados del tablero de
juegos con un nodo del árbol y por medio de flechas evaluaremos
con la función de evaluación los distintos escenarios posibles.
El árbol estará formado por nodos ordenados en niveles de
profundidad en los cuales cada uno pertenecerá respectivamente a
nuestro turno y el siguiente al jugador adversario.
Figura 6. Estado del tablero Mancala cuando ha terminado el
turno del jugador 2 y sigue en su turno
8.2
Representación de los dos niveles de
búsqueda
7.4 Fin del juego
Existen dos posibilidades de fin de juego: por victoria de uno de
los jugadores o por tablas. Un jugador gana la partida cuando
consigue que su oponente tenga en su fila una o ninguna semilla o
cuando el oponente abandona o si su función de evaluación
comete algún error, por ejemplo abortando.
Otro factor que hace que un jugador gane es que tenga mayor
número de semillas que el contrario, en nuestro caso si tiene más
de 24 semillas en su contenedor, el jugador ganará la partida.
Figura 9: Representación árbol con profundidad 2
La figura que hemos dibujado representa la búsqueda en dos
niveles (aunque para simplificar el dibujo simplemente hemos
expandido el árbol en un nodo). Esta búsqueda como vemos tiene
el problema de ser muy costosa en términos de memoria, ya que la
búsqueda en términos computacionales sería del orden de:
Figura 7: Estado final del tablero de Mancala
8. ALGORITMO MINIMAX PARA
MANCALA
Para la representación del algoritmo de Mancala usaremos una
representación en forma de árbol, que es la más usada para este
tipo de algoritmos, ya que nos permite clasificar el algoritmo
según el número de niveles que tenemos que recorrer y dar un
valor a cada una de las ramas de un nodo:
Complejidad = 6!*6! = 518400 posibilidades lo que resulta ser un
número bastante elevado y simplemente estamos expandiendo en
dos niveles.
Si realizamos una búsqueda en más niveles obtenemos los
siguientes datos:
3 niveles
3733248000
4 niveles
268738560000
5 niveles
193491763200000
Tabla 2: Número de movimientos en el árbol Minimax
Como podemos observar si aumentamos el número de niveles, los
valores se vuelven en términos computacionales y de memoria
imposibles de manejar, por lo que además de reducir el número de
niveles que vamos a manejar, también aplicaremos la poda alfabeta que nos ayudará a no tener que manejar todas las
posibilidades del árbol, sino quedarnos con únicamente las que
mejoran el camino.

Estamos realizando una búsqueda en profundidad (DFS) que
puede mejorar su eficiencia usando una técnica de ramificación y
acotación, con la cual una solución parcial se abandona cuando se
comprueba que es peor que otra solución conocida o umbral.
Por lo tanto, la estrategia de poda del algoritmo Minimax
usaremos es la llamada poda alfa-beta, puesto que dado
existen dos jugadores maximizador y minimizador, existen
valores umbral alfa y beta para acotar la búsqueda de cada
respectivamente.


El valor alfa representa la cota inferior del
puede asignarse en último término a
maximizante.
El valor beta representa la cota superior del
puede asignarse en último término a
minimizante.
que
que
dos
uno

valor que
un nodo
valor que
un nodo
En un nivel dado, el valor de umbral alfa o beta según
corresponda, debe actualizarse cuando se encuentra un umbral
mejor.
Aparte de este algoritmo que sería una implementación básica,
existe otros métodos para refinar el algoritmo y conseguir mejores
resultados La efectividad del procedimiento alfa-beta depende en
gran medida del orden en que se examinen los caminos. Si se
examinan primero los peores caminos no se realizará ningún
corte. Pero, naturalmente, si de antemano se conociera el mejor
camino no necesitaríamos buscarlo.
La efectividad de la técnica de poda en el caso perfecto ofrece una
cota superior del rendimiento en otras situaciones. Según Knuth y
Moore (1975), si los nodos están perfectamente ordenados, el
número de nodos terminales considerados en una búsqueda de
profundidad d con alfa-beta es el doble de los nodos terminales
considerados en una búsqueda de profundidad d/2 sin alfa-beta.
Esto significa que en el caso perfecto, una búsqueda alfa-beta nos
da una ganancia sustancial pudiendo explorar con igual costo la
mitad de los nodos finales de un árbol de juego del doble de
profundidad.
Describimos ahora otras modificaciones del procedimiento
MINIMAX que también mejoran su rendimiento.


La poda de inutilidades es la finalización de la
exploración de un subárbol que ofrece pocas
posibilidades de mejora sobre otros caminos que ya han
sido explorado
Espera del reposo: Cuando la condición de corte de la
recursión del algoritmo MINIMAX está basada sólo en
la profundidad fija del árbol explorado, puede darse el
llamado efecto horizonte. Esto ocurre cuando se evalúa
como buena o mala una posición, sin saber que en la
siguiente jugada la situación se revierte. La espera del
reposo ayuda a evitar el efecto horizonte. Una de las
condiciones de corte de recursión en el algoritmo
MINIMAX debería ser el alcanzar una situación estable.
Si se evalúa un nodo de un árbol de juego y este valor
cambia drásticamente al evaluar el nodo después de

realizar la exploración de un nivel más del árbol, la
búsqueda debería continuar hasta que esto dejara de
ocurrir. Esto se denomina esperar el reposo y nos
asegura que las medidas a corto plazo, por ejemplo un
intercambio de piezas, no influyen indebidamente en la
elección.
Búsqueda secundaria: Otra manera de mejorar el
procedimiento MINIMAX es realizar una doble
comprobación del movimiento
elegido, para
asegurarnos que no hay una trampa algunos
movimientos más allá de los que exploró la búsqueda
inicial. Luego de haber elegido un movimiento en
concreto con un procedimiento MINIMAX que explora
n niveles, la técnica de búsqueda secundaria realiza una
búsqueda adicional de d niveles en la única rama
escogida para asegurar que la elección sea buena.
Uso de movimientos de libro: La solución ideal de un
juego sería seleccionar un movimiento consultando la
configuración actual en catálogo y extrayendo el
movimiento correcto. Naturalmente en juegos
complicados esto es imposible de realizar, pues la tabla
sería muy grande y además nadie sabría construirla. Sin
embargo, este enfoque resulta razonable para algunas
partes de ciertos juegos. Se puede usar movimientos de
libro en aperturas y finales, combinando con el uso de
búsqueda MINIMAX para la parte central de la partida,
mejorando el rendimiento del programa. Por ejemplo,
las secuencias de apertura y los finales del ajedrez están
altamente estudiados y pueden ser catalogados.
Búsqueda sesgada: Una forma de podar un árbol de
juegos es hacer que el factor de ramificación varíe a fin
de dirigir más esfuerzo hacia las jugadas más
prometedoras. Se puede realizar una búsqueda sesgada
clasificando cada nodo hijo, quizás mediante un
evaluador estático rápido y luego utilizando la siguiente
fórmula:
R(hijo) = R(padre) - r(hijo)
donde R es el número de ramas de un nodo y r es el
lugar que ocupa un nodo entre sus hermanos ordenados
según la evaluación estática rápida.
Una variante respecto a la que hemos estudiado es tener en cuenta
la inteligencia del adversario, esto es, que pueda obtener algún
movimiento que este en alguna capa más profunda que la que
estudia nuestro algoritmo. Aun suponiendo que el algoritmo
siempre explora a una mayor profundidad que el adversario, éste
último puede equivocarse y no elegir el camino óptimo. La
consecuencia es que el algoritmo elige el movimiento basándose
en una suposición errada.
Ante una situación de derrota, según sugiere Berliner (1977),
podría ser mejor asumir el riesgo de que el oponente puede
cometer un error.
Análogamente, cuando se debe elegir entre dos movimientos
buenos, uno ligeramente mejor que el otro, podría resultar mejor
elegir el menos mejor si al asumir el riesgo de que el oponente se
equivoque nos conduce a una situación muchos más ventajosa.
Para tomar esta clase de decisiones correctamente, el algoritmo
debería modelar el estilo de juego de cada oponente en particular.
Esto permitiría estimar la probabilidad de que cometa distintos
errores. Sin lugar a dudas, esto es muy difícil de lograr y se
necesita contar con técnicas de aprendizaje para que el algoritmo
obtenga conocimiento sobre su oponente a lo largo del juego.
System.out.println("Empate");
return 3;
}
9. ALGORITMO MINIMAX
IMPLEMENTADO
Vamos a describir la implementación que hemos realizado para
nuestro juego de Mancala empezando por la función de
evaluación:
La función de evaluación que se ha implementado es muy
sencilla, el jugador automático elegirá como movimiento optimo
el que le permite depositar más semillas en su contenedor, sin
verificar ningún otro parámetro. Hemos elegido esta estrategia por
simplicidad en la ejecución y porque es la que más se parece a un
jugador novato o con poca experiencia en este tipo de juegos.
Una forma de mejorar esta función de evaluación sería que el
jugador también tuviese en cuenta el número de semillas que
puede capturar con su movimiento o que jugase de una forma
defensiva, esto es, en vez de intentar llenar su contenedor mover
de tal forma que el oponente estuviera bloqueado y no pudiese
rellenar su contenedor.
Una vez comentada la función de evaluación vamos a comentar
como hemos realizado en Java el Mancala.
Las dos filas de hoyos las hemos realizado como un array de siete
columnas y dos filas (en las que incluimos también los
recogedores de cada jugador) y en nuestro juego, hemos colocado
como estado inicial que cada hoyo tenga 4 semillas:
Vamos a explicar el algoritmo Minimax que hemos usado cuyo
código es el siguiente:
public Movimiento MiniMaxAB(int [][] tableroActual,int turno,
int prof){
cuantasVeces++;
System.out.println("MINIMAX:"+cuantasVeces);
int valores[][]= tableroActual;
imprimeTablero(valores);
List <Movimiento> lista= PosiblesMovimientos(valores, turno);
Movimiento mov= new Movimiento();
Movimiento movAux= new Movimiento();
Movimiento pulsar = new Movimiento();
System.out.println("PROFUNDIDAD = "+prof);
if(prof<=0 || lista == null || lista.isEmpty()){
System.out.println("Ultimo nivel : PROFUNDIDAD = "+prof);
if(lista == null || lista.isEmpty()){
System.out.println("No hay movimientos posibles");}
for(int i = 0 ;i<lista.size();i++){
if(i==0)movAux= lista.get(i);
mov = lista.get(i);
iniciales = 4;
imprimeTablero(mov.getTablero());
bolas = new int[7][2];
if(mov.getPuntos()> movAux.getPuntos())
bolas[6][0]= 0;
movAux= mov;
bolas[6][1]= 0;
}
for(int j =0;j<2;j++){
for (int i = 0;i<6;i++){
bolas[i][j]=iniciales;
return movAux;
}
for(int i = 0 ;i<lista.size();i++){ //recorremos lista
}
if(turno==0)turno=1;else turno=0
}
El juego termina cuando un jugador obtiene más de la mitad de las
semillas que hay en el sistema completo, esto es, cuando obtiene
más de 24 semillas en su contenedor:
Dentro del método haGanado():
Movimiento
MiniMaxAB((lista.get(i)).getTablero(),turno,prof-1);
if(i==0)pulsar=m;
m=
(lista.get(i)).setPuntos(m.getPuntos());
if(lista.get(i).getY()==0){
if(lista.get(i).getPuntos()>pulsar.getPuntos())
pulsar= lista.get(i);
if( bolas[6][0]<24 ){
}
System.out.println("Ha ganado el jugador 2");
else{
return 1;
}else if(bolas[6][0]>24){
System.out.println("Ha ganado el jugador 1");
return 0;
if(lista.get(i).getPuntos()<pulsar.getPuntos())
pulsar= lista.get(i);
}}
return pulsar;
}
if(bolas[6][0]==24){
Esta función va hasta el nivel más profundidad dado por el valor
de la profundidad (a más profundidad mayor gasto en memoria) y
una vez estemas en lo más profundo del árbol, evaluamos cada
una de las ramas de ese nodo. Una vez tengamos todos los nodos
almacenados en una lista de posibles movimientos elegimos aquel
que tenga un mayor valor (en nuestro caso aquel que permita
meter un mayor número de semillas en el recogedor en el
siguiente movimiento) y hacemos lo mismo con todos los nodos
de este último nivel.
Una vez se haya obtenido el mayor valor para este nivel,
recorremos de forma inversa el árbol, realizando la misma
operación con los nodos superiores, hasta llegar a la raíz de la
cima con todos los nodos, hasta el nivel de profundidad
correspondiente, evaluados. Nos quedamos con aquel que nos da
un mayor valor neto, este es el que nos permite meter mayor
número de semillas en nuestro recogedor en el siguiente
movimiento y posteriores.
10. REFERENCIAS
[1] Villena, Julio. Apuntes de la asignatura Inteligencia en redes
de comunicación. Universidad Carlos III de Madrid
[2] Recurso web:
http://www.dma.fi.upm.es/docencia/primerciclo/matrecreativ
a/juegos/mancala/historia.htm.
[3] Recurso web: http://brainking.com/es/GameRules?tp=103
[4] Recurso web:
http://aprendiendomatematicas.com/tag/mancala/
[5] Jeroen Donkers, Jos Uiterwijk and Alex de Voogt, Mancala
games - Topics in Mathemathics and Artificial Intelligence
[6] Irving, G., Donkers, H. H. L. M., & Uiterwijk, J. W. H. M.
(2000). Solving Kalah. ICGA Journal, 23(3), 139-146.
[7] Retschitzki, J. (1990). Stratégies des joueurs d’awélé. Paris:
L’Harmattan
[8] Recurso web: http://nineil-leissics.blogspot.com.es/2008/06/proyecto-1-unidad-juegomancala.html
[9] Recurso web: http://www.bgamers.com/mancrul.htm
Descargar