En el contexto de la teoría de juegos combinatorios , que típicamente estudia juegos secuenciales con información perfecta , un árbol de juego es un gráfico que representa todos los estados de juego posibles dentro de dicho juego. Dichos juegos incluyen los conocidos como ajedrez , damas , Go y tres en raya . Esto se puede utilizar para medir la complejidad de un juego , ya que representa todas las formas posibles en que un juego puede resultar. Debido a los grandes árboles de juego de juegos complejos como el ajedrez, los algoritmos que están diseñados para jugar esta clase de juegos utilizarán árboles de juego parciales, lo que hace que el cálculo sea factible en las computadoras modernas. Existen varios métodos para resolver árboles de juego. Si se puede generar un árbol de juego completo, se puede utilizar un algoritmo determinista , como la inducción hacia atrás o el análisis retrógrado . Los algoritmos aleatorios y los algoritmos minmax como MCTS se pueden utilizar en casos en los que un árbol de juego completo no es factible.
Para entender mejor el árbol de juego, se puede pensar en él como una técnica para analizar juegos adversarios, que determinan las acciones que el jugador realiza para ganar el juego. En teoría de juegos, un árbol de juego es un grafo dirigido cuyos nodos son posiciones en un juego (por ejemplo, la disposición de las piezas en un juego de mesa) y cuyos bordes son movimientos (por ejemplo, mover piezas de una posición en un tablero a otra). [1]
El árbol de juego completo de un juego es el árbol de juego que comienza en la posición inicial y contiene todos los movimientos posibles desde cada posición; el árbol completo es el mismo árbol que se obtiene a partir de la representación del juego en forma extensiva . Para ser más específicos, el juego completo es una norma para el juego en la teoría de juegos. La cual puede expresar claramente muchos aspectos importantes. Por ejemplo, la secuencia de acciones que las partes interesadas pueden tomar, sus elecciones en cada punto de decisión, información sobre las acciones tomadas por otras partes interesadas cuando cada parte interesada toma una decisión y los beneficios de todos los resultados posibles del juego. [2]
El diagrama muestra los dos primeros niveles, o plies , en el árbol de juego del tres en raya . Las rotaciones y reflexiones de las posiciones son equivalentes, por lo que el primer jugador tiene tres opciones de movimiento: en el centro, en el borde o en la esquina. El segundo jugador tiene dos opciones para la respuesta si el primer jugador jugó en el centro, de lo contrario, cinco opciones. Y así sucesivamente.
La cantidad de nodos de hoja en el árbol de juego completo es la cantidad de formas posibles de jugar al juego. Por ejemplo, el árbol de juego del tres en raya tiene 255 168 nodos de hoja.
Los árboles de juego son importantes en la inteligencia artificial porque una forma de elegir el mejor movimiento en un juego es buscar en el árbol de juego utilizando cualquiera de los numerosos algoritmos de búsqueda de árboles , combinados con reglas similares a minimax para podar el árbol . El árbol de juego para el tres en raya se puede buscar fácilmente, pero los árboles de juego completos para juegos más grandes como el ajedrez son demasiado grandes para buscar. En cambio, un programa de ajedrez busca un árbol de juego parcial : típicamente tantos plies desde la posición actual como pueda buscar en el tiempo disponible. Excepto en el caso de árboles de juego "patológicos" [3] (que parecen ser bastante raros en la práctica), aumentar la profundidad de búsqueda (es decir, el número de plies buscados) generalmente mejora la posibilidad de elegir el mejor movimiento.
Los juegos de dos personas también se pueden representar como árboles and-or . Para que el primer jugador gane un juego, debe existir un movimiento ganador para todos los movimientos del segundo jugador. Esto se representa en el árbol and-or utilizando la disyunción para representar los movimientos alternativos del primer jugador y utilizando la conjunción para representar todos los movimientos del segundo jugador.
Con un árbol de juego completo, es posible "resolver" el juego, es decir, encontrar una secuencia de movimientos que el primer o el segundo jugador puedan seguir y que garanticen el mejor resultado posible para ese jugador (normalmente una victoria o un empate). El algoritmo determinista (que generalmente se denomina inducción hacia atrás o análisis retrógrado ) se puede describir recursivamente de la siguiente manera.
El diagrama muestra un árbol de juego para un juego arbitrario, coloreado utilizando el algoritmo anterior.
Generalmente es posible resolver un juego (en este sentido técnico de "resolver") usando solo un subconjunto del árbol del juego, ya que en muchos juegos no es necesario analizar un movimiento si hay otro movimiento que es mejor para el mismo jugador (por ejemplo, la poda alfa-beta se puede usar en muchos juegos deterministas).
Cualquier subárbol que pueda usarse para resolver el juego se conoce como árbol de decisión , y los tamaños de los árboles de decisión de diversas formas se utilizan como medidas de la complejidad del juego . [4]
Los algoritmos aleatorios se pueden utilizar para resolver árboles de juego. Hay dos ventajas principales en este tipo de implementación: velocidad y practicidad. Mientras que una versión determinista de la resolución de árboles de juego se puede hacer en Ο ( n ) , el siguiente algoritmo aleatorio tiene un tiempo de ejecución esperado de θ ( n 0.792 ) si cada nodo en el árbol de juego tiene grado 2. Además, es práctico porque los algoritmos aleatorios son capaces de "frustrar a un enemigo", lo que significa que un oponente no puede vencer al sistema de árboles de juego conociendo el algoritmo utilizado para resolver el árbol de juego porque el orden de resolución es aleatorio.
La siguiente es una implementación del algoritmo de solución de árbol de juego aleatorio: [5]
def gt_eval_rand ( u ) -> bool : """Devuelve Verdadero si este nodo se evalúa como una victoria, de lo contrario Falso""" if u . leaf : devuelve u . win else : random_children = ( gt_eval_rand ( child ) para child en random_order ( u . children )) if u . op == "OR" : devuelve cualquiera ( random_children ) if u . op == "AND" : devuelve todos ( random_children )
El algoritmo utiliza la idea de " cortocircuito ": si el nodo raíz se considera un operador " OR ", entonces una vez que se encuentra un Verdadero , la raíz se clasifica como Verdadero ; por el contrario, si el nodo raíz se considera un operador " AND ", entonces una vez que se encuentra un Falso , la raíz se clasifica como Falso .
[6]