Un jugador de póquer por computadora es un programa de computadora diseñado para jugar al póquer (generalmente la versión Texas Hold'em ), contra oponentes humanos u otros oponentes por computadora. Se le conoce comúnmente como pokerbot o simplemente bot . A partir de 2019, las computadoras pueden vencer a cualquier jugador humano en el póquer. [1] [2] [3]
Estos bots o programas informáticos se utilizan a menudo en situaciones de póquer en línea, ya sea como oponentes legítimos para jugadores humanos o como una forma de hacer trampa . A partir de 2020, todos los sitios de póquer en línea consideran trampa todo uso de asistencia en tiempo real (RTA) o bots automatizados, aunque el nivel de aplicación de la ley por parte de los operadores del sitio varía considerablemente. [ cita necesaria ]
El uso de bots de jugadores o asistencia informática mientras se juega al póquer en línea está prohibido en la mayoría, si no en todos, los sitios en línea. Las acciones tomadas en caso de incumplimiento son la prohibición permanente y la confiscación de las ganancias. [ cita necesaria ] Un tipo de bot puede interactuar con el cliente de póquer (en otras palabras, jugar solo como un jugador automático) sin la ayuda de su operador humano. La asistencia en tiempo real (RTA) es otro método de uso de programas informáticos. RTA ocurre cuando un jugador humano usa un programa llamado "solucionador", como PioSOLVER o PokerSnowie, [4] que se ejecuta en una computadora diferente, [5] para tomar sus decisiones.
La cuestión de la ventaja injusta tiene dos vertientes. Por un lado, los robots pueden jugar durante muchas horas seguidas sin debilidades humanas como la fatiga y pueden soportar las variaciones naturales del juego sin verse influenciados por las emociones humanas (o " tilt "). En segundo lugar, desde 2019, el programa informático Pluribus (robot de póquer) tiene tanto éxito en leer faroles, calcular probabilidades y adaptarse a la estrategia que vence constantemente a los jugadores de póquer profesionales en Hold'em sin límite para 6 jugadores. [6] [7] [8]
Si bien los términos y condiciones de los sitios de póquer generalmente prohíben el uso de bots, el nivel de aplicación depende del operador del sitio. Algunos buscarán y prohibirán a los usuarios de bots mediante el uso de una variedad de herramientas de software. El cliente de póquer puede programarse para intentar detectar bots, aunque esto es controvertido en sí mismo, ya que podría verse como equivalente a incrustar software espía en el software del cliente. [ cita necesaria ] Otro método es usar CAPTCHA a intervalos aleatorios durante el juego para detectar bots automatizados, aunque no es efectivo contra la asistencia en tiempo real.
Los “robots domésticos” pueden plantear un conflicto de intereses. Según la definición más estricta, un robot doméstico es un jugador automatizado operado por la propia sala de póquer en línea. Este tipo de robots serían el equivalente a los cómplices tradicionales .
Se supone que tanto los cómplices de los casinos tradicionales como los robots domésticos en línea tienen acceso a información que no esté disponible para ningún otro jugador en la mano. El problema es que en un entorno en línea la casa no tiene forma de demostrar que sus robots no reciben información confidencial del servidor de la tarjeta. Esto se ve exacerbado aún más por la facilidad con la que se puede lograr el intercambio clandestino de información en un entorno digital. Es esencialmente imposible incluso para la casa demostrar que no controla a algunos jugadores.
Al igual que en los juegos de ajedrez , Go (juego) y muchos otros juegos, los sistemas de inteligencia artificial vencen incluso a los mejores humanos en el póquer. [9] [10] El póquer es un juego de información imperfecta (porque algunas cartas en juego están ocultas), lo que hace que sea más difícil para cualquier persona (incluida una computadora) deducir el resultado final de la mano. Debido a esta falta de información, los programadores de ordenadores solían tener que implementar sistemas basados en el teorema de Bayes , el equilibrio de Nash , la simulación de Montecarlo o las redes neuronales , todas ellas técnicas imperfectas. Pluribus , sin embargo, perfeccionó el poker mirando sólo unos pocos movimientos para determinar qué acción tomar, en lugar de intentar evaluar todos los movimientos hasta el final del juego.
Las IA más antiguas, como PokerSnowie y Claudico, se crearon permitiendo que la computadora determinara la mejor estrategia posible al permitirle jugar una enorme cantidad de veces. Durante años, este fue el enfoque de la IA del póquer, en lugar de intentar crear una computadora que jugara como un humano. Esto resultó en un tamaño de apuesta extraño y una estrategia muy diferente a la que los humanos estamos acostumbrados a ver.
Primero se desarrollaron métodos para aproximar la estrategia perfecta del póquer desde la perspectiva de la teoría de juegos en el juego mano a mano (dos jugadores) y luego para el juego multijugador. La estrategia perfecta tiene múltiples significados en este contexto. Desde el punto de vista óptimo de la teoría de juegos, una estrategia perfecta es aquella que no puede esperar perder frente a la estrategia de ningún otro jugador; sin embargo, la estrategia óptima puede variar en presencia de jugadores subóptimos que tienen debilidades que pueden explotarse. En este caso, una estrategia perfecta es aquella que modela correcta o fielmente esas debilidades y las aprovecha para obtener ganancias, como las explicadas anteriormente.
La IA logró un rendimiento sobrehumano en el póquer durante la década de 2010, con la siguiente línea de tiempo. En 2015, las computadoras resolvieron el heads-up limit Hold'em a través de Cepheus . Alrededor de 2018, Libratus demostró una habilidad sobrehumana en el mano a mano sin límite de Hold'em. En 2019, Pluribus (una versión más nueva de Libratus) [11] demostró una habilidad sobrehumana en el Hold'em sin límite para seis jugadores, la variedad de póquer más jugada en el mundo. [12] En 2021, Microsoft lanzó comercialmente el antiguo programa de juego de póquer, Libratus, que luego venció a cuatro jugadores de póquer profesionales en una competencia de póquer de 20 días en Rivers Casino. [13]
Neo Poker Lab era un equipo científico establecido centrado en la investigación de la inteligencia artificial del póquer. Durante varios años desarrolló y aplicó algoritmos y procedimientos de última generación, como minimización de arrepentimiento y aproximación de equilibrio de búsqueda de gradiente, árboles de decisión, métodos de búsqueda recursiva y algoritmos expertos para resolver una variedad de problemas relacionados con el juego de póquer. El sitio web de Neo Poker Lab, https://www.neopokerlab.com, ya no está en funcionamiento.
Hasta 2017, un equipo de la Universidad de Auckland estaba formado por un pequeño número de científicos que emplean el razonamiento basado en casos para crear y mejorar agentes de póquer Texas Hold'em. El grupo aplicó diferentes técnicas de IA a varios juegos, incluida la participación en los proyectos comerciales Small Worlds y Civilization (videojuego) .
Hasta 2019, una gran parte de la investigación sobre jugadores de póquer por computadora la realizaba en la Universidad de Alberta el Grupo de Investigación de Póquer por Computadora, dirigido por el Dr. Michael Bowling. El grupo desarrolló los agentes Poki , PsOpti , Hyperborean y Polaris . Poki ha obtenido la licencia para el juego de entretenimiento STACKED que presenta al jugador de póquer canadiense Daniel Negreanu . PsOpti estaba disponible con el nombre "SparBot" en el programa de formación de póquer "Poker Academy". La serie de programas Hyperborean ha competido en la Competencia Anual de Póquer por Computadora, y más recientemente se llevó tres medallas de oro en seis eventos en la competencia de 2012. La misma línea de investigación también produjo Polaris , que jugó contra profesionales humanos en 2007 y 2008, y se convirtió en el primer programa de póquer por computadora en ganar una competencia de póquer significativa.
En enero de 2015, un artículo en Science [14] de Michael Bowling, Neil Burch, Michael Johanson y Oskari Tammelin afirmó que su robot de póquer Cepheus había "resuelto esencialmente débilmente" el juego de Texas Hold'em mano a mano con límite. [15] [16] [17]
T. Sandholm y A. Gilpin de la Universidad Carnegie Mellon comenzaron a investigar la inteligencia artificial del póquer en 2004, comenzando con un agente imbatible para el juego de 3 cartas llamado Rhode-Island Hold 'em. El siguiente paso fue GS1, que superó a los mejores robots de póquer disponibles comercialmente. En 2006, los agentes de póquer de este grupo comenzaron a participar en competiciones informáticas anuales. "En algún momento tendremos un programa mejor que el de los mejores jugadores humanos", afirmó Sandholm, cuyo robot Claudico se enfrentó a cuatro oponentes humanos en 2015.
En 2017, el software del programa, Libratus , se enfrentó a cuatro jugadores de póquer profesionales. Al final del experimento, los cuatro jugadores humanos habían perdido en conjunto 1,8 millones de dólares en dinero simulado a manos de Libratus. [18]
En 2019, Libratus fue reemplazado por la versión final llamada Pluribus (poker bot) .
Una de las primeras competiciones de robots de póquer sin límite fue organizada en 2004 por la Conferencia Internacional sobre Modelado Cognitivo. [19] El torneo acogió a cinco robots de varias universidades de todo el mundo. El ganador fue Ace Gruber, de la Universidad de Toronto . [20]
La Association for Computing Machinery (ACM) solía organizar competiciones en las que los competidores presentaban un software capaz de jugar al póquer en su plataforma específica. Los anfitriones del evento llevaron a cabo los concursos operando el software e informando los resultados. [ cita necesaria ]
En el verano de 2005, la sala de póquer en línea Golden Palace organizó un torneo promocional en Las Vegas, en el antiguo Binions, con un premio de 100.000 dólares. Fue anunciado como la Serie Mundial de Robots de Póquer de 2005. El torneo fue solo para bots sin tarifa de inscripción. Los desarrolladores del bot eran informáticos de seis nacionalidades que viajaban por su cuenta. La plataforma anfitriona fue Poker Academy. El evento también contó con una demostración de mano a mano con Phil Laak.
En el verano de 2007, la Universidad de Alberta organizó un torneo mano a mano altamente especializado entre humanos y su robot Polaris, en la conferencia AAAI en Vancouver, BC, Canadá. La plataforma anfitriona fue escrita por la Universidad de Alberta . Hubo una bolsa de regalo máxima de $50 mil con reglas especiales para motivar a los humanos a jugar bien. Los humanos no pagaron tarifa de entrada. Este torneo único contó con cuatro sesiones de estilo duplicadas de 500 manos cada una. Los humanos ganaron por un estrecho margen.
En el verano de 2008, la Universidad de Alberta y el sitio web de entrenamiento de póquer Stoxpoker organizaron un segundo torneo durante la Serie Mundial de Póquer en Las Vegas. El torneo tuvo seis sesiones duplicadas de 500 manos cada una, y los jugadores humanos eran especialistas en Heads-Up Limit. Polaris ganó el torneo con 3 victorias, 2 derrotas y un empate. Los resultados del torneo, incluidos los historiales de manos de los partidos, están disponibles en el sitio web de la competición.
De abril a mayo de 2015, el robot Sandholm de la Universidad Carnegie Mellon, Claudico , se enfrentó a cuatro oponentes humanos en una serie de partidas de Texas Hold'em sin límite. [21] [22] Finalmente, después de jugar 80.000 manos, los humanos ganaron un total combinado de $732.713. Pero a pesar de que técnicamente los humanos ganaron, los científicos consideraron la victoria como estadísticamente insignificante (más bien, un empate estadístico) cuando se comparan esos $732,713 con el monto total apostado de $170,000,000 ($170 millones). Sin embargo, algunos han determinado que esta afirmación es falsa. [23] Estadísticamente insignificante aquí significa que los programadores de Claudico no pueden decir con un 95% de confianza (un intervalo de confianza del 95%) que los humanos son mejores que el programa de computadora. Sin embargo, es una victoria estadísticamente significativa en un intervalo de confianza del 90%. Esto significa que los jugadores humanos son favoritos entre 10 a 1 y 20 a 1. [24]
La forma en que se estructuró el torneo fue en dos sets de dos jugadores cada uno. En cada uno de los dos sets, los jugadores obtuvieron cartas opuestas. Es decir, si la computadora tiene As9c (As de espadas y nueve de tréboles) y el humano tiene Jh8d en una computadora, el otro de los dos jugadores del conjunto tendrá As9c contra el Jh8d de la computadora. Sin embargo, incluso con los jugadores humanos ganando más que la computadora, no todos los jugadores fueron positivos en sus enfrentamientos cara a cara.
Los totales de las ganancias de cada uno de los jugadores fueron los siguientes:
De 2006 a 2018, la Competencia Anual de Póquer por Computadora organizó una serie de competencias para programas de póquer. Desde 2010, se juegan tres tipos de póquer: Texas Hold'em con límite Heads-Up, Texas Hold'em sin límite Heads-Up y Texas Hold'em con límite para 3 jugadores. Dentro de cada evento, se nombran dos ganadores: el agente que gana la mayor cantidad de partidos (Bankroll Instant Run-off) y el agente que gana la mayor cantidad de dinero (Total Bankroll). Estos ganadores a menudo no son el mismo agente, ya que Bankroll Instant Run-off recompensa a los jugadores robustos y Total Bankroll recompensa a los jugadores que son buenos explotando los errores de los otros agentes. La competencia estuvo motivada por investigaciones científicas y se hizo hincapié en garantizar que todos los resultados sean estadísticamente significativos al ejecutar millones de manos de póquer. La competición de 2012 tuvo el mismo formato con más de 70 millones de manos jugadas para eliminar el factor suerte.
Algunos investigadores desarrollaron una aplicación web donde la gente podía jugar y evaluar la calidad de la IA. Así, a diciembre de 2012 se podían encontrar los siguientes grupos principales y agentes de investigadores individuales:
El concurso final de póquer no fue público. Cuando el programa Pluribus (robot de póquer) venció consistentemente a los profesionales en Hold'em sin límite de 6 manos, el resultado se anunció discretamente en una publicación de Facebook. [29]
{{cite journal}}
: Parámetro desconocido |agency=
ignorado ( ayuda )