stringtranslate.com

Jugador de póquer por ordenador

Un jugador de póquer por computadora es un programa de computadora diseñado para jugar al póquer (generalmente la versión Texas Hold'em ), contra oponentes humanos u otros oponentes por computadora. Se le conoce comúnmente como pokerbot o simplemente bot . A partir de 2019, las computadoras pueden vencer a cualquier jugador humano en el póquer. [1] [2] [3]

En Internet

Estos bots o programas informáticos se utilizan a menudo en situaciones de póquer en línea, ya sea como oponentes legítimos para jugadores humanos o como una forma de hacer trampa . A partir de 2020, todos los sitios de póquer en línea consideran trampa todo uso de asistencia en tiempo real (RTA) o bots automatizados, aunque el nivel de aplicación de la ley por parte de los operadores del sitio varía considerablemente. [ cita necesaria ]

robots de jugador

El uso de bots de jugadores o asistencia informática mientras se juega al póquer en línea está prohibido en la mayoría, si no en todos, los sitios en línea. Las acciones tomadas en caso de incumplimiento son la prohibición permanente y la confiscación de las ganancias. [ cita necesaria ] Un tipo de bot puede interactuar con el cliente de póquer (en otras palabras, jugar solo como un jugador automático) sin la ayuda de su operador humano. La asistencia en tiempo real (RTA) es otro método de uso de programas informáticos. RTA ocurre cuando un jugador humano usa un programa llamado "solucionador", como PioSOLVER o PokerSnowie, [4] que se ejecuta en una computadora diferente, [5] para tomar sus decisiones.

La cuestión de la ventaja injusta tiene dos vertientes. Por un lado, los robots pueden jugar durante muchas horas seguidas sin debilidades humanas como la fatiga y pueden soportar las variaciones naturales del juego sin verse influenciados por las emociones humanas (o " tilt "). En segundo lugar, desde 2019, el programa informático Pluribus (robot de póquer) tiene tanto éxito en leer faroles, calcular probabilidades y adaptarse a la estrategia que vence constantemente a los jugadores de póquer profesionales en Hold'em sin límite para 6 jugadores. [6] [7] [8]

Aplicación de la ley

Si bien los términos y condiciones de los sitios de póquer generalmente prohíben el uso de bots, el nivel de aplicación depende del operador del sitio. Algunos buscarán y prohibirán a los usuarios de bots mediante el uso de una variedad de herramientas de software. El cliente de póquer puede programarse para intentar detectar bots, aunque esto es controvertido en sí mismo, ya que podría verse como equivalente a incrustar software espía en el software del cliente. [ cita necesaria ] Otro método es usar CAPTCHA a intervalos aleatorios durante el juego para detectar bots automatizados, aunque no es efectivo contra la asistencia en tiempo real.

robots domésticos

Los “robots domésticos” pueden plantear un conflicto de intereses. Según la definición más estricta, un robot doméstico es un jugador automatizado operado por la propia sala de póquer en línea. Este tipo de robots serían el equivalente a los cómplices tradicionales .

Se supone que tanto los cómplices de los casinos tradicionales como los robots domésticos en línea tienen acceso a información que no esté disponible para ningún otro jugador en la mano. El problema es que en un entorno en línea la casa no tiene forma de demostrar que sus robots no reciben información confidencial del servidor de la tarjeta. Esto se ve exacerbado aún más por la facilidad con la que se puede lograr el intercambio clandestino de información en un entorno digital. Es esencialmente imposible incluso para la casa demostrar que no controla a algunos jugadores.

Inteligencia artificial

Al igual que en los juegos de ajedrez , Go (juego) y muchos otros juegos, los sistemas de inteligencia artificial vencen incluso a los mejores humanos en el póquer. [9] [10] El póquer es un juego de información imperfecta (porque algunas cartas en juego están ocultas), lo que hace que sea más difícil para cualquier persona (incluida una computadora) deducir el resultado final de la mano. Debido a esta falta de información, los programadores de ordenadores solían tener que implementar sistemas basados ​​en el teorema de Bayes , el equilibrio de Nash , la simulación de Montecarlo o las redes neuronales , todas ellas técnicas imperfectas. Pluribus , sin embargo, perfeccionó el poker mirando sólo unos pocos movimientos para determinar qué acción tomar, en lugar de intentar evaluar todos los movimientos hasta el final del juego.

Las IA más antiguas, como PokerSnowie y Claudico, se crearon permitiendo que la computadora determinara la mejor estrategia posible al permitirle jugar una enorme cantidad de veces. Durante años, este fue el enfoque de la IA del póquer, en lugar de intentar crear una computadora que jugara como un humano. Esto resultó en un tamaño de apuesta extraño y una estrategia muy diferente a la que los humanos estamos acostumbrados a ver.

Primero se desarrollaron métodos para aproximar la estrategia perfecta del póquer desde la perspectiva de la teoría de juegos en el juego mano a mano (dos jugadores) y luego para el juego multijugador. La estrategia perfecta tiene múltiples significados en este contexto. Desde el punto de vista óptimo de la teoría de juegos, una estrategia perfecta es aquella que no puede esperar perder frente a la estrategia de ningún otro jugador; sin embargo, la estrategia óptima puede variar en presencia de jugadores subóptimos que tienen debilidades que pueden explotarse. En este caso, una estrategia perfecta es aquella que modela correcta o fielmente esas debilidades y las aprovecha para obtener ganancias, como las explicadas anteriormente.

La IA logró un rendimiento sobrehumano en el póquer durante la década de 2010, con la siguiente línea de tiempo. En 2015, las computadoras resolvieron el heads-up limit Hold'em a través de Cepheus . Alrededor de 2018, Libratus demostró una habilidad sobrehumana en el mano a mano sin límite de Hold'em. En 2019, Pluribus (una versión más nueva de Libratus) [11] demostró una habilidad sobrehumana en el Hold'em sin límite para seis jugadores, la variedad de póquer más jugada en el mundo. [12] En 2021, Microsoft lanzó comercialmente el antiguo programa de juego de póquer, Libratus, que luego venció a cuatro jugadores de póquer profesionales en una competencia de póquer de 20 días en Rivers Casino. [13]

Grupos de investigación

Laboratorio de Neo Poker

Neo Poker Lab era un equipo científico establecido centrado en la investigación de la inteligencia artificial del póquer. Durante varios años desarrolló y aplicó algoritmos y procedimientos de última generación, como minimización de arrepentimiento y aproximación de equilibrio de búsqueda de gradiente, árboles de decisión, métodos de búsqueda recursiva y algoritmos expertos para resolver una variedad de problemas relacionados con el juego de póquer. El sitio web de Neo Poker Lab, https://www.neopokerlab.com, ya no está en funcionamiento.

Grupo de IA de juegos de la Universidad de Auckland

Hasta 2017, un equipo de la Universidad de Auckland estaba formado por un pequeño número de científicos que emplean el razonamiento basado en casos para crear y mejorar agentes de póquer Texas Hold'em. El grupo aplicó diferentes técnicas de IA a varios juegos, incluida la participación en los proyectos comerciales Small Worlds y Civilization (videojuego) .

Grupo de Investigación sobre Póquer Informático (Universidad de Alberta, Canadá)

Hasta 2019, una gran parte de la investigación sobre jugadores de póquer por computadora la realizaba en la Universidad de Alberta el Grupo de Investigación de Póquer por Computadora, dirigido por el Dr. Michael Bowling. El grupo desarrolló los agentes Poki , PsOpti , Hyperborean y Polaris . Poki ha obtenido la licencia para el juego de entretenimiento STACKED que presenta al jugador de póquer canadiense Daniel Negreanu . PsOpti estaba disponible con el nombre "SparBot" en el programa de formación de póquer "Poker Academy". La serie de programas Hyperborean ha competido en la Competencia Anual de Póquer por Computadora, y más recientemente se llevó tres medallas de oro en seis eventos en la competencia de 2012. La misma línea de investigación también produjo Polaris , que jugó contra profesionales humanos en 2007 y 2008, y se convirtió en el primer programa de póquer por computadora en ganar una competencia de póquer significativa.

En enero de 2015, un artículo en Science [14] de Michael Bowling, Neil Burch, Michael Johanson y Oskari Tammelin afirmó que su robot de póquer Cepheus había "resuelto esencialmente débilmente" el juego de Texas Hold'em mano a mano con límite. [15] [16] [17]

Facultad de Ciencias de la Computación de la Universidad Carnegie Mellon

T. Sandholm y A. Gilpin de la Universidad Carnegie Mellon comenzaron a investigar la inteligencia artificial del póquer en 2004, comenzando con un agente imbatible para el juego de 3 cartas llamado Rhode-Island Hold 'em. El siguiente paso fue GS1, que superó a los mejores robots de póquer disponibles comercialmente. En 2006, los agentes de póquer de este grupo comenzaron a participar en competiciones informáticas anuales. "En algún momento tendremos un programa mejor que el de los mejores jugadores humanos", afirmó Sandholm, cuyo robot Claudico se enfrentó a cuatro oponentes humanos en 2015.

En 2017, el software del programa, Libratus , se enfrentó a cuatro jugadores de póquer profesionales. Al final del experimento, los cuatro jugadores humanos habían perdido en conjunto 1,8 millones de dólares en dinero simulado a manos de Libratus. [18]

En 2019, Libratus fue reemplazado por la versión final llamada Pluribus (poker bot) .

Concursos históricos

Competición ICCM 2004 PokerBot

Una de las primeras competiciones de robots de póquer sin límite fue organizada en 2004 por la Conferencia Internacional sobre Modelado Cognitivo. [19] El torneo acogió a cinco robots de varias universidades de todo el mundo. El ganador fue Ace Gruber, de la Universidad de Toronto . [20]

competiciones ACM

La Association for Computing Machinery (ACM) solía organizar competiciones en las que los competidores presentaban un software capaz de jugar al póquer en su plataforma específica. Los anfitriones del evento llevaron a cabo los concursos operando el software e informando los resultados. [ cita necesaria ]

La Serie Mundial de Robots de Póquer 2005

En el verano de 2005, la sala de póquer en línea Golden Palace organizó un torneo promocional en Las Vegas, en el antiguo Binions, con un premio de 100.000 dólares. Fue anunciado como la Serie Mundial de Robots de Póquer de 2005. El torneo fue solo para bots sin tarifa de inscripción. Los desarrolladores del bot eran informáticos de seis nacionalidades que viajaban por su cuenta. La plataforma anfitriona fue Poker Academy. El evento también contó con una demostración de mano a mano con Phil Laak.

Experimentos de la máquina Man V de la Universidad de Alberta

En el verano de 2007, la Universidad de Alberta organizó un torneo mano a mano altamente especializado entre humanos y su robot Polaris, en la conferencia AAAI en Vancouver, BC, Canadá. La plataforma anfitriona fue escrita por la Universidad de Alberta . Hubo una bolsa de regalo máxima de $50 mil con reglas especiales para motivar a los humanos a jugar bien. Los humanos no pagaron tarifa de entrada. Este torneo único contó con cuatro sesiones de estilo duplicadas de 500 manos cada una. Los humanos ganaron por un estrecho margen.

En el verano de 2008, la Universidad de Alberta y el sitio web de entrenamiento de póquer Stoxpoker organizaron un segundo torneo durante la Serie Mundial de Póquer en Las Vegas. El torneo tuvo seis sesiones duplicadas de 500 manos cada una, y los jugadores humanos eran especialistas en Heads-Up Limit. Polaris ganó el torneo con 3 victorias, 2 derrotas y un empate. Los resultados del torneo, incluidos los historiales de manos de los partidos, están disponibles en el sitio web de la competición.

La competencia Brains vs AI 2015 de Rivers Casino, CMU y Microsoft

De abril a mayo de 2015, el robot Sandholm de la Universidad Carnegie Mellon, Claudico , se enfrentó a cuatro oponentes humanos en una serie de partidas de Texas Hold'em sin límite. [21] [22] Finalmente, después de jugar 80.000 manos, los humanos ganaron un total combinado de $732.713. Pero a pesar de que técnicamente los humanos ganaron, los científicos consideraron la victoria como estadísticamente insignificante (más bien, un empate estadístico) cuando se comparan esos $732,713 con el monto total apostado de $170,000,000 ($170 millones). Sin embargo, algunos han determinado que esta afirmación es falsa. [23] Estadísticamente insignificante aquí significa que los programadores de Claudico no pueden decir con un 95% de confianza (un intervalo de confianza del 95%) que los humanos son mejores que el programa de computadora. Sin embargo, es una victoria estadísticamente significativa en un intervalo de confianza del 90%. Esto significa que los jugadores humanos son favoritos entre 10 a 1 y 20 a 1. [24]

La forma en que se estructuró el torneo fue en dos sets de dos jugadores cada uno. En cada uno de los dos sets, los jugadores obtuvieron cartas opuestas. Es decir, si la computadora tiene As9c (As de espadas y nueve de tréboles) y el humano tiene Jh8d en una computadora, el otro de los dos jugadores del conjunto tendrá As9c contra el Jh8d de la computadora. Sin embargo, incluso con los jugadores humanos ganando más que la computadora, no todos los jugadores fueron positivos en sus enfrentamientos cara a cara.

Los totales de las ganancias de cada uno de los jugadores fueron los siguientes:

La competencia anual de póquer por computadora

De 2006 a 2018, la Competencia Anual de Póquer por Computadora organizó una serie de competencias para programas de póquer. Desde 2010, se juegan tres tipos de póquer: Texas Hold'em con límite Heads-Up, Texas Hold'em sin límite Heads-Up y Texas Hold'em con límite para 3 jugadores. Dentro de cada evento, se nombran dos ganadores: el agente que gana la mayor cantidad de partidos (Bankroll Instant Run-off) y el agente que gana la mayor cantidad de dinero (Total Bankroll). Estos ganadores a menudo no son el mismo agente, ya que Bankroll Instant Run-off recompensa a los jugadores robustos y Total Bankroll recompensa a los jugadores que son buenos explotando los errores de los otros agentes. La competencia estuvo motivada por investigaciones científicas y se hizo hincapié en garantizar que todos los resultados sean estadísticamente significativos al ejecutar millones de manos de póquer. La competición de 2012 tuvo el mismo formato con más de 70 millones de manos jugadas para eliminar el factor suerte.

Algunos investigadores desarrollaron una aplicación web donde la gente podía jugar y evaluar la calidad de la IA. Así, a diciembre de 2012 se podían encontrar los siguientes grupos principales y agentes de investigadores individuales:

Resultados

Pluribus

El concurso final de póquer no fue público. Cuando el programa Pluribus (robot de póquer) venció consistentemente a los profesionales en Hold'em sin límite de 6 manos, el resultado se anunció discretamente en una publicación de Facebook. [29]

Ver también

Referencias

  1. ^ Naturaleza. "DeepMind AI derroca a los expertos en el complejo juego Stratego". Anil Ananthaswamy. NOTICIA 01 Diciembre 2022, Aclaración 05 Diciembre 2022.
  2. ^ Cielo, Douglas (11 de julio de 2019). "Sin límite: el robot de póquer con IA es el primero en vencer a los profesionales en el juego multijugador". Naturaleza . 571 (7765): 307–308. Código Bib :2019Natur.571..307H. doi : 10.1038/d41586-019-02156-9 . PMID  31312056.
  3. ^ Smith, Dana G. "La IA aprende lo que un bebé sabe sobre el mundo físico". Científico americano . Consultado el 17 de mayo de 2023 .
  4. ^ Siete juegos: una historia humana. Capítulo 5. Oliver Roeder, 2022. Editorial: WW Norton and Co.
  5. ^ https://docs.house.gov/meetings/IF/IF17/20131210/101570/HHRG-113-IF17-Wstate-EggertK-20131210.pdf Testimonio del profesor de derecho Kurt Eggert Facultad de Derecho Dale E. Fowler de la Universidad Chapman Ante el Subcomité de Comercio, Manufactura y Comercio del Comité de Energía y Comercio de la Cámara de Representantes en una audiencia titulada: “El estado de los juegos en línea” Edificio de oficinas de Rayburn House, Washington, DC 10 de diciembre de 2013
  6. ^ Marrón, Noam; Sandholm, Tuomas (30 de agosto de 2019). "IA sobrehumana para el póquer multijugador". Ciencia . 365 (6456): 885–890. Código Bib : 2019 Ciencia... 365..885B. doi : 10.1126/ciencia.aay2400 . PMID  31296650. S2CID  195892791.
  7. ^ "Carnegie Mellon y Facebook AI vencen a los profesionales en el póquer para seis jugadores - Noticias - Universidad Carnegie Mellon". www.cmu.edu . Consultado el 17 de mayo de 2023 .
  8. ^ Marr, Bernard. "La inteligencia artificial domina el juego del póquer: ¿qué significa eso para los humanos?". Forbes . Consultado el 17 de mayo de 2023 .
  9. ^ Intagliata, Cristóbal. "Esta Inteligencia Artificial aprende como un bebé". Científico americano . Consultado el 17 de mayo de 2023 .
  10. ^ Equipo de Diplomacia de Investigación de IA Meta Fundamental (FAIR) †; Bajtín, Antón; Marrón, Noam; Dinán, Emily; Farina, Gabriele; Flaherty, Colin; Frito, Daniel; Goff, Andrés; Gris, Jonathan; Hu, Hengyuan; Jacob, Athul Paul; Komeili, Mojtaba; Konath, Karthik; Kwon, Minae; Lerer, Adam (9 de diciembre de 2022). "Juego a nivel humano en el juego de la diplomacia combinando modelos lingüísticos con razonamiento estratégico". Ciencia . 378 (6624): 1067–1074. Código Bib : 2022 Ciencia... 378.1067M. doi : 10.1126/science.ade9097. ISSN  0036-8075. PMID  36413172. S2CID  253759631.
  11. ^ Revista, Smithsonian; Solly, Meilan. "Esta IA que juega al póquer sabe cuándo retenerlos y cuándo retirarlos". Revista Smithsonian . Consultado el 17 de mayo de 2023 .
  12. ^ "Apueste por el bot: la IA vence a los profesionales en el Texas Hold 'Em para 6 jugadores". NPR . Consultado el 17 de mayo de 2023 .
  13. ^ "La irrupción de la IA en el espacio de los juegos de estrategia demuestra que las máquinas se están volviendo más inteligentes". Forbes. Annie Brown. 10 de noviembre de 2021, 04:42 p. m. EST.
  14. ^ Bolos, Michael; Burch, Neil; Johanson, Michael; Tammelin, Oskari (enero de 2015). "El póquer Hold'em con límite mano a mano está resuelto". Ciencia . 347 (6218): 145–9. Código Bib : 2015 Ciencia... 347.. 145B. CiteSeerX 10.1.1.697.72 . doi : 10.1126/ciencia.1259433. PMID  25574016. S2CID  3796371. 
  15. ^ Philip Ball (8 de enero de 2015). "Los teóricos de los juegos descubren el póquer". Naturaleza . doi : 10.1038/naturaleza.2015.16683 . S2CID  155710390 . Consultado el 13 de enero de 2015 . {{cite journal}}: Parámetro desconocido |agency=ignorado ( ayuda )
  16. ^ Robert Lee Hotz (8 de enero de 2015). "La computadora conquista el Texas Hold 'Em, dicen los investigadores". Wall Street Journal .
  17. ^ Bob McDonald (10 de enero de 2015). "La computadora de póquer se lleva el bote [entrevista de audio]". Quirks y quarks (Pódcast).
  18. ^ Joshua Brustein (31 de enero de 2017). "Juegos Pkv en línea de Daftar Situs Poker". Bloomberg.com . Bloomberg . Consultado el 2 de febrero de 2017 .
  19. ^ "Cicm 2004".
  20. ^ https://www.era.lib.ed.ac.uk/bitstream/1842/2392/2/Carter%20RG%20thesis%2007.pdf [ URL básica PDF ]
  21. ^ Marilyn Malara (25 de abril de 2015). "Cerebros versus IA: la computadora se enfrenta a profesionales del póquer en Texas Hold'em sin límite". UPI . Consultado el 26 de abril de 2015 .
  22. ^ "El cerebro de Rivers Casino frente a la IA". Archivado desde el original el 3 de febrero de 2016 . Consultado el 23 de octubre de 2015 .
  23. ^ "Cerebros versus IA | Escuela de Ciencias de la Computación Carnegie Mellon". www.cs.cmu.edu . Consultado el 10 de febrero de 2016 .
  24. ^ "Cerebros versus IA | Escuela de Ciencias de la Computación Carnegie Mellon". www.cs.cmu.edu . Consultado el 10 de febrero de 2016 .
  25. ^ "Cerebros versus inteligencia artificial". www.riverscasino.com . Archivado desde el original el 3 de febrero de 2016 . Consultado el 10 de febrero de 2016 .
  26. ^ "CPRG".
  27. ^ "CPRG".
  28. ^ "Evolución de los Poker Bots: de la historia al futuro". 8 de julio de 2020.
  29. ^ Solly, Meilan. "Esta IA que juega al póquer sabe cuándo retenerlos y cuándo retirarlos". Smithsoniano .

enlaces externos