Sistema de calificación Glicko

El sistema de clasificación Glicko y el sistema de clasificación Glicko-2 son métodos para evaluar la fuerza de un jugador en juegos de dos jugadores de suma cero . El sistema de clasificación Glicko fue inventado por Mark Glickman en 1995 como una mejora del sistema de clasificación Elo e inicialmente estaba destinado a su uso principal como sistema de clasificación de ajedrez . La principal contribución de Glickman a la medición es la "confiabilidad de las calificaciones", llamada RD, por desviación de las calificaciones .

Descripción general

Mark Glickman creó el sistema de calificación Glicko en 1995 como una mejora del sistema de calificación Elo . ^[1]

Tanto el sistema de clasificación Glicko como el Glicko-2 son de dominio público y se han implementado en servidores de juegos en línea como Pokémon Showdown , Pokémon Go , ^[2] Lichess , Free Internet Chess Server , Chess.com , Online Go Server (OGS), ^{[ 3]} Counter-Strike: Global Offensive , Quake Live , Team Fortress 2 , ^[4]Dota 2 , ^[5]Dota Underlords , Guild Wars 2 , ^[6]Splatoon 2 y 3 , ^[7]Dominion Online , TETR.IO, y concursos competitivos de programación.

La desviación de confiabilidad (RD) mide la precisión de la calificación de un jugador, donde la RD es igual a una desviación estándar. Por ejemplo, un jugador con una calificación de 1500 y un RD de 50 tiene una fuerza real entre 1400 y 1600 (dos desviaciones estándar de 1500) con un 95% de confianza. Dos veces (exacta: 1,96) se suma y se resta el RD de su calificación para calcular este rango. Después de un juego, la cantidad de cambios en el rating depende del RD: el cambio es menor cuando el RD del jugador es bajo (dado que su rating ya se considera preciso), y también cuando el RD del oponente es alto (ya que el verdadero rating del oponente no es bien conocido, por lo que se está obteniendo poca información). La RD en sí disminuye después de jugar un juego, pero aumentará lentamente con el tiempo de inactividad.

El sistema de calificación Glicko-2 mejora el sistema de calificación Glicko e introduce aún más la volatilidad de calificación σ. ^{[8] La}Federación Australiana de Ajedrez implementa una versión ligeramente modificada del sistema de clasificación Glicko-2 . ^[9]

El algoritmo de Glicko

Paso 1: Determinar la desviación de las calificaciones

La nueva Desviación de Calificaciones ( ) se encuentra utilizando la antigua Desviación de Calificaciones ( ): ${\displaystyleRD}$ $RD_{0}$

$RD=\min \left({\sqrt {{RD_{0}}^{2}+c^{2}t}},350\right)$

donde es la cantidad de tiempo (períodos de calificación) desde la última competencia y se supone que '350' es el RD de un jugador sin calificación. Si se han producido varios juegos dentro de un período de calificación, el método los trata como si hubieran ocurrido simultáneamente. El período de calificación puede durar varios meses o tan solo unos minutos, según la frecuencia con la que se organicen los juegos. La constante se basa en la incertidumbre de la habilidad de un jugador durante un cierto período de tiempo. Puede derivarse de un análisis exhaustivo de datos o estimarse considerando el período de tiempo que tendría que pasar antes de que la desviación de calificación de un jugador crezca hasta la de un jugador sin calificación. Si se supone que se necesitarían 100 períodos de calificación para que la desviación de calificación de un jugador regrese a una incertidumbre inicial de 350, y un jugador típico tiene una desviación de calificación de 50, entonces la constante se puede encontrar resolviendo para . ^[10] $t$ $c$ $350={\sqrt {50^{2}+100c^{2}}}$ $c$

$c={\sqrt {(350^{2}-50^{2})/100}}\aproximadamente 34,6$

Paso 2: determinar la nueva calificación

Las nuevas calificaciones, después de una serie de m juegos, están determinadas por la siguiente ecuación:

$r=r_{0}+{\frac {q}{{\frac {1}{RD^{2}}}+{\frac {1}{d^{2}}}}}\sum _{i=1}^{m}{g(RD_{i})(s_{i}-E(s|r_{0},r_{i},RD_{i}))}$

dónde:

$g(RD_{i})={\frac {1}{\sqrt {1+{\frac {3q^{2}(RD_{i}^{2})}{\pi ^{2} }}}}}$

$E(s|r_{0},r_{i},RD_{i})={\frac {1}{1+10^{\left({\frac {g(RD_{i})( r_{0}-r_{i})}{-400}}\right)}}}$

$q={\frac {\ln(10)}{400}}=0,00575646273$

$d^{2}={\frac {1}{q^{2}\sum _{i=1}^{m}{(g(RD_{i}))^{2}E(s |r_{0},r_{i},RD_{i})(1-E(s|r_{0},r_{i},RD_{i}))}}}$

${\ Displaystyle r_ {i}}$ representa las calificaciones de los oponentes individuales.

$RD_{i}$ representa las desviaciones de calificación de los oponentes individuales.

${\ Displaystyle s_ {i}}$ representa el resultado de los juegos individuales. Una victoria es 1, un empate es y una derrota es 0. ${\frac {1}{2}}$

Paso 3: Determinar la nueva desviación de las calificaciones

La función del cálculo de RD anterior era aumentar el RD de manera apropiada para tener en cuenta la creciente incertidumbre en el nivel de habilidad de un jugador durante un período de no observación por parte del modelo. Ahora, el RD se actualiza (disminuye) después de la serie de juegos:

$RD'={\sqrt {\left({\frac {1}{RD^{2}}}+{\frac {1}{d^{2}}}\right)^{-1} }}$

Algoritmo Glicko-2

Glicko-2 funciona de manera similar al algoritmo Glicko original, con la adición de una volatilidad de calificación que mide el grado de fluctuación esperada en la calificación de un jugador, en función de cuán erráticas son las actuaciones del jugador. Por ejemplo, la volatilidad de la calificación de un jugador sería baja cuando se desempeñara a un nivel consistente y aumentaría si obtuviera resultados excepcionalmente sólidos después de ese período de consistencia. A continuación se presenta una explicación simplificada del algoritmo Glicko-2: ^[8] $\sigma$

Paso 1: Calcular cantidades auxiliares

Durante un período de calificación, un jugador con una calificación actual y una desviación de calificación juega contra oponentes, con calificaciones y RD , lo que resulta en puntuaciones . Primero necesitamos calcular las cantidades auxiliares y : $\mu$ $\phi$ $m$ $\mu _{1},...,\mu _{m}$ $\phi _{1},...,\phi _{m}$ $s_{1},...,s_{m}$ $v$ $\Delta$

$v=\left[\sum _{j=1}^{m}g(\phi _{j})^{2}E(\mu ,\mu _{j},\phi _{j })\{1-E(\mu ,\mu _{j},\phi _{j})\}\right]^{-1}$

$\Delta =v\sum _{j=1}^{m}g(\phi _{j})\{s_{j}-E(\mu ,\mu _{j},\phi _ {j})\}$

dónde

$g(\phi _{j})={\frac {1}{\sqrt {1+3\phi _{j}^{2}/\pi ^{2}}}},$

$E(\mu ,\mu _{j},\phi _{j})={\frac {1}{1+\exp\{-g(\phi _{j})(\mu -\mu _{j})\}}}.$

Paso 2: Determinar la nueva volatilidad de las calificaciones

Luego debemos elegir una pequeña constante que limite la volatilidad a lo largo del tiempo, por ejemplo (valores más pequeños de evitan cambios dramáticos en las calificaciones después de resultados inesperados). Entonces para $\tau$ $\tau =0.2$ $\tau$

$f(x)={\frac {1}{2}}{\frac {e^{x}(\Delta ^{2}-\phi ^{2}-v-e^{x})}{(\phi ^{2}+v+e^{x})^{2}}}-{\frac {x-\ln({\sigma ^{2}})}{\tau ^{2}}},$

Necesitamos encontrar el valor que satisfaga . Una forma eficaz de resolver esto sería utilizar el algoritmo de Illinois, una versión modificada del procedimiento regula falsi (consulte Regula falsi § El algoritmo de Illinois para obtener detalles sobre cómo se haría esto). Una vez que se completa este procedimiento iterativo, establecemos la nueva volatilidad de calificación como $A$ $f(A)=0$ $\sigma '$

$\sigma '=\exp\{A/2\}.$

Paso 3: Determinar la nueva desviación y calificación de las calificaciones

Luego obtenemos el nuevo RD.

$\phi '=1{\Big /}{\sqrt {{\frac {1}{\phi ^{2}+\sigma '^{2}}}+{\frac {1}{v}}}},$

y nueva calificación

$\mu '=\mu +\phi '^{2}\sum _{j=1}^{m}g(\phi _{j})\{s_{j}-E(\mu ,\mu _{j},\phi _{j})\}.$

Estas calificaciones y RD están en una escala diferente a la del algoritmo original de Glicko y sería necesario convertirlos para compararlos adecuadamente. ^[8]

Ver también

Sistema de clasificación de ajedrez

Referencias

^ Glickman, Mark. "El sistema Glicko" (PDF) . Consultado el 13 de octubre de 2022 .
^ "Volatilidad agrícola: cómo una falla importante en un sistema de calificación conocido se apodera de la clasificación de GBL". 23 de julio de 2020 . Consultado el 12 de diciembre de 2022 .
^ "¡OGS tiene un nuevo sistema de clasificación basado en Glicko-2!". 7 de agosto de 2017 . Consultado el 19 de abril de 2020 .
^ Válvula. "Lanzada la actualización de Team Fortress 2" . Consultado el 29 de junio de 2021 .
^ "Actualización New Frontiers: actualización del juego 7.33" . Consultado el 20 de abril de 2023 .
^ Justin, O'Dell. "Encontrar la pareja perfecta" . Consultado el 16 de enero de 2015 .
^ Cúpula de avena. "Una mirada en profundidad al sistema de clasificación de Splatoon 2". avenadome.me . Consultado el 16 de junio de 2021 .
^ abc Glickman, Mark E. (30 de noviembre de 2013). «Ejemplo del sistema Glicko-2» (PDF) . Glicko.net . Consultado el 27 de enero de 2020 .
^ "Estatuto de calificaciones de la Federación Australiana de Ajedrez" (PDF) . Consultado el 17 de enero de 2019 .
^ "Bienvenido a las valoraciones de Glicko".

enlaces externos

Sitio web Glicko del profesor Glickman
El sistema de calificación TrueSkill [1] de Microsoft toma prestadas muchas ideas de Glicko.
forwardloop/glicko2s Implementación de Glicko-2 para la JVM
RobKohr/glicko Implementación de JavaScript Glicko-2.
mmai/glicko2js Implementación de javascript y node.js en el lado del cliente Glicko-2
deepy/glicko2 Implementación de Python Glicko-2.
sulee/glicko2 Implementación de Python Glicko-2.
Implementación de PlayerRatings R Glicko por Alec Stephenson y Jeff Sonas.
scala-glicko2 Implementación de Scala Glicko-2.
dimos/glicko2 Implementación de Glicko-2 para Scala y Scala.js