El sistema de clasificación Glicko y el sistema de clasificación Glicko-2 son métodos para evaluar la fuerza de un jugador en juegos de dos jugadores de suma cero . El sistema de clasificación Glicko fue inventado por Mark Glickman en 1995 como una mejora del sistema de clasificación Elo e inicialmente estaba destinado a su uso principal como sistema de clasificación de ajedrez . La principal contribución de Glickman a la medición es la "confiabilidad de las calificaciones", llamada RD, por desviación de las calificaciones .
Mark Glickman creó el sistema de calificación Glicko en 1995 como una mejora del sistema de calificación Elo . [1]
Tanto el sistema de clasificación Glicko como el Glicko-2 son de dominio público y se han implementado en servidores de juegos en línea como Pokémon Showdown , Pokémon Go , [2] Lichess , Free Internet Chess Server , Chess.com , Online Go Server (OGS), [ 3] Counter-Strike: Global Offensive , Quake Live , Team Fortress 2 , [4] Dota 2 , [5] Dota Underlords , Guild Wars 2 , [6] Splatoon 2 y 3 , [7] Dominion Online , TETR.IO, y concursos competitivos de programación.
La desviación de confiabilidad (RD) mide la precisión de la calificación de un jugador, donde la RD es igual a una desviación estándar. Por ejemplo, un jugador con una calificación de 1500 y un RD de 50 tiene una fuerza real entre 1400 y 1600 (dos desviaciones estándar de 1500) con un 95% de confianza. Dos veces (exacta: 1,96) se suma y se resta el RD de su calificación para calcular este rango. Después de un juego, la cantidad de cambios en el rating depende del RD: el cambio es menor cuando el RD del jugador es bajo (dado que su rating ya se considera preciso), y también cuando el RD del oponente es alto (ya que el verdadero rating del oponente no es bien conocido, por lo que se está obteniendo poca información). La RD en sí disminuye después de jugar un juego, pero aumentará lentamente con el tiempo de inactividad.
El sistema de calificación Glicko-2 mejora el sistema de calificación Glicko e introduce aún más la volatilidad de calificación σ. [8] La Federación Australiana de Ajedrez implementa una versión ligeramente modificada del sistema de clasificación Glicko-2 . [9]
La nueva Desviación de Calificaciones ( ) se encuentra utilizando la antigua Desviación de Calificaciones ( ):
donde es la cantidad de tiempo (períodos de calificación) desde la última competencia y se supone que '350' es el RD de un jugador sin calificación. Si se han producido varios juegos dentro de un período de calificación, el método los trata como si hubieran ocurrido simultáneamente. El período de calificación puede durar varios meses o tan solo unos minutos, según la frecuencia con la que se organicen los juegos. La constante se basa en la incertidumbre de la habilidad de un jugador durante un cierto período de tiempo. Puede derivarse de un análisis exhaustivo de datos o estimarse considerando el período de tiempo que tendría que pasar antes de que la desviación de calificación de un jugador crezca hasta la de un jugador sin calificación. Si se supone que se necesitarían 100 períodos de calificación para que la desviación de calificación de un jugador regrese a una incertidumbre inicial de 350, y un jugador típico tiene una desviación de calificación de 50, entonces la constante se puede encontrar resolviendo para . [10]
O
Las nuevas calificaciones, después de una serie de m juegos, están determinadas por la siguiente ecuación:
dónde:
representa las calificaciones de los oponentes individuales.
representa las desviaciones de calificación de los oponentes individuales.
representa el resultado de los juegos individuales. Una victoria es 1, un empate es y una derrota es 0.
La función del cálculo de RD anterior era aumentar el RD de manera apropiada para tener en cuenta la creciente incertidumbre en el nivel de habilidad de un jugador durante un período de no observación por parte del modelo. Ahora, el RD se actualiza (disminuye) después de la serie de juegos:
Glicko-2 funciona de manera similar al algoritmo Glicko original, con la adición de una volatilidad de calificación que mide el grado de fluctuación esperada en la calificación de un jugador, en función de cuán erráticas son las actuaciones del jugador. Por ejemplo, la volatilidad de la calificación de un jugador sería baja cuando se desempeñara a un nivel consistente y aumentaría si obtuviera resultados excepcionalmente sólidos después de ese período de consistencia. A continuación se presenta una explicación simplificada del algoritmo Glicko-2: [8]
Durante un período de calificación, un jugador con una calificación actual y una desviación de calificación juega contra oponentes, con calificaciones y RD , lo que resulta en puntuaciones . Primero necesitamos calcular las cantidades auxiliares y :
dónde
Luego debemos elegir una pequeña constante que limite la volatilidad a lo largo del tiempo, por ejemplo (valores más pequeños de evitan cambios dramáticos en las calificaciones después de resultados inesperados). Entonces para
Necesitamos encontrar el valor que satisfaga . Una forma eficaz de resolver esto sería utilizar el algoritmo de Illinois, una versión modificada del procedimiento regula falsi (consulte Regula falsi § El algoritmo de Illinois para obtener detalles sobre cómo se haría esto). Una vez que se completa este procedimiento iterativo, establecemos la nueva volatilidad de calificación como
Luego obtenemos el nuevo RD.
y nueva calificación
Estas calificaciones y RD están en una escala diferente a la del algoritmo original de Glicko y sería necesario convertirlos para compararlos adecuadamente. [8]