El modelo Bradley-Terry es un modelo de probabilidad para el resultado de comparaciones por pares entre elementos, equipos u objetos. Dado un par de elementos i y j extraídos de alguna población , estima la probabilidad de que la comparación por pares i > j resulte verdadera, como
donde p i es una puntuación positiva de valor real asignada al individuo i . La comparación i > j se puede leer como " i es preferible a j ", " i ocupa un lugar más alto que j " o " i vence a j ", dependiendo de la aplicación.
Por ejemplo, p i podría representar la habilidad de un equipo en un torneo deportivo y la probabilidad de que i gane un juego contra j . [1] [2] O p i podría representar la calidad o conveniencia de un producto comercial y la probabilidad de que un consumidor prefiera el producto i al producto j .
El modelo Bradley-Terry se puede utilizar en dirección directa para predecir resultados, como se describe, pero se utiliza más comúnmente a la inversa para inferir las puntuaciones p i dado un conjunto de resultados observados. [2] En este tipo de aplicación, p i representa alguna medida de la fuerza o calidad de y el modelo nos permite estimar las fortalezas a partir de una serie de comparaciones por pares. En una encuesta sobre preferencias de vinos, por ejemplo, puede resultar difícil para los encuestados dar una clasificación completa de un gran conjunto de vinos, pero les resulta relativamente fácil comparar pares de vinos de muestra y decir cuál creen que es mejor. A partir de un conjunto de comparaciones por pares, el modelo Bradley-Terry puede utilizarse para obtener una clasificación completa de los vinos.
Una vez calculados los valores de las puntuaciones p i , el modelo también se puede utilizar en la dirección de avance, por ejemplo para predecir el resultado probable de comparaciones que aún no se han producido. En el ejemplo de la encuesta sobre vinos, por ejemplo, se podría calcular la probabilidad de que alguien prefiera el vino al vino , incluso si nadie en la encuesta comparó directamente ese par en particular.
El modelo lleva el nombre de Ralph A. Bradley y Milton E. Terry, [3] quienes lo presentaron en 1952, [4] aunque ya había sido estudiado por Ernst Zermelo en los años 1920. [1] [5] [6] Las aplicaciones del modelo incluyen la clasificación de competidores en deportes, ajedrez y otras competiciones, [7] la clasificación de productos en encuestas comparativas pareadas de elección del consumidor , análisis de jerarquías de dominancia dentro de animales y humanos. comunidades, [8] ranking de revistas , ranking de modelos de IA, [9] y estimación de la relevancia de documentos en motores de búsqueda de aprendizaje automático . [10]
El modelo Bradley-Terry se puede parametrizar de varias maneras. La ecuación ( 1 ) es quizás la más común, pero hay muchas otras. Los propios Bradley y Terry definieron funciones de puntuación exponenciales , de modo que [2]
Alternativamente, se puede utilizar un logit , tal que [1]
es decir, para
Esta formulación resalta la similitud entre el modelo Bradley-Terry y la regresión logística . Ambos emplean esencialmente el mismo modelo pero de diferentes maneras. En la regresión logística, normalmente se conocen los parámetros y se intenta inferir la forma funcional de ; Al clasificar según el modelo de Bradley-Terry, se conoce la forma funcional e intenta inferir los parámetros.
Con un factor de escala de 400, esto equivale al sistema de calificación Elo para jugadores con calificaciones Elo R i y R j .
La aplicación más común del modelo Bradley-Terry es inferir los valores de los parámetros dado un conjunto observado de resultados , como victorias y derrotas en una competencia. La forma más sencilla de estimar los parámetros es mediante estimación de máxima verosimilitud , es decir, maximizando la probabilidad de los resultados observados dados los valores del modelo y de los parámetros.
Supongamos que conocemos los resultados de un conjunto de competiciones por parejas entre un determinado grupo de individuos, y sea w ij el número de veces que el individuo i vence al individuo j . Entonces la probabilidad de este conjunto de resultados dentro del modelo Bradley-Terry es y la probabilidad logarítmica del vector de parámetros p = [ p 1 , ..., p n ] es [1]
Zermelo [5] demostró que esta expresión tiene un solo máximo, que se puede encontrar derivando con respecto a y estableciendo el resultado en cero, lo que conduce a
Esta ecuación no tiene una solución de forma cerrada conocida, pero Zermelo sugirió resolverla mediante una simple iteración. A partir de cualquier conjunto conveniente de valores iniciales (positivos) para , se realiza la actualización de forma iterativa
para todos yo a mi vez. Los parámetros resultantes son arbitrarios hasta una constante multiplicativa general, por lo que después de calcular todos los nuevos valores deben normalizarse dividiéndolos por su media geométrica de la siguiente manera:
Este procedimiento de estimación mejora la probabilidad logarítmica en cada iteración y garantiza que eventualmente alcanzará el máximo único. [5] [11] Sin embargo, su convergencia es lenta. [1] [12] Más recientemente se ha señalado [13] que la ecuación ( 2 ) también se puede reorganizar como
que se puede resolver iterando
normalizándose nuevamente después de cada ronda de actualizaciones usando la ecuación ( 4 ). Esta iteración da resultados idénticos a la de ( 3 ) pero converge mucho más rápido y, por lo tanto, normalmente se prefiere a ( 3 ). [13]
Consideremos una competición deportiva entre cuatro equipos, que juegan un total de 22 partidos entre ellos. Las victorias de cada equipo se muestran en las filas de la siguiente tabla y los oponentes se muestran en las columnas:
Por ejemplo, el equipo A venció al equipo B dos veces y perdió ante el equipo B tres veces; no jugó contra el equipo C en absoluto; ganó una vez y perdió cuatro veces contra el equipo D.
Nos gustaría estimar las fortalezas relativas de los equipos, lo cual hacemos calculando los parámetros , donde los parámetros más altos indican una mayor destreza. Para ello, inicializamos las cuatro entradas en el vector de parámetros p de forma arbitraria, por ejemplo asignando el valor 1 a cada equipo: [1, 1, 1, 1] . Luego aplicamos la ecuación ( 5 ) para actualizar , lo que da
Ahora, aplicamos ( 5 ) nuevamente para actualizar , asegurándonos de usar el nuevo valor de que acabamos de calcular:
De manera similar para y obtenemos
Luego normalizamos todos los parámetros dividiéndolos por su media geométrica para obtener los parámetros estimados p = [0,516, 1,413, 0,672, 2,041] .
Para mejorar aún más las estimaciones, repetimos el proceso utilizando los nuevos valores de p . Por ejemplo,
Repitiendo este proceso para los parámetros restantes y normalizando, obtenemos p = [0,677, 1,034, 0,624, 2,287] . Repetir 10 veces más produce una rápida convergencia hacia una solución final de p = [0,640, 1,043, 0,660, 2,270] . Esto indica que el equipo D es el más fuerte y el equipo B el segundo más fuerte, mientras que los equipos A y C son casi iguales en fuerza pero por debajo de los equipos B y D. De esta manera, el modelo Bradley-Terry nos permite inferir la relación entre los cuatro equipos. aunque no todos los equipos se han enfrentado entre sí.