Un sistema de clasificación deportiva es un sistema que analiza los resultados de las competiciones deportivas para proporcionar clasificaciones para cada equipo o jugador. Los sistemas comunes incluyen encuestas de votantes expertos, crowdsourcing de votantes no expertos, mercados de apuestas y sistemas informáticos. Las clasificaciones, o clasificaciones de poder , son representaciones numéricas de la fuerza competitiva, a menudo directamente comparables para que se pueda predecir el resultado del juego entre dos equipos. Las clasificaciones , o clasificaciones de poder , se pueden proporcionar directamente (por ejemplo, pidiendo a las personas que clasifiquen a los equipos), o se pueden derivar ordenando las clasificaciones de cada equipo y asignando un rango ordinal a cada equipo, de modo que el equipo mejor clasificado obtenga el puesto número 1. Los sistemas de clasificación proporcionan una alternativa a las clasificaciones deportivas tradicionales que se basan en las proporciones de victorias, derrotas y empates.
En los Estados Unidos, el mayor uso de los sistemas de clasificación deportiva es para calificar a los equipos de fútbol americano universitario de la NCAA en la División I FBS , eligiendo a los equipos que jugarán en el College Football Playoff . Los sistemas de clasificación deportiva también se utilizan para ayudar a determinar el campo para los torneos de baloncesto masculino y femenino de la NCAA, los torneos de golf profesional masculino , los torneos de tenis profesional y la NASCAR . A menudo se mencionan en las discusiones sobre los equipos que podrían o deberían recibir invitaciones para participar en ciertos concursos, a pesar de no obtener la vía de entrada más directa (como un campeonato de liga). [1]
Los sistemas de clasificación por computadora pueden tender a la objetividad , sin sesgo específico por jugador, equipo, región o estilo. Ken Massey escribe que una ventaja de los sistemas de clasificación por computadora es que pueden "rastrear objetivamente a todos" los 351 equipos de baloncesto universitario, mientras que las encuestas humanas "tienen un valor limitado". [2] Las clasificaciones por computadora son verificables y repetibles, y son integrales, lo que requiere la evaluación de todos los criterios seleccionados. En comparación, los sistemas de clasificación que dependen de encuestas humanas incluyen subjetividad humana inherente; esto puede o no ser una propiedad atractiva según las necesidades del sistema.
Los sistemas de clasificación deportiva existen desde hace casi 80 años, cuando las clasificaciones se calculaban en papel en lugar de por computadora, como la mayoría de las veces en la actualidad. Algunos sistemas informáticos más antiguos que todavía se utilizan en la actualidad incluyen: los sistemas de Jeff Sagarin , el sistema del New York Times y el índice Dunkel , que data de 1929. Antes de la llegada de los playoffs de fútbol americano universitario, los participantes del juego de campeonato de la Bowl Championship Series se determinaban mediante una combinación de encuestas de expertos y sistemas informáticos.
Los sistemas de clasificación deportiva utilizan una variedad de métodos para clasificar a los equipos, pero el método más común se denomina clasificación de potencia. La clasificación de potencia de un equipo es un cálculo de la fuerza del equipo en relación con otros equipos de la misma liga o división. La idea básica es maximizar la cantidad de relaciones transitivas en un conjunto de datos dado debido a los resultados de los juegos. Por ejemplo, si A derrota a B y B derrota a C, entonces se puede decir con seguridad que A>B>C.
Existen problemas obvios al basar un sistema únicamente en victorias y derrotas. Por ejemplo, si C derrota a A, entonces se establece una relación intransitiva (A > B > C > A) y se producirá una violación de la clasificación si estos son los únicos datos disponibles. Escenarios como este ocurren con bastante regularidad en los deportes; por ejemplo, en la temporada de fútbol de la División IA de la NCAA de 2005 , Penn State venció a Ohio State , Ohio State venció a Michigan y Michigan venció a Penn State. Para abordar estas fallas lógicas, los sistemas de clasificación generalmente consideran otros criterios, como el puntaje del juego y dónde se llevó a cabo el partido (por ejemplo, para evaluar la ventaja de jugar en casa ). Sin embargo, en la mayoría de los casos, cada equipo juega una cantidad suficiente de otros juegos durante una temporada determinada, lo que reduce el efecto general de tales violaciones.
Desde una perspectiva académica , el uso del álgebra lineal y la estadística es popular entre muchos de los autores de sistemas para determinar sus clasificaciones. Algunos trabajos académicos se publican en foros como la MIT Sloan Sports Analytics Conference , otros en revistas tradicionales de estadística, matemáticas, psicología y ciencias de la computación.
Si no se logra un juego de liga "interdivisional" suficiente, los equipos en una división aislada pueden ser apuntalados artificialmente hacia arriba o hacia abajo en las clasificaciones generales debido a una falta de correlación con otros equipos en la liga general. Este fenómeno es evidente en los sistemas que analizan temporadas históricas de fútbol universitario, como cuando algunos sistemas de clasificación calcularon que los mejores equipos de la Ivy League de la década de 1970, como Dartmouth , eran comparables con los equipos poderosos de esa época, como Nebraska , USC y Ohio State . Esto entra en conflicto con la opinión subjetiva que afirma que, si bien eran buenos por derecho propio, no eran tan buenos como esos programas superiores. Sin embargo, esto puede considerarse una "ventaja" para los equipos que no pertenecen a la BCS en el fútbol universitario de la División IA, quienes señalan que los sistemas de clasificación han demostrado que sus mejores equipos pertenecen al mismo estrato que los equipos de la BCS. Esto se evidencia por el equipo de Utah de 2004 que estuvo invicto en la temporada regular y ganó una oferta para un tazón de la BCS debido al aumento en sus clasificaciones generales de la BCS a través del componente de clasificaciones de computadora. Luego jugaron y derrotaron al campeón de la Conferencia Big East, Pittsburgh, en el Fiesta Bowl de 2005 por un marcador de 35-7. Un ejemplo relacionado ocurrió durante el torneo de baloncesto masculino de la NCAA de 2006 , donde George Mason recibió una invitación general para el torneo debido a su récord de la temporada regular y su calificación RPI y aprovechó esa oportunidad hasta llegar a la Final Four .
Los objetivos de algunos sistemas de clasificación difieren entre sí. Por ejemplo, algunos sistemas pueden estar diseñados para proporcionar un análisis retrospectivo perfecto de los partidos jugados hasta la fecha, mientras que otros son predictivos y dan más peso a las tendencias futuras que a los resultados pasados. Esto da lugar a la posibilidad de que personas no familiarizadas con estos objetivos interpreten mal los resultados del sistema de clasificación; por ejemplo, un sistema de clasificación diseñado para proporcionar predicciones precisas de la diferencia de puntos para los apostadores puede no ser adecuado para su uso en la selección de los equipos más merecedores de jugar en un partido de campeonato o torneo.
Cuando dos equipos de igual calidad juegan, el equipo que juega en casa tiende a ganar con más frecuencia. La magnitud del efecto varía en función de la época del juego, el tipo de juego, la duración de la temporada, el deporte, incluso el número de zonas horarias cruzadas . Pero en todas las condiciones, "simplemente jugar en casa aumenta las posibilidades de ganar". [3] Por lo tanto, una victoria fuera de casa se considera más favorable que una victoria en casa, porque fue más desafiante. La ventaja de jugar en casa (que, para los deportes que se juegan en una cancha, casi siempre se llama "ventaja de jugar en casa") también se basa en las cualidades del estadio y la multitud individuales; la ventaja en la NFL puede ser más de una diferencia de 4 puntos entre el estadio con la menor ventaja y el estadio con la mayor. [4]
La fuerza del calendario se refiere a la calidad de los oponentes de un equipo. Una victoria contra un oponente inferior suele verse con menos buenos ojos que una victoria contra un oponente superior. A menudo, los equipos de la misma liga, que se comparan entre sí para el campeonato o los playoffs, no han jugado contra los mismos oponentes. Por lo tanto, juzgar sus registros relativos de victorias y derrotas es complicado.
Miramos más allá del historial. El comité le dio un valor significativo a la calidad de las victorias de Oregon.
— Jeff Long , presidente del comité de playoffs de fútbol universitario , conferencia de prensa, semana 12 de la temporada 2014, [5] después de clasificar a Oregon con 9-1 por encima de Florida State con 9-0
El comité de playoffs de fútbol universitario utiliza un algoritmo de calendario de fuerza limitado que solo considera los récords de los oponentes y los récords de los oponentes de los oponentes [6] (muy parecido al RPI ).
Una dicotomía clave entre los sistemas de clasificación deportiva radica en la representación de los resultados de los partidos. Algunos sistemas almacenan los puntajes finales como eventos discretos ternarios : victorias, empates y derrotas. Otros sistemas registran el puntaje final exacto del partido y luego juzgan a los equipos según el margen de victoria. La clasificación de los equipos según el margen de victoria suele ser criticada por crear un incentivo para que los entrenadores aumenten el puntaje, lo que resulta "antideportivo". [7]
Otros sistemas optan por un término medio, reduciendo el valor marginal de los puntos adicionales a medida que aumenta el margen de victoria. Sagarin optó por limitar el margen de victoria a una cantidad predeterminada. [8] Otros enfoques incluyen el uso de una función de decaimiento, como un logaritmo o la colocación en una función de distribución acumulativa .
Además de los puntos o las victorias, algunos diseñadores de sistemas optan por incluir información más granular sobre el juego. Algunos ejemplos incluyen el tiempo de posesión del balón, las estadísticas individuales y los cambios de liderazgo. Los datos sobre el clima, las lesiones o los partidos "desperdiciados" cerca del final de la temporada pueden afectar los resultados de los partidos, pero son difíciles de modelar. Los "partidos descartados" son partidos en los que los equipos ya se han ganado un lugar en los playoffs y han asegurado su clasificación para los playoffs antes del final de la temporada regular, y quieren dar descanso o proteger a sus jugadores titulares dejándolos en la banca para los partidos restantes de la temporada regular. Esto suele dar lugar a resultados impredecibles y puede sesgar el resultado de los sistemas de calificación.
Los equipos suelen cambiar su composición entre partidos y dentro de ellos, y los jugadores se lesionan con frecuencia. La clasificación de un equipo suele consistir en clasificar a un conjunto específico de jugadores. Algunos sistemas suponen la paridad entre todos los miembros de la liga, como que cada equipo se construya a partir de un grupo equitativo de jugadores a través de un sistema de draft o agencia libre , como se hace en muchos deportes de las grandes ligas, como la NFL , la MLB , la NBA y la NHL . Este no es ciertamente el caso de las ligas universitarias, como el fútbol americano de la División IA o el baloncesto masculino y femenino.
Al comienzo de una temporada, no ha habido partidos para juzgar la calidad relativa de los equipos. Las soluciones al problema del inicio en frío a menudo incluyen alguna medición de la temporada anterior, tal vez ponderada por el porcentaje del equipo que regresa para la nueva temporada. ARGH Power Ratings es un ejemplo de un sistema que utiliza múltiples años anteriores más un peso porcentual de los jugadores que regresan.
Varios métodos ofrecen alguna permutación de las clasificaciones tradicionales. Esta búsqueda del récord de victorias y derrotas "real" a menudo implica el uso de otros datos, como la diferencia de puntos o la identidad de los oponentes, para alterar el récord de un equipo de una manera que sea fácilmente comprensible. El periodista deportivo Gregg Easterbrook creó una medida de Partidos Auténticos, que solo tiene en cuenta los partidos jugados contra oponentes que se consideran de suficiente calidad. [9] El consenso es que no todas las victorias son iguales.
Revisé las primeras semanas de juego y volví a hacer los registros de todos, etiquetando cada juego como una victoria o una derrota legítima, una victoria o una derrota contundente o un juego de una cosa o la otra. Y si ocurría algo más en ese juego que tuviera repercusiones en las apuestas (una victoria con remontada, una ventaja desperdiciada, una disfunción importante, lo que fuera), también lo etiquetaba.
— Bill Simmons , periodista deportivo de Grantland [10]
La expectativa pitagórica, o proyección pitagórica, calcula un porcentaje basado en la cantidad de puntos que un equipo ha anotado y permitido. Normalmente, la fórmula implica la cantidad de puntos anotados, elevado a un exponente, colocado en el numerador. Luego, la cantidad de puntos que el equipo permitió, elevado al mismo exponente, se coloca en el denominador y se suma al valor en el numerador. Football Outsiders ha utilizado [11]
El porcentaje resultante se compara a menudo con el porcentaje de victorias real de un equipo, y se dice que un equipo ha "superado" o "no ha logrado" lo esperado en comparación con la expectativa pitagórica. Por ejemplo, Bill Barnwell calculó que antes de la semana 9 de la temporada 2014 de la NFL, los Arizona Cardinals tenían un récord pitagórico dos victorias más bajo que su récord real. [12] Bill Simmons cita el trabajo de Barnwell antes de la semana 10 de esa temporada y agrega que "cualquier nerd de los números está agitando una bandera de "¡REGRESIÓN!!!!" en este momento". [13] En este ejemplo, el récord de la temporada regular de los Arizona Cardinals era de 8-1 al entrar en la décima semana de la temporada 2014. La fórmula de victoria pitagórica implicaba un porcentaje de victorias del 57,5%, basado en 208 puntos anotados y 183 puntos permitidos. Multiplicado por 9 partidos jugados, la expectativa pitagórica de los Cardinals era de 5,2 victorias y 3,8 derrotas. El equipo había "superado" las expectativas en ese momento por 2,8 victorias, derivadas de sus 8 victorias reales menos las 5,2 victorias esperadas, un aumento de 0,8 victorias superadas con respecto a solo una semana antes.
El sistema de clasificación Elo , diseñado originalmente por Arpad Elo como método para clasificar a los jugadores de ajedrez, ha sido adaptado por varias personas para deportes de equipo como el baloncesto, el fútbol y el fútbol americano. Por ejemplo, Jeff Sagarin y FiveThirtyEight publican clasificaciones de fútbol americano de la NFL utilizando métodos Elo. [14] Las clasificaciones Elo inicialmente asignan valores de fuerza a cada equipo, y los equipos intercambian puntos en función del resultado de cada juego.
Investigadores como Matt Mills utilizan cadenas de Markov para modelar partidos de fútbol universitario, con puntuaciones de fuerza del equipo como resultados. [15] Algoritmos como el PageRank de Google también se han adaptado para clasificar a los equipos de fútbol. [16] [17]
En el fútbol americano universitario, se utilizaron los siguientes sistemas populares para elegir los equipos que jugarían en el campeonato nacional.
Este es un vistazo a 20 de los equipos (en orden alfabético) que se encuentran en la gran burbuja de este año. Hemos incluido tres clasificaciones estadísticas. El RPI (índice de porcentaje de calificaciones, tomado de collegeRPI.com) se considera el estándar y se proporciona a los miembros del comité durante el proceso de selección. Los otros dos índices de clasificación incluyen el margen de victoria en sus fórmulas: las calificaciones de Pomeroy (en kenpom.com) y las calificaciones de Sagarin (a través de USA Today), no son nuevas, pero han jugado un papel cada vez mayor en las discusiones sobre los posibles preclasificados durante esta temporada de baloncesto universitario.