Sistema de clasificación de deportes

Un sistema de clasificación deportiva es un sistema que analiza los resultados de las competiciones deportivas para proporcionar clasificaciones para cada equipo o jugador. Los sistemas comunes incluyen encuestas de votantes expertos, crowdsourcing de votantes no expertos, mercados de apuestas y sistemas informáticos. Las clasificaciones, o clasificaciones de poder , son representaciones numéricas de la fuerza competitiva, a menudo directamente comparables para que se pueda predecir el resultado del juego entre dos equipos. Las clasificaciones , o clasificaciones de poder , se pueden proporcionar directamente (por ejemplo, pidiendo a las personas que clasifiquen a los equipos), o se pueden derivar ordenando las clasificaciones de cada equipo y asignando un rango ordinal a cada equipo, de modo que el equipo mejor clasificado obtenga el puesto número 1. Los sistemas de clasificación proporcionan una alternativa a las clasificaciones deportivas tradicionales que se basan en las proporciones de victorias, derrotas y empates.

En los Estados Unidos, el mayor uso de los sistemas de clasificación deportiva es para calificar a los equipos de fútbol americano universitario de la NCAA en la División I FBS , eligiendo a los equipos que jugarán en el College Football Playoff . Los sistemas de clasificación deportiva también se utilizan para ayudar a determinar el campo para los torneos de baloncesto masculino y femenino de la NCAA, los torneos de golf profesional masculino , los torneos de tenis profesional y la NASCAR . A menudo se mencionan en las discusiones sobre los equipos que podrían o deberían recibir invitaciones para participar en ciertos concursos, a pesar de no obtener la vía de entrada más directa (como un campeonato de liga). ^[1]

Los sistemas de clasificación por computadora pueden tender a la objetividad , sin sesgo específico por jugador, equipo, región o estilo. Ken Massey escribe que una ventaja de los sistemas de clasificación por computadora es que pueden "rastrear objetivamente a todos" los 351 equipos de baloncesto universitario, mientras que las encuestas humanas "tienen un valor limitado". ^[2] Las clasificaciones por computadora son verificables y repetibles, y son integrales, lo que requiere la evaluación de todos los criterios seleccionados. En comparación, los sistemas de clasificación que dependen de encuestas humanas incluyen subjetividad humana inherente; esto puede o no ser una propiedad atractiva según las necesidades del sistema.

Historia

Los sistemas de clasificación deportiva existen desde hace casi 80 años, cuando las clasificaciones se calculaban en papel en lugar de por computadora, como la mayoría de las veces en la actualidad. Algunos sistemas informáticos más antiguos que todavía se utilizan en la actualidad incluyen: los sistemas de Jeff Sagarin , el sistema del New York Times y el índice Dunkel , que data de 1929. Antes de la llegada de los playoffs de fútbol americano universitario, los participantes del juego de campeonato de la Bowl Championship Series se determinaban mediante una combinación de encuestas de expertos y sistemas informáticos.

Teoría

Los sistemas de clasificación deportiva utilizan una variedad de métodos para clasificar a los equipos, pero el método más común se denomina clasificación de potencia. La clasificación de potencia de un equipo es un cálculo de la fuerza del equipo en relación con otros equipos de la misma liga o división. La idea básica es maximizar la cantidad de relaciones transitivas en un conjunto de datos dado debido a los resultados de los juegos. Por ejemplo, si A derrota a B y B derrota a C, entonces se puede decir con seguridad que A>B>C.

Existen problemas obvios al basar un sistema únicamente en victorias y derrotas. Por ejemplo, si C derrota a A, entonces se establece una relación intransitiva (A > B > C > A) y se producirá una violación de la clasificación si estos son los únicos datos disponibles. Escenarios como este ocurren con bastante regularidad en los deportes; por ejemplo, en la temporada de fútbol de la División IA de la NCAA de 2005 , Penn State venció a Ohio State , Ohio State venció a Michigan y Michigan venció a Penn State. Para abordar estas fallas lógicas, los sistemas de clasificación generalmente consideran otros criterios, como el puntaje del juego y dónde se llevó a cabo el partido (por ejemplo, para evaluar la ventaja de jugar en casa ). Sin embargo, en la mayoría de los casos, cada equipo juega una cantidad suficiente de otros juegos durante una temporada determinada, lo que reduce el efecto general de tales violaciones.

Desde una perspectiva académica , el uso del álgebra lineal y la estadística es popular entre muchos de los autores de sistemas para determinar sus clasificaciones. Algunos trabajos académicos se publican en foros como la MIT Sloan Sports Analytics Conference , otros en revistas tradicionales de estadística, matemáticas, psicología y ciencias de la computación.

Si no se logra un juego de liga "interdivisional" suficiente, los equipos en una división aislada pueden ser apuntalados artificialmente hacia arriba o hacia abajo en las clasificaciones generales debido a una falta de correlación con otros equipos en la liga general. Este fenómeno es evidente en los sistemas que analizan temporadas históricas de fútbol universitario, como cuando algunos sistemas de clasificación calcularon que los mejores equipos de la Ivy League de la década de 1970, como Dartmouth , eran comparables con los equipos poderosos de esa época, como Nebraska , USC y Ohio State . Esto entra en conflicto con la opinión subjetiva que afirma que, si bien eran buenos por derecho propio, no eran tan buenos como esos programas superiores. Sin embargo, esto puede considerarse una "ventaja" para los equipos que no pertenecen a la BCS en el fútbol universitario de la División IA, quienes señalan que los sistemas de clasificación han demostrado que sus mejores equipos pertenecen al mismo estrato que los equipos de la BCS. Esto se evidencia por el equipo de Utah de 2004 que estuvo invicto en la temporada regular y ganó una oferta para un tazón de la BCS debido al aumento en sus clasificaciones generales de la BCS a través del componente de clasificaciones de computadora. Luego jugaron y derrotaron al campeón de la Conferencia Big East, Pittsburgh, en el Fiesta Bowl de 2005 por un marcador de 35-7. Un ejemplo relacionado ocurrió durante el torneo de baloncesto masculino de la NCAA de 2006 , donde George Mason recibió una invitación general para el torneo debido a su récord de la temporada regular y su calificación RPI y aprovechó esa oportunidad hasta llegar a la Final Four .

Los objetivos de algunos sistemas de clasificación difieren entre sí. Por ejemplo, algunos sistemas pueden estar diseñados para proporcionar un análisis retrospectivo perfecto de los partidos jugados hasta la fecha, mientras que otros son predictivos y dan más peso a las tendencias futuras que a los resultados pasados. Esto da lugar a la posibilidad de que personas no familiarizadas con estos objetivos interpreten mal los resultados del sistema de clasificación; por ejemplo, un sistema de clasificación diseñado para proporcionar predicciones precisas de la diferencia de puntos para los apostadores puede no ser adecuado para su uso en la selección de los equipos más merecedores de jugar en un partido de campeonato o torneo.

Consideraciones de calificación

Ventaja de jugar en casa

Cuando dos equipos de igual calidad juegan, el equipo que juega en casa tiende a ganar con más frecuencia. La magnitud del efecto varía en función de la época del juego, el tipo de juego, la duración de la temporada, el deporte, incluso el número de zonas horarias cruzadas . Pero en todas las condiciones, "simplemente jugar en casa aumenta las posibilidades de ganar". ^[3] Por lo tanto, una victoria fuera de casa se considera más favorable que una victoria en casa, porque fue más desafiante. La ventaja de jugar en casa (que, para los deportes que se juegan en una cancha, casi siempre se llama "ventaja de jugar en casa") también se basa en las cualidades del estadio y la multitud individuales; la ventaja en la NFL puede ser más de una diferencia de 4 puntos entre el estadio con la menor ventaja y el estadio con la mayor. ^[4]

Fuerza del cronograma

La fuerza del calendario se refiere a la calidad de los oponentes de un equipo. Una victoria contra un oponente inferior suele verse con menos buenos ojos que una victoria contra un oponente superior. A menudo, los equipos de la misma liga, que se comparan entre sí para el campeonato o los playoffs, no han jugado contra los mismos oponentes. Por lo tanto, juzgar sus registros relativos de victorias y derrotas es complicado.

Miramos más allá del historial. El comité le dio un valor significativo a la calidad de las victorias de Oregon.
— Jeff Long , presidente del comité de playoffs de fútbol universitario , conferencia de prensa, semana 12 de la temporada 2014, ^[5] después de clasificar a Oregon con 9-1 por encima de Florida State con 9-0

El comité de playoffs de fútbol universitario utiliza un algoritmo de calendario de fuerza limitado que solo considera los récords de los oponentes y los récords de los oponentes de los oponentes ^[6] (muy parecido al RPI ).

Puntos versus victorias

Una dicotomía clave entre los sistemas de clasificación deportiva radica en la representación de los resultados de los partidos. Algunos sistemas almacenan los puntajes finales como eventos discretos ternarios : victorias, empates y derrotas. Otros sistemas registran el puntaje final exacto del partido y luego juzgan a los equipos según el margen de victoria. La clasificación de los equipos según el margen de victoria suele ser criticada por crear un incentivo para que los entrenadores aumenten el puntaje, lo que resulta "antideportivo". ^[7]

Otros sistemas optan por un término medio, reduciendo el valor marginal de los puntos adicionales a medida que aumenta el margen de victoria. Sagarin optó por limitar el margen de victoria a una cantidad predeterminada. ^[8] Otros enfoques incluyen el uso de una función de decaimiento, como un logaritmo o la colocación en una función de distribución acumulativa .

Información del juego

Además de los puntos o las victorias, algunos diseñadores de sistemas optan por incluir información más granular sobre el juego. Algunos ejemplos incluyen el tiempo de posesión del balón, las estadísticas individuales y los cambios de liderazgo. Los datos sobre el clima, las lesiones o los partidos "desperdiciados" cerca del final de la temporada pueden afectar los resultados de los partidos, pero son difíciles de modelar. Los "partidos descartados" son partidos en los que los equipos ya se han ganado un lugar en los playoffs y han asegurado su clasificación para los playoffs antes del final de la temporada regular, y quieren dar descanso o proteger a sus jugadores titulares dejándolos en la banca para los partidos restantes de la temporada regular. Esto suele dar lugar a resultados impredecibles y puede sesgar el resultado de los sistemas de calificación.

Composición del equipo

Los equipos suelen cambiar su composición entre partidos y dentro de ellos, y los jugadores se lesionan con frecuencia. La clasificación de un equipo suele consistir en clasificar a un conjunto específico de jugadores. Algunos sistemas suponen la paridad entre todos los miembros de la liga, como que cada equipo se construya a partir de un grupo equitativo de jugadores a través de un sistema de draft o agencia libre , como se hace en muchos deportes de las grandes ligas, como la NFL , la MLB , la NBA y la NHL . Este no es ciertamente el caso de las ligas universitarias, como el fútbol americano de la División IA o el baloncesto masculino y femenino.

Arranque en frío

Al comienzo de una temporada, no ha habido partidos para juzgar la calidad relativa de los equipos. Las soluciones al problema del inicio en frío a menudo incluyen alguna medición de la temporada anterior, tal vez ponderada por el porcentaje del equipo que regresa para la nueva temporada. ARGH Power Ratings es un ejemplo de un sistema que utiliza múltiples años anteriores más un peso porcentual de los jugadores que regresan.

Métodos de calificación

Permutación de clasificaciones

Varios métodos ofrecen alguna permutación de las clasificaciones tradicionales. Esta búsqueda del récord de victorias y derrotas "real" a menudo implica el uso de otros datos, como la diferencia de puntos o la identidad de los oponentes, para alterar el récord de un equipo de una manera que sea fácilmente comprensible. El periodista deportivo Gregg Easterbrook creó una medida de Partidos Auténticos, que solo tiene en cuenta los partidos jugados contra oponentes que se consideran de suficiente calidad. ^[9] El consenso es que no todas las victorias son iguales.

Revisé las primeras semanas de juego y volví a hacer los registros de todos, etiquetando cada juego como una victoria o una derrota legítima, una victoria o una derrota contundente o un juego de una cosa o la otra. Y si ocurría algo más en ese juego que tuviera repercusiones en las apuestas (una victoria con remontada, una ventaja desperdiciada, una disfunción importante, lo que fuera), también lo etiquetaba.
— Bill Simmons , periodista deportivo de Grantland ^[10]

pitagórico

La expectativa pitagórica, o proyección pitagórica, calcula un porcentaje basado en la cantidad de puntos que un equipo ha anotado y permitido. Normalmente, la fórmula implica la cantidad de puntos anotados, elevado a un exponente, colocado en el numerador. Luego, la cantidad de puntos que el equipo permitió, elevado al mismo exponente, se coloca en el denominador y se suma al valor en el numerador. Football Outsiders ha utilizado ^[11]

{\text{Pythagorean wins}}={\frac {{\text{Points For}}^{2.37}}{{\text{Points For}}^{2.37}+{\text{Points Against}}^{2.37}}}\times {\text{Games Played}}.

El porcentaje resultante se compara a menudo con el porcentaje de victorias real de un equipo, y se dice que un equipo ha "superado" o "no ha logrado" lo esperado en comparación con la expectativa pitagórica. Por ejemplo, Bill Barnwell calculó que antes de la semana 9 de la temporada 2014 de la NFL, los Arizona Cardinals tenían un récord pitagórico dos victorias más bajo que su récord real. ^[12] Bill Simmons cita el trabajo de Barnwell antes de la semana 10 de esa temporada y agrega que "cualquier nerd de los números está agitando una bandera de "¡REGRESIÓN!!!!" en este momento". ^[13] En este ejemplo, el récord de la temporada regular de los Arizona Cardinals era de 8-1 al entrar en la décima semana de la temporada 2014. La fórmula de victoria pitagórica implicaba un porcentaje de victorias del 57,5%, basado en 208 puntos anotados y 183 puntos permitidos. Multiplicado por 9 partidos jugados, la expectativa pitagórica de los Cardinals era de 5,2 victorias y 3,8 derrotas. El equipo había "superado" las expectativas en ese momento por 2,8 victorias, derivadas de sus 8 victorias reales menos las 5,2 victorias esperadas, un aumento de 0,8 victorias superadas con respecto a solo una semana antes.

Intercambio de "puntos de habilidad"

El sistema de clasificación Elo , diseñado originalmente por Arpad Elo como método para clasificar a los jugadores de ajedrez, ha sido adaptado por varias personas para deportes de equipo como el baloncesto, el fútbol y el fútbol americano. Por ejemplo, Jeff Sagarin y FiveThirtyEight publican clasificaciones de fútbol americano de la NFL utilizando métodos Elo. ^[14] Las clasificaciones Elo inicialmente asignan valores de fuerza a cada equipo, y los equipos intercambian puntos en función del resultado de cada juego.

Resolver ecuaciones

Investigadores como Matt Mills utilizan cadenas de Markov para modelar partidos de fútbol universitario, con puntuaciones de fuerza del equipo como resultados. ^{[15] Algoritmos como}el PageRank de Google también se han adaptado para clasificar a los equipos de fútbol. ^[16]^[17]

Lista de sistemas de clasificación de deportes

Estadísticas avanzadas de la NFL , Liga Nacional de Fútbol de los Estados Unidos de América
Clasificaciones de potencia ARGH
Ranking ATP , tenis internacional
Matriz de Colley
Sistema Dickinson , fútbol universitario de Estados Unidos de América
Calificaciones de baloncesto de Pomeroy College , baloncesto universitario de Estados Unidos de América
Índice de porcentaje de calificaciones (RPI) , Estados Unidos de América , baloncesto , béisbol , softbol , hockey , fútbol , lacrosse y voleibol de la NCAA
Índice cualitativo de Smithman , fútbol de Estados Unidos de América - obsoleto
TrueSkill , un sistema de clasificación bayesiano inspirado en el sistema de clasificación Glicko ^[18]

Sistemas de clasificación por computadora de la Bowl Championship Series

En el fútbol americano universitario, se utilizaron los siguientes sistemas populares para elegir los equipos que jugarían en el campeonato nacional.

Anderson y Hester / Seattle Times
Richard Billingsley
Wes Colley / Revista de la Constitución de Atlanta
Richard Dunkel
Kenneth Massey
Herman Matthews / Scripps Howard
El New York Times
David Rothman
Jeff Sagarin / EE.UU. Hoy
Pedro Wolfe

Lectura adicional

Bibliografías

Wilson, David. "Bibliografía sobre sistemas de clasificación del fútbol universitario". Universidad de Wisconsin-Madison . Consultado el 18 de noviembre de 2014 .

Prensa popular

Feng, Ed (24 de noviembre de 2014). "Cómo entender las estadísticas del fútbol universitario: la guía definitiva". The Power Rank .
Mather, Victor (23 de octubre de 2012). "Docenas de jugadores de fútbol universitario hacen la pregunta número uno". New York Times .
Wayne Winston es profesor de ciencias de la decisión en la Universidad de Indiana y fue compañero de clase de Jeff Sagarin en el MIT. ^[19] Publicó varias ediciones de un texto sobre el software de hojas de cálculo Microsoft Excel que incluye material sobre la clasificación de equipos deportivos, así como un libro centrado directamente en este tema. Él y Sagarin crearon sistemas de clasificación juntos. ^[20]
- Winston, Wayne L. (2012). Mathletics: cómo los jugadores, los directivos y los entusiastas del deporte utilizan las matemáticas en el béisbol, el baloncesto y el fútbol americano. Princeton University Press. ISBN 978-1-4008-4207-0.
- Winston, Wayne L. (2009). Análisis de datos y modelado empresarial en Microsoft® Excel. Microsoft Press. ISBN 978-0-7356-3714-6.

Trabajo académico

Barrow, Daniel; Drayer, Ian; Elliott, Peter; Gaut, Garren; Osting, Braxton (mayo de 2013). "Ranking rankings: una comparación empírica del poder predictivo de los métodos de ranking deportivo". Journal of Quantitative Analysis in Sports . 9 (2). doi :10.1515/jqas-2013-0013. ISSN 1559-0410. S2CID 199665454.
- Gran parte de esta información está disponible en Sports Rankings REU Final Report 2012: An Analysis of Pairwise-Comparison Based Sports Ranking Methods and a Novel Agent-Based Markovian Basketball Simulation en Internet Archive PDF
Gray, Kathy L.; Schwertman, Neil C. (marzo de 2012). "Comparación de la selección de equipos y la clasificación para el torneo de baloncesto masculino de la NCAA de 2011". Revista de análisis cuantitativo en deportes . 8 (1). doi :10.1515/1559-0410.1369. ISSN 1559-0410. S2CID 121322446.
Massey, Ken (primavera de 1997). "Proyecto de honores en matemáticas" (PDF) .Disponible en Modelos estadísticos aplicados a la calificación de equipos deportivos en Internet Archive PDF
Mease, David (2003). "Un enfoque de máxima verosimilitud penalizado para la clasificación de equipos de fútbol universitario independientemente de los márgenes de victoria" (PDF) . The American Statistician . 57 (4): 241–248. doi :10.1198/0003130032396. S2CID 2372150.

Referencias

^ Fagan, Ryan (9 de marzo de 2011). "Clasificación de equipos en una gran burbuja". Sporting News . Consultado el 24 de marzo de 2011. Este es un vistazo a 20 de los equipos (en orden alfabético) que se encuentran en la gran burbuja de este año. Hemos incluido tres clasificaciones estadísticas. El RPI (índice de porcentaje de calificaciones, tomado de collegeRPI.com) se considera el estándar y se proporciona a los miembros del comité durante el proceso de selección. Los otros dos índices de clasificación incluyen el margen de victoria en sus fórmulas: las calificaciones de Pomeroy (en kenpom.com) y las calificaciones de Sagarin (a través de USA Today), no son nuevas, pero han jugado un papel cada vez mayor en las discusiones sobre los posibles preclasificados durante esta temporada de baloncesto universitario.
^ Ken Massey [@masseyratings] (3 de noviembre de 2014). "@kenpomeroy las encuestas humanas tienen un valor limitado. Los sistemas informáticos pueden hacer un seguimiento objetivo de todos los equipos. http://www.masseyratings.com/cb/compare.htm #all351" ( Tweet ) . Consultado el 9 de noviembre de 2014 – vía Twitter .
^ Jamieson, Jeremy P. (2010). "The Home Field Advantage in Athletics: A Meta-Analysis" (PDF) . Journal of Applied Social Psychology . 40 (7): 1819–1848. doi :10.1111/j.1559-1816.2010.00641.x . Consultado el 11 de noviembre de 2014 .
^ Barnwell, Bill (20 de diciembre de 2013). "Safe at Home". Grantland . Consultado el 11 de noviembre de 2014 .
^ Russo, Ralph D. (11 de noviembre de 2014). "Oregon sube al segundo puesto en la clasificación de playoffs; TCU al cuarto puesto". Associated Press . Consultado el 12 de noviembre de 2014 .
^ Stewart Mandel [@slmandel] (12 de noviembre de 2014). "El comité no utiliza una clasificación SOS. Observa el historial de los oponentes y el historial de los oponentes de los oponentes" ( Tweet ) . Consultado el 12 de noviembre de 2014 – vía Twitter .
^ Richards, Darryl (2001). «BCS elimina el elemento de margen de victoria». Fox Sports . Consultado el 12 de noviembre de 2014 .
^ Sagarin, Jeff (otoño de 2014). "Clasificaciones de Jeff Sagarin de la NCAAAF". EE.UU. hoy . Consultado el 12 de noviembre de 2014 .
^ Easterbrook, Gregg (18 de noviembre de 2014). "Más banderas en los marcadores de D spins". ESPN . Consultado el 19 de noviembre de 2014 .
^ Simmons, Bill (24 de octubre de 2014). "Selección de la semana 8: una epifanía sobre el juego". Grantland . Consultado el 19 de noviembre de 2014 .
^ Schatz, Aaron; Alamar, Ben; Barnwell, Bill; Bill Connelly; Doug Farrar (2011). Football Outsiders Almanac 2011: La guía esencial para las temporadas 2011 de la NFL y el fútbol universitario. CreateSpace. p. xviii. ISBN 978-1-4662-4613-3.
^ Barnwell, Bill (5 de noviembre de 2014). "NFL at the Half: Breaking Down the Numbers" (La NFL en la primera mitad: análisis de los números). Grantland . Consultado el 7 de enero de 2015 .
^ Simmons, Bill (7 de noviembre de 2014). "Revisiting the Y2K-Compliant Quarterbacks" (Revisitando a los mariscales de campo que cumplen con el Y2K) . Consultado el 10 de noviembre de 2014 .
^ Silver, Nate (4 de septiembre de 2014). "Introducing NFL Elo Ratings". FiveThirtyEight . Consultado el 10 de noviembre de 2014 .
^ Mills, Matt (21 de diciembre de 2014). "Uso de cadenas de Markov de tiempo continuo para clasificar equipos de fútbol universitario". The Spread . Consultado el 21 de diciembre de 2014 .
^ "Ranking NFL computers using Network Science" (Clasificación de equipos de la NFL utilizando la ciencia de redes). LinkedIN . 17 de marzo de 2016 . Consultado el 17 de marzo de 2016 .
^ "Modificación del algoritmo de clasificación de páginas de Google para clasificar a los equipos". Reddit . 21 de diciembre de 2014 . Consultado el 22 de diciembre de 2014 .
^ Weng, Ruby C.; Lin, Chih-Jen (2011). "Un método de aproximación bayesiana para la clasificación en línea" (PDF) . Revista de investigación en aprendizaje automático . 12 : 267–300.
^ "Wayne Winston: Analítica en el mundo del deporte". Universidad de Indiana Bloomington - Escuela de Negocios Kelley - Tecnologías de operaciones y decisiones . 25 de noviembre de 2013. Consultado el 8 de noviembre de 2014 .
^ "Juego de números". Washington Times . 13 de abril de 2004 . Consultado el 8 de noviembre de 2014 .