Sistema de clasificación deportiva

Un sistema de clasificación deportiva es un sistema que analiza los resultados de las competiciones deportivas para proporcionar clasificaciones para cada equipo o jugador. Los sistemas comunes incluyen encuestas de votantes expertos, crowdsourcing de votantes no expertos, mercados de apuestas y sistemas informáticos. Las clasificaciones, o clasificaciones de poder , son representaciones numéricas de la fuerza competitiva, a menudo directamente comparables, de modo que se puede predecir el resultado del juego entre dos equipos cualesquiera. Las clasificaciones , o clasificaciones de poder , se pueden proporcionar directamente (p. ej., pidiendo a las personas que clasifiquen los equipos) o se pueden derivar clasificando las calificaciones de cada equipo y asignando una clasificación ordinal a cada equipo, de modo que el equipo mejor calificado obtenga el puesto número 1. . Los sistemas de clasificación ofrecen una alternativa a las clasificaciones deportivas tradicionales que se basan en proporciones de victorias, derrotas y empates.

En los Estados Unidos, el mayor uso de los sistemas de clasificación deportiva es calificar a los equipos de fútbol universitario de la NCAA en la División I FBS , eligiendo equipos para jugar en el College Football Playoff . Los sistemas de clasificación deportiva también se utilizan para ayudar a determinar el campo para los torneos de baloncesto masculino y femenino de la NCAA, los torneos de golf profesionales masculinos , los torneos de tenis profesionales y NASCAR . A menudo se mencionan en discusiones sobre los equipos que podrían o deberían recibir invitaciones para participar en ciertos concursos, a pesar de no obtener la vía de entrada más directa (como un campeonato de liga). ^[1]

Los sistemas de clasificación por computadora pueden tender a la objetividad , sin sesgos específicos de jugador, equipo, región o estilo. Ken Massey escribe que una ventaja de los sistemas de clasificación por computadora es que pueden "seguir objetivamente a todos" los 351 equipos de baloncesto universitario, mientras que las encuestas humanas "tienen un valor limitado". ^[2] Las calificaciones informáticas son verificables y repetibles, y son completas y requieren la evaluación de todos los criterios seleccionados. En comparación, los sistemas de calificación que se basan en encuestas humanas incluyen la subjetividad humana inherente; Esta puede ser una propiedad atractiva o no dependiendo de las necesidades del sistema.

Historia

Los sistemas de clasificación deportiva existen desde hace casi 80 años, cuando las clasificaciones se calculaban en papel y no por computadora, como ocurre la mayoría en la actualidad. Algunos sistemas informáticos más antiguos que todavía se utilizan hoy en día incluyen: los sistemas de Jeff Sagarin , el sistema del New York Times y el índice Dunkel , que data de 1929. Antes de la llegada de los playoffs de fútbol americano universitario, los participantes del juego de campeonato de la Bowl Championship Series estaban determinados por una combinación de encuestas de expertos y sistemas informáticos.

Teoría

Los sistemas de clasificación deportiva utilizan una variedad de métodos para clasificar a los equipos, pero el método más frecuente se llama clasificación de potencia. La clasificación de poder de un equipo es un cálculo de la fuerza del equipo en relación con otros equipos en la misma liga o división. La idea básica es maximizar la cantidad de relaciones transitivas en un conjunto de datos determinado debido a los resultados del juego. Por ejemplo, si A vence a B y B vence a C, entonces se puede decir con seguridad que A>B>C.

Hay problemas obvios al basar un sistema únicamente en victorias y derrotas. Por ejemplo, si C derrota a A, entonces se establece una relación intransitiva (A > B > C > A) y se producirá una violación de clasificación si estos son los únicos datos disponibles. Escenarios como este ocurren con bastante regularidad en los deportes; por ejemplo, en la temporada de fútbol americano de la División IA de la NCAA de 2005 , Penn State venció a Ohio State , Ohio State venció a Michigan y Michigan venció a Penn State. Para abordar estos desgloses lógicos, los sistemas de clasificación generalmente consideran otros criterios, como la puntuación del juego y el lugar donde se llevó a cabo el partido (por ejemplo, para evaluar la ventaja de jugar en casa ). Sin embargo, en la mayoría de los casos, cada equipo juega una cantidad suficiente de otros partidos durante una temporada determinada, lo que reduce el efecto general de dichas infracciones.

Desde una perspectiva académica , el uso de álgebra lineal y estadística es popular entre muchos de los autores de sistemas para determinar sus calificaciones. Algunos trabajos académicos se publican en foros como la MIT Sloan Sports Analytics Conference , otros en revistas tradicionales de estadística, matemáticas, psicología e informática.

Si no se logra suficiente juego de liga "interdivisional", los equipos de una división aislada pueden subir o bajar artificialmente en las clasificaciones generales debido a una falta de correlación con otros equipos de la liga general. Este fenómeno es evidente en los sistemas que analizan temporadas históricas de fútbol universitario, como cuando algunos sistemas de clasificación calcularon que los mejores equipos de la Ivy League de la década de 1970, como Dartmouth , eran comparables con equipos poderosos de esa época, como Nebraska , USC , y el estado de Ohio . Esto entra en conflicto con la opinión subjetiva que afirma que, si bien son buenos por derecho propio, no son tan buenos como los mejores programas. Sin embargo, esto puede ser considerado "profesional" por equipos que no pertenecen al BCS en el fútbol universitario de la División IA, quienes señalan que los sistemas de clasificación han demostrado que sus mejores equipos pertenecen al mismo estrato que los equipos del BCS. Esto se evidencia en el equipo de Utah de 2004 que quedó invicto en la temporada regular y obtuvo una oferta de tazón BCS debido al aumento en sus calificaciones generales de BCS a través del componente de calificaciones por computadora. Pasaron a jugar y derrotaron al campeón de la Conferencia Big East, Pittsburgh, en el Fiesta Bowl de 2005 por un marcador de 35-7. Un ejemplo relacionado ocurrió durante el torneo de baloncesto masculino de la NCAA de 2006 , donde a George Mason se le otorgó una oferta para el torneo general debido a su récord de la temporada regular y su índice de RPI y aprovechó esa oportunidad hasta llegar a la Final Four .

Los objetivos de algunos sistemas de calificación difieren entre sí. Por ejemplo, los sistemas pueden diseñarse para proporcionar un análisis retrodictivo perfecto de los juegos jugados hasta la fecha, mientras que otros son predictivos y dan más peso a las tendencias futuras que a los resultados pasados. Esto da como resultado la posibilidad de que personas no familiarizadas con estos objetivos puedan malinterpretar los resultados del sistema de calificación; por ejemplo, un sistema de clasificación diseñado para ofrecer predicciones precisas de la distribución de puntos para los jugadores podría no ser adecuado para seleccionar los equipos que más merecen jugar en un campeonato o torneo.

Consideraciones de calificación

Ventaja de jugar en casa

Cuando juegan dos equipos de igual calidad, el equipo de casa tiende a ganar con más frecuencia. El tamaño del efecto cambia según la época del juego, el tipo de juego, la duración de la temporada, el deporte y el número par de zonas horarias cruzadas . Pero en todas las condiciones, "el simple hecho de jugar en casa aumenta las posibilidades de ganar". ^[3] Por lo tanto, una victoria fuera de casa se considera más favorable que una victoria en casa, porque fue más desafiante. La ventaja de jugar en casa (que, en el caso de los deportes que se practican en un campo, casi siempre se denomina "ventaja de jugar en casa") también se basa en las cualidades del estadio individual y del público; la ventaja en la NFL puede ser más de una diferencia de 4 puntos del estadio con menor ventaja al estadio con mayor. ^[4]

Fuerza del horario

La solidez del calendario se refiere a la calidad de los oponentes de un equipo. Una victoria contra un oponente inferior suele verse menos favorablemente que una victoria contra un oponente superior. A menudo, los equipos de la misma liga, que se comparan entre sí para considerar el campeonato o los playoffs, no se han enfrentado a los mismos oponentes. Por lo tanto, juzgar sus registros relativos de pérdidas y ganancias es complicado.

Miramos más allá del registro. El comité otorgó un valor significativo a la calidad de las victorias de Oregon.
— Jeff Long , presidente del comité de playoffs de fútbol americano universitario , conferencia de prensa, semana 12 de la temporada 2014, ^[5] después de clasificar 9-1 a Oregon por encima de 9-0 del estado de Florida

El comité de playoffs de fútbol universitario utiliza un algoritmo de fuerza de calendario limitado que solo considera los registros de los oponentes y los registros de los oponentes ^[6] (muy parecido al RPI ).

Puntos versus victorias

Una dicotomía clave entre los sistemas de clasificación deportiva reside en la representación de los resultados de los juegos. Algunos sistemas almacenan las puntuaciones finales como eventos ternarios discretos: victorias, empates y derrotas. Otros sistemas registran la puntuación final exacta del juego y luego juzgan a los equipos según el margen de victoria. A menudo se critica a los equipos de clasificación basándose en el margen de victoria porque crea un incentivo para que los entrenadores aumenten el puntaje, un resultado "antideportivo". ^[7]

Otros sistemas eligen un término medio, reduciendo el valor marginal de los puntos adicionales a medida que aumenta el margen de victoria. Sagarin optó por limitar el margen de victoria a una cantidad predeterminada. ^[8] Otros enfoques incluyen el uso de una función de desintegración, como un logaritmo o la colocación en una función de distribución acumulativa .

Información del juego

Más allá de los puntos o las victorias, algunos diseñadores de sistemas optan por incluir información más granular sobre el juego. Los ejemplos incluyen tiempo de posesión del balón, estadísticas individuales y cambios de liderazgo. Los datos sobre el clima, las lesiones o los juegos "desechables" cerca del final de la temporada pueden afectar los resultados de los juegos, pero son difíciles de modelar. Los "juegos descartables" son juegos en los que los equipos ya obtuvieron lugares para los playoffs y aseguraron su clasificación para los playoffs antes del final de la temporada regular, y quieren descansar/proteger a sus jugadores titulares enviándolos a la banca para los juegos restantes de la temporada regular. Esto suele dar lugar a resultados impredecibles y puede sesgar el resultado de los sistemas de calificación.

Composición del equipo

Los equipos suelen cambiar su composición entre partidos y dentro de ellos, y los jugadores se lesionan habitualmente. Calificar a un equipo a menudo consiste en calificar a un grupo específico de jugadores. Algunos sistemas asumen paridad entre todos los miembros de la liga, como que cada equipo se construya a partir de un grupo equitativo de jugadores a través de un sistema de draft o agencia libre , como se hace en muchos deportes de ligas importantes como la NFL , MLB , NBA y NHL . Ciertamente, este no es el caso en ligas universitarias como el fútbol de la División IA o el baloncesto masculino y femenino.

Inicio fresco

Al comienzo de una temporada, no ha habido partidos para juzgar la calidad relativa de los equipos. Las soluciones al problema del arranque en frío a menudo incluyen alguna medida de la temporada anterior, tal vez ponderada por el porcentaje del equipo que regresa para la nueva temporada. ARGH Power Ratings es un ejemplo de un sistema que utiliza varios años anteriores más un porcentaje de peso de los jugadores que regresan.

Métodos de calificación

Permutación de clasificaciones

Varios métodos ofrecen cierta permutación de las posiciones tradicionales. Esta búsqueda del récord "real" de victorias y derrotas a menudo implica el uso de otros datos, como la diferencia de puntos o la identidad de los oponentes, para alterar el récord de un equipo de una manera que sea fácilmente comprensible. El periodista deportivo Gregg Easterbrook creó una medida de Juegos Auténticos, que sólo considera los juegos jugados contra oponentes considerados de calidad suficientemente alta. ^[9] El consenso es que no todas las victorias son iguales.

Repasé las primeras semanas de juegos y rehice los registros de todos, etiquetando cada juego como una victoria o derrota legítima, una victoria o derrota tremenda, o un juego de uno u otro. Y si algo más sucedió en ese juego con repercusiones en el juego (una remontada, una ventaja desperdiciada, una disfunción importante, lo que sea), también lo etiqueté.
— Bill Simmons , periodista deportivo, Grantland ^[10]

pitagórico

La expectativa pitagórica, o proyección pitagórica, calcula un porcentaje basado en la cantidad de puntos que un equipo ha anotado y permitido. Normalmente, la fórmula implica el número de puntos obtenidos, elevado a algún exponente, colocado en el numerador. Luego, el número de puntos que permitió el equipo, elevado al mismo exponente, se coloca en el denominador y se suma al valor del numerador. Football Outsiders ha utilizado ^[11]

{\text{Pythagorean wins}}={\frac {{\text{Points For}}^{2.37}}{{\text{Points For}}^{2.37}+{\text{Points Against}}^{2.37}}}\times {\text{Games Played}}.

El porcentaje resultante a menudo se compara con el verdadero porcentaje de victorias de un equipo, y se dice que un equipo ha "logrado demasiado" o "bajo" en comparación con la expectativa pitagórica. Por ejemplo, Bill Barnwell calculó que antes de la semana 9 de la temporada 2014 de la NFL, los Arizona Cardinals tenían un récord pitagórico dos victorias menos que su récord real. ^[12] Bill Simmons cita el trabajo de Barnwell antes de la semana 10 de esa temporada y agrega que "cualquier nerd de los números está agitando un "¡¡¡REGRESIÓN !!!!!" bandera ahora mismo." ^[13] En este ejemplo, el récord de la temporada regular de los Arizona Cardinals era 8-1 al entrar en la décima semana de la temporada 2014. La fórmula pitagórica de victorias implicaba un porcentaje de victorias del 57,5%, basado en 208 puntos anotados y 183 puntos permitidos. Multiplicada por 9 partidos jugados, la expectativa pitagórica de los Cardinals era de 5,2 victorias y 3,8 derrotas. El equipo había "superado sus logros" en ese momento con 2,8 victorias, derivadas de sus 8 victorias reales menos las 5,2 victorias esperadas, un aumento de 0,8 victorias superadas con respecto a apenas una semana antes.

Intercambiar "puntos de habilidad"

Diseñado originalmente por Arpad Elo como un método para clasificar a los jugadores de ajedrez, varias personas han adaptado el sistema de clasificación Elo para deportes de equipo como el baloncesto, el fútbol y el fútbol americano. Por ejemplo, Jeff Sagarin y FiveThirtyEight publican clasificaciones de fútbol americano de la NFL utilizando métodos Elo. ^[14] Las calificaciones Elo inicialmente asignan valores de fuerza a cada equipo, y los equipos intercambian puntos según el resultado de cada juego.

Resolver ecuaciones

Investigadores como Matt Mills utilizan cadenas de Markov para modelar partidos de fútbol universitario, con puntuaciones de fuerza del equipo como resultados. ^{[15] Algoritmos como}el PageRank de Google también se han adaptado para clasificar los equipos de fútbol. ^[16]^[17]

Lista de sistemas de clasificación deportiva

Estadísticas avanzadas de la NFL , Liga Nacional de Fútbol Americano de los Estados Unidos de América
Clasificaciones de potencia ARGH
Ranking ATP , tenis internacional
matriz colley
Dickinson System , fútbol universitario de los Estados Unidos de América
Calificaciones de baloncesto universitario de Pomeroy , baloncesto universitario de los Estados Unidos de América
Índice de porcentaje de calificaciones (RPI) , Estados Unidos de América Baloncesto , béisbol , sóftbol , hockey , fútbol , lacrosse y voleibol de la NCAA de Estados Unidos
Índice cualitativo de Smithman , fútbol de los Estados Unidos de América - obsoleto
TrueSkill , un sistema de clasificación bayesiano inspirado en el sistema de clasificación Glicko ^[18]

Sistemas de clasificación por computadora de la Bowl Championship Series

En el fútbol americano universitario, se utilizaron los siguientes sistemas para elegir equipos para jugar en el campeonato nacional.

Anderson y Hester / Seattle Times
Richard Billingsley
Wes Colley / Atlanta Journal-Constitución
Richard Dunkel
Kenneth Massey
Herman Matthews /Scripps Howard
New York Times
David Rothman
Jeff Sagarin / EE.UU. Hoy en día
Peter Wolfe

Otras lecturas

Bibliografías

Wilson, David. "Bibliografía sobre sistemas de clasificación de fútbol universitario". Universidad de Wisconsin-Madison . Consultado el 18 de noviembre de 2014 .

Prensa popular

Feng, Ed (24 de noviembre de 2014). "Cómo entender los análisis del fútbol universitario: la guía definitiva". El rango de poder .
Mather, Víctor (23 de octubre de 2012). "Los clasificadores de fútbol universitario por docena hacen la pregunta número uno". New York Times .
Wayne Winston es profesor de ciencias de la decisión en la Universidad de Indiana y fue compañero de clase de Jeff Sagarin en el MIT. ^[19] Publicó varias ediciones de un texto en el software de hoja de cálculo Microsoft Excel que incluye material sobre la clasificación de equipos deportivos, así como un libro centrado directamente en este tema. Él y Sagarin crearon juntos sistemas de clasificación. ^[20]
- Winston, Wayne L. (2012). Mathletics: cómo los jugadores, gerentes y entusiastas de los deportes utilizan las matemáticas en el béisbol, el baloncesto y el fútbol. Prensa de la Universidad de Princeton. ISBN 978-1-4008-4207-0.
- Winston, Wayne L. (2009). Análisis de datos y modelado de negocios en Microsoft® Excel. Prensa de Microsoft. ISBN 978-0-7356-3714-6.

Trabajo académico

Carretilla, Daniel; Drayer, Ian; Elliott, Pedro; Gaut, Garren; Osting, Braxton (mayo de 2013). "Clasificaciones de clasificación: una comparación empírica del poder predictivo de los métodos de clasificación deportiva". Revista de Análisis Cuantitativo en el Deporte . 9 (2). doi :10.1515/jqas-2013-0013. ISSN 1559-0410. S2CID 199665454.
- Gran parte de esta información está disponible en Sports Rankings REU Final Report 2012: Un análisis de métodos de clasificación deportiva basados en comparaciones por pares y una novedosa simulación de baloncesto markoviano basada en agentes en Internet Archive PDF
Gris, Kathy L.; Schwertman, Neil C. (marzo de 2012). "Comparación de la selección de equipos y la clasificación para el torneo de baloncesto masculino de la NCAA de 2011". Revista de Análisis Cuantitativo en el Deporte . 8 (1). doi :10.1515/1559-0410.1369. ISSN 1559-0410. S2CID 121322446.
Massey, Ken (primavera de 1997). «Proyecto de Honor en Matemáticas» (PDF) .disponible en Modelos estadísticos aplicados a la clasificación de equipos deportivos en Internet Archive PDF
Mease, David (2003). "Un enfoque de máxima probabilidad penalizado para la clasificación de equipos de fútbol universitario independientemente de los márgenes de victoria" (PDF) . El estadístico estadounidense . 57 (4): 241–248. doi :10.1198/0003130032396. S2CID 2372150.

Referencias

^ Fagan, Ryan (9 de marzo de 2011). "Clasificar equipos en una gran burbuja". Noticias deportivas . Consultado el 24 de marzo de 2011 . Este es un vistazo a 20 de los equipos (en orden alfabético) que residen en la gran burbuja de este año. Hemos incluido tres clasificaciones estadísticas. El RPI (índice de porcentaje de calificaciones, tomado de collegeRPI.com) se considera el estándar y se proporciona a los miembros del comité durante el proceso de selección. Los otros dos índices de clasificación incluyen el margen de victoria en sus fórmulas: las calificaciones de Pomeroy (en kenpom.com) y las calificaciones de Sagarin (a través de USA Today), no son nuevas, pero han desempeñado un papel cada vez mayor en las discusiones sobre posibles cabezas de serie durante este baloncesto universitario. estación.
^ Ken Massey [@masseyratings] (3 de noviembre de 2014). "Las encuestas humanas de @kenpomeroy tienen un valor limitado. Los sistemas informáticos pueden rastrear objetivamente a todos los equipos. http://www.masseyratings.com/cb/compare.htm #all351" ( Tweet ) . Consultado el 9 de noviembre de 2014 - vía Twitter .
^ Jamieson, Jeremy P. (2010). "La ventaja del campo local en el atletismo: un metaanálisis" (PDF) . Revista de Psicología Social Aplicada . 40 (7): 1819–1848. doi : 10.1111/j.1559-1816.2010.00641.x . Consultado el 11 de noviembre de 2014 .
^ Barnwell, Bill (20 de diciembre de 2013). "Seguro en casa". Grantlandia . Consultado el 11 de noviembre de 2014 .
^ Russo, Ralph D. (11 de noviembre de 2014). "Oregon hasta el segundo lugar en el ranking de playoffs; TCU al cuarto lugar". Associated Press . Consultado el 12 de noviembre de 2014 .
^ Stewart Mandel [@slmandel] (12 de noviembre de 2014). "El comité no utiliza una clasificación SOS. Examina el historial de los oponentes y el historial de los oponentes" ( Tweet ) . Consultado el 12 de noviembre de 2014 - vía Twitter .
^ Richards, Darryl (2001). "BCS elimina el elemento de margen de victoria". Deportes Fox . Consultado el 12 de noviembre de 2014 .
^ Sagarin, Jeff (otoño de 2014). "Clasificaciones de Jeff Sagarin de la NCAAAF". EE.UU. Hoy en día . Consultado el 12 de noviembre de 2014 .
^ Easterbrook, Gregg (18 de noviembre de 2014). "Más banderas en los marcadores de giros D". ESPN . Consultado el 19 de noviembre de 2014 .
^ Simmons, Bill (24 de octubre de 2014). "Selecciones de la semana 8: una epifanía del juego". Grantlandia . Consultado el 19 de noviembre de 2014 .
^ Schatz, Aarón; Alamar, Ben; Barnwell, Bill; Bill Connelly; Doug Farrar (2011). Football Outsiders Almanac 2011: la guía esencial para las temporadas de fútbol americano universitario y de la NFL de 2011. Crear espacio. pag. xviii. ISBN 978-1-4662-4613-3.
^ Barnwell, Bill (5 de noviembre de 2014). "NFL en la mitad: analizando los números". Grantlandia . Consultado el 7 de enero de 2015 .
^ Simmons, Bill (7 de noviembre de 2014). "Revisando a los mariscales de campo que cumplen con el año 2000" . Consultado el 10 de noviembre de 2014 .
^ Plata, Nate (4 de septiembre de 2014). "Presentamos las calificaciones Elo de la NFL". Cinco Treinta Ocho . Consultado el 10 de noviembre de 2014 .
^ Mills, Matt (21 de diciembre de 2014). "Uso de cadenas de Markov de tiempo continuo para clasificar los equipos de fútbol universitario". La propagación . Consultado el 21 de diciembre de 2014 .
^ "Clasificación de equipos de la NFL utilizando Network Science". LinkedIN . 17 de marzo de 2016 . Consultado el 17 de marzo de 2016 .
^ "Modificación del algoritmo de clasificación de páginas de Google para clasificar equipos". Reddit . 21 de diciembre de 2014 . Consultado el 22 de diciembre de 2014 .
^ Weng, Ruby C.; Lin, Chih-Jen (2011). "Un método de aproximación bayesiana para la clasificación en línea" (PDF) . Revista de investigación sobre aprendizaje automático . 12 : 267–300.
^ "Wayne Winston: análisis en el mundo del deporte". Universidad de Indiana Bloomington - Escuela de Negocios Kelley - Tecnologías de operaciones y decisiones . 25 de noviembre de 2013 . Consultado el 8 de noviembre de 2014 .
^ "Juego de números". Tiempos de Washington . 13 de abril de 2004 . Consultado el 8 de noviembre de 2014 .