En análisis deportivo , sabermetrics (originalmente SABRmetrics ) es el análisis empírico del béisbol , especialmente las estadísticas de béisbol que miden la actividad en el juego. Los sabermetristas recopilan y resumen los datos relevantes de esta actividad del juego para responder preguntas específicas. El término se deriva del acrónimo SABR, que significa Sociedad para la Investigación del Béisbol Estadounidense , fundada en 1971. El término "sabermetrics" fue acuñado por Bill James , quien es uno de sus pioneros y a menudo es considerado su defensor y público más destacado. rostro. [1]
Henry Chadwick , un periodista deportivo de Nueva York, desarrolló el box score en 1858. Esta fue la primera forma en que los estadísticos pudieron describir el deporte del béisbol mediante el seguimiento numérico de varios aspectos del juego. [2] La creación del cuadro de puntuación ha proporcionado a los estadísticos del béisbol un resumen de las actuaciones individuales y del equipo para un juego determinado. [3]
La investigación en sabermetría comenzó a mediados del siglo XX con los escritos de Earnshaw Cook , uno de los primeros sabermétricos. El libro de Cook de 1964, Percentage Baseball, fue uno de los primeros de su tipo. [4] Al principio, la mayoría de los equipos de béisbol organizados y los profesionales descartaron el trabajo de Cook como si no tuviera sentido. La idea de una ciencia de las estadísticas del béisbol comenzó a ganar legitimidad en 1977, cuando Bill James comenzó a publicar Baseball Abstracts , su compendio anual de datos sobre el béisbol. [5] [6] Sin embargo, las ideas de James tardaron en encontrar una aceptación generalizada. [1]
Bill James creía que había un malentendido generalizado sobre cómo se jugaba el béisbol, afirmando que el deporte no estaba definido por sus reglas sino, en realidad, como lo resumió el profesor de ingeniería Richard J. Puerzer, "definido por las condiciones bajo las cuales se juega el juego". --específicamente, los estadios pero también los jugadores, la ética, las estrategias, el equipamiento y las expectativas del público”. [2] Los sabermetristas, a veces considerados estadísticos del béisbol, comenzaron a intentar reemplazar la estadística favorita desde hace mucho tiempo conocida como promedio de bateo . [7] [8] Se ha afirmado que el promedio de bateo del equipo proporciona un ajuste relativamente pobre para las carreras anotadas por el equipo. [7] El razonamiento sabermétrico diría que las carreras ganan los juegos de pelota, y que una buena medida del valor de un jugador es su capacidad para ayudar a su equipo a anotar más carreras que el equipo contrario.
Antes de que Bill James popularizara la sabermetría, Davey Johnson utilizó un IBM System/360 en la cervecería del propietario del equipo Jerold Hoffberger para escribir una simulación por computadora de béisbol FORTRAN mientras jugaba para los Orioles de Baltimore de la Major League Baseball (MLB) a principios de los años 1970. Usó sus resultados en un intento fallido de promoverle a su manager Earl Weaver la idea de que debería batear segundo en la alineación. Escribió programas IBM BASIC para ayudarlo a administrar Tidewater Tides , y después de convertirse en gerente de los Mets de Nueva York en 1984, consiguió que un empleado del equipo escribiera una aplicación dBASE II para compilar y almacenar métricas avanzadas en estadísticas del equipo. [9] Craig R. Wright era otro empleado de la MLB y trabajaba con los Texas Rangers a principios de la década de 1980. Durante su tiempo con los Rangers, se hizo conocido como el primer empleado de la oficina principal en la historia de la MLB en trabajar bajo el título de "sabermetrician". [10] [11]
David Smith fundó Retrosheet en 1989, con el objetivo de computarizar el puntaje de cada partido de béisbol de las grandes ligas jamás jugado, para recopilar y comparar con mayor precisión las estadísticas del juego.
Los Atléticos de Oakland comenzaron a utilizar un enfoque más cuantitativo del béisbol centrándose en los principios sabermétricos en la década de 1990. Inicialmente, esto comenzó con Sandy Alderson como gerente general del equipo cuando utilizó los principios para obtener jugadores relativamente infravalorados. [1] Sus ideas continuaron cuando Billy Beane asumió el cargo de gerente general en 1997, puesto que ocupó hasta 2015, y contrató a su asistente Paul DePodesta . [8] A través del análisis estadístico realizado por Beane y DePodesta en la temporada 2002, los Atléticos de Oakland ganaron 20 juegos seguidos. Este fue un momento histórico para la franquicia, en el que se jugó el partido número 20 en el Oakland-Alameda County Coliseum . [12] Sus enfoques sobre el béisbol pronto ganaron reconocimiento nacional cuando Michael Lewis publicó Moneyball: The Art of Winning an Unfair Game en 2003 para detallar el uso de la sabermetría por parte de Beane. En 2011, se estrenó una película basada en el libro de Lewis, también llamada Moneyball , que dio una amplia exposición a las técnicas utilizadas en la oficina principal de los Atléticos de Oakland.
Sabermetrics fue creado en un intento de que los fanáticos del béisbol aprendieran sobre el deporte a través de evidencia objetiva. Esto se realiza evaluando a los jugadores en todos los aspectos del juego, específicamente bateo, lanzamiento y fildeo. Estas medidas de evaluación generalmente se expresan en términos de carreras o victorias del equipo, ya que las estadísticas más antiguas se consideraban ineficaces.
La medida tradicional del rendimiento de bateo se considera hits divididos por el número total de turnos al bate . Bill James, junto con otros padres de la sabermetría, encontró que esta medida era defectuosa, ya que ignora cualquier otra forma en que un bateador pueda llegar a la base además de un hit. [13] Por el contrario, el porcentaje de embase (OBP) toma en consideración la base por bolas ("bases por bolas") y los hits por lanzamiento . [a] Otro problema con la medida tradicional del promedio de bateo es que no distingue entre hits (es decir, sencillos, dobles, triples y jonrones) y otorga a cada hit el mismo valor. [13] Una medida que diferencia entre estos resultados es el porcentaje de slugging (SLG). [a] Para calcular el porcentaje de slugging, el número total de bases de todos los hits se divide por el número total de veces al bate.
Stephen Jay Gould propuso que la desaparición del promedio de bateo de .400 (logrado por última vez en la MLB por Ted Williams en 1941) es en realidad una señal de mejora general en el bateo. [15] [16] Esto se debe a que, en la era moderna, los jugadores se centran más en batear para obtener potencia que para el promedio. [16] Por lo tanto, se ha vuelto más valioso comparar jugadores usando el porcentaje de slugging y el porcentaje de embase sobre el promedio de bateo. [15]
Estas dos medidas sabermétricas mejoradas son habilidades importantes para medir en un bateador y se han combinado para crear la estadística moderna de embase más slugging (OPS). OPS es la suma del porcentaje de embase y el porcentaje de slugging. Esta estadística moderna se ha vuelto útil para comparar jugadores y es un método poderoso para predecir carreras anotadas por un determinado jugador. [17]
Algunas de las otras estadísticas que utilizan los sabermetristas para evaluar el rendimiento de bateo son el promedio ponderado de embase , el promedio secundario , las carreras creadas y el promedio equivalente .
La medida tradicional del desempeño del lanzador es el promedio de rendimiento ganado (ERA). Se calcula como carreras limpias permitidas por nueve entradas. El promedio de rendimiento ganado no separa la habilidad del lanzador de las habilidades de los defensores con los que juega. [18] Otra medida clásica para el lanzamiento es el porcentaje de victorias de un lanzador . El porcentaje de victorias se calcula dividiendo las victorias por el número total de decisiones (victorias más derrotas). El porcentaje de victorias también depende en gran medida del equipo del lanzador, particularmente del número de carreras que anota.
Los sabermetristas han intentado encontrar diferentes medidas del desempeño del lanzador que excluyan el desempeño de los fildeadores involucrados. Uno de los primeros desarrollados, y uno de los más populares en su uso, son las bases por bolas más hits por entrada lanzada (WHIP), que si bien no es completamente independiente de la defensa, tiende a indicar cuántas veces es probable que un lanzador ponga a un jugador en base. (ya sea mediante base por bolas, hit por lanzamiento o hit de base) y, por lo tanto, qué tan efectivos son los bateadores contra un lanzador en particular para llegar a la base.
Un desarrollo posterior fue la creación del sistema de estadísticas de lanzamiento independientes de la defensa (DIPS). A Voros McCracken se le atribuye el desarrollo de este sistema en 1999. [19] A través de su investigación, McCracken pudo demostrar que hay poca o ninguna diferencia entre los lanzadores en la cantidad de hits que permiten a las bolas puestas en juego, independientemente de su nivel de habilidad. [20] Algunos ejemplos de estas estadísticas son la efectividad de la defensa independiente , el lanzamiento independiente del campo y la efectividad del componente independiente de la defensa . Otros sabermetristas han impulsado el trabajo en DIPS, como Tom Tango , que dirige el sitio web Tango on Baseball sabermetrics.
Baseball Prospectus creó otra estadística llamada ERA periférica . Esta medida del desempeño de un lanzador toma hits, bases por bolas, jonrones permitidos y ponches mientras se ajusta a los factores del estadio. [18] Cada estadio tiene diferentes dimensiones en lo que respecta a la pared del jardín, por lo que un lanzador no debe medirse igual para cada uno de estos parques. [21]
El promedio de bateo sobre bolas en juego (BABIP) es otra medida útil para determinar el desempeño de los lanzadores. [20] Cuando un lanzador tiene un BABIP alto, a menudo mostrará mejoras en la siguiente temporada, mientras que un lanzador con un BABIP bajo a menudo mostrará una disminución en la siguiente temporada. [20] Esto se basa en el concepto estadístico de regresión a la media . Otros han creado varios medios para intentar cuantificar los lanzamientos individuales basándose en sus características, en contraposición a las carreras ganadas o las pelotas bateadas.
El valor sobre el jugador de reemplazo (VORP) alguna vez se consideró una estadística sabermétrica popular. Esta estadística demuestra cuánto contribuye un jugador a su equipo en comparación con un jugador hipotético que se desempeña al nivel mínimo necesario para ocupar una posición en la plantilla de un equipo de Grandes Ligas. Esta medida fue inventada por Keith Woolner, ex escritor del grupo sabermétrico/sitio web Baseball Prospectus .
Victorias por encima del reemplazo (WAR) es otra estadística sabermétrica popular para evaluar las contribuciones de un jugador a su equipo. [22] Al igual que VORP, WAR compara a un jugador determinado con un jugador de nivel de reemplazo para determinar el número de victorias adicionales que el jugador ha proporcionado a su equipo. [23] Los valores de WAR varían según las posiciones de golpe y están determinados en gran medida por el desempeño exitoso del jugador y la cantidad de tiempo de juego. [23]
Muchas estadísticas tradicionales y modernas, como ERA y Wins Shared, no brindan una comprensión completa de lo que sucede en el campo. [24] : 189–198 Los ratios simples no son suficientes para comprender los datos estadísticos del béisbol. El análisis cuantitativo estructurado es capaz de explicar muchos aspectos del juego, por ejemplo, para examinar con qué frecuencia un equipo debe intentar robar . [25]
Sabermetrics se puede utilizar para múltiples propósitos, pero los más comunes son evaluar el desempeño pasado y predecir el desempeño futuro para determinar las contribuciones de un jugador a su equipo. [17] Estos pueden ser útiles para determinar quién debería ganar premios de final de temporada, como el MVP, y para determinar el valor de realizar un determinado intercambio.
La mayoría de los jugadores de béisbol tienden a jugar algunos años en las ligas menores antes de ser llamados a la liga mayor. Las diferencias competitivas, sumadas a los efectos del estadio, hacen que la comparación exacta de las estadísticas de un jugador sea un problema. Los sabermetristas han podido solucionar este problema ajustando las estadísticas de ligas menores del jugador, también conocidas como Equivalencia de ligas menores. [17] A través de estos ajustes, los equipos pueden observar el desempeño de un jugador tanto en AA como en AAA para determinar si está en condiciones de ser llamado a las mayores.
Los métodos Sabermetrics se utilizan generalmente para tres propósitos:
Se puede construir un modelo de aprendizaje automático utilizando conjuntos de datos disponibles en fuentes como baseball-reference. Este modelo dará estimaciones de probabilidad para el resultado de juegos específicos o el desempeño de jugadores particulares. Estas estimaciones son cada vez más precisas cuando se aplican a un gran número de acontecimientos a largo plazo. El resultado del juego (ganar/perder) se trata como si tuviera una distribución binomial.
Se pueden hacer predicciones utilizando un modelo de regresión logística con variables explicativas que incluyen: carreras anotadas de los oponentes, carreras anotadas, blanqueadas, tiempo al bate, tasa de victorias y látigo del lanzador.
Los dos libros de Bill James, The Bill James Historical Baseball Abstract (1985) y Win Shares (2002) han seguido avanzando en el campo de la sabermétrica. [26] Su ex asistente Rob Neyer , quien más tarde se convirtió en escritor senior de ESPN.com y editor nacional de béisbol de SBNation, también trabajó en la popularización de la sabermetría desde mediados de la década de 1980. [27]
Nate Silver , ex escritor y socio gerente de Baseball Prospectus , inventó PECOTA en 2002-2003 y lo presentó al público en el libro Baseball Prospectus en 2003. [28] El acrónimo significa Algoritmo de prueba de optimización y comparación empírica de jugadores , [29 ] y es un sistema sabermétrico para pronosticar el desempeño de los jugadores de las Grandes Ligas de Béisbol. En pocas palabras, supone que las carreras de jugadores similares seguirán una trayectoria similar. Este sistema es propiedad de Baseball Prospectus desde 2003 y ayuda a los autores del sitio web a inventar o mejorar medidas y técnicas sabermétricas ampliamente utilizadas. [30]
A partir de la temporada de béisbol de 2007, la MLB comenzó a buscar tecnología para registrar información detallada sobre cada lanzamiento que se realiza en un juego. Esto se conoció como el sistema PITCHf/x que es capaz de registrar la velocidad del lanzamiento, en su punto de lanzamiento y cuando cruza el plato, así como la ubicación y ángulo de ruptura de ciertos lanzamientos a través de cámaras de video. [13] FanGraphs es un sitio web que favorece este sistema, así como el análisis de datos jugada por jugada. El sitio web también se especializa en publicar estadísticas avanzadas de béisbol, así como gráficos que evalúan y rastrean el desempeño de jugadores y equipos. [ cita necesaria ]
... La discusión giró en torno a un ensayo que Gould escribió para la revista
Discover
en 1986 y que fue reimpreso tanto en su libro de 1996
Full House
como en
Triumph and Tragedy
bajo el título "Why No One Hits .400 Anymore"...