stringtranslate.com

PECOTA

PECOTA , acrónimo de Algoritmo de prueba de optimización y comparación empírica de jugadores , [1] es un sistema sabermétrico para pronosticar el desempeño de los jugadores de las Grandes Ligas de Béisbol . La palabra es un backronym basado en el nombre del jugador oficial de Grandes Ligas Bill Pecota , quien, con un promedio de bateo de por vida de .249, es quizás representativo de la entrada típica de PECOTA. PECOTA fue desarrollado por Nate Silver en 2002-2003 y presentado al público en el libro Baseball Prospectus 2003 . [2] Baseball Prospectus (BP) es propietario de PECOTA desde 2003; Silver administró PECOTA de 2003 a 2009. A partir de la primavera de 2009, BP asumió la responsabilidad de producir los pronósticos anuales, haciendo de 2010 la primera temporada de béisbol en la que Silver no jugó ningún papel en la producción de proyecciones de PECOTA. [3]

Uno de los varios sistemas estadísticos ampliamente publicitados de pronósticos del desempeño de los jugadores, los pronósticos de jugadores PECOTA son comercializados por BP como un producto de béisbol de fantasía . Desde 2003, los pronósticos anuales de PECOTA se han publicado tanto en los libros anuales de Baseball Prospectus como, de forma más detallada, en el sitio web por suscripción BaseballProspectus.com. [4] PECOTA también inspiró algunos sistemas de proyección análogos para otros deportes profesionales: KUBIAK para la Liga Nacional de Fútbol , ​​SCHOENE [5] y CARMELO [6] para la Asociación Nacional de Baloncesto , y VUKOTA [7] para la Liga Nacional de Hockey .

PECOTA pronostica el desempeño de un jugador en todas las categorías principales utilizadas en los típicos juegos de béisbol de fantasía; también pronostica la producción en categorías sabermétricas avanzadas desarrolladas por Baseball Prospectus (por ejemplo, VORP y EqA ). Además, PECOTA pronostica varios diagnósticos resumidos, como tasas de ruptura, tasas de mejora y tasas de deserción, así como los valores de mercado de los jugadores. La lógica y la metodología subyacentes a PECOTA se han descrito en varias publicaciones, pero las fórmulas detalladas son exclusivas y no se han compartido con la comunidad de investigación del béisbol. [ cita necesaria ]

Metodología

Silver describió la inspiración para su enfoque de la siguiente manera:

La idea básica detrás de PECOTA es en realidad una fusión de dos cosas diferentes: el trabajo de [Bill] James en puntuaciones de similitud y el trabajo de Gary Huckabay en Vlad, el sistema de proyección anterior de [Baseball Prospectus], que intentaba asignar jugadores a una serie de trayectorias profesionales diferentes. [8] Creo que Gary usó algo así como trece o quince carreras profesionales separadas, y todo lo que PECOTA realmente está haciendo es llevar eso al extremo lógico, donde esencialmente hay una carrera profesional separada para cada jugador en la historia de las Grandes Ligas. Las puntuaciones de comparabilidad son el mecanismo mediante el cual elige entre esas trayectorias profesionales. [9]

Jugadores comparables

PECOTA se basa en ajustar las estadísticas de rendimiento pasado de un jugador determinado al rendimiento de jugadores "comparables" de las Grandes Ligas mediante puntuaciones de similitud . Como se describe en el glosario del sitio web Baseball Prospectus: [10]

PECOTA compara a cada jugador con una base de datos de aproximadamente 20.000 temporadas de bateadores de Grandes Ligas desde la Segunda Guerra Mundial. Además, también se basa en una base de datos de aproximadamente 15.000 temporadas traducidas de ligas menores (1997-2006) para jugadores que pasaron la mayor parte de su temporada anterior en las ligas menores. ... PECOTA considera cuatro categorías amplias de atributos para determinar la comparabilidad de un jugador: [ cita necesaria ]

1. Métricas de producción, como el promedio de bateo, el poder aislado y la tasa de bases por bolas no intencionales para los bateadores, o la tasa de ponches y la tasa de rodados para los lanzadores.

2. Métricas de uso, incluida la duración de la carrera y las apariciones en el plato o las entradas lanzadas.

3. Atributos fenotípicos, incluida la lateralidad, la altura, el peso, la duración de la carrera (para los jugadores de las ligas mayores) y el nivel de las ligas menores (para los prospectos).

4. Posición de fildeo (para bateadores) o rol de abridor/relevista (para lanzadores). ... En la mayoría de los casos, la base de datos es lo suficientemente grande como para proporcionar un conjunto significativamente grande de comparables apropiados. Cuando no es así, el programa está diseñado para "hacer trampa" ampliando su tolerancia para jugadores diferentes hasta alcanzar un tamaño de muestra razonable.

PECOTA utiliza el análisis del vecino más cercano para relacionar al jugador individual con un conjunto de otros jugadores que son más similares a él. Aunque se basa en el concepto subyacente de las puntuaciones de similitud de Bill James , PECOTA calcula estas puntuaciones de una manera distinta que conduce a un conjunto de "comparables" muy diferente al método de James. [11] Además, Silver describe la siguiente característica distintiva:

Los puntajes de similitud de PECOTA se basan principalmente en observar una ventana de tres años del desempeño de un lanzador. Por lo tanto, podríamos observar lo que hizo un lanzador entre los 35 y los 37 años y compararlo con las actuaciones más similares entre los 35 y los 37 años, después de ajustar por parques, efectos de liga y una gran cantidad de otras cosas. Esto es diferente de los puntajes de similitud que puede ver en baseball-reference.com o en otros lugares, que intentan evaluar la totalidad de la carrera de un jugador hasta una edad determinada. [12]

Una vez que se determina un conjunto de "comparables" para cada jugador, su pronóstico de desempeño futuro se basa en el desempeño histórico de sus "comparables". Por ejemplo, el desempeño pronosticado de un jugador de 26 años en la próxima temporada se basará en cómo se desempeñaron los jugadores de 26 años de Grandes Ligas más comparables en su temporada siguiente.

Se desarrollan conjuntos separados de predicciones para bateadores y lanzadores.

Estadísticas periféricas

PECOTA también depende mucho del uso de estadísticas periféricas para pronosticar el desempeño futuro de un jugador determinado. Por ejemplo, basándose en los conocimientos que surgen del uso de estadísticas de lanzamiento independientes de la defensa , PECOTA pronostica el desempeño futuro de un lanzador en un área determinada utilizando información sobre su desempeño pasado en otras áreas. [13] Como escribe el analista y periodista de béisbol Alan Schwarz , "Silver... diseñó un sofisticado algoritmo de varianza que ha examinado las estadísticas de cada lanzador de grandes ligas desde 1946 para determinar qué números pronostican mejor la efectividad, específicamente el promedio de rendimiento ganado . Sus hallazgos son contradictorios para la mayoría de los fanáticos. "Cuando intentas predecir la efectividad futura con la efectividad pasada, estás cometiendo un error", dijo Silver. Silver descubrió que las estadísticas más predictivas, por un margen considerable, son la tasa de ponches y la tasa de boletos de un lanzador. carreras permitidas, desgloses entre zurdos y derechos y otros datos dicen menos sobre el futuro de un lanzador". [14]

Distribuciones de probabilidad

En lugar de centrarse en hacer estimaciones puntuales del desempeño futuro de un jugador (como promedio de bateo, jonrones y ponches), PECOTA se basa en el desempeño histórico de los "comparables" de un jugador dado para producir una distribución de probabilidad de los pronósticos del jugador dado. desempeño durante los próximos cinco años. Alan Schwarz ha enfatizado esta característica de PECOTA: "Lo que separa a Pecota del grupo de sistemas de proyección que los forasteros han desarrollado durante muchas décadas es cómo reconoce, e incluso hace alarde, la incertidumbre de predecir las habilidades de un jugador. En lugar de generar una línea de estadísticas esperadas , Pecota presenta siete, algunos optimistas, otros pesimistas, cada uno con su propio nivel de confianza. El sistema se parece mucho a la predicción de la trayectoria de un huracán: los jugadores pueden ir en muchas direcciones, por lo que prepararse para una sola es una tontería". [15] Plata ha escrito,

Este procedimiento requiere que nos sintamos cómodos con el pensamiento probabilístico. Si bien la mayoría de los jugadores de un determinado tipo pueden progresar de cierta manera (por ejemplo, llegar a su punto máximo temprano), siempre habrá excepciones. Además, es posible que los jugadores comparables no siempre se desempeñen de acuerdo con su verdadero nivel de habilidad. A veces parecerá que lo superan en una temporada determinada, y otras veces se quedan cortos, debido a los problemas de tamaño de la muestra que describimos anteriormente.

PECOTA tiene en cuenta este tipo de factores al crear no un único punto de pronóstico, como lo hacen otros sistemas, sino más bien una variedad de resultados posibles que el jugador podría esperar lograr con diferentes niveles de probabilidad. En lugar de decirte que va a llover, te decimos que hay un 80% de posibilidades de que llueva, porque el 80% de las veces que se han presentado estas condiciones atmosféricas el martes, ha llovido el miércoles. [ cita necesaria ]

Seguramente, este enfoque es más complicado que el método estándar de aplicar un ajuste por edad basado en el curso de desarrollo "promedio" de todos los jugadores a lo largo de la historia. Sin embargo, también es a pasos agigantados más representativo de la realidad y, además, más preciso. [dieciséis]

Esfuerzo de equipo

Aunque Silver fue el creador de PECOTA, producir pronósticos de PECOTA fue un esfuerzo de equipo: "Puede que yo sea 'el tipo de PECOTA', pero en gran medida es un esfuerzo de equipo", dijo Silver sobre el personal de BP. "Todos lo hacemos. Es mi bebé, pero se necesita un pueblo para hacer funcionar una PECOTA". [17] Por ejemplo, PECOTA se basa en las traducciones de Clay Davenport (las llamadas Davenport Translations o DT) de estadísticas de ligas menores e internacionales de béisbol para estimar el rendimiento equivalente de cada jugador en las ligas mayores. [18] De esta manera, PECOTA puede hacer proyecciones para más de 1.600 jugadores cada año, incluidos muchos jugadores con poca o ninguna experiencia previa en las Grandes Ligas.

Las previsiones de pretemporada de 2009 fueron las últimas de las que Silver asumió la responsabilidad principal. En marzo de 2009, Silver anunció que el conjunto extremadamente complejo y laborioso de manipulaciones y cálculos de bases de datos de PECOTA se trasladaría a una plataforma diferente . Aunque Baseball Prospectus había sido el propietario de PECOTA desde que Silver se lo vendió en 2003, y Silver administraba y asumía la responsabilidad de los pronósticos, de ahora en adelante los pronósticos de PECOTA serían generados por el equipo de Baseball Prospectus, inicialmente con Clay Davenport a cargo del esfuerzo. [19] y más tarde, durante la temporada 2013, con Colin Wyers dirigiendo tanto la producción como las mejoras en PECOTA. [3]

Sistemas de previsión alternativos

La mayoría de los otros sistemas de pronóstico populares no utilizan un enfoque de "jugadores comparables". En cambio, la mayoría se basa en proyecciones directas del desempeño pasado de un jugador a su desempeño futuro, generalmente utilizando como base un promedio ponderado del desempeño de un jugador en sus tres años anteriores. Al igual que PECOTA, muchos de esos sistemas también ajustan las proyecciones de envejecimiento, efectos de parque y regresión hacia la media . Al igual que PECOTA, también pueden adaptarse a la dificultad competitiva de cada una de las dos ligas principales. [20] Sin embargo, los sistemas difieren entre sí en los tipos e intensidades de los ajustes de edad, las estimaciones del efecto de regresión, los ajustes de los parques y los ajustes de la dificultad de la liga que pueden realizar, así como en si utilizan puntuaciones de similitud. [21] PECOTA también hace proyecciones para muchos más jugadores que otros sistemas, porque PECOTA se basa en estadísticas ajustadas de las ligas menores, así como en las estadísticas de las ligas mayores, y trata de hacer proyecciones para todos los jugadores en las listas ampliadas de las ligas mayores (40 jugadores por equipo). ) así como otras perspectivas . [ cita necesaria ]

A partir del año 2000, los Indios de Cleveland desarrollaron una base de datos analítica patentada llamada DiamondView para evaluar la información de exploración recopilada por el equipo; este sistema incorporó posteriormente indicadores de desempeño de jugadores e indicadores financieros, con el propósito de evaluar y proyectar el desempeño de todos los jugadores de las Grandes Ligas. [22] Durante 2008-2009, los Piratas de Pittsburgh estaban en proceso de desarrollar MITT ("Gestión, Información, Herramientas y Talento"), una base de datos patentada que integra informes de exploración, información médica y de contratos, y estadísticas y proyecciones de desempeño. [23]

Actualizaciones y revisiones

Introducidas por primera vez en 2003, [24] las proyecciones PECOTA se producen cada año y se publican tanto en las monografías anuales de Baseball Prospectus como en el sitio web BaseballProspectus.com. PECOTA ha experimentado varias mejoras desde 2003. La versión de 2006 introdujo métricas para la valoración de mercado de los jugadores en función de los niveles de rendimiento previstos. La versión de 2007 introdujo ajustes por efectos de liga, para tener en cuenta las diferencias en el entorno competitivo de las dos ligas principales. [25] La actualización de 2008 tomó en cuenta las diferencias en el desempeño de los jugadores durante la primera y segunda mitad de la temporada anterior, así como las divisiones de pelotón (qué tan bien se desempeñó un jugador contra bateadores o lanzadores que eran zurdos o diestros). [26] También tuvo en cuenta el funcionamiento de bases. [27] En 2009, Baseball Prospectus introdujo proyecciones PECOTA durante la temporada, para actualizar y complementar sus proyecciones de inicio de temporada. [28] En 2012, PECOTA cambió sustancialmente la forma en que sopesaba el desempeño de los años anteriores al establecer la base de referencia para las proyecciones. [29] Además, se agregaron pronósticos a 10 años y pronósticos percentiles a las tarjetas PECOTA de jugadores individuales que se publican en línea. [30]

Exactitud

Aunque Baseball Prospectus promueve comercialmente PECOTA como "muy preciso", todos los sistemas de proyección están sujetos a una incertidumbre considerable. Una comparación encontró que PECOTA había superado a varios otros sistemas de pronóstico para la temporada 2006 en la predicción de OPS . Funcionó casi tan bien como los mejores de los otros sistemas en la predicción de ERA . [31] Aunque las proyecciones PECOTA se hacen para más de 1000 bateadores cada temporada, la evaluación del sistema incluyó solo un poco más de 100 jugadores que tenían un mínimo de 500 AB de las Grandes Ligas y también habían sido incluidos en las proyecciones de los otros sistemas. La propia comparación de Nate Silver sobre el desempeño de sistemas de proyección alternativos para bateadores en 2007 también mostró que PECOTA lideraba el campo, aunque un par de otros estaban cerca. [32]

Aunque está diseñado principalmente para predecir el desempeño de un jugador individual , PECOTA se ha aplicado también para predecir el desempeño de un equipo . Para este propósito, se establecen tablas de profundidad proyectadas del equipo con tiempos de juego proyectados para cada miembro del equipo, basándose en el asesoramiento experto del personal de Baseball Prospectus. El número de carreras que un equipo anotará y permitirá durante la próxima temporada se estima en función de los tiempos de juego y el rendimiento individual previsto por PECOTA para cada jugador, utilizando un algoritmo de "Valor de alineación marginal" creado por David Tate y desarrollado por Keith Woolner . [33] Las victorias esperadas de un equipo se basan en la aplicación de una versión mejorada de la fórmula pitagórica de Bill James al número estimado de carreras anotadas y permitidas por la lista de jugadores bajo los supuestos de tiempo de juego dados. [34]

PECOTA se ha utilizado en pronósticos de pretemporada [35] sobre cuántas victorias obtendrán los equipos y en simulaciones de mitad de temporada sobre la cantidad de victorias que obtendrá cada equipo y sus probabilidades de llegar a los playoffs. [36] En 2006, los pronósticos de pretemporada de PECOTA se compararon favorablemente con otros sistemas de pronóstico (incluidas las probabilidades de las líneas de apuestas de Las Vegas ) al predecir el número de victorias que los equipos obtendrían durante la temporada. [37] Una evaluación independiente realizada por el sitio web Vegas Watch mostró que PECOTA tuvo el error más bajo al predecir las victorias de los equipos de las Grandes Ligas en 2008 de todos los pronósticos más conocidos, tanto los que se basaban en sabermetría como los que dependían de la experiencia individual. [38] Sin embargo, en 2009 PECOTA iba por detrás de todos los pronosticadores conocidos. [39]

Un resumen de las temporadas 2003 a 2007 muestra que el error promedio de PECOTA entre las victorias del equipo previstas y reales disminuyó: [40] 2003 5,91 victorias; 2004 7,71 victorias; 2005 5,14 victorias; 2006 4,94 victorias; 2007 4,31 victorias. Silver conjetura que la mejora se debe en parte a que se tuvo en cuenta la defensa en los pronósticos a partir de 2005. En 2008, el error promedio fue de 8,5 victorias. [41]

Referencias

  1. ^ "Folleto de béisbol | Glosario". www.baseballprospectus.com . Consultado el 5 de mayo de 2016 .
  2. ^ Nate Silver, "Presentación de PECOTA", en Gary Huckabay, Chris Kahrl , Dave Pease et al. , Eds., Baseball Prospectus 2003 (Dulles, VA: Brassey's Publishers, 2003): 507–514.
  3. ^ ab Nate Silver y Kevin Goldstein, "State of the Prospectus: Spring 2009", BaseballProspectus.com, 24 de marzo de 2009 Archivado el 27 de marzo de 2009 en Wayback Machine .
  4. ^ Las estimaciones y "tarjetas" ilustrativas de PECOTA están disponibles para su inspección por parte de no suscriptores aquí: http://www.baseballprospectus.com/pecota/.
  5. ^ Kevin Pelton, "Presentación de SCHOENE: nuestro sistema de proyección de la NBA", BasketballProspectus.com (20 de octubre de 2008)
  6. ^ Plata, Nate (9 de octubre de 2015). "Estamos prediciendo la carrera de cada jugador de la NBA. Así es como se hace". Cinco Treinta Ocho . Consultado el 29 de febrero de 2016 .
  7. ^ Thomas Awad, "Presentación de VUKOTA", PuckProspectus.com (20 de julio de 2009).
  8. ^ Gary Huckabay, "6–4–3: estándar de persona razonable", BaseballProspectus.com, 2 de agosto de 2002.
  9. ^ Rich Lederer, "Una entrevista sin filtrar con Nate Silver", Baseball Analysts, 12 de febrero de 2007.
  10. ^ "Folleto de béisbol | Glosario". legado.baseballprospectus.com .
  11. ^ Esta diferencia se explica e ilustra en Nate Silver, "Introtaining PECOTA", Baseball Prospectus 2003 , citado anteriormente.
  12. ^ http://www.baseballprospectus.com/unfiltered/?p=136. Consulte también la entrada del glosario de Baseball Prospectus para "Jugadores comparables".
  13. ^ Consulte PERA para ver un ejemplo del uso de estadísticas periféricas para estimar un desempeño.
  14. ^ Alan Schwarz , "Los números sugieren que los Mets están apostando por Zambrano", New York Times , 22 de agosto de 2004.
  15. ^ Alan Schwarz, "Predecir el futuro del béisbol y las desventajas de Damon", New York Times , 13 de noviembre de 2005.
  16. ^ Nate Silver, "Conceptos básicos de Baseball Prospectus: la ciencia de la previsión", BaseballProspectus.com, 11 de marzo de 2004.
  17. ^ William Hageman, "Béisbol en cifras", Chicago Tribune , 4 de enero de 2006.
  18. ^ Véase Clay Davenport, "DT's vs. MLEs - A Validation Study", BaseballProspectus.com, 30 de enero de 1998; Clay Davenport, "Traducciones de las ligas de invierno y otoño: ¿Qué tan buenas son estas ligas, de todos modos?" BaseballProspectus.com, 27 de enero de 2004; y Clay Davenport, "¡Allí! Una segunda revisión de la traducción de estadísticas japonesas y la traducción de la liga mexicana", Baseball Prospectus 2004 (Nueva York: Workman, 2004): 585–590.
  19. ^ Véase, por ejemplo, Clay Davenport, "Depth Charts", BaseballProspectus.com, 13 de mayo de 2009.
  20. ^ El ajuste por envejecimiento de PECOTA está implícito en el camino del desempeño "futuro" del conjunto de jugadores históricos "comparables".
  21. ^ Entre los principales sistemas de proyección alternativos basados ​​​​en estadísticas se encuentran las proyecciones Marcel de Tom Tango (disponibles y documentadas para 2007 en The Hardball Times); Diamond Mind Baseball , también descrito en un artículo de ESPN.com sobre las proyecciones del equipo de 2007; Baseball HQ de Ron Shandler y su libro anual, Baseball Forecaster ; Las previsiones de pretemporada del Hardball Times , inauguradas con la temporada 2007; "Chone Projections" de Chone Smith, publicado en el sitio web Fangraphs.com; Soluciones de información sobre béisbol – BIS; y Proyecciones "ZiPS" de Dan Szymborski . Para obtener una lista de sistemas de pronóstico conocidos a partir de 2014, incluido "Steamer", consulte este resumen de Fangraphs : "Projection Systems".
  22. ^ "cleveland.com: el plan de juego". Archivado desde el original el 10 de diciembre de 2007.
  23. ^ Pat Mitsch, "Los piratas esperan que 'The MITT' se ponga de moda", Pittsburgh Tribune-Review, 19 de julio de 2009 Archivado el 22 de julio de 2009 en Wayback Machine .
  24. ^ Nate Silver, "Presentando PECOTA", Baseball Prospectus 2003 , citado anteriormente.
  25. ^ "Chat sobre el prospecto de béisbol: Nate Silver", BaseballProspectus.com, 19 de enero de 2007.
  26. ^ Steven Goldman y Christina Kahrl , Eds., Baseball Prospectus 2008 (Nueva York: Plume, 2008), págs. viii-ix.
  27. ^ Nate Silver, "¿Es el funcionamiento base una habilidad?" BaseballProspectus.com, 29 de noviembre de 2007.
  28. ^ Eric Seidman, "PECOTA de temporada", BaseballProspectus.com, 23 de julio de 2009.
  29. ^ Colin Wyers, "Reintroducción de PECOTA: la ponderación es la parte más difícil", BaseballProspectus.com, 8 de febrero de 2012.
  30. ^ Colin Wyers, "Reintroducción de PECOTA", BaseballProspectus.com, 12 de marzo de 2012.
  31. ^ Chone Smith http://lanaheimangelfan.blogspot.com/2006/12/pecota.html
  32. ^ Nate Silver, "Resumen de proyecciones de bateadores de 2007", BaseballProspectus.com (4 de octubre de 2007).
  33. ^ Keith Woolner , "Valor de alineación marginal", StatHead.com.
  34. ^ Sobre la fórmula de Pythagenport, consulte Clay Davenport y Keith Woolner , "Revisiting the Pythagorean Theorem: Putting Bill James' Pythagorean Theorem To the Test", BaseballProspectus.com, 30 de junio de 1999, así como la entrada del glosario de Baseball Prospectus para "Pythagenport". [1]. Sobre la construcción de las tablas de profundidad para cada equipo y la aplicación de PECOTA para estimar las victorias del equipo, ver Nate Silver, "PECOTA Projects the American League", BaseballProspectus.com, 21 de marzo de 2005; y Nate Silver, "PECOTA Breaks Hearts", BaseballProspectus.com, 29 de marzo de 2006.
  35. ^ por ejemplo, Clay Davenport, "Clasificaciones proyectadas de PECOTA: vinculación de la temporada 2009", BaseballProspectus.com, 19 de febrero de 2009.
  36. ^ Véase Clay Davenport, "Informe de probabilidades de playoffs: la incorporación de PECOTA", BaseballProspectus.com, 3 de mayo de 2006 y Baseball Prospectus Statistics.
  37. ^ Nate Silver, "Projection Reflection", BaseballProspectus.com, 11 de octubre de 2006.
  38. ^ "Evaluación de las predicciones de la MLB de abril (2008)", VegasWatch.net, 21 de septiembre de 2008 y 28 de septiembre de 2008.
  39. ^ "Evaluación de las predicciones de la MLB de abril (2009)", VegasWatch, 28 de septiembre de 2009.
  40. ^ Nate Silver, "Bravos, los ángeles tienen más corazón", BaseballProspectus.com, 10 de marzo de 2007.
  41. ^ "Tomando el control de PECOTA", VegasWatch.net, 8 de febrero de 2009.

Fuentes