Hobart Peyton Young (nacido el 9 de marzo de 1945) es un teórico de juegos y economista estadounidense conocido por sus contribuciones a la teoría de juegos evolutiva y su aplicación al estudio del cambio institucional y tecnológico, así como a la teoría del aprendizaje en los juegos. Actualmente es profesor centenario en la London School of Economics , profesor emérito de Economía James Meade en la Universidad de Oxford , profesor asociado en el Nuffield College de Oxford y director de investigación en la Oficina de Investigación Financiera del Departamento del Tesoro de Estados Unidos .
Peyton Young fue nombrado miembro de la Econometric Society en 1995, miembro de la Academia Británica en 2007 y miembro de la Academia Estadounidense de las Artes y las Ciencias en 2018. Se desempeñó como presidente de la Game Theory Society de 2006 a 2008. [1] Ha publicado ampliamente sobre el aprendizaje en juegos, la evolución de las normas e instituciones sociales, la teoría de juegos cooperativos, la negociación, los impuestos y la asignación de costos, la representación política, los procedimientos de votación y la justicia distributiva.
En 1966 se graduó cum laude en estudios generales en la Universidad de Harvard . Completó un doctorado en Matemáticas en la Universidad de Michigan en 1970, donde se graduó con el premio de tesis Sumner B. Myers por su trabajo en matemáticas combinatorias .
Su primer puesto académico fue en la escuela de posgrado de la City University de Nueva York como profesor asistente y luego profesor asociado, de 1971 a 1976. De 1976 a 1982, Young fue investigador y vicepresidente de la División de Sistemas y Ciencias de la Decisión en el Instituto de Análisis de Sistemas Aplicados, Austria. Luego fue nombrado profesor de Economía y Políticas Públicas en la Escuela de Asuntos Públicos de la Universidad de Maryland, College Park de 1992 a 1994. Young fue profesor Scott & Barbara Black de Economía en la Universidad Johns Hopkins desde 1994, hasta que se mudó a Oxford como profesor James Meade de Economía en 2007. En 2004 fue presidente distinguido Fulbright en la Universidad de Siena . Ha sido profesor centenario en la London School of Economics desde 2015 y sigue siendo profesor asociado del Nuffield College, Oxford.
Los conceptos convencionales de estabilidad dinámica, incluido el concepto de estrategia evolutivamente estable , identifican estados a partir de los cuales pequeñas desviaciones puntuales se autocorrigen. Estos conceptos de estabilidad no son apropiados para analizar sistemas sociales y económicos que se ven constantemente perturbados por errores y comportamientos idiosincrásicos, y por shocks individuales y agregados en los pagos. Basándose en la teoría de grandes desviaciones para procesos temporales continuos de Freidlin y Wentzell (1984), Dean Foster y Peyton Young (1990) desarrollaron el concepto más poderoso de estabilidad estocástica : "El conjunto estocásticamente estable [SSS] es el conjunto de estados tales que, a largo plazo, es casi seguro que el sistema se encuentra dentro de cada conjunto abierto que contiene S a medida que el ruido tiende lentamente a cero" [p. 221]. Este concepto de solución creó un gran impacto en la economía y la teoría de juegos después de que Young (1993) desarrollara una versión más manejable de la teoría para cadenas de Markov generales de estados finitos. Un estado es estocásticamente estable si atrae un peso positivo en la distribución estacionaria de la cadena de Markov. Young desarrolla potentes herramientas de teoría de grafos para identificar los estados estocásticamente estables.
En un influyente libro, Individual Strategy and Social Structure (Estrategia individual y estructura social) , Young ofrece una exposición clara y concisa de los principales resultados en el campo de la teoría de juegos evolutivos estocásticos, de la que fue pionero. Presenta su modelo de interacciones sociales llamado "juego adaptativo". Los agentes son seleccionados aleatoriamente de una gran población para jugar un juego fijo. Eligen una mejor respuesta miope, basándose en una muestra aleatoria de jugadas anteriores del juego. La evolución de la historia (limitada) del juego se describe mediante una cadena de Markov finita. El comportamiento idiosincrásico o los errores perturban constantemente el proceso, de modo que cada estado es accesible desde todos los demás. Esto significa que la cadena de Markov es ergódica, por lo que existe una distribución estacionaria única que caracteriza el comportamiento a largo plazo del proceso. Un trabajo reciente de Young y coautores descubre que la dinámica evolutiva de este y otros tipos puede transitar rápidamente de equilibrios localmente estables a equilibrios estocásticamente estables, cuando las perturbaciones son pequeñas pero no desaparecen (Arieli y Young 2016, Kreindler y Young 2013, Kreindler y Young 2014).
La teoría se utiliza para demostrar que en los juegos de coordinación 2x2, el equilibrio de riesgo dominante se jugará prácticamente todo el tiempo, a medida que el tiempo tiende al infinito. También proporciona una prueba formal del resultado de Thomas Schelling (1971) de que la segregación residencial surge a nivel social incluso si ningún individuo prefiere ser segregado. Además, la teoría "demuestra cómo los conceptos de solución de alta racionalidad en la teoría de juegos pueden surgir en un mundo poblado por agentes de baja racionalidad" [p. 144]. En los juegos de negociación, Young demuestra que las soluciones de negociación de Nash (1950) y Kalai-Smorodinsky (1975) surgen de las acciones descentralizadas de agentes racionalmente limitados sin conocimiento común.
Mientras que la teoría de juegos evolutiva estudia el comportamiento de grandes poblaciones de agentes, la teoría del aprendizaje en los juegos se centra en si las acciones de un pequeño grupo de jugadores terminan ajustándose a alguna noción de equilibrio. Este es un problema desafiante, porque los sistemas sociales son autorreferenciales : el acto de aprender cambia lo que se aprende. Existe una retroalimentación compleja entre las creencias de un jugador, sus acciones y las acciones de los demás, lo que hace que el proceso de generación de datos sea extremadamente no estacionario . Young ha hecho numerosas contribuciones a esta literatura. Foster y Young (2001) demuestran el fracaso de las reglas de aprendizaje bayesianas para aprender equilibrios mixtos en juegos de información incierta. Foster y Young (2003) introducen un procedimiento de aprendizaje en el que los jugadores forman hipótesis sobre las estrategias de sus oponentes, que ocasionalmente prueban contra el juego pasado de sus oponentes. Al alejarse de la racionalidad de esta manera, Foster y Young muestran que existen procedimientos de aprendizaje naturales y robustos que conducen al equilibrio de Nash en juegos de forma normal general.
La literatura reciente sobre el aprendizaje en juegos se revisa en el libro de Young de 2004, Strategic Learning and its Limits .
En una serie de artículos, Young ha aplicado las técnicas de la teoría de juegos evolutivos estocásticos al estudio de las normas sociales (véase Young 2015 para una reseña). La teoría identifica cuatro características clave de la dinámica de las normas.
(1) Persistencia : una vez establecidas las normas, persisten durante largos períodos de tiempo a pesar de las condiciones externas cambiantes.
(2) Cambios de tendencia : cuando las normas cambian, lo hacen de repente. Las desviaciones de una norma establecida pueden ocurrir de manera gradual al principio. Sin embargo, una vez que se forma una masa crítica de desviaciones, el proceso se invierte y una nueva norma se difunde rápidamente entre la población.
(3) Compresión : las normas implican que el comportamiento (por ejemplo, las edades de jubilación, los contratos de reparto de cosechas) muestra un mayor grado de conformidad y una menor capacidad de respuesta a las condiciones económicas que lo predicho por los modelos económicos estándar.
(4) Conformidad local/diversidad global : una norma es uno de los muchos equilibrios posibles. La compresión implica que los individuos que están estrechamente conectados se ajustan bastante a una norma particular. Al mismo tiempo, la presencia de múltiples equilibrios implica que los individuos menos estrechamente conectados en la población podrían llegar a una norma muy diferente.
Estas predicciones se confirman en trabajos empíricos. En el estudio de Young y Burke (2001) sobre los contratos de reparto de cosechas en Illinois, en el que se utilizó información detallada sobre los términos de los contratos en varios miles de granjas de diferentes partes del estado, se descubrieron varias regularidades. En primer lugar, se observó una considerable compresión en los términos de los contratos: el 98% de todos los contratos implicaban divisiones de 1/2-1/2, 2/5-3/5 o 1/3-2/3. En segundo lugar, al dividir la muestra en granjas del norte y del sur de Illinois, Young y Burke descubrieron un alto grado de uniformidad en los contratos dentro de cada región, pero una variación significativa entre las regiones, lo que evidencia el efecto de conformidad local/diversidad global. En el norte de Illinois, la participación habitual era de 1/2-1/2. En el sur de Illinois, era de 1/3-2/3 o 2/5-3/5.
Young también ha hecho importantes contribuciones aplicadas a la comprensión de la difusión de nuevas ideas, tecnologías y prácticas en una población. La difusión de normas sociales particulares puede analizarse dentro del mismo marco. En el transcurso de varios artículos (Young 2003, Young 2011, Kreindler y Young 2014), Young ha demostrado cómo la topología de una red social afecta la tasa y la naturaleza de la difusión bajo reglas de adopción particulares a nivel individual.
En un influyente artículo de 2009, Young centró su atención en la dinámica de difusión que puede resultar de diferentes reglas de adopción en una población bien mezclada. En particular, distinguió entre tres clases diferentes de modelos de difusión:
(1) Contagio : Los individuos adoptan una innovación (una nueva idea, producto o práctica) después del contacto con adoptantes existentes.
(2) Influencia social : Es probable que los individuos adopten una innovación cuando una masa crítica de individuos en su grupo la ha adoptado.
(3) Inclinación social : los individuos observan los beneficios de los adoptantes y adoptan la innovación cuando estos beneficios son suficientemente altos.
El tercer proceso de adopción es el más relacionado con la optimización del comportamiento y, por lo tanto, con los enfoques habituales en economía. Sin embargo, los dos primeros procesos son los que se analizan en la vasta literatura sociológica y de marketing sobre el tema.
Young caracterizó la dinámica media de cada uno de estos procesos bajo formas generales de heterogeneidad en las creencias y preferencias individuales. Si bien cada una de las dinámicas produce una curva de adopción familiar en forma de S, Young mostró cómo el proceso de adopción subyacente puede inferirse a partir de la curva de adopción agregada. Resulta que cada proceso deja una huella distinta. Recurriendo a los datos sobre la adopción del maíz híbrido en los Estados Unidos, Young presentó evidencia de una aceleración superexponencial en las primeras etapas de la adopción, un sello distintivo del aprendizaje social.
Young (1985) ha aportado una axiomatización del valor de Shapley . Se considera una pieza clave [2] para entender la relación entre el principio de marginalidad y el valor de Shapley. Young demuestra que el valor de Shapley es el único concepto de solución simétrica y eficiente que se calcula únicamente a partir de las contribuciones marginales de un jugador en un juego cooperativo . En consecuencia, el valor de Shapley es la única solución eficiente y simétrica que satisface la monotonía que requiere que siempre que la contribución de un jugador a todas las coaliciones aumenta débilmente, entonces la asignación de este jugador también debería aumentar débilmente. Esto justifica el valor de Shapley como la medida de la productividad de un jugador en un juego cooperativo y lo hace particularmente atractivo para los modelos de asignación de costos. [3] [4]
El método Kemeny-Young es un sistema de votación que utiliza papeletas preferenciales y recuentos de comparación por pares para identificar las opciones más populares en una elección. Es un método Condorcet porque si hay un ganador Condorcet, siempre se clasificará como la opción más popular.
El método Kemeny-Young fue desarrollado por John Kemeny en 1959. Young y Levenglick (1978) demostraron que este método era el único método neutral que satisfacía el reforzamiento y el criterio de Condorcet. En otros artículos (Young 1986, 1988, 1995, 1997), Young adoptó un enfoque epistémico para la agregación de preferencias: supuso que había un orden de preferencia objetivamente "correcto", pero desconocido, sobre las alternativas, y los votantes reciben señales ruidosas de este verdadero orden de preferencia (cf. el teorema del jurado de Condorcet ). Utilizando un modelo probabilístico simple para estas señales ruidosas, Young demostró que el método Kemeny-Young era el estimador de máxima verosimilitud del verdadero orden de preferencia. Young argumenta además que el propio Marqués de Condorcet conocía la regla de Kemeny-Young y su interpretación de máxima verosimilitud, pero no pudo expresar claramente sus ideas.