stringtranslate.com

Diseño de mecanismos

El diagrama de Stanley Reiter anterior ilustra un juego de diseño de mecanismos. El espacio superior izquierdo representa el espacio tipográfico y el espacio superior derecho X el espacio de resultados. La función de elección social asigna un perfil de tipo a un resultado. En los juegos de diseño de mecanismos, los agentes envían mensajes en un entorno de juego . El equilibrio del juego puede diseñarse para implementar alguna función de elección social .

El diseño de mecanismos es una rama de la economía , la teoría de la elección social y la teoría de juegos que se ocupa del diseño de juegos (o mecanismos) que implementan una función de elección social determinada cuando los jugadores actúan en su propio interés racional. Debido a que comienza al final del juego y luego avanza hacia atrás, a veces se le llama teoría de juegos inversa . [ cita necesaria ]

El diseño de mecanismos tiene amplias aplicaciones, incluidos dominios tradicionales de la economía como el diseño de mercados , pero también las ciencias políticas (a través de la teoría de la votación ) e incluso sistemas en red (como en el enrutamiento entre dominios ). [ cita necesaria ]

El diseño de mecanismos estudia conceptos de solución para una clase de juegos de información privada. Leonid Hurwicz explica que "en un problema de diseño, la función objetivo es lo principal, mientras que el mecanismo es lo desconocido. Por lo tanto, el problema de diseño es el inverso de la teoría económica tradicional, que típicamente se dedica al análisis del desempeño de una mecanismo dado." [1]

El Premio Nobel de Ciencias Económicas de 2007 fue otorgado a Leonid Hurwicz , Eric Maskin y Roger Myerson "por haber sentado las bases de la teoría del diseño de mecanismos". [2]

Intuición

En una clase interesante de juegos bayesianos , a un jugador, llamado "principal", le gustaría condicionar su comportamiento a información que otros jugadores conocen de forma privada. Por ejemplo, al director le gustaría saber la verdadera calidad de un automóvil usado que un vendedor está promocionando. No puede aprender nada simplemente preguntándole al vendedor, porque al vendedor le conviene distorsionar la verdad. Sin embargo, en el diseño de mecanismos, el director tiene una ventaja: puede diseñar un juego cuyas reglas influyan en otros para que actúen como él quisiera.

Sin la teoría del diseño de mecanismos, el problema del director sería difícil de resolver. Tendría que considerar todos los juegos posibles y elegir el que mejor influya en las tácticas de los demás jugadores. Además, el director tendría que sacar conclusiones de los agentes que puedan mentirle. Gracias al principio de revelación , el director sólo necesita considerar juegos en los que los agentes reportan verazmente su información privada.

Cimientos

Mecanismo

Un juego de diseño de mecanismos es un juego de información privada en el que uno de los agentes, llamado principal, elige la estructura de pagos. Siguiendo a Harsanyi  (1967), los agentes reciben "mensajes" secretos de la naturaleza que contienen información relevante para los pagos. Por ejemplo, un mensaje puede contener información sobre sus preferencias o la calidad de un bien a la venta. A esta información la llamamos "tipo" del agente (normalmente se indica y, en consecuencia, el espacio de tipos ). Luego, los agentes informan al director de un tipo (generalmente señalado con un sombrero ) que puede ser una mentira estratégica. Después del informe, el principal y los agentes reciben su pago de acuerdo con la estructura de pago elegida por el principal.

El horario del juego es:

  1. El director se compromete con un mecanismo que otorga un resultado en función del tipo reportado.
  2. Los agentes denuncian, posiblemente de forma deshonesta, un perfil tipo
  3. El mecanismo se ejecuta (los agentes reciben el resultado )

Para entender quién obtiene qué, es común dividir el resultado en una asignación de bienes y una transferencia de dinero, donde representa una asignación de bienes prestados o recibidos en función del tipo, y representa una transferencia monetaria en función de tipo.

Como punto de referencia, el diseñador suele definir lo que sucedería con la información completa. Definir unfunción de elección social que asigna el (verdadero) perfil de tipo directamente a la asignación de bienes recibidos o prestados,

Por el contrario, un mecanismo asigna el perfil de tipo reportado a un resultado (nuevamente, tanto una asignación de bienes como una transferencia de dinero ) .

Principio de revelación

Un mecanismo propuesto constituye un juego bayesiano (un juego de información privada) y, si se comporta bien, el juego tiene un equilibrio bayesiano de Nash . En el equilibrio los agentes eligen sus informes estratégicamente en función del tipo.

Es difícil resolver los equilibrios bayesianos en tal escenario porque implica resolver las estrategias de mejor respuesta de los agentes y la mejor inferencia a partir de una posible mentira estratégica. Gracias a un resultado radical llamado principio de revelación, sin importar el mecanismo, un diseñador puede [3] limitar la atención a los equilibrios en los que los agentes informan verazmente el tipo. El principio de revelación establece: "A cada equilibrio bayesiano de Nash corresponde un juego bayesiano con el mismo resultado de equilibrio pero en el que los jugadores informan verazmente el tipo".

Esto es extremadamente útil. El principio permite resolver un equilibrio bayesiano asumiendo que todos los jugadores informan verazmente el tipo (sujeto a una restricción de compatibilidad de incentivos ). De un solo golpe elimina la necesidad de considerar el comportamiento estratégico o la mentira.

Su prueba es bastante directa. Supongamos un juego bayesiano en el que la estrategia y la recompensa del agente son funciones de su tipo y de lo que hacen otros . Por definición, la estrategia de equilibrio del agente i es Nash en utilidad esperada:

Simplemente defina un mecanismo que induciría a los agentes a elegir el mismo equilibrio. La más fácil de definir es que el mecanismo se comprometa a aplicar las estrategias de equilibrio de los agentes por ellos.

Bajo tal mecanismo, los agentes, por supuesto, encuentran óptimo revelar el tipo, ya que el mecanismo juega las estrategias que encontraron óptimas de todos modos. Formalmente, elija tal que

Implementabilidad

El diseñador de un mecanismo generalmente espera:

Implementar una función de elección social es encontrar alguna función de transferencia que motive a los agentes a elegir . Formalmente, si el perfil de la estrategia de equilibrio bajo el mecanismo se corresponde con la misma asignación de bienes que una función de elección social,

decimos que el mecanismo implementa la función de elección social.

Gracias al principio de revelación, el diseñador normalmente puede encontrar una función de transferencia para implementar una elección social resolviendo un juego de verdad asociado. Si los agentes consideran óptimo informar verazmente el tipo,

decimos que tal mecanismo es verdaderamente implementable (o simplemente "implementable"). La tarea entonces es encontrar una función de transferencia verdaderamente implementable e imputarla al juego original. Una asignación es verdaderamente implementable si existe una función de transferencia tal que

que también se denomina restricción de compatibilidad de incentivos (CI).

En las aplicaciones, la condición del IC es la clave para describir la forma de cualquier forma útil. En determinadas condiciones, puede incluso aislar analíticamente la función de transferencia. Además, a veces se agrega una restricción de participación ( racionalidad individual ) si los agentes tienen la opción de no jugar.

Necesidad

Considere un entorno en el que todos los agentes tienen una función de utilidad contingente al tipo . Considere también una asignación de bienes que tiene un valor vectorial y un tamaño (que permite una cantidad de bienes) y suponga que es continua por partes con respecto a sus argumentos.

La función es implementable sólo si

siempre que y y x sea continua en . Esta es una condición necesaria y se deriva de las condiciones de primer y segundo orden del problema de optimización del agente suponiendo que se diga la verdad.

Su significado se puede entender en dos partes. La primera parte dice que la tasa marginal de sustitución (TMS) del agente aumenta en función del tipo,

En resumen, los agentes no dirán la verdad si el mecanismo no ofrece un mejor trato a los agentes de mayor rango. De lo contrario, los tipos superiores que se enfrentan a cualquier mecanismo que castigue a los tipos superiores por informar mentirán y declararán que son tipos inferiores, violando la restricción de decir la verdad del CI. La segunda parte es una condición de monotonicidad esperando a suceder,

lo cual, para ser positivo, significa que a los tipos superiores se les debe dar más del bien.

Existe la posibilidad de que las dos piezas interactúen. Si para algún rango de tipos el contrato ofreciera menos cantidad a tipos más altos , es posible que el mecanismo pueda compensar dando un descuento a los tipos más altos. Pero ese contrato ya existe para agentes de bajo nivel, por lo que esta solución es patológica. Esta solución a veces ocurre en el proceso de resolver un mecanismo. En estos casos hay que “plancharlo”. En un entorno de bienes múltiples, también es posible que el diseñador recompense al agente con más de un bien para sustituir menos de otro (por ejemplo, mantequilla por margarina ). Los mecanismos de bienes múltiples son un problema constante en la teoría del diseño de mecanismos.

Suficiencia

Los documentos de diseño de mecanismos generalmente parten de dos suposiciones para garantizar la implementabilidad:

Esto se conoce con varios nombres: condición de cruce simple , condición de clasificación y condición de Spence-Mirrlees. Significa que la función de utilidad tiene una forma tal que la TMS del agente aumenta en tipo.

Esta es una condición técnica que limita la tasa de crecimiento de la TMS.

Estos supuestos son suficientes para establecer que cualquier monótono es implementable ( existe alguien que pueda implementarlo). Además, en el escenario de un solo bien, la condición de cruce simple es suficiente para establecer que sólo un monótono sea implementable, por lo que el diseñador puede limitar su búsqueda a un monótono .

Resultados destacados

Teorema de equivalencia de ingresos

Vickrey  (1961) ofrece un célebre resultado de que cualquier miembro de una gran clase de subastas asegura al vendedor los mismos ingresos esperados y que los ingresos esperados son los mejores que el vendedor puede hacer. Este es el caso si

  1. Los compradores tienen funciones de valoración idénticas (que pueden ser una función del tipo)
  2. Los tipos de compradores se distribuyen de forma independiente.
  3. Los tipos de compradores se extraen de una distribución continua.
  4. La distribución de tipos lleva la propiedad de tasa de riesgo monótona.
  5. El mecanismo vende el bien al comprador con mayor valoración.

La última condición es crucial para el teorema. Una implicación es que para que el vendedor obtenga mayores ingresos debe arriesgarse a entregar el artículo a un agente con una valoración más baja. Por lo general, esto significa que debe correr el riesgo de no vender el artículo en absoluto.

Mecanismos de Vickrey-Clarke-Groves

El modelo de subasta de Vickrey (1961) fue posteriormente ampliado por Clarke  (1971) y Groves para tratar un problema de elección pública en el que el costo de un proyecto público es asumido por todos los agentes, por ejemplo, si se construye o no un puente municipal. El mecanismo resultante "Vickrey-Clarke-Groves" puede motivar a los agentes a elegir la asignación socialmente eficiente del bien público incluso si los agentes tienen valoraciones conocidas de forma privada. En otras palabras, puede resolver la " tragedia de los bienes comunes ", bajo ciertas condiciones, en particular la utilidad cuasilineal o si no se requiere equilibrio presupuestario.

Consideremos un entorno en el que varios agentes tienen una utilidad cuasilineal con valoraciones privadas donde la moneda se valora linealmente. El diseñador de VCG diseña un mecanismo compatible con incentivos (por lo tanto, verdaderamente implementable) para obtener el perfil de tipo real, a partir del cual el diseñador implementa la asignación socialmente óptima.

La astucia del mecanismo VCG es la forma en que motiva la revelación veraz. Elimina los incentivos para informar erróneamente al penalizar a cualquier agente con el costo de la distorsión que causa. Entre los informes que puede hacer el agente, el mecanismo VCG permite un informe "nulo" que diga que es indiferente al bien público y que sólo se preocupa por la transferencia de dinero. Esto efectivamente elimina al agente del juego. Si un agente elige informar un tipo, el mecanismo VCG le cobra una tarifa al agente si su informe es fundamental , es decir, si su informe cambia la asignación óptima x para dañar a otros agentes. El pago se calcula

que suma la distorsión en las utilidades de los otros agentes (y no la suya) causada por el informe de un agente.

Teorema de Gibbard-Satterthwaite

Gibbard  (1973) y Satterthwaite  (1975) dan un resultado de imposibilidad similar en espíritu al teorema de imposibilidad de Arrow . Para una clase muy general de juegos, sólo se pueden implementar funciones de elección social "dictatoriales".

Una función de elección social f () es dictatorial si un agente siempre recibe su asignación de bienes más favorecida,

El teorema establece que, en condiciones generales, cualquier función de elección social verdaderamente implementable debe ser dictatorial si,

  1. X es finito y contiene al menos tres elementos.
  2. Las preferencias son racionales.

Teorema de Myerson-Satterthwaite

Myerson y Satterthwaite (1983) muestran que no existe una manera eficiente para que dos partes intercambien un bien cuando cada una tiene valoraciones secretas y que varían probabilísticamente del mismo, sin el riesgo de obligar a una de las partes a comerciar con pérdidas. Es uno de los resultados negativos más notables en economía: una especie de espejo negativo de los teoremas fundamentales de la economía del bienestar .

Valor de Shapley

Phillips y Marden (2018) demostraron que para los juegos de costos compartidos con funciones de costos cóncavas, la regla de costo compartido óptima que, en primer lugar, optimiza las ineficiencias del peor de los casos en un juego (el precio de la anarquía ) y luego, en segundo lugar, optimiza el mejor de los casos. resultados (el precio de la estabilidad ), es precisamente la regla de reparto de costos del valor de Shapley. [4] Una afirmación simétrica es igualmente válida para juegos de utilidad compartida con funciones de utilidad convexas.

Ejemplos

Discriminación de precios

Mirrlees  (1971) introduce un escenario en el que la función de transferencia t () es fácil de resolver. Debido a su relevancia y manejabilidad, es un escenario común en la literatura. Considere un entorno de un solo bien y un solo agente en el que el agente tiene una utilidad cuasilineal con un parámetro de tipo desconocido.

y en el que el principal tiene una CDF previa sobre el tipo de agente . El principal puede producir bienes a un costo marginal convexo c ( x ) y quiere maximizar el beneficio esperado de la transacción.

sujeto a condiciones IC e IR

El principal aquí es un monopolista que intenta establecer un esquema de precios que maximice las ganancias en el que no puede identificar el tipo de cliente. Un ejemplo común es el de una aerolínea que fija tarifas para viajeros de negocios, de placer y de estudiantes. Debido a la condición de IR, tiene que ofrecer a cada tipo un trato lo suficientemente bueno como para inducir la participación. Debido a la condición de IC, tiene que darle a cada tipo un trato lo suficientemente bueno como para que el tipo prefiera su trato al de cualquier otro.

Un truco dado por Mirrlees (1971) es utilizar el teorema de la envolvente para eliminar la función de transferencia de la expectativa de que se maximice,

integrando,

¿ Dónde hay algún tipo de índice? Reemplazando el incentivo compatible en el maximando,

después de una integración por partes. Esta función se puede maximizar puntualmente.

Debido a que es compatible con incentivos, el diseñador ya puede eliminar la restricción de CI. Si la función de utilidad satisface la condición de Spence-Mirrlees, entonces existe una función monótona. La restricción IR se puede comprobar en el equilibrio y la tabla de tarifas puede aumentarse o reducirse en consecuencia. Además, tenga en cuenta la presencia de una tasa de riesgo en la expresión. Si la distribución de tipos tiene la propiedad de índice de riesgo monótono, el FOC es suficiente para resolver t (). De lo contrario, entonces es necesario verificar si la restricción de monotonicidad (ver suficiencia, arriba) se cumple en todas partes a lo largo de las tablas de asignación y tarifas. De lo contrario, el diseñador debe utilizar el planchado Myerson.

planchado myerson

Es posible encontrar una tabla de bienes o precios que satisfaga las condiciones de primer orden pero que no sea monótona. Si es así, es necesario "planchar" el cronograma eligiendo algún valor al cual aplanar la función.

En algunas aplicaciones, el diseñador puede resolver las condiciones de primer orden para los programas de precios y asignación, pero descubrir que no son monótonas. Por ejemplo, en un entorno cuasilineal esto sucede a menudo cuando el índice de riesgo no es monótono en sí mismo. Según la condición de Spence-Mirrlees, el precio óptimo y los programas de asignación deben ser monótonos, por lo que el diseñador debe eliminar cualquier intervalo en el que el programa cambie de dirección aplanándolo.

Intuitivamente, lo que sucede es que el diseñador considera óptimo agrupar ciertos tipos y darles el mismo contrato. Normalmente, el diseñador motiva a los tipos superiores a distinguirse ofreciéndoles un mejor trato. Si no hay suficientes tipos superiores en el margen, el diseñador no considera que valga la pena otorgar a los tipos inferiores una concesión (llamada renta de información) para cobrar a los tipos superiores un contrato específico de tipo.

Considere un principal monopolista que vende a agentes con utilidad cuasilineal, el ejemplo anterior. Supongamos que el programa de asignación que satisface las condiciones de primer orden tiene un único pico interior en y un único valle interior en , ilustrado a la derecha.

Prueba

La prueba utiliza la teoría del control óptimo. Considera el conjunto de intervalos en la región no monótona sobre los cuales podría aplanarse el cronograma. Luego escribe un hamiltoniano para obtener las condiciones necesarias para a dentro de los intervalos

  1. que sí satisface la monotonicidad
  2. para el cual la restricción de monotonicidad no es vinculante en los límites del intervalo

La condición dos garantiza que el problema de control óptimo se vuelva a conectar con el cronograma del problema original en los límites del intervalo (sin saltos). Cualquiera que satisfaga las condiciones necesarias debe ser plano porque debe ser monótono y, sin embargo, reconectarse en los límites.

Como antes, maximizar el pago esperado del principal, pero esta vez sujeto a la restricción de monotonicidad.

y usar un hamiltoniano para hacerlo, con precio sombra

donde es una variable de estado y el control. Como es habitual en el control óptimo, la ecuación de evolución de costos debe satisfacer

Aprovechando la condición 2, tenga en cuenta que la restricción de monotonicidad no es vinculante en los límites del intervalo,

lo que significa que la condición de la variable costate se puede integrar y también es igual a 0

La distorsión promedio del excedente del principal debe ser 0. Para aplanar la tabla, encuentre un tal que su imagen inversa se corresponda con un intervalo que satisfaga la condición anterior.

Ver también

Notas

  1. ^ L. Hurwicz y S. Reiter (2006) Diseño de mecanismos económicos , p. 30
  2. ^ "Premio Sveriges Riksbank de Ciencias Económicas en memoria de Alfred Nobel 2007" (Presione soltar). Fundación Nobel . 15 de octubre de 2007 . Consultado el 15 de agosto de 2008 .
  3. ^ En circunstancias inusuales, algunos juegos que dicen la verdad tienen más equilibrios que el juego bayesiano del que se trazaron. Véase Fudenburg-Tirole, cap. 7.2 para algunas referencias.
  4. ^ Phillips, Mateo; Marden, Jason R. (julio de 2018). "Compensaciones de diseño en juegos cóncavos de costos compartidos". Transacciones IEEE sobre control automático . 63 (7): 2242–2247. doi :10.1109/tac.2017.2765299. ISSN  0018-9286. S2CID  45923961.

Referencias

Otras lecturas

enlaces externos