En el diseño de mecanismos , un mecanismo a prueba de estrategias (SP) es una forma de juego en la que cada jugador tiene una estrategia débilmente dominante , de modo que ningún jugador puede ganar "espiando" a los otros jugadores para saber qué van a jugar. Cuando los jugadores tienen información privada (por ejemplo, su tipo o su valor para algún elemento), y el espacio de estrategia de cada jugador consiste en los posibles valores de información (por ejemplo, posibles tipos o valores), un mecanismo veraz es un juego en el que revelar la información verdadera es una estrategia débilmente dominante para cada jugador. [1] : 244 Un mecanismo SP también se llama compatible con incentivos de estrategia dominante (DSIC) , [1] : 415 para distinguirlo de otros tipos de compatibilidad de incentivos .
Un mecanismo de SP es inmune a las manipulaciones de los jugadores individuales (pero no de las coaliciones). En cambio, en un mecanismo de grupo a prueba de estrategias , ningún grupo de personas puede coludirse para informar erróneamente sobre sus preferencias de una manera que beneficie a todos los miembros. En un mecanismo de grupo fuerte a prueba de estrategias, ningún grupo de personas puede coludirse para informar erróneamente sobre sus preferencias de una manera que beneficie al menos a un miembro del grupo sin perjudicar a ninguno de los miembros restantes. [2]
Ejemplos típicos de mecanismos SP son:
Ejemplos típicos de mecanismos que no son SP son:
SP también es aplicable en el enrutamiento de redes . [ cita requerida ] Considere una red como un gráfico donde cada borde (es decir, enlace) tiene un costo asociado de transmisión , conocido de forma privada por el propietario del enlace. El propietario de un enlace desea ser compensado por retransmitir mensajes. Como remitente de un mensaje en la red, uno quiere encontrar la ruta de menor costo. Hay métodos eficientes para hacerlo, incluso en redes grandes. Sin embargo, hay un problema: se desconocen los costos de cada enlace. Un enfoque ingenuo sería preguntarle al propietario de cada enlace el costo, usar estos costos declarados para encontrar la ruta de menor costo y pagar a todos los enlaces en la ruta sus costos declarados. Sin embargo, se puede demostrar que este esquema de pago no es SP, es decir, los propietarios de algunos enlaces pueden beneficiarse mintiendo sobre el costo. Podemos terminar pagando mucho más que el costo real. Se puede demostrar que dadas ciertas suposiciones sobre la red y los jugadores (propietarios de enlaces), una variante del mecanismo VCG es SP. [ cita requerida ]
Hay un conjunto de resultados posibles.
Existen agentes que tienen distintas valoraciones para cada resultado. La valoración del agente se representa como una función:
que expresa el valor que tiene cada alternativa, en términos monetarios.
Se supone que los agentes tienen funciones de utilidad cuasililineales ; esto significa que, si el resultado es y además el agente recibe un pago (positivo o negativo), entonces la utilidad total del agente es:
El vector de todas las funciones de valor se denota por .
Para cada agente , el vector de todas las funciones de valor de los otros agentes se denota por . Por lo tanto .
Un mecanismo es un par de funciones:
Un mecanismo se denomina a prueba de estrategias si, para cada jugador y para cada vector de valores de los demás jugadores :
Resulta útil contar con condiciones simples para comprobar si un mecanismo determinado es SP o no. En esta subsección se muestran dos condiciones simples que son necesarias y suficientes.
Si un mecanismo con transferencias monetarias es SP, entonces debe satisfacer las dos condiciones siguientes, para cada agente : [1] : 226
1. El pago al agente es una función del resultado elegido y de las valoraciones de los otros agentes , pero no una función directa de la propia valoración del agente . Formalmente, existe una función de precio que toma como entrada un resultado y un vector de valoración para los otros agentes y devuelve el pago para el agente , de modo que para cada , si:
entonces:
PRUEBA: Si entonces un agente con valoración prefiere informar , ya que le da el mismo resultado y un pago mayor; de manera similar, si entonces un agente con valoración prefiere informar .
Como corolario, existe una función de "precio", , que toma como entrada un resultado y un vector de valoración para los otros agentes , y devuelve el pago para el agente Para cada , si:
entonces:
2. El resultado seleccionado es óptimo para el agente , dadas las valoraciones de los demás agentes. Formalmente:
donde la maximización se aplica a todos los resultados en el rango de .
PRUEBA: Si hay otro resultado tal que , entonces un agente con valoración prefiere informar , ya que le da una utilidad total mayor.
Las condiciones 1 y 2 no sólo son necesarias sino también suficientes: cualquier mecanismo que satisfaga las condiciones 1 y 2 es SP.
PRUEBA: Fijar un agente y valoraciones . Denotar:
Por la propiedad 1, la utilidad del agente cuando juega honestamente es:
y la utilidad del agente cuando juega de forma deshonesta es:
Por propiedad 2:
Por lo tanto, una estrategia dominante para el agente es actuar con veracidad.
El objetivo real de un mecanismo es su función; la función de pago es sólo una herramienta para inducir a los jugadores a ser honestos. Por lo tanto, es útil saber, dada una determinada función de resultado, si se puede implementar utilizando un mecanismo SP o no (esta propiedad también se denomina implementabilidad ). [ cita requerida ]
La propiedad de monotonía es necesaria para la seguridad de las estrategias. [ cita requerida ]
Un dominio de un solo parámetro es un juego en el que cada jugador obtiene un valor positivo determinado por "ganar" y un valor 0 por "perder". Un ejemplo sencillo es una subasta de un solo artículo, en la que es el valor que el jugador asigna al artículo.
En este contexto, es fácil caracterizar los mecanismos de verdad. Empecemos con algunas definiciones.
Un mecanismo se denomina normalizado si cada oferta perdedora paga 0.
Un mecanismo se llama monótono si, cuando un jugador aumenta su apuesta, sus posibilidades de ganar aumentan (débilmente).
Para un mecanismo monótono, para cada jugador i y cada combinación de ofertas de los otros jugadores, hay un valor crítico en el cual el jugador pasa de perder a ganar.
Un mecanismo normalizado en un dominio de un solo parámetro es veraz si se cumplen las dos condiciones siguientes: [1] : 229–230
Existen diversas formas de extender la noción de veracidad a los mecanismos aleatorios. Son, de mayor a menor: [3] : 6–8
Universal implica DE fuerte, implica Lex implica DE débil, y todas las implicaciones son estrictas. [3] : Teoría 3.4
Para cada constante , un mecanismo aleatorio se llama veraz con probabilidad si para cada agente y para cada vector de ofertas, la probabilidad de que el agente se beneficie al ofertar de manera no veraz es como máximo , donde la probabilidad se toma sobre la aleatoriedad del mecanismo. [1] : 349
Si la constante tiende a 0 cuando el número de postores aumenta, entonces el mecanismo se denomina veraz con alta probabilidad . Este concepto es más débil que el de veracidad total, pero sigue siendo útil en algunos casos; véase, por ejemplo, la estimación por consenso .
Un nuevo tipo de fraude que se ha vuelto común con la abundancia de subastas en Internet son las ofertas con nombres falsos : ofertas presentadas por un solo postor que utiliza múltiples identificadores, como múltiples direcciones de correo electrónico.
La prueba de nombres falsos significa que no hay incentivos para que ninguno de los jugadores haga ofertas con nombres falsos. Este concepto es más fuerte que el de prueba de estrategia. En particular, la subasta Vickrey-Clarke-Groves (VCG) no es prueba de nombres falsos. [4]
La prueba de nombres falsos es muy diferente de la prueba de estrategias grupales porque supone que un individuo solo puede simular ciertos comportamientos que normalmente requieren la coordinación colusoria de múltiples individuos. [ cita requerida ] [ se necesita más explicación ]