stringtranslate.com

Valor de Shapley

Lloyd Shapley en 2012

El valor de Shapley es un concepto de solución en la teoría de juegos cooperativos . Fue nombrado en honor a Lloyd Shapley , quien lo introdujo en 1951 y ganó el Premio Nobel de Ciencias Económicas por él en 2012. [1] [2] A cada juego cooperativo le asigna una distribución única (entre los jugadores) de un excedente total generado por la coalición de todos los actores. El valor de Shapley se caracteriza por un conjunto de propiedades deseables. Hart (1989) ofrece un estudio del tema. [3] [4]

Definicion formal

Formalmente, un juego de coalición se define como: Hay un conjunto N (de n jugadores) y una función que asigna subconjuntos de jugadores a los números reales: , con , donde denota el conjunto vacío. La función se llama función característica.

La función tiene el siguiente significado: si S es una coalición de jugadores, entonces ( S ), llamado valor de la coalición S , describe la suma total esperada de pagos que los miembros pueden obtener mediante la cooperación.

El valor de Shapley es una forma de distribuir las ganancias totales entre los jugadores, asumiendo que todos colaboran. Es una distribución "justa" en el sentido de que es la única distribución con ciertas propiedades deseables que se enumeran a continuación. Según el valor de Shapley, [5] la cantidad que se le da al jugador i en un juego de coalición es

donde n es el número total de jugadores y la suma se extiende a todos los subconjuntos S de N que no contienen al jugador i , incluido el conjunto vacío. Tenga en cuenta también que es el coeficiente binomial . La fórmula se puede interpretar de la siguiente manera: imagine que la coalición se forma un actor a la vez, con cada actor exigiendo su contribución como compensación justa, y luego, para cada actor, tome el promedio de esta contribución sobre las posibles diferentes permutaciones en las que se forma la coalición. se puede formar.

Una fórmula equivalente alternativa para el valor de Shapley es:

donde la suma abarca todos los órdenes de los jugadores y es el conjunto de jugadores que preceden en el orden . Finalmente, también se puede expresar como

que puede interpretarse como

En términos de sinergia

A partir de la función característica se puede calcular la sinergia que proporciona cada grupo de jugadores. La sinergia es la única función , tal que

para cualquier subconjunto de jugadores. En otras palabras, el "valor total" de la coalición proviene de resumir las sinergias de cada posible subconjunto de .

Dada una función característica , la función de sinergia se calcula mediante

utilizando el principio de exclusión de inclusión . En otras palabras, la sinergia de la coalición es el valor que aún no está representado por sus subconjuntos.

Los valores de Shapley están dados en términos de la función de sinergia por [6] [7]

donde la suma abarca todos los subconjuntos de ese jugador incluido .

Esto puede interpretarse como

En otras palabras, la sinergia de cada coalición se divide equitativamente entre todos los miembros.

Ejemplos

Ejemplo de negocio

Considere una descripción simplificada de una empresa. Un propietario, o , proporciona un capital crucial en el sentido de que, sin él, no se pueden obtener ganancias. Hay m trabajadores w 1 ,..., w m , cada uno de los cuales aporta una cantidad p a la ganancia total. Dejar

La función de valor de este juego de coalición es

Calcular el valor de Shapley para este juego de coalición conduce a un valor dediputado/2para el dueño ypag/2para cada uno de los m trabajadores.

Esto puede entenderse desde la perspectiva de la sinergia. La función de sinergia es

de modo que las únicas coaliciones que generan sinergia son las individuales entre el propietario y cualquier trabajador individual.

Usando la fórmula anterior para el valor de Shapley en términos de calculamos

y

El resultado también puede entenderse desde la perspectiva del promedio de todos los pedidos. Un trabajador determinado se une a la coalición después del propietario (y por lo tanto contribuye p ) en la mitad de los pedidos y, por lo tanto, hace una contribución promedio de al unirse. Cuando el propietario se une, en promedio la mitad de los trabajadores ya se han afiliado, por lo que la contribución promedio del propietario al unirse es de .

juego de guantes

El juego del guante es un juego de coalición en el que los jugadores tienen guantes para la mano izquierda y la derecha y el objetivo es formar parejas. Dejar

donde los jugadores 1 y 2 tienen guantes para la mano derecha y el jugador 3 tiene un guante para la mano izquierda.

La función de valor de este juego de coalición es

La fórmula para calcular el valor de Shapley es

donde R es un orden de los jugadores y es el conjunto de jugadores en N que preceden a i en el orden R.

La siguiente tabla muestra las contribuciones marginales del Jugador 1.

Observar

Mediante un argumento de simetría se puede demostrar que

Debido al axioma de eficiencia, la suma de todos los valores de Shapley es igual a 1, lo que significa que

Propiedades

El valor de Shapley tiene muchas propiedades deseables. En particular, es la única regla de pago que satisface las cuatro propiedades de eficiencia, simetría, linealidad y jugador nulo. [8] Véase [9] : 147–156  para obtener más caracterizaciones del valor de Shapley.

Eficiencia

La suma de los valores de Shapley de todos los agentes es igual al valor de la gran coalición, de modo que toda la ganancia se distribuye entre los agentes:

Prueba :

puesto que es una suma telescópica y hay |N|! diferentes ordenamientos R .

Simetría

Si y son dos actores que son equivalentes en el sentido de que

para cada subconjunto del cual no contiene ni ni , entonces .

Esta propiedad también se denomina trato igualitario entre iguales .

Linealidad

Si se combinan dos juegos de coalición descritos por funciones de ganancia y , entonces las ganancias distribuidas deben corresponder a las ganancias derivadas de y a las ganancias derivadas de :

por cada en  . Además, para cualquier número real ,

por cada en  .

jugador nulo

El valor de Shapley de un jugador nulo en un juego es cero. Un jugador es nulo en if para todas las coaliciones que no contengan .

Prueba independiente

Si es una función de conjunto subaditivo , es decir , entonces para cada agente :.

De manera similar, si es una función de conjunto superaditiva , es decir , entonces para cada agente :.

Entonces, si la cooperación tiene externalidades positivas, todos los agentes (débilmente) ganan, y si tiene externalidades negativas, todos los agentes (débilmente) pierden. [9] : 147-156 

Anonimato

Si y son dos agentes, y es una función de ganancia idéntica a excepto que los roles de y han sido intercambiados, entonces . Esto significa que el etiquetado de los agentes no influye en la asignación de sus ganancias.

Marginalismo

El valor de Shapley se puede definir como una función que utiliza sólo las contribuciones marginales del jugador como argumentos.

Valor de Aumann-Shapley

En su libro de 1974, Lloyd Shapley y Robert Aumann ampliaron el concepto del valor de Shapley a juegos infinitos (definidos con respecto a una medida no atómica ), creando la fórmula de la diagonal. [10] Esto fue posteriormente ampliado por Jean-François Mertens y Abraham Neyman .

Como se vio anteriormente, el valor de un juego de n personas asocia a cada jugador la expectativa de su contribución al valor de la coalición o de los jugadores anteriores a él en un orden aleatorio de todos los jugadores. Cuando hay muchos jugadores y cada individuo desempeña sólo un papel menor, el conjunto de todos los jugadores que preceden a uno determinado se considera heurísticamente como una buena muestra de los jugadores, de modo que el valor de un jugador infinitesimal dado se considera "su" contribución a el valor de una muestra "perfecta" de la población de todos los jugadores.

Simbólicamente, si v es la función de valor de coalición que asocia a cada coalición c un subconjunto medido de un conjunto medible I , eso se puede pensar sin pérdida de generalidad.

donde denota el valor de Shapley del jugador infinitesimal ds en el juego, tI es una muestra perfecta del conjunto de todos los jugadores I que contiene una proporción t de todos los jugadores, y es la coalición obtenida después de que ds se une a tI . Ésta es la forma heurística de la fórmula diagonal .

Suponiendo cierta regularidad de la función de valor, por ejemplo suponiendo que v se puede representar como una función diferenciable de una medida no atómica en I , μ , con función de densidad , con ( la función característica de c ). En tales condiciones

,

como se puede mostrar aproximando la densidad mediante una función escalonada y manteniendo la proporción t para cada nivel de la función de densidad, y

La fórmula de la diagonal tiene entonces la forma desarrollada por Aumann y Shapley (1974)

Por encima de μ puede tener un valor vectorial (siempre que la función esté definida y sea diferenciable en el rango de μ , la fórmula anterior tiene sentido).

En el argumento anterior, si la medida contiene átomos ya no es cierto; es por eso que la fórmula diagonal se aplica principalmente a juegos no atómicos.

Se implementaron dos enfoques para extender esta fórmula diagonal cuando la función f ya no es derivable. Mertens vuelve a la fórmula original y toma la derivada de la integral beneficiándose así del efecto suavizante. Neyman adoptó un enfoque diferente. Volviendo a una aplicación elemental del enfoque de Mertens (1980): [11]

Esto funciona, por ejemplo, para juegos mayoritarios, mientras que la fórmula diagonal original no se puede utilizar directamente. Cómo Mertens extiende esto aún más identificando simetrías sobre las cuales el valor de Shapley debe ser invariante y promediando dichas simetrías para crear un mayor efecto de suavizado conmutando promedios con la operación derivada como se indicó anteriormente. [12] Un estudio sobre el valor no atómico se encuentra en Neyman (2002) [13]

Generalización a coaliciones

El valor de Shapley solo asigna valores a los agentes individuales. Se ha generalizado [14] para aplicar a un grupo de agentes C como,

En términos de la función de sinergia anterior, esto dice [6] [7]

donde la suma abarca todos los subconjuntos de ese contenido .

Esta fórmula sugiere la interpretación de que el valor de Shapley de una coalición debe considerarse como el valor de Shapley estándar de un solo jugador, si la coalición se trata como un solo jugador.

Valor de un jugador para otro jugador

El valor de Shapley se descompuso en [15] en una matriz de valores

Cada valor representa el valor de jugador a jugador . Esta matriz satisface

es decir, el valor del jugador para todo el juego es la suma de su valor para todos los jugadores individuales.

En términos de la sinergia definida anteriormente, esto dice

donde la suma abarca todos los subconjuntos que contienen y .

Esto se puede interpretar como una suma de todos los subconjuntos que contienen jugadores y , donde para cada subconjunto se

En otras palabras, el valor de sinergia de cada coalición se divide equitativamente entre todos los pares de jugadores de esa coalición, donde genera superávit para .

En el aprendizaje automático

El valor de Shapley proporciona una forma basada en principios de explicar las predicciones de modelos no lineales comunes en el campo del aprendizaje automático . Al interpretar un modelo entrenado en un conjunto de características como una función de valor en una coalición de jugadores, los valores de Shapley proporcionan una forma natural de calcular qué características contribuyen a una predicción [16] o contribuyen a la incertidumbre de una predicción. [17] Esto unifica varios otros métodos, incluidas las explicaciones independientes del modelo interpretables localmente (LIME), [18] DeepLIFT, [19] y la propagación de relevancia por capas. [20]

Ver también

Referencias

  1. ^ Shapley, Lloyd S. (21 de agosto de 1951). "Notas sobre el juego de n personas - II: El valor de un juego de n personas" (PDF) . Santa Mónica, California: RAND Corporation.
  2. ^ Roth, Alvin E., ed. (1988). El valor de Shapley: ensayos en honor a Lloyd S. Shapley . Cambridge: Prensa de la Universidad de Cambridge. doi :10.1017/CBO9780511528446. ISBN 0-521-36177-X.
  3. ^ Hart, Sergiu (1989). "Valor de Shapley". En Eatwell, J.; Milgate, M.; Newman, P. (eds.). El nuevo Palgrave: teoría de juegos . Norton. págs. 210–216. doi :10.1007/978-1-349-20181-5_25. ISBN 978-0-333-49537-7.
  4. ^ Hart, Sergiu (12 de mayo de 2016). "Una bibliografía de juegos cooperativos: teoría del valor".
  5. ^ Para obtener una prueba de existencia única, consulte Ichiishi, Tatsuro (1983). Teoría de juegos para el análisis económico. Nueva York: Academic Press. págs. 118-120. ISBN 0-12-370180-5.
  6. ^ ab Grabisch, Michel (octubre de 1997). "Representaciones alternativas de medidas difusas discretas para la toma de decisiones". Revista internacional de incertidumbre, confusión y sistemas basados ​​en el conocimiento . 5 (5): 587–607. doi :10.1142/S0218488597000440. ISSN  0218-4885.
  7. ^ ab Grabisch, Michel (1 de diciembre de 1997). "Medidas difusas discretas aditivas de orden k y su representación". Conjuntos y sistemas difusos . 92 (2): 167–189. doi :10.1016/S0165-0114(97)00168-1. ISSN  0165-0114.
  8. ^ Shapley, Lloyd S. (1953). "Un valor para los juegos de n personas". En Kuhn, HW; Tucker, AW (eds.). Aportaciones a la Teoría de Juegos . Anales de estudios matemáticos. vol. 28. Prensa de la Universidad de Princeton. págs. 307–317. doi :10.1515/9781400881970-018. ISBN 9781400881970.
  9. ^ ab Hervé Moulin (2004). División Justa y Bienestar Colectivo . Cambridge, Massachusetts: MIT Press. ISBN 9780262134231.
  10. ^ Aumann, Robert J.; Shapley, Lloyd S. (1974). Valores de los juegos no atómicos . Princeton: Universidad de Princeton. Prensa. ISBN 0-691-08103-4.
  11. ^ Mertens, Jean-François (1980). "Valores y Derivados". Matemáticas de la Investigación de Operaciones . 5 (4): 523–552. doi :10.1287/moor.5.4.523. JSTOR  3689325.
  12. ^ Mertens, Jean-François (1988). "El valor de Shapley en el caso no diferenciable". Revista Internacional de Teoría de Juegos . 17 (1): 1–65. doi :10.1007/BF01240834. S2CID  118017018.
  13. ^ Neyman, A., 2002. Valor de los juegos con una cantidad infinita de jugadores, "Handbook of Game Theory with Economic Applications", Handbook of Game Theory with Economic Applications, Elsevier, edición 1, volumen 3, número 3, 00. RJ Aumann & S. Hart (ed.).[1]
  14. ^ Grabisch, Michel; Roubens, Marc (1999). "Una aproximación axiomática al concepto de interacción entre jugadores en juegos cooperativos". Revista Internacional de Teoría de Juegos . 28 (4): 547–565. doi :10.1007/s001820050125. S2CID  18033890.
  15. ^ Hausken, Kjell; Mohr, Matías (2001). "El valor de un jugador en juegos de n personas". Elección social y bienestar . 18 (3): 465–83. doi :10.1007/s003550000070. JSTOR  41060209. S2CID  27089088.
  16. ^ Lundberg, Scott M.; Lee, Su-In (2017). "Un enfoque unificado para interpretar las predicciones de los modelos". Avances en los sistemas de procesamiento de información neuronal . 30 : 4765–4774. arXiv : 1705.07874 . Consultado el 30 de enero de 2021 .
  17. ^ Watson, David; O'Hara, Joshua; Impuestos, Niek; Mudd, Richard; Chico, ido (2023). "Explicación de la incertidumbre predictiva con el teórico de la información Shapley" (PDF) . Avances en los sistemas de procesamiento de información neuronal . 37 . arXiv : 2306.05724 . Consultado el 19 de diciembre de 2023 .
  18. ^ Ribeiro, Marco Tulio; Singh, Sameer; Guestrín, Carlos (13 de agosto de 2016). ""¿Por qué debería confiar en ti?"". Actas de la 22.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos . Nueva York, NY, EE. UU.: ACM. págs. 1135–1144. doi :10.1145/2939672.2939778. ISBN 978-1-4503-4232-2.
  19. ^ Shrikumar, Avanti; Lado verde, Peyton; Kundaje, Anshul (17 de julio de 2017). "Aprender funciones importantes mediante la propagación de diferencias de activación". PMLR : 3145–3153. ISSN  2640-3498 . Consultado el 30 de enero de 2021 .
  20. ^ Bach, Sebastián; Carpeta, Alejandro; Montavon, Grégoire; Klauschen, Federico; Müller, Klaus-Robert ; Samek, Wojciech (10 de julio de 2015). Suárez, Oscar Deniz (ed.). "Sobre explicaciones en términos de píxeles para decisiones de clasificadores no lineales mediante propagación de relevancia en capas". MÁS UNO . 10 (7). Biblioteca Pública de Ciencias (PLoS): e0130140. Código Bib : 2015PLoSO..1030140B. doi : 10.1371/journal.pone.0130140 . ISSN  1932-6203. PMC 4498753 . PMID  26161953. 

Otras lecturas

enlaces externos