Agregación de creencias

La agregación de creencias , ^[1] también llamada agregación de riesgos, ^[2] agregación de opiniones ^[3] o agrupación de opiniones probabilísticas , ^[4] es un proceso en el que se combinan diferentes distribuciones de probabilidad, producidas por diferentes expertos, para producir una única distribución de probabilidad.

Fondo

Las opiniones de los expertos suelen ser inciertas. En lugar de decir, por ejemplo, "lloverá mañana", un experto en meteorología puede decir "lloverá con una probabilidad del 70% y hará sol con una probabilidad del 30%". Este tipo de afirmación se denomina creencia . Diferentes expertos pueden tener diferentes creencias; por ejemplo, un experto en meteorología diferente puede decir "lloverá con una probabilidad del 60% y hará sol con una probabilidad del 40%". En otras palabras, cada experto tiene una distribución de probabilidad subjetiva sobre un conjunto dado de resultados.

Una regla de agregación de creencias es una función que toma como entrada dos o más distribuciones de probabilidad sobre el mismo conjunto de resultados y devuelve una única distribución de probabilidad sobre el mismo espacio.

Aplicaciones

Las aplicaciones documentadas de la agregación de creencias incluyen:

Predicción de la actividad volcánica . ^[5]^[6]
Predicción de la probabilidad de un cambio climático abrupto . ^[7]
Predicción de la población futura de osos polares . ^[8]

Durante la pandemia de COVID-19, la Academia Europea de Neurología desarrolló un método de votación ad hoc de tres rondas para agregar opiniones de expertos y llegar a un consenso. ^[9]

Reglas comunes

Las reglas de agregación de creencias comunes incluyen:

Agregación lineal (también llamada regla de votación promedio ): selección de la media aritmética ponderada o no ponderada de los informes de los expertos.
Agregación geométrica : selección de la media geométrica ponderada o no ponderada de los informes.
Agregación multiplicativa : selección del producto de probabilidades.

Dietrich y List ^[4] presentan caracterizaciones axiomáticas de cada clase de reglas. Argumentan que la agregación lineal puede justificarse “procedimentalmente” pero no “epistémicamente”, mientras que las otras dos reglas pueden justificarse epistémicamente. La agregación geométrica se justifica cuando las creencias de los expertos se basan en la misma información, y la agregación multiplicativa se justifica cuando las creencias de los expertos se basan en información privada.

Propiedades de las reglas de agregación de creencias

Podría decirse que una regla de agregación de creencias debería satisfacer algunas propiedades deseables o axiomas:

La preservación del cero ^[3] significa que, si todos los expertos están de acuerdo en que un evento tiene probabilidad cero, entonces lo mismo debería cumplirse en la distribución agregada. Un axioma equivalente es la preservación del consenso ^[10] o la preservación de la certeza ^[1] , lo que significa que, si todos los expertos están de acuerdo en que un evento tiene probabilidad 1, entonces lo mismo debería cumplirse en la distribución agregada. Este es un axioma básico que se satisface mediante la agregación lineal, geométrica y multiplicativa, así como muchos otros.
La preservación de la plausibilidad significa que, si todos los expertos coinciden en que un evento tiene una probabilidad positiva, entonces lo mismo debería suceder en la distribución agregada. Este axioma se cumple mediante la agregación lineal.
Proporcionalidad significa que, si cada experto asigna una probabilidad de 1 a un único resultado, la distribución agregada es el promedio (o el promedio ponderado) de las creencias de los expertos. Este axioma se cumple mediante la agregación lineal.
La diversidad es más fuerte que la proporcionalidad. Esto significa que el respaldo de la distribución agregada contiene el respaldo de las creencias de todos los expertos. En otras palabras, si cualquier evento tiene una probabilidad positiva para al menos un experto, tiene una probabilidad positiva para la sociedad. Este axioma se satisface mediante la agregación lineal.

Reglas de agregación veraces con el dinero

La mayor parte de la literatura sobre agregación de creencias presupone que los expertos expresan sus creencias con honestidad, ya que su principal objetivo es ayudar a los responsables de la toma de decisiones a llegar a la verdad. En la práctica, los expertos pueden tener incentivos estratégicos. Por ejemplo, la FDA utiliza comités asesores y ha habido controversias debido a conflictos de intereses dentro de estos comités. ^[11] Por lo tanto, un mecanismo veraz para la agregación de creencias podría ser útil.

En algunos contextos, es posible pagar a los expertos una determinada suma de dinero, en función tanto de su creencia expresada como del resultado obtenido. Un diseño cuidadoso de la función de pago (a menudo denominada " regla de puntuación ") puede conducir a un mecanismo veraz. Existen varias reglas de puntuación veraces. ^[12]^[13]^[14]^[15]

Reglas de agregación veraces sin dinero

En algunos casos, las transferencias monetarias no son posibles. Por ejemplo, el resultado puede ocurrir en un futuro lejano o una decisión equivocada puede ser catastrófica.

Para desarrollar mecanismos veraces, es necesario hacer suposiciones sobre las preferencias de los expertos en el conjunto de distribuciones de probabilidad aceptadas. Si el espacio de preferencias posibles es demasiado rico, entonces los resultados de imposibilidad fuerte implican que el único mecanismo veraz es el mecanismo de la dictadura (véase el teorema de Gibbard-Satterthwaite ).

Preferencias de un solo pico

Una restricción de dominio útil es que los expertos tienen preferencias de un solo pico . Una regla de agregación se llama a prueba de estrategia unidimensional (1D-SP) si, siempre que todos los expertos tienen preferencias de un solo pico y someten sus picos a la regla de agregación, ningún experto puede imponer una distribución agregada estrictamente mejor informando un pico falso. Una propiedad equivalente se llama inflexibilidad: ^[16] dice que, si la creencia del experto i es menor que la distribución agregada, e i cambia su informe, entonces la distribución agregada será débilmente mayor; y viceversa.

Moulin ^[17] demostró una caracterización de todas las reglas 1D-SP, así como las dos caracterizaciones siguientes:

Una regla es anónima y 1D-SP para todas las preferencias de un solo pico si es equivalente a una regla de votación mediana con como máximo n +1 "fantasmas".
Una regla es anónima , 1D-SP y Pareto-eficiente para todas las preferencias de un solo pico si es equivalente a una regla de votación mediana con como máximo n -1 fantasmas.

Jennings, Laraki, Puppe y Varloot ^[18] presentan nuevas caracterizaciones de mecanismos a prueba de estrategias con preferencias de un solo pico.

Preferencias de un solo pico del pdf

Otra restricción del dominio de pico único es que los agentes tienen preferencias de pico único con métrica L1 en la función de densidad de probabilidad . Es decir: para cada agente i , existe una distribución de probabilidad "ideal" p _i , y su utilidad a partir de una distribución de probabilidad seleccionada p * es menos la distancia L1 entre p _i y p* . Una regla de agregación se llama L1-metric-strategyproof (L1-metric-SP) si siempre que todos los expertos tienen preferencias de pico único con métrica L1 y someten sus picos a la regla de agregación, ningún experto puede imponer una distribución agregada estrictamente mejor informando un pico falso. Se sugirieron varias reglas de agregación L1-metric-SP en el contexto de la agregación de propuestas presupuestarias :

Goel, Krishnaswamy y Sakshuwong ^[19] demostraron la existencia de una regla de agregación óptima de Pareto que es L1-métrica-SP;
Freeman, Pennock, Peters y Vaughan ^[20] presentaron una regla llamada fantasmas móviles , que es L1-métrica-SP y satisface una propiedad de equidad (pero no es Pareto-óptima). También presentaron una familia de reglas L1-métrica-SP basadas en la regla de la mediana .

Sin embargo, es posible que estas preferencias no sean adecuadas para la agregación de creencias, ya que son neutrales : no distinguen entre diferentes resultados. Por ejemplo, supongamos que hay tres resultados y la creencia del experto p _i asigna el 100% al resultado 1. Entonces, la métrica L1 entre p _i y "100% resultado 2" es 2, y la métrica L1 entre p _i y "100% resultado 3" también es 2. Lo mismo es válido para cualquier métrica neutral. Esto tiene sentido cuando 1, 2, 3 son partidas presupuestarias. Sin embargo, si estos resultados describen la fuerza potencial de un terremoto en la escala de Richter, entonces la distancia entre p _i y "100% resultado 2" debería ser mucho menor que la distancia al "100% resultado 3".

Preferencias de un solo pico en la cdf

Varloot y Laraki ^[1] estudian un dominio de preferencias diferente, en el que los resultados están ordenados linealmente y las preferencias tienen un único pico en el espacio de la función de distribución acumulativa (cdf) . Es decir: cada agente i tiene una función de distribución acumulativa ideal c _i y su utilidad depende negativamente de la distancia entre c _i y la distribución aceptada c*. Definen un nuevo concepto llamado nivel-estrategia a prueba de estrategia (Level-SP) , que es relevante cuando la decisión de la sociedad se basa en la cuestión de si la probabilidad de algún evento está por encima o por debajo de un umbral dado. El nivel-SP implica demostrablemente la estrategia a prueba de estrategia para una clase rica de preferencias de un único pico cdf. Caracterizan dos nuevas reglas de agregación:

Las reglas acumulativas de orden son las únicas reglas de agregación que satisfacen los requisitos de nivel SP, anonimato, preservación de la certeza y preservación de la plausibilidad. Un caso especial de esta familia es la acumulativa de orden intermedio , que es una acumulativa de orden basada en la mediana .
- Sin embargo, estas reglas no son diversas , por ejemplo: si tres expertos informan "99% resultado 1" y un experto informa "99% resultado 2", entonces cada regla acumulativa de orden elegirá "99% resultado 1" o "99% resultado 2"; sin embargo, un resultado como "75% resultado 1 y 25% resultado 2" es más razonable.
La regla proporcional-acumulativa es la única regla de agregación que satisface el nivel SP y la proporcionalidad. También maneja perfiles con dominaciones (donde la función de distribución acumulativa de cada agente i está completamente por encima o completamente por debajo de la función de distribución acumulativa de cualquier otro agente j ) de manera natural. Sin embargo, viola la preservación de la plausibilidad.

Otros resultados incluyen:

No existe una regla de agregación que satisfaga diversidad, Nivel-SP y unanimidad.
Cuando hay al menos 4 resultados, las únicas reglas que satisfacen el Nivel-SP, el Nivel-métrico-SP y la preservación de la certeza son las dictaduras (hay reglas que satisfacen el Nivel-SP y el Nivel-métrico-SP, pero no la preservación de la certeza; con 3 resultados, cada regla de nivel-SP es también el Nivel-métrico-SP).
La mayoría de los resultados se pueden ampliar para asignar diferentes pesos a diferentes expertos (que representan su nivel de experiencia).
Un nuevo método de votación: el voto mayoritario con incertidumbre (MJU). Se trata de una variante del voto mayoritario que permite a los electores expresar su incertidumbre sobre las cualidades de cada candidato.

Software

ANDURIL ^[21] es una caja de herramientas MATLAB para la agregación de creencias.

Véase también

Predicción de conjunto : en lugar de realizar una única previsión del tiempo más probable, se produce un conjunto (o conjunto) de previsiones, con el objetivo de dar una indicación del rango de posibles estados futuros de la atmósfera.
Programa de Estimación Contingente Agregativa : un programa de la Oficina de Análisis Incisivo que se ejecutó entre 2010 y 2015.
Asimilación de datos : disciplina matemática que busca combinar de forma óptima la teoría (generalmente en forma de modelo numérico) con las observaciones.
Regla de puntuación : se puede utilizar para incentivar la agregación de creencias veraces.
Fusión de sensores : combinación de datos de sensores de fuentes dispares.
Agregación de propuestas presupuestarias : un problema similar en el que cada experto informa su asignación presupuestaria ideal y el objetivo es agregar los informes a una asignación presupuestaria común.
Fusión de creencias : similar a la agregación de creencias, excepto que las creencias están dadas por fórmulas lógicas en lugar de distribuciones de probabilidad.

Lectura adicional

Hay varios libros disponibles sobre temas relacionados. ^[22]^[23]^[3]

Referencias

^ abc Varloot, Estelle Marine; Laraki, Rida (13 de julio de 2022). "Mecanismos de agregación de creencias a prueba de estrategias de nivel". Actas de la 23.ª Conferencia de la ACM sobre economía y computación . EC '22. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 335–369. doi :10.1145/3490486.3538309. ISBN 978-1-4503-9150-4.
^ Boyer-Kassem, Thomas (enero de 2019). «Experiencia científica y agregación de riesgos». Filosofía de la ciencia . 86 (1): 124–144. doi :10.1086/701071. ISSN 0031-8248.
^ abc Martini, Carlo; Sprenger, Jan (1 de enero de 2017), Boyer-Kassem, Thomas; Mayo-Wilson, Conor; Weisberg, Michael (eds.), "Agregación de opiniones y experiencia individual", Colaboración científica y conocimiento colectivo , Oxford University Press USA, págs. 180–201, ISBN 978-0-19-068053-4, consultado el 9 de noviembre de 2023
^ ab Dietrich, Franz; List, Christian (marzo de 2014). Agrupamiento probabilístico de opiniones (informe). Biblioteca Universitaria de Múnich, Alemania.
^ Aspinall, William P. (2006), "Obtención estructurada de juicios de expertos para la evaluación probabilística de peligros y riesgos en erupciones volcánicas", Estadísticas en vulcanología , The Geological Society of London en nombre de la Asociación Internacional de Vulcanología y Química del Interior de la Tierra, págs. 15-30, doi :10.1144/iavcei001.2, ISBN 978-1-86239-623-4, consultado el 9 de noviembre de 2023
^ Christophersen, Annemarie; Deligne, Natalia I.; Hanea, Anca M.; Chardot, Lauriane; Fournier, Nicolas; Aspinall, Willy P. (2018). "Modelado de redes bayesianas y obtención de expertos para la predicción probabilística de erupciones: estudio piloto para Whakaari/White Island, Nueva Zelanda". Fronteras en Ciencias de la Tierra . 6 . doi : 10.3389/feart.2018.00211 . hdl : 10356/85752 . ISSN 2296-6463.
^ Arnell, Nigel W.; Tompkins, Emma L.; Adger, W. Neil (diciembre de 2005). "Obtención de información de expertos sobre la probabilidad de un cambio climático rápido". Análisis de riesgos . 25 (6): 1419–1431. doi :10.1111/j.1539-6924.2005.00689.x. ISSN 0272-4332.
^ O'Neill, Saffron J.; Osborn, Tim J.; Hulme, Mike; Lorenzoni, Irene; Watkinson, Andrew R. (21 de octubre de 2008). "Uso del conocimiento experto para evaluar las incertidumbres en las futuras poblaciones de osos polares bajo el cambio climático". Journal of Applied Ecology . 45 (6): 1649–1659. doi :10.1111/j.1365-2664.2008.01552.x. ISSN 0021-8901.
^ von Oertzen, TJ; Macerollo, A.; Leona, MA; Beghi, E.; Crean, M.; Oztuk, S.; Bassetti, C.; Twardzik, A.; Bereczki, D.; Di Liberto, G.; Helbok, R.; Oreja-Guevara, C.; Pisani, A.; Sauerbier, A.; Sellner, J. (enero de 2021). "Declaración de consenso EAN para el tratamiento de pacientes con enfermedades neurológicas durante la pandemia de COVID-19". Revista europea de neurología . 28 (1): 7–14. doi :10.1111/ene.14521. ISSN 1351-5101. PMC 7675361 . PMID 33058321.
^ Dietrich, Franz; List, Christian (1 de abril de 2017). "Agrupamiento probabilístico de opiniones generalizado. Primera parte: agendas generales". Elección social y bienestar . 48 (4): 747–786. doi : 10.1007/s00355-017-1034-z . ISSN 1432-217X.
^ Elster, Jon (26 de junio de 2015). Secreto y publicidad en votaciones y debates. Cambridge University Press. ISBN 978-1-107-08336-3.
^ Good, IJ (enero de 1952). "Decisiones racionales". Revista de la Royal Statistical Society, Serie B (Metodológica) . 14 (1): 107–114. doi :10.1111/j.2517-6161.1952.tb00104.x. ISSN 0035-9246.
^ McCarthy, John (septiembre de 1956). "Medidas del valor de la información". Actas de la Academia Nacional de Ciencias . 42 (9): 654–655. doi : 10.1073/pnas.42.9.654 . ISSN 0027-8424. PMC 534271 . PMID 16589926.
^ Winkler, Robert L. (septiembre de 1969). "Reglas de puntuación y evaluación de evaluadores de probabilidad". Revista de la Asociación Estadounidense de Estadística . 64 (327): 1073–1078. doi :10.1080/01621459.1969.10501037. ISSN 0162-1459.
^ Friedman, Daniel (abril de 1983). "Reglas de puntuación efectivas para pronósticos probabilísticos". Management Science . 29 (4): 447–454. doi :10.1287/mnsc.29.4.447. ISSN 0025-1909.
^ Border, Kim C.; Jordan, JS (1983). "Elecciones sencillas, unanimidad y votantes fantasma". The Review of Economic Studies . 50 (1): 153–170. doi :10.2307/2296962. ISSN 0034-6527. JSTOR 2296962.
^ Moulin, H. (1980-01-01). "Sobre la estrategia a prueba y la existencia de un solo pico". Public Choice . 35 (4): 437–455. doi :10.1007/BF00128122. ISSN 1573-7101. S2CID 154508892.
^ Jennings, Andrew B.; Laraki, Rida; Puppe, Clemens; Varloot, Estelle M. (28 de agosto de 2023). "Nuevas caracterizaciones de la estrategia a prueba bajo un solo pico". Programación matemática . arXiv : 2102.11686 . doi : 10.1007/s10107-023-02010-x . ISSN 1436-4646.
^ Goel, Ashish; Krishnaswamy, Anilesh K.; Sakshuwong, Sukolsak; Aitamurto, Tanja (29 de julio de 2019). "Votación con mochila para presupuestos participativos". ACM Transactions on Economics and Computation . 7 (2): 8:1–8:27. arXiv : 2009.06856 . doi : 10.1145/3340230 . ISSN 2167-8375.
^ Freeman, Rupert; Pennock, David M.; Peters, Dominik; Wortman Vaughan, Jennifer (17 de junio de 2019). "Agregación veraz de propuestas presupuestarias". Actas de la Conferencia ACM de 2019 sobre Economía y Computación . EC '19. Nueva York, NY, EE. UU.: Association for Computing Machinery. págs. 751–752. arXiv : 1905.00457 . doi :10.1145/3328526.3329557. ISBN 978-1-4503-6792-9.
^ Leontaris, Georgios; Morales-Nápoles, Oswaldo (1 de enero de 2018). "ANDURIL — Una caja de herramientas de MATLAB para análisis y decisiones con incertidumbre: aprendizaje a partir de juicios de expertos". SoftwareX . 7 : 313–317. doi : 10.1016/j.softx.2018.07.001 . ISSN 2352-7110.
^ Cooke, Roger M. (24 de octubre de 1991). Expertos en incertidumbre: opinión y probabilidad subjetiva en la ciencia. Oxford University Press. ISBN 978-0-19-536237-4.
^ Armstrong, J. Scott, ed. (2001). "Principios de previsión". Serie internacional de investigación de operaciones y ciencia de la gestión . 30. doi :10.1007/978-0-306-47630-3. ISBN. 978-0-7923-7401-5. ISSN 0884-8289.