Un teorema del jurado es un teorema matemático que demuestra que, bajo ciertos supuestos, una decisión obtenida mediante votación mayoritaria en un grupo grande tiene más probabilidades de ser correcta que una decisión tomada por un solo experto. Sirve como argumento formal a favor de la idea de la sabiduría de la multitud , de la decisión de cuestiones de hecho mediante juicios con jurado y de la democracia en general. [1]
El primer y más famoso teorema del jurado es el teorema del jurado de Condorcet . Se supone que todos los votantes tienen probabilidades independientes de votar por la alternativa correcta, estas probabilidades son mayores que 1/2 y son las mismas para todos los votantes. Bajo estos supuestos, la probabilidad de que la decisión mayoritaria sea correcta es estrictamente mayor cuando el grupo es más grande; y cuando el tamaño del grupo tiende a infinito, la probabilidad de que la decisión mayoritaria sea correcta tiende a 1.
Hay muchos otros teoremas del jurado que relajan algunos o todos estos supuestos.
La premisa de todos los teoremas del jurado es que existe una verdad objetiva , que los votantes desconocen. La mayoría de los teoremas se centran en cuestiones binarias (cuestiones con dos estados posibles), por ejemplo, si un determinado acusado es culpable o inocente, si una determinada acción va a subir o bajar, etc. Hay votantes (o jurados) y su objetivo es revelar la verdad. Cada votante tiene una opinión sobre cuál de las dos opciones es la correcta. La opinión de cada votante es correcta (es decir, igual al estado verdadero) o incorrecta (es decir, difiere del estado verdadero). Esto contrasta con otros entornos de votación , en los que la opinión de cada votante representa sus preferencias subjetivas y, por tanto, siempre es "correcta" para ese votante específico. La opinión de un votante puede considerarse una variable aleatoria : para cada votante, existe una probabilidad positiva de que su opinión sea igual a la verdadera.
La decisión del grupo está determinada por la regla de la mayoría . Por ejemplo, si una mayoría de votantes dice "culpable", entonces la decisión es "culpable", mientras que si una mayoría dice "inocente", entonces la decisión es "inocente". Para evitar empates, a menudo se supone que el número de votantes es impar. Alternativamente, si es par, entonces los empates se rompen lanzando una moneda justa .
Los teoremas del jurado están interesados en la probabilidad de corrección : la probabilidad de que la decisión mayoritaria coincida con la verdad objetiva. Los teoremas típicos del jurado hacen dos tipos de afirmaciones sobre esta probabilidad: [1]
La afirmación 1 a menudo se denomina parte no asintótica y la reivindicación 2 a menudo se denomina parte asintótica del teorema del jurado.
Obviamente, estas afirmaciones no siempre son ciertas, pero lo son bajo ciertos supuestos sobre los votantes. Los diferentes teoremas del jurado parten de diferentes suposiciones.
El teorema del jurado de Condorcet parte de los siguientes tres supuestos:
El teorema del jurado de Condorcet dice que estos tres supuestos implican una confiabilidad creciente y una infalibilidad colectiva.
Las opiniones de diferentes votantes a menudo están correlacionadas, por lo que la independencia incondicional puede no ser válida. En este caso, el reclamo de Fiabilidad Creciente podría fracasar.
Sea la probabilidad de que un jurado vote por la alternativa correcta y sea el coeficiente de correlación (de segundo orden) entre dos votos correctos cualesquiera. Si todos los coeficientes de correlación de orden superior en la representación de Bahadur [2] de la distribución de probabilidad conjunta de los votos son iguales a cero y son un par admisible, entonces la probabilidad de que el jurado llegue colectivamente a la decisión correcta por mayoría simple viene dada por:
¿Dónde está la función beta incompleta regularizada ?
Ejemplo: Tomemos un jurado de tres jurados , con competencia individual y correlación de segundo orden . Entonces . La competencia del jurado es inferior a la competencia de un solo jurado, lo que equivale a . Además, ampliar el jurado con dos miembros reduce aún más su competencia . Tenga en cuenta que y es un par de parámetros admisibles. Para y , el coeficiente de correlación de segundo orden máximo admisible es igual a .
El ejemplo anterior muestra que cuando la competencia individual es baja pero la correlación es alta:
El resultado anterior se debe a Kaniovski y Zaigraev. También analizan el diseño óptimo del jurado para jurados homogéneos con votos correlacionados. [3]
Hay varios teoremas del jurado que debilitan el supuesto de independencia de diversas maneras.
En los problemas de decisión binaria, suele haber una opción que es más fácil de detectar que la otra. Por ejemplo, puede ser más fácil detectar que un acusado es culpable (ya que hay pruebas claras de su culpabilidad) que detectar que es inocente. En este caso, la probabilidad de que la opinión de un solo votante sea correcta está representada por dos números diferentes: probabilidad dado que la opción número 1 es correcta y probabilidad dado que la opción número 2 es correcta. Esto también implica que las opiniones de diferentes votantes están correlacionadas . Esto motiva las siguientes flexibilizaciones de los supuestos anteriores:
La creciente confiabilidad y la infalibilidad de la multitud continúan manteniéndose bajo estos supuestos más débiles. [1]
Una crítica a la competencia condicional es que depende de la forma en que se formula la pregunta de decisión. Por ejemplo, en lugar de preguntar si el acusado es culpable o inocente, se puede preguntar si es culpable de exactamente 10 cargos (opción A), o culpable de otro número de cargos (0...9 o más de 11). Esto cambia las condiciones y, por tanto, la probabilidad condicional. Además, si el estado es muy específico, entonces la probabilidad de votar correctamente podría ser inferior a 1/2, por lo que la competencia condicional podría no ser válida. [4]
Otra causa de correlación entre votantes es la existencia de un líder de opinión . Supongamos que cada votante toma una decisión independiente, pero luego cada votante, con cierta probabilidad fija, cambia su opinión para coincidir con la del líder de opinión. Los teoremas del jurado de Boland [5] y Boland, Proschan y Tong [6] muestran que, si (y sólo si) la probabilidad de seguir al líder de opinión es menor que 1-1/2 p (donde p es el nivel de competencia de todos votantes), entonces se cumple la infalibilidad de la multitud.
Además de la dependencia de la opción verdadera, existen muchas otras razones por las cuales las opiniones de los votantes pueden estar correlacionadas. Por ejemplo:
Es posible debilitar el supuesto de Independencia Condicional y condicionarlo a todas las causas comunes de los votos (en lugar de solo al Estado). En otras palabras, los votos ahora son independientes y están condicionados al problema de decisión específico . Sin embargo, en un problema específico, el supuesto de Competencia Condicional puede no ser válido. Por ejemplo, en un problema específico con evidencia falsa, es probable que la mayoría de los votantes tengan una opinión equivocada. Por lo tanto, los dos supuestos -independencia condicional y competencia condicional- no son justificables simultáneamente (bajo la misma condicionalización). [7]
Una posible solución es debilitar la competencia condicional de la siguiente manera. Para cada votante y cada problema x , existe una probabilidad p ( x ) de que la opinión del votante sea correcta en este problema específico. Dado que x es una variable aleatoria, p ( x ) también es una variable aleatoria. La competencia condicional requiere que p ( x ) > 1/2 con probabilidad 1. El supuesto debilitado es:
Un teorema del jurado de Dietrich y Spiekerman [8] dice que la independencia condicional, la tendencia a la competencia y la uniformidad condicional implican en conjunto una confiabilidad creciente. Tenga en cuenta que la infalibilidad de la multitud no está implícita. De hecho, la probabilidad de corrección tiende a un valor inferior a 1, si y sólo si la Competencia Condicional no se cumple.
Un teorema del jurado de Pivato [9] muestra que, si la covarianza promedio entre votantes se vuelve pequeña a medida que la población crece, entonces se cumple la infalibilidad de masas (para alguna regla de votación). Existen otros teoremas del jurado que tienen en cuenta el grado en que los votos pueden estar correlacionados. [10] [11]
Otras formas de afrontar la correlación de votantes incluyen las redes causales , las estructuras de dependencia y la intercambiabilidad. [1] : 2.2
Los distintos votantes suelen tener diferentes niveles de competencia, por lo que el supuesto de uniformidad no se cumple. En este caso, tanto la confiabilidad creciente como la infalibilidad de la multitud pueden no ser válidas. Esto puede suceder si los nuevos votantes tienen una competencia mucho menor que los votantes existentes, de modo que agregar nuevos votantes disminuye la probabilidad de acierto del grupo. En algunos casos, la probabilidad de corrección puede converger a 1/2 (una decisión aleatoria) en lugar de 1. [12]
La uniformidad puede descartarse si se fortalece el supuesto de Competencia. Hay varias formas de fortalecerlo:
en lugar de suponer que la identidad de los votantes es fija, se puede suponer que existe un gran grupo de votantes potenciales con diferentes niveles de competencia, y que los votantes reales se seleccionan al azar de este grupo (como en el sorteo ).
Un teorema del jurado de Ben Yashar y Paroush [15] muestra que, bajo ciertas condiciones, la probabilidad de corrección de un jurado, o de un subconjunto del mismo elegido al azar, es mayor que la probabilidad de corrección de un solo miembro del jurado seleccionado al azar. Un teorema del jurado más general de Berend y Sapir [16] demuestra que la confiabilidad creciente se cumple en este escenario: la probabilidad de corrección de un comité aleatorio aumenta con el tamaño del comité. El teorema se cumple, bajo ciertas condiciones, incluso con votos correlacionados. [17]
Un teorema del jurado de Owen, Grofman y Feld [18] analiza un escenario donde el nivel de competencia es aleatorio. Muestran qué distribución de competencia individual maximiza o minimiza la probabilidad de corrección.
Cuando se conocen los niveles de competencia de los votantes, la regla de la mayoría simple puede no ser la mejor regla de decisión. Existen varios trabajos sobre la identificación de la regla de decisión óptima : la regla que maximiza la probabilidad de corrección del grupo. Nitzan y Paroush [19] muestran que, bajo Independencia Incondicional, la regla de decisión óptima es una regla de mayoría ponderada , donde el peso de cada votante con probabilidad de corrección p i es log( p i /(1- p i )), y un Se selecciona una alternativa si la suma de los pesos de sus partidarios está por encima de algún umbral. Grofman y Shapley [20] analizan el efecto de las interdependencias entre votantes sobre la regla de decisión óptima. Ben-Yashar y Nitzan [21] demuestran un resultado más general.
Dietrich [22] generaliza este resultado a un escenario que no requiere probabilidades previas de la "corrección" de las dos alternativas. El único supuesto requerido es la monotonicidad epistémica, que dice que, si bajo cierto perfil se selecciona la alternativa x , y el perfil cambia de manera que x se vuelve más probable, entonces x todavía se selecciona. Dietrich muestra que la monotonicidad epistémica implica que la regla de decisión óptima es la mayoría ponderada con un umbral. En el mismo artículo, generaliza la regla de decisión óptima a un escenario que no requiere que el insumo sea un voto por una de las alternativas. Puede ser, por ejemplo, un grado subjetivo de creencia. Además, no es necesario conocer los parámetros de competencia. Por ejemplo, si las entradas son creencias subjetivas x 1 ,..., x n , entonces la regla de decisión óptima suma log( x i /(1- x i )) y verifica si la suma está por encima de algún umbral. La monotonicidad epistémica no es suficiente para calcular el umbral en sí; el umbral se puede calcular suponiendo la maximización de la utilidad esperada y las probabilidades previas.
Un problema general con las reglas de mayoría ponderada es que requieren conocer los niveles de competencia de los diferentes votantes, lo que suele ser difícil de calcular de manera objetiva. Baharad, Goldberger, Koppel y Nitzan [23] presentan un algoritmo que resuelve este problema mediante aprendizaje automático estadístico . Requiere como entrada sólo una lista de votos anteriores; no necesita saber si estos votos fueron correctos o no. Si la lista es suficientemente grande, entonces su probabilidad de corrección converge a 1 incluso si los niveles de competencia de los votantes individuales son cercanos a 1/2.
A menudo, los problemas de decisión implican tres o más opciones. De hecho, esta limitación crítica fue reconocida por Condorcet (ver la paradoja de Condorcet ) y, en general, es muy difícil conciliar decisiones individuales entre tres o más resultados (ver el teorema de Arrow ).
Esta limitación también puede superarse mediante una secuencia de votaciones sobre pares de alternativas, como suele realizarse mediante el proceso de enmienda legislativa. (Sin embargo, según el teorema de Arrow, esto crea una "dependencia del camino" en la secuencia exacta de pares de alternativas; por ejemplo, qué enmienda se propone primero puede hacer una diferencia en qué enmienda se aprueba finalmente, o si la ley, con o sin enmiendas—se apruebe en absoluto.)
Con tres o más opciones, la Competencia Condicional se puede generalizar de la siguiente manera:
Un teorema del jurado de List y Goodin muestra que la competencia condicional de opciones múltiples y la independencia condicional juntas implican infalibilidad colectiva. [24] Dietrich y Spiekermann conjeturan que también implican una confiabilidad creciente. [1] Otro teorema del jurado relacionado es el de Everaere, Konieczny y Marquis. [25]
Cuando hay más de dos opciones, existen varias reglas de votación que se pueden utilizar en lugar de la mayoría simple. Las propiedades estadísticas y utilitarias de dichas reglas son analizadas, por ejemplo, por Pivato. [26] [27]
El teorema de Condorcet considera un sistema de mayoría directa , en el que todos los votos se cuentan directamente para el resultado final. Muchos países utilizan un sistema de mayoría indirecta , en el que los votantes se dividen en grupos. Los votantes de cada grupo deciden el resultado mediante mayoría interna; luego, los grupos deciden el resultado final por mayoría de votos entre ellos. Por ejemplo, [5] supongamos que hay 15 votantes. En un sistema de mayoría directa, se acepta una decisión siempre que la apoyen al menos 8 votos. Supongamos ahora que los votantes están agrupados en 3 grupos de tamaño 5 cada uno. Se acepta una decisión siempre que al menos 2 grupos la apoyen, y en cada grupo, se acepta una decisión siempre que la apoyen al menos 3 votantes. Por lo tanto, una decisión puede ser aceptada incluso si sólo la apoyan 6 votantes.
Boland, Proschan y Tong [6] demuestran que, cuando los votantes son independientes y p>1/2, un sistema de mayoría directa - como en el teorema de Condorcet - siempre tiene mayores posibilidades de aceptar la decisión correcta que cualquier sistema de mayoría indirecta.
Berg y Paroush [28] consideran jerarquías de votación de múltiples niveles, que pueden tener varios niveles con diferentes reglas de toma de decisiones en cada nivel. Estudian la estructura de votación óptima y comparan la competencia con el beneficio del ahorro de tiempo y otros gastos.
Goodin y Spiekermann [29] calculan en qué medida un pequeño grupo de expertos debería ser mejor que los votantes promedio para que puedan aceptar mejores decisiones.
Es bien sabido que, cuando hay tres o más alternativas y los votantes tienen diferentes preferencias, pueden realizar una votación estratégica , por ejemplo, votar por la segunda mejor opción para evitar que se elija la peor opción. Sorprendentemente, la votación estratégica puede ocurrir incluso con dos alternativas y cuando todos los votantes tienen la misma preferencia, que es revelar la verdad. Por ejemplo, supongamos que la pregunta es si un acusado es culpable o inocente, y supongamos que cierto miembro del jurado piensa que la verdadera respuesta es "culpable". Sin embargo, también sabe que su voto sólo es efectivo si los demás votos están empatados. Pero, si otros votos están empatados, significa que la probabilidad de que el acusado sea culpable es cercana a la mitad. Teniendo esto en cuenta, nuestro jurado podría decidir que esta probabilidad no es suficiente para decidir "culpable" y, por tanto, votará "inocente". Pero si todos los demás votantes hacen lo mismo, se obtiene una respuesta equivocada. En términos de teoría de juegos, la votación veraz podría no ser un equilibrio de Nash . [30] Este problema se ha denominado la maldición del votante indeciso , [31] ya que es análogo a la maldición del ganador en la teoría de las subastas.
Un teorema del jurado de Peleg y Zamir [32] muestra condiciones suficientes y necesarias para la existencia de un equilibrio Bayesiano-Nash que satisfaga el teorema del jurado de Condorcet. Bozbay, Dietrich y Peters [33] muestran reglas de votación que conducen a una agregación eficiente de la información privada de los votantes incluso con votación estratégica.
En la práctica, este problema puede no ser muy grave, ya que a la mayoría de los votantes no sólo les importa el resultado final, sino también votar correctamente según su conciencia. Además, la mayoría de los votantes no son lo suficientemente sofisticados como para votar estratégicamente. [1] : 4,7
La noción de "corrección" puede no ser significativa cuando se toman decisiones políticas, que se basan en valores o preferencias, y no sólo en hechos.
Algunos defensores del teorema sostienen que es aplicable cuando la votación tiene como objetivo determinar qué política promueve mejor el bien público, en lugar de simplemente expresar preferencias individuales. Según esta lectura, lo que dice el teorema es que aunque cada miembro del electorado pueda tener sólo una vaga percepción de cuál de dos políticas es mejor, el voto por mayoría tiene un efecto amplificador. El "nivel de competencia del grupo", representado por la probabilidad de que la mayoría elija la mejor alternativa, aumenta hacia 1 a medida que crece el tamaño del electorado, suponiendo que cada votante acierta más que mal.
Varios artículos muestran que, en condiciones razonables, los grupos grandes siguen mejor la preferencia de la mayoría. [34] : 323 [35] [36]
Se debate la aplicabilidad de los teoremas del jurado, en particular el teorema del jurado de Condorcet (CJT), a los procesos democráticos, ya que puede demostrar que el gobierno de la mayoría es un mecanismo perfecto o un desastre dependiendo de la competencia individual. Estudios recientes muestran que, en un caso no homogéneo, la tesis del teorema no se cumple casi con seguridad (a menos que se utilice la regla de la mayoría ponderada con pesos estocásticos que estén correlacionados con la racionalidad epistémica pero de manera que cada votante tenga un peso mínimo de uno). [37]