El teorema del jurado es un teorema matemático que demuestra que, bajo ciertas premisas, una decisión tomada mediante votación por mayoría en un grupo grande tiene más probabilidades de ser correcta que una decisión tomada por un solo experto. Sirve como argumento formal para la idea de la sabiduría de la multitud , para la decisión de cuestiones de hecho mediante juicio por jurado y para la democracia en general. [1]
El primer y más famoso teorema del jurado es el teorema del jurado de Condorcet . Supone que todos los votantes tienen probabilidades independientes de votar por la alternativa correcta, estas probabilidades son mayores que 1/2 y son las mismas para todos los votantes. Bajo estos supuestos, la probabilidad de que la decisión mayoritaria sea correcta es estrictamente mayor cuando el grupo es más grande; y cuando el tamaño del grupo tiende a infinito, la probabilidad de que la decisión mayoritaria sea correcta tiende a 1.
Hay muchos otros teoremas del jurado que flexibilizan algunos o todos estos supuestos.
La premisa de todos los teoremas del jurado es que existe una verdad objetiva , que es desconocida para los votantes. La mayoría de los teoremas se centran en cuestiones binarias (cuestiones con dos estados posibles), por ejemplo, si un determinado acusado es culpable o inocente, si una determinada acción va a subir o bajar, etc. Hay votantes (o jurados), y su objetivo es revelar la verdad. Cada votante tiene una opinión sobre cuál de las dos opciones es correcta. La opinión de cada votante es correcta (es decir, igual al estado verdadero), o incorrecta (es decir, diferente del estado verdadero). Esto contrasta con otros entornos de votación , en los que la opinión de cada votante representa sus preferencias subjetivas y, por lo tanto, siempre es "correcta" para este votante específico. La opinión de un votante puede considerarse una variable aleatoria : para cada votante, existe una probabilidad positiva de que su opinión sea igual al estado verdadero.
La decisión del grupo se determina por la regla de la mayoría . Por ejemplo, si una mayoría de votantes dice "culpable", entonces la decisión es "culpable", mientras que si una mayoría dice "inocente", entonces la decisión es "inocente". Para evitar empates, a menudo se supone que el número de votantes es impar. Alternativamente, si es par, entonces los empates se resuelven lanzando una moneda justa .
Los teoremas del jurado se interesan por la probabilidad de corrección , es decir, la probabilidad de que la decisión mayoritaria coincida con la verdad objetiva. Los teoremas del jurado típicos plantean dos tipos de afirmaciones sobre esta probabilidad: [1]
La reivindicación 1 a menudo se denomina la parte no asintótica y la reivindicación 2 a menudo se denomina la parte asintótica del teorema del jurado.
Obviamente, estas afirmaciones no siempre son ciertas, pero sí lo son bajo ciertas suposiciones sobre los votantes. Los distintos teoremas del jurado hacen suposiciones diferentes.
El teorema del jurado de Condorcet plantea los tres supuestos siguientes:
El teorema del jurado de Condorcet dice que estos tres supuestos implican confiabilidad creciente e infalibilidad de masas.
Las opiniones de distintos votantes suelen estar correlacionadas, por lo que la independencia incondicional puede no ser válida. En este caso, la afirmación de la confiabilidad creciente podría no ser válida.
Sea la probabilidad de que un jurado vote por la alternativa correcta y el coeficiente de correlación (de segundo orden) entre dos votos correctos cualesquiera. Si todos los coeficientes de correlación de orden superior en la representación de Bahadur [2] de la distribución de probabilidad conjunta de votos son iguales a cero, y es un par admisible, entonces la probabilidad de que el jurado alcance colectivamente la decisión correcta bajo una mayoría simple está dada por:
donde es la función beta incompleta regularizada .
Ejemplo: tomemos un jurado de tres jurados , con competencia individual y correlación de segundo orden . Entonces . La competencia del jurado es menor que la competencia de un solo jurado, que es igual a . Además, ampliar el jurado con dos jurados disminuye aún más la competencia del jurado, . Tenga en cuenta que y es un par de parámetros admisible. Para y , el coeficiente de correlación de segundo orden máximo admisible es igual a .
El ejemplo anterior muestra que cuando la competencia individual es baja pero la correlación es alta:
El resultado anterior se debe a Kaniovski y Zaigraev, quienes también analizan el diseño óptimo del jurado para jurados homogéneos con votos correlacionados. [3]
Hay varios teoremas del jurado que debilitan el supuesto de independencia de diversas maneras.
En los problemas de decisión binaria, suele haber una opción que es más fácil de detectar que la otra. Por ejemplo, puede ser más fácil detectar que un acusado es culpable (ya que hay pruebas claras de su culpabilidad) que detectar que es inocente. En este caso, la probabilidad de que la opinión de un solo votante sea correcta está representada por dos números diferentes: la probabilidad de que la opción n.° 1 sea correcta y la probabilidad de que la opción n.° 2 sea correcta. Esto también implica que las opiniones de diferentes votantes están correlacionadas . Esto motiva las siguientes relajaciones de los supuestos anteriores:
La creciente confiabilidad y la infalibilidad de las masas continúan manteniéndose bajo estos supuestos más débiles. [1]
Una crítica a la Competencia Condicional es que depende de la forma en que se formula la pregunta de decisión. Por ejemplo, en lugar de preguntar si el acusado es culpable o inocente, se puede preguntar si el acusado es culpable de exactamente 10 cargos (opción A), o culpable de otro número de cargos (0...9 o más de 11). Esto cambia las condiciones y, por lo tanto, la probabilidad condicional. Además, si el estado es muy específico, entonces la probabilidad de votar correctamente podría ser inferior a 1/2, por lo que la Competencia Condicional podría no ser válida. [4]
Otra causa de correlación entre votantes es la existencia de un líder de opinión . Supongamos que cada votante toma una decisión independiente, pero luego cada votante, con cierta probabilidad fija, cambia su opinión para coincidir con la del líder de opinión. Los teoremas del jurado de Boland [5] y Boland, Proschan y Tong [6] muestran que, si (y solo si) la probabilidad de seguir al líder de opinión es menor que 1-1/2 p (donde p es el nivel de competencia de todos los votantes), entonces se cumple la infalibilidad de la multitud.
Además de la dependencia de la opción verdadera, hay muchas otras razones por las que las opiniones de los votantes pueden estar correlacionadas. Por ejemplo:
Es posible debilitar el supuesto de independencia condicional y condicionar a todas las causas comunes de los votos (en lugar de solo al estado). En otras palabras, los votos ahora son independientes condicionados al problema de decisión específico . Sin embargo, en un problema específico, el supuesto de competencia condicional puede no ser válido. Por ejemplo, en un problema específico con evidencia falsa, es probable que la mayoría de los votantes tengan una opinión equivocada. Por lo tanto, los dos supuestos -independencia condicional y competencia condicional- no son justificables simultáneamente (bajo la misma condicionalización). [7]
Una posible solución es debilitar la competencia condicional de la siguiente manera: para cada votante y cada problema x , existe una probabilidad p ( x ) de que la opinión del votante sea correcta en este problema específico. Como x es una variable aleatoria, p ( x ) también es una variable aleatoria. La competencia condicional requiere que p ( x ) > 1/2 con probabilidad 1. El supuesto debilitado es:
Un teorema del jurado de Dietrich y Spiekerman [8] dice que la independencia condicional, la tendencia a la competencia y la uniformidad condicional implican juntas una confiabilidad creciente. Nótese que la infalibilidad de la multitud no está implícita. De hecho, la probabilidad de corrección tiende a un valor que es inferior a 1, si y solo si la competencia condicional no se cumple.
Un teorema del jurado de Pivato [9] muestra que, si la covarianza promedio entre votantes se vuelve pequeña a medida que la población se hace grande, entonces se cumple la infalibilidad de la multitud (para alguna regla de votación). Hay otros teoremas del jurado que tienen en cuenta el grado en que los votos pueden estar correlacionados. [10] [11]
Otras formas de abordar la correlación de votantes incluyen redes causales , estructuras de dependencia e intercambiabilidad. [1] : 2.2
Los distintos votantes suelen tener distintos niveles de competencia, por lo que el supuesto de uniformidad no se cumple. En este caso, tanto la fiabilidad creciente como la infalibilidad de la multitud pueden no cumplirse. Esto puede suceder si los nuevos votantes tienen una competencia mucho menor que los votantes existentes, de modo que la incorporación de nuevos votantes disminuye la probabilidad de acierto del grupo. En algunos casos, la probabilidad de acierto puede converger a 1/2 (- una decisión aleatoria) en lugar de a 1. [12]
La uniformidad puede descartarse si se refuerza el supuesto de competencia. Existen varias maneras de reforzarlo:
En lugar de asumir que la identidad del votante es fija, se puede asumir que hay un gran grupo de votantes potenciales con diferentes niveles de competencia, y que los votantes reales se seleccionan al azar de este grupo (como en el sorteo ).
Un teorema del jurado de Ben Yashar y Paroush [15] muestra que, en determinadas condiciones, la probabilidad de acierto de un jurado, o de un subconjunto de él elegido al azar, es mayor que la probabilidad de acierto de un único jurado seleccionado al azar. Un teorema del jurado más general de Berend y Sapir [16] demuestra que la confiabilidad creciente se cumple en este contexto: la probabilidad de acierto de un comité aleatorio aumenta con el tamaño del comité. El teorema se cumple, en determinadas condiciones, incluso con votaciones correlacionadas. [17]
El teorema del jurado de Owen, Grofman y Feld [18] analiza un contexto en el que el nivel de competencia es aleatorio. Muestran qué distribución de la competencia individual maximiza o minimiza la probabilidad de acierto.
Cuando se conocen los niveles de competencia de los votantes, la regla de mayoría simple puede no ser la mejor regla de decisión. Existen varios trabajos para identificar la regla de decisión óptima : la regla que maximiza la probabilidad de corrección del grupo. Nitzan y Paroush [19] muestran que, bajo Independencia Incondicional, la regla de decisión óptima es una regla de mayoría ponderada , donde el peso de cada votante con probabilidad de corrección p i es log( p i /(1- p i )), y se selecciona una alternativa si la suma de los pesos de sus partidarios está por encima de un cierto umbral. Grofman y Shapley [20] analizan el efecto de las interdependencias entre votantes en la regla de decisión óptima. Ben-Yashar y Nitzan [21] prueban un resultado más general.
Dietrich [22] generaliza este resultado a un entorno que no requiere probabilidades previas de la "corrección" de las dos alternativas. El único supuesto requerido es la monotonía epistémica, que dice que, si bajo cierto perfil se selecciona la alternativa x , y el perfil cambia de tal manera que x se vuelve más probable, entonces x todavía es seleccionado. Dietrich muestra que la monotonía epistémica implica que la regla de decisión óptima es la mayoría ponderada con un umbral. En el mismo artículo, generaliza la regla de decisión óptima a un entorno que no requiere que la entrada sea un voto por una de las alternativas. Puede ser, por ejemplo, un grado subjetivo de creencia. Además, no es necesario conocer los parámetros de competencia. Por ejemplo, si las entradas son creencias subjetivas x 1 ,..., x n , entonces la regla de decisión óptima suma log( x i /(1- x i )) y verifica si la suma está por encima de algún umbral. La monotonía epistémica no es suficiente para calcular el umbral en sí; El umbral se puede calcular asumiendo la maximización de la utilidad esperada y probabilidades previas.
Un problema general con las reglas de mayoría ponderada es que requieren conocer los niveles de competencia de los diferentes votantes, lo que suele ser difícil de calcular de forma objetiva. Baharad, Goldberger, Koppel y Nitzan [23] presentan un algoritmo que resuelve este problema utilizando aprendizaje automático estadístico . Requiere como entrada solo una lista de votos pasados; no necesita saber si estos votos fueron correctos o no. Si la lista es suficientemente grande, entonces su probabilidad de corrección converge a 1 incluso si los niveles de competencia de los votantes individuales son cercanos a 1/2.
A menudo, los problemas de decisión implican tres o más opciones. Esta limitación crítica fue reconocida por Condorcet (véase la paradoja de Condorcet ) y, en general, es muy difícil conciliar decisiones individuales entre tres o más resultados (véase el teorema de Arrow ).
Esta limitación también puede superarse mediante una secuencia de votaciones sobre pares de alternativas, como se hace habitualmente mediante el proceso de enmienda legislativa. (Sin embargo, según el teorema de Arrow, esto crea una "dependencia de la trayectoria" en la secuencia exacta de pares de alternativas; por ejemplo, qué enmienda se propone primero puede marcar una diferencia en qué enmienda se aprueba en última instancia, o si la ley, con o sin enmiendas, se aprueba en absoluto).
Con tres o más opciones, la Competencia Condicional se puede generalizar de la siguiente manera:
Un teorema del jurado de List y Goodin muestra que la competencia condicional multiopción y la independencia condicional juntas implican la infalibilidad de la multitud. [24] Dietrich y Spiekermann conjeturan que también implican confiabilidad creciente. [1] Otro teorema del jurado relacionado es el de Everaere, Konieczny y Marquis. [25]
Cuando hay más de dos opciones, existen diversas reglas de votación que pueden utilizarse en lugar de la mayoría simple. Las propiedades estadísticas y utilitarias de dichas reglas son analizadas, por ejemplo, por Pivato. [26] [27]
El teorema de Condorcet considera un sistema de mayoría directa , en el que todos los votos se cuentan directamente para el resultado final. Muchos países utilizan un sistema de mayoría indirecta , en el que los votantes se dividen en grupos. Los votantes de cada grupo deciden un resultado mediante una votación mayoritaria interna; luego, los grupos deciden el resultado final mediante una votación mayoritaria entre ellos. Por ejemplo, [5] supongamos que hay 15 votantes. En un sistema de mayoría directa, una decisión se acepta siempre que al menos 8 votos la apoyen. Supongamos ahora que los votantes están agrupados en 3 grupos de tamaño 5 cada uno. Una decisión se acepta siempre que al menos 2 grupos la apoyen, y en cada grupo, una decisión se acepta siempre que al menos 3 votantes la apoyen. Por lo tanto, una decisión puede aceptarse incluso si solo 6 votantes la apoyan.
Boland, Proschan y Tong [6] demuestran que, cuando los votantes son independientes y p>1/2, un sistema de mayoría directa -como en el teorema de Condorcet- siempre tiene una mayor probabilidad de aceptar la decisión correcta que cualquier sistema de mayoría indirecta.
Berg y Paroush [28] consideran jerarquías de votación de múltiples niveles, que pueden tener varios niveles con diferentes reglas de toma de decisiones en cada nivel. Estudian la estructura de votación óptima y comparan la competencia con el beneficio del ahorro de tiempo y otros gastos.
Goodin y Spiekermann [29] calculan la cantidad en que un pequeño grupo de expertos debería ser mejor que el promedio de los votantes para que acepten mejores decisiones.
Es bien sabido que, cuando hay tres o más alternativas y los votantes tienen diferentes preferencias, pueden realizar una votación estratégica , por ejemplo, votar por la segunda mejor opción para evitar que se elija la peor opción. Sorprendentemente, la votación estratégica puede ocurrir incluso con dos alternativas y cuando todos los votantes tienen la misma preferencia, que es revelar la verdad. Por ejemplo, supongamos que la pregunta es si un acusado es culpable o inocente, y supongamos que un determinado miembro del jurado piensa que la respuesta verdadera es "culpable". Sin embargo, también sabe que su voto es efectivo solo si los otros votos están empatados. Pero, si los otros votos están empatados, significa que la probabilidad de que el acusado sea culpable es cercana a 1/2. Teniendo esto en cuenta, nuestro jurado podría decidir que esta probabilidad no es suficiente para decidir "culpable", y por lo tanto votará "inocente". Pero si todos los demás votantes hacen lo mismo, se deriva la respuesta incorrecta. En términos de teoría de juegos, la votación veraz podría no ser un equilibrio de Nash . [30] Este problema se ha denominado la maldición del votante indeciso , [31] ya que es análogo a la maldición del ganador en la teoría de las subastas.
Un teorema del jurado de Peleg y Zamir [32] muestra condiciones suficientes y necesarias para la existencia de un equilibrio bayesiano-Nash que satisface el teorema del jurado de Condorcet. Bozbay, Dietrich y Peters [33] muestran reglas de votación que conducen a una agregación eficiente de la información privada de los votantes incluso con votación estratégica.
En la práctica, este problema puede no ser muy grave, ya que a la mayoría de los votantes no sólo les importa el resultado final, sino también votar correctamente según su conciencia. Además, la mayoría de los votantes no son lo suficientemente sofisticados como para votar estratégicamente. [1] : 4.7
La noción de "corrección" puede no tener sentido cuando se toman decisiones políticas que se basan en valores o preferencias, más que sólo en hechos.
Algunos defensores del teorema sostienen que es aplicable cuando la votación tiene como objetivo determinar qué política promueve mejor el bien público, en lugar de limitarse a expresar preferencias individuales. Según esta interpretación, lo que dice el teorema es que, aunque cada miembro del electorado puede tener sólo una vaga percepción de cuál de las dos políticas es mejor, la votación por mayoría tiene un efecto amplificador. El "nivel de competencia del grupo", representado por la probabilidad de que la mayoría elija la mejor alternativa, aumenta hacia 1 a medida que crece el tamaño del electorado, suponiendo que cada votante tiene más frecuencia de razón que de error.
Varios artículos muestran que, en condiciones razonables, los grupos grandes son mejores rastreadores de la preferencia mayoritaria. [34] : 323 [35] [36]
La aplicabilidad de los teoremas del jurado, en particular el Teorema del Jurado de Condorcet (TJC), a los procesos democráticos es objeto de debate, ya que puede demostrar que la regla de la mayoría es un mecanismo perfecto o un desastre dependiendo de la competencia individual. Estudios recientes muestran que, en un caso no homogéneo, la tesis del teorema no se cumple casi con seguridad (a menos que se utilice la regla de la mayoría ponderada con pesos estocásticos que estén correlacionados con la racionalidad epistémica pero de tal manera que cada votante tenga un peso mínimo de uno). [37]