El teorema de imposibilidad de Arrow es un resultado clave en la teoría de la elección social , que muestra que ninguna regla de decisión basada en clasificación puede satisfacer los requisitos de la teoría de la elección racional . [1] En particular, Arrow demostró que ninguna regla de este tipo puede satisfacer la independencia de alternativas irrelevantes , el principio de que una elección entre dos alternativas A y B no debe depender de la calidad de una tercera opción C no relacionada . [2] [3] [4]
El resultado se cita con mayor frecuencia en las discusiones sobre las reglas de votación , [5] donde muestra que ninguna regla de votación por orden de preferencia puede eliminar el efecto de spoiler . [6] [7] [8] Sin embargo, el teorema de Arrow es sustancialmente más amplio y se puede aplicar a métodos de toma de decisiones sociales distintos de la votación. Por lo tanto, generaliza la paradoja de votación de Condorcet y muestra que existen problemas similares para cada procedimiento de toma de decisiones colectivas basado en comparaciones relativas . [1]
Los métodos de votación por orden de preferencia, como el sistema de mayoría simple y el sistema de elección por orden de preferencia (segunda vuelta) son muy sensibles a los saboteadores, [9] [10] particularmente en situaciones en las que no son forzados . [11] [12] Por el contrario, los métodos de votación por orden de preferencia basados en la regla de la mayoría (Condorcet) minimizan de manera única el número de elecciones nulas [12] al restringirlas a situaciones raras [13] [14] llamadas empates cíclicos . [11] Bajo algunos modelos idealizados de comportamiento de los votantes (por ejemplo, el espectro izquierda-derecha de Black ), los efectos de los saboteadores pueden desaparecer por completo para estos métodos. [15] [16]
Las reglas de votación por calificación , donde los votantes asignan una calificación separada a cada candidato, no se ven afectadas por el teorema de Arrow. [6] [7] [17] Arrow afirmó inicialmente que la información proporcionada por estos sistemas no tenía sentido y, por lo tanto, no podía usarse para evitar paradojas, lo que lo llevó a pasarlas por alto. [18] Sin embargo, él y otros autores reconocerían más tarde esto como un error, [19] [20] y Arrow admitió que las reglas basadas en utilidades cardinales (como la votación por puntuación y aprobación ) no están sujetas a su teorema. [21] [22]
Cuando Kenneth Arrow demostró su teorema en 1950, inauguró el campo moderno de la teoría de la elección social , una rama de la economía del bienestar que trata de la agregación de preferencias y creencias para tomar decisiones óptimas. [20] El objetivo de la teoría de la elección social es identificar una regla de elección social , una función matemática que determina cuál de dos resultados u opciones es mejor, según todos los miembros de una sociedad. [2] Tal procedimiento puede ser un mercado , un sistema de votación , una constitución o incluso un marco moral o ético . [1] Idealmente, tal procedimiento debería satisfacer las propiedades de la elección racional y evitar cualquier tipo de autocontradicción . [2]
En el contexto del teorema de Arrow, se supone que los ciudadanos tienen preferencias ordinales , es decir, ordenamientos de candidatos . Si A y B son candidatos o alternativas diferentes, entonces significa que A es preferido a B. Se requiere que las preferencias individuales (o votos) satisfagan las propiedades intuitivas de los ordenamientos, por ejemplo, deben ser transitivas —si y , entonces . La función de elección social es entonces una función matemática que asigna los ordenamientos individuales a un nuevo ordenamiento que representa las preferencias de toda la sociedad.
El teorema de Arrow supone como antecedente que cualquier regla de elección social no degenerada (es decir, realmente utilizable) satisfará: [23]
La declaración original de Arrow del teorema incluía la capacidad de respuesta no negativa como condición, es decir, que aumentar el rango de un resultado no debería hacerlo perder ; en otras palabras, que una regla de votación. [2] Sin embargo, esta suposición no es necesaria ni se utiliza en su prueba (excepto para derivar la condición más débil de la eficiencia de Pareto), y por lo tanto no está relacionada con la paradoja. [3] Si bien Arrow lo consideró un requisito obvio de cualquier regla de elección social propuesta, la votación por orden de preferencia (RCV) no cumple esta condición. [26] Arrow corrigió más tarde su declaración del teorema para incluir las segundas vueltas y otras reglas de votación vulnerables a la paradoja del apoyo adicional . [3] [26]
Entre los axiomas más importantes de la elección racional está la independencia de alternativas irrelevantes (IIA), que dice que al decidir entre A y B , la opinión sobre una tercera opción C no debería afectar su decisión. [2]
El IIA se ilustra a veces con un pequeño chiste del filósofo Sidney Morgenbesser : [27]
El teorema de Arrow muestra que si una sociedad desea tomar decisiones evitando tales contradicciones, no puede utilizar métodos que descarten información cardinal . [27]
El ejemplo de Condorcet ya es suficiente para ver la imposibilidad de un sistema de votación por orden de preferencia justo , dadas condiciones de equidad más fuertes que las que supone el teorema de Arrow. [28] Supongamos que tenemos tres candidatos ( , , y ) y tres votantes cuyas preferencias son las siguientes:
Si se elige como ganador, se puede argumentar que cualquier sistema de votación justo diría que debería ganar en su lugar, ya que dos votantes (1 y 2) prefieren y solo un votante (3) prefiere . Sin embargo, por el mismo argumento se prefiere a , y se prefiere a , por un margen de dos a uno en cada ocasión. Por lo tanto, aunque cada votante individual tiene preferencias consistentes, las preferencias de la sociedad son contradictorias: se prefiere sobre cuál se prefiere sobre cuál se prefiere sobre .
Debido a este ejemplo, algunos autores atribuyen a Condorcet el mérito de haber dado un argumento intuitivo que presenta el núcleo del teorema de Arrow. [28] Sin embargo, el teorema de Arrow es sustancialmente más general; se aplica a métodos de toma de decisiones distintos de las elecciones de un hombre, un voto, como los mercados o la votación ponderada , basada en papeletas clasificadas .
Sea un conjunto de alternativas . Las preferencias de un votante sobre son una relación binaria completa y transitiva sobre (a veces llamada preorden total ), es decir, un subconjunto de las que satisfacen:
El elemento que está en se interpreta como que se prefiere la alternativa a la alternativa . Esta situación se suele denotar como o . Denote el conjunto de todas las preferencias en por . Sea un entero positivo. Una función de bienestar social ordinal (clasificada) es una función [2]
que agrega las preferencias de los votantes en una única preferencia sobre . Una tupla de preferencias de los votantes se denomina perfil de preferencias .
Teorema de imposibilidad de Arrow : si hay al menos tres alternativas, entonces no existe una función de bienestar social que satisfaga las tres condiciones enumeradas a continuación: [29]
El teorema de imposibilidad de Arrow todavía se mantiene si la eficiencia de Pareto se debilita a la siguiente condición: [4]
El teorema de Arrow establece que ninguna regla de votación por orden de preferencia puede satisfacer siempre la independencia de las alternativas irrelevantes, pero no dice nada sobre la frecuencia de los saboteadores. Esto llevó a Arrow a señalar que "la mayoría de los sistemas no van a funcionar mal todo el tiempo. Todo lo que he demostrado es que todos pueden funcionar mal a veces". [8] [34]
Los intentos de abordar los efectos del teorema de Arrow adoptan uno de dos enfoques: o bien aceptar su regla y buscar los métodos menos propensos a generar spoilers, o bien abandonar su suposición de votación por orden de preferencia para centrarse en el estudio de las reglas de votación por orden de preferencia . [27]
El primer conjunto de métodos estudiados por los economistas son los métodos de la regla de la mayoría, o de Condorcet . Estas reglas limitan los saboteadores a situaciones en las que la regla de la mayoría es contradictoria en sí misma, llamadas ciclos de Condorcet , y como resultado minimizan de manera única la posibilidad de un efecto saboteador entre reglas clasificadas. (De hecho, muchas funciones de bienestar social diferentes pueden cumplir las condiciones de Arrow bajo tales restricciones del dominio. Sin embargo, se ha demostrado que bajo cualquier restricción de este tipo, si existe alguna función de bienestar social que se adhiera a los criterios de Arrow, entonces el método de Condorcet se adherirá a los criterios de Arrow. [12] ) Condorcet creía que las reglas de votación deberían satisfacer tanto la independencia de alternativas irrelevantes como el principio de la regla de la mayoría , es decir, si la mayoría de los votantes colocan a Alice por delante de Bob , Alice debería derrotar a Bob en la elección. [28]
Desafortunadamente, como demostró Condorcet, esta regla puede ser contradictoria en sí misma ( intransitiva ), porque puede haber un ciclo de piedra-papel-tijera con tres o más candidatos derrotándose entre sí en un círculo. [35] Así, Condorcet demostró una forma más débil del teorema de imposibilidad de Arrow mucho antes que Arrow, bajo el supuesto más fuerte de que un sistema de votación en el caso de dos candidatos estará de acuerdo con un voto de mayoría simple. [28]
A diferencia de las reglas pluralistas, como la segunda vuelta por orden de preferencia o la pluralidad de primera preferencia , [9] los métodos de Condorcet evitan el efecto saboteador en elecciones no cíclicas, en las que los candidatos pueden ser elegidos por la regla de la mayoría. Los politólogos han descubierto que tales ciclos son bastante raros, probablemente del orden de un pequeño porcentaje, lo que sugiere que pueden ser de importancia práctica limitada. [14] [ aclaración necesaria ] Los modelos de votación espacial también sugieren que es probable que tales paradojas sean poco frecuentes [36] [13] o incluso inexistentes. [15]
Poco después de que Arrow publicara su teorema, Duncan Black mostró su propio resultado notable, el teorema del votante mediano . El teorema demuestra que si los votantes y los candidatos están dispuestos en un espectro de izquierda-derecha , las condiciones de Arrow son todas completamente compatibles y todas se cumplirán con cualquier regla que satisfaga el principio de la regla de la mayoría de Condorcet . [15] [37]
Más formalmente, el teorema de Black supone que las preferencias tienen un único pico : la satisfacción de un votante con un candidato sube y luego baja a medida que el candidato se mueve a lo largo de un espectro. Por ejemplo, en un grupo de amigos que eligen un volumen para la música, cada amigo probablemente tendría su propio volumen ideal; a medida que el volumen se vuelve progresivamente demasiado alto o demasiado bajo, se sentirían cada vez más insatisfechos. Si el dominio se restringe a perfiles donde cada individuo tiene una preferencia de un solo pico con respecto al orden lineal, entonces las preferencias sociales son acíclicas. En esta situación, los métodos de Condorcet satisfacen una amplia variedad de propiedades altamente deseables, incluida la de ser totalmente a prueba de spoilers. [15] [37] [12]
La regla no se generaliza completamente del espectro político a la brújula política, un resultado relacionado con el teorema del caos de McKelvey-Schofield . [15] [38] Sin embargo, existe un ganador de Condorcet bien definido si la distribución de votantes es rotacionalmente simétrica o tiene una mediana definida de manera única . [39] [40] En la mayoría de las situaciones realistas, donde las opiniones de los votantes siguen una distribución aproximadamente normal o se pueden resumir con precisión en una o dos dimensiones, los ciclos de Condorcet son raros (aunque no inauditos). [36] [11]
El teorema de Campbell-Kelly muestra que los métodos Condorcet son la clase de sistemas de votación por orden de preferencia más resistente a los efectos de spoiler: siempre que sea posible para algún sistema de votación por orden de preferencia evitar un efecto de spoiler, un método Condorcet lo hará. [12] En otras palabras, reemplazar un método por orden de preferencia con su variante Condorcet (es decir, elegir un ganador Condorcet si existe y, de lo contrario, ejecutar el método) a veces evitará un efecto de spoiler, pero nunca puede crear uno nuevo. [12]
En 1977, Ehud Kalai y Eitan Muller dieron una caracterización completa de las restricciones de dominio admitiendo una función de bienestar social no dictatorial y a prueba de estrategias . Estas corresponden a preferencias para las cuales hay un ganador de Condorcet. [41]
Holliday y Pacuit idearon un sistema de votación que minimiza demostrablemente el número de candidatos capaces de arruinar una elección, aunque al precio de perder en ocasiones la positividad del voto (aunque a una tasa mucho menor que la observada en la votación de segunda vuelta ). [11]
Como se muestra arriba, la prueba del teorema de Arrow se basa fundamentalmente en el supuesto de votación por orden de preferencia , y no es aplicable a los sistemas de votación por puntuación . Como resultado, sistemas como la votación por puntuación y el juicio por mayoría graduada pasan la independencia de alternativas irrelevantes . [34] Estos sistemas piden a los votantes que califiquen a los candidatos en una escala numérica (por ejemplo, de 0 a 10), y luego eligen al candidato con el promedio más alto (para la votación por puntuación) o la mediana ( juicio por mayoría graduada ). [42]
Si bien el teorema de Arrow no se aplica a los sistemas graduados, el teorema de Gibbard sí lo hace: ningún juego de votación puede ser sencillo (es decir, tener una estrategia única, clara y siempre la mejor), [43] por lo que el dictamen informal de que "ningún sistema de votación es perfecto" todavía tiene cierta base matemática. [44]
El marco de Arrow asumió que las preferencias individuales y sociales son ordenamientos o clasificaciones , es decir, declaraciones sobre qué resultados son mejores o peores que otros. [45] Inspirándose en el conductismo estricto popular en psicología, algunos filósofos y economistas rechazaron la idea de comparar las experiencias humanas internas de bienestar . [46] [27] Dichos filósofos afirmaron que era imposible comparar la fuerza de las preferencias entre personas que no estaban de acuerdo; Sen da como ejemplo que sería imposible saber si el Gran Incendio de Roma fue bueno o malo, porque a pesar de matar a miles de romanos, tuvo el efecto positivo de permitir que Nerón expandiera su palacio. [47]
Arrow originalmente estuvo de acuerdo con estas posiciones y rechazó la utilidad cardinal , lo que lo llevó a centrar su teorema en las clasificaciones de preferencias; [46] [48] su objetivo al agregar el axioma de independencia era, en parte, evitar que la función de elección social "introdujera" información cardinal al intentar inferirla de las clasificaciones. [27] Como resultado, Arrow inicialmente interpretó su teorema como una especie de prueba matemática del nihilismo o el egoísmo . [27] [45] [2] Sin embargo, más tarde revirtió esta opinión, admitiendo que los métodos cardinales pueden proporcionar información útil que les permite evadir su teorema. [19] [49] De manera similar, Amartya Sen afirmó por primera vez que la comparabilidad interpersonal es necesaria para la IIA, pero más tarde llegó a argumentar a favor de los métodos cardinales para evaluar la elección social, argumentando que solo requeriría "niveles bastante limitados de comparabilidad parcial" para sostenerse en la práctica. [47]
Balinski y Laraki cuestionaron que se requieran comparaciones interpersonales para que las reglas de votación calificada sean aprobadas por el IIA. Sostienen que la disponibilidad de un lenguaje común con calificaciones verbales es suficiente para el IIA al permitir que los votantes den respuestas consistentes a preguntas sobre la calidad de los candidatos. En otras palabras, sostienen que la mayoría de los votantes no cambiarán sus creencias sobre si un candidato es "bueno", "malo" o "neutral" simplemente porque otro candidato se una o se retire de una contienda. [42]
John Harsanyi señaló que el teorema de Arrow podría considerarse una versión más débil de su propio teorema [50] y otros teoremas de representación de utilidad como el teorema VNM , que generalmente muestran que el comportamiento racional requiere utilidades cardinales consistentes . [51] Harsanyi [50] y Vickrey [52] obtuvieron cada uno de forma independiente resultados que muestran que tales comparaciones interpersonales de utilidad podrían definirse rigurosamente como preferencias individuales sobre la lotería del nacimiento . [53] [54]
Otros académicos han señalado que las comparaciones interpersonales de utilidad no son exclusivas de la votación cardinal, sino que son una necesidad de cualquier procedimiento de elección no dictatorial (o no egoísta ), y las reglas de votación cardinal simplemente hacen explícitas estas comparaciones. David Pearce identificó la interpretación original de Arrow del teorema como una prueba matemática del nihilismo o el egoísmo con una especie de razonamiento circular , [27] y Hildreth señaló que "cualquier procedimiento que extienda el ordenamiento parcial de [ la eficiencia de Pareto ] debe involucrar comparaciones interpersonales de utilidad". [55] Estas observaciones han llevado al surgimiento de la votación utilitaria implícita , que identifica los procedimientos clasificados con aproximaciones de la regla utilitaria (es decir, la votación por puntuación ), lo que ayuda a hacerlos más explícitos. [56]
En psicometría , existe un consenso científico casi universal sobre la utilidad y la significatividad de las calificaciones autoinformadas, que empíricamente muestran una mayor validez y confiabilidad que las clasificaciones para medir las opiniones humanas. [57] [58] La investigación ha encontrado consistentemente que las escalas de calificación cardinales (por ejemplo, las escalas Likert ) brindan más información que las clasificaciones solas. [58] [59] Kaiser y Oswald realizaron una revisión empírica de cuatro décadas de investigación que incluyeron más de 700.000 participantes que proporcionaron calificaciones autoinformadas de utilidad, con el objetivo de identificar si las personas "tienen un sentido de una escala subyacente real para sus sentimientos más íntimos". [60] Encontraron que las respuestas a estas preguntas eran consistentes con todas las expectativas de una medida cuantitativa bien especificada. Además, dichas calificaciones eran altamente predictivas de decisiones importantes (como la migración internacional y el divorcio) y tenían tamaños de efecto más grandes que los predictores socioeconómicos estándar como el ingreso y la demografía. [60] Finalmente, los autores concluyeron que "esta relación entre sentimientos y acciones adopta una forma genérica, es reproducible de manera consistente y tiene una estructura bastante cercana a la lineal. Por lo tanto, parece que los seres humanos pueden operacionalizar con éxito una escala de números enteros para los sentimientos". [60]
Los economistas del comportamiento han demostrado que la irracionalidad individual implica violaciones del IIA (por ejemplo, con efectos señuelo ), [61] lo que sugiere que el comportamiento humano puede causar fallas del IIA incluso si el método de votación en sí no lo hace. [62] Sin embargo, la investigación anterior generalmente ha encontrado que dichos efectos son bastante pequeños, [63] y estos saboteadores psicológicos pueden aparecer independientemente del sistema electoral. Balinski y Laraki discuten técnicas de diseño de papeletas derivadas de la psicometría que minimizan estos efectos psicológicos, como pedir a los votantes que le den a cada candidato una calificación verbal (por ejemplo, "malo", "neutral", "bueno", "excelente") y emitir instrucciones a los votantes que se refieran a sus papeletas como juicios de candidatos individuales. [42] A menudo se discuten técnicas similares en el contexto de la valoración contingente . [49]
Además de las resoluciones prácticas mencionadas anteriormente, existen situaciones inusuales (poco prácticas) en las que se puede satisfacer el requisito de IIA de Arrow.
Las reglas de supermayoría pueden evitar el teorema de Arrow a costa de ser poco decisivas (es decir, no devolver un resultado con frecuencia). En este caso, un umbral que requiere una mayoría para ordenar 3 resultados, para 4, etc. no produce paradojas de votación . [64]
En los modelos espaciales (ideología n-dimensional) de votación , esto se puede relajar para requerir solo (aproximadamente el 64%) de los votos para evitar ciclos, siempre que la distribución de votantes se comporte bien ( cuasicóncava ). [65] Estos resultados proporcionan cierta justificación para el requisito común de una mayoría de dos tercios para las enmiendas constitucionales, que es suficiente para evitar preferencias cíclicas en la mayoría de las situaciones. [65]
Fishburn muestra que todas las condiciones de Arrow pueden satisfacerse para conjuntos infinitos e incontables de votantes dado el axioma de elección ; [66] sin embargo, Kirman y Sondermann demostraron que esto requiere privar del derecho al voto a casi todos los miembros de una sociedad (los votantes elegibles forman un conjunto de medida 0), lo que los lleva a referirse a dichas sociedades como "dictaduras invisibles". [67]
El teorema de Arrow no está relacionado con el voto estratégico , que no aparece en su marco [3] [1], aunque el teorema sí tiene implicaciones importantes para el voto estratégico (se utiliza como lema para demostrar el teorema de Gibbard [23] ). El marco arroviano de bienestar social supone que se conocen todas las preferencias de los votantes y que el único problema es agregarlas. [1]
La monotonía (a la que Arrow llama asociación positiva ) no es una condición del teorema de Arrow. [3] Este error de concepto se debe a un error del propio Arrow, que incluyó el axioma en su enunciado original del teorema, pero no lo utilizó. [2] Abandonar el supuesto no permite construir una función de bienestar social que cumpla con sus otras condiciones. [3]
Contrariamente a una idea errónea común, el teorema de Arrow se ocupa de la clase limitada de sistemas de votación por orden de preferencia , en lugar de los sistemas de votación en su conjunto. [1] [68]
que sin ellos, B habría ganado. ... La votación por segunda vuelta... no elimina por completo el problema de los candidatos que arruinaron la elección .
En la etapa actual de la discusión sobre el problema de la elección social, debería ser de conocimiento común que el Teorema de Imposibilidad General se cumple porque sólo las preferencias ordinales son o pueden ser tomadas en cuenta. Si la intensidad de la preferencia o la utilidad cardinal pueden ser conocidas o se reflejan en la elección social, la paradoja de la elección social puede ser resuelta.
El abandono de la condición 3 permite formular un procedimiento para llegar a una elección social. Tal procedimiento se describe a continuación .
Al igual que con las elecciones de mayoría simple, es evidente que el resultado será muy sensible a la distribución de los candidatos.
Los candidatos C y D arruinaron la elección para B... Con ellos en la carrera, A ganó, mientras que sin ellos, B habría ganado. ... La votación por segunda vuelta... no elimina por completo el problema de los candidatos que arruinaron la elección, aunque sin duda hace que sea menos probable que ocurra en la práctica.
Esta es una especie de propiedad de estabilidad de los ganadores de Condorcet: no se puede desbancar a un ganador de Condorcet
A
agregando un nuevo candidato
B
a la elección si A vence a B en una votación por mayoría directa. Por ejemplo, aunque en las elecciones presidenciales de Estados Unidos de 2000 en Florida no se utilizaron papeletas con voto por orden de preferencia, es plausible (véase Magee 2003) que Al Gore (A) hubiera ganado sin Ralph Nader (B) en las elecciones, y que Gore hubiera vencido a Nader en el duelo directo. Por lo tanto, Gore debería haber ganado de todas formas con Nader incluido en las elecciones.
El IRV está sujeto a algo llamado "apretón de centro". Un moderado popular puede recibir relativamente pocos votos de primer lugar sin culpa suya, sino debido a la división de votos entre candidatos de derecha e izquierda. [...] La votación de aprobación parece resolver el problema de la división de votos de manera simple y elegante. [...] La votación por rango resuelve los problemas de los saboteadores y la división de votos.
Se demuestra que la función de bienestar utilitarista satisface todos los postulados de elección social de Arrow, evitando el célebre teorema de imposibilidad al hacer uso de información que no está
disponible
en el marco original de Arrow.
Dr. Arrow: Bueno, me inclino un poco a pensar que los sistemas de puntuación en los que se categoriza en tres o cuatro clases (a pesar de lo que dije sobre la manipulación) son probablemente los mejores. [...] Y se han realizado algunos de estos estudios. En Francia, [Michel] Balinski ha realizado algunos estudios de este tipo que parecen dar cierto respaldo a estos métodos de puntuación.
¿Existe un sistema de votación perfecto? Los encuestados insistieron unánimemente en que no lo hay.
{{cite journal}}
: CS1 maint: DOI inactive as of August 2024 (link)la noción ficticia de 'posición original' [fue] desarrollada por Vickery (1945), Harsanyi (1955) y Rawls (1971).
El altísimo grado de correspondencia encontrado entre el ranking y los promedios de calificación... no deja ninguna duda sobre la preferibilidad del método de calificación para propósitos de descripción de grupos. La ventaja obvia de la calificación es que, si bien sus resultados son virtualmente idénticos a los que se obtienen mediante el ranking, proporciona más información que el ranking.
Muchos investigadores de valores han asumido que las clasificaciones de valores son más válidas que las calificaciones de valores porque las clasificaciones obligan a los participantes a diferenciar de manera más incisiva entre valores considerados de manera similar ... Los resultados indicaron que las calificaciones tendían a evidenciar una mayor validez que las clasificaciones dentro de los participantes de diferenciación moderada y baja. Además, la validez de las calificaciones fue mayor que la de las clasificaciones en general.
El método de la escala de valores se puede utilizar para aproximadamente los mismos fines que el método del orden de mérito, pero que el método de la escala de valores es un mejor medio para obtener un registro de juicios.