En lógica matemática , la paradoja de Russell (también conocida como antinomia de Russell ) es una paradoja de teoría de conjuntos publicada por el filósofo y matemático británico Bertrand Russell en 1901. [1] [2] La paradoja de Russell muestra que toda teoría de conjuntos que contenga un principio de comprensión irrestricto conduce a contradicciones. [3] La paradoja ya había sido descubierta de forma independiente en 1899 por el matemático alemán Ernst Zermelo . [4] Sin embargo, Zermelo no publicó la idea, que permaneció conocida solo por David Hilbert , Edmund Husserl y otros académicos de la Universidad de Gotinga . A finales de la década de 1890, Georg Cantor —considerado el fundador de la teoría de conjuntos moderna— ya se había dado cuenta de que su teoría conduciría a una contradicción, como le dijo a Hilbert y Richard Dedekind por carta. [5]
Según el principio de comprensión irrestricta, para cualquier propiedad suficientemente bien definida , existe el conjunto de todos y sólo los objetos que tienen esa propiedad. Sea R el conjunto de todos los conjuntos que no son miembros de sí mismos. (A este conjunto se le llama a veces "el conjunto de Russell"). Si R no es un miembro de sí mismo, entonces su definición implica que es un miembro de sí mismo; sin embargo, si es un miembro de sí mismo, entonces no es un miembro de sí mismo, ya que es el conjunto de todos los conjuntos que no son miembros de sí mismos. La contradicción resultante es la paradoja de Russell. En símbolos:
Russell también demostró que una versión de la paradoja podría derivarse en el sistema axiomático construido por el filósofo y matemático alemán Gottlob Frege , socavando así el intento de Frege de reducir las matemáticas a la lógica y poniendo en tela de juicio el programa logicista . En 1908 se propusieron dos formas influyentes de evitar la paradoja: la propia teoría de tipos de Russell y la teoría de conjuntos de Zermelo . En particular, los axiomas de Zermelo restringían el principio de comprensión ilimitada. Con las contribuciones adicionales de Abraham Fraenkel , la teoría de conjuntos de Zermelo se desarrolló en la ahora estándar teoría de conjuntos de Zermelo-Fraenkel (comúnmente conocida como ZFC cuando incluye el axioma de elección ). La principal diferencia entre la solución de Russell y la de Zermelo a la paradoja es que Zermelo modificó los axiomas de la teoría de conjuntos manteniendo un lenguaje lógico estándar, mientras que Russell modificó el lenguaje lógico en sí. El lenguaje de ZFC, con la ayuda de Thoralf Skolem , resultó ser el de la lógica de primer orden . [6]
La mayoría de los conjuntos que se encuentran comúnmente no son miembros de sí mismos. Llamemos a un conjunto "normal" si no es miembro de sí mismo, y "anormal" si es miembro de sí mismo. Claramente, todo conjunto debe ser normal o anormal. Por ejemplo, considere el conjunto de todos los cuadrados en un plano . Este conjunto no es en sí mismo un cuadrado en el plano, por lo tanto, no es un miembro de sí mismo y, por lo tanto, es normal. En contraste, el conjunto complementario que contiene todo lo que no es un cuadrado en el plano no es en sí mismo un cuadrado en el plano, y por lo tanto es uno de sus propios miembros y, por lo tanto, es anormal.
Ahora consideramos el conjunto de todos los conjuntos normales, R , y tratamos de determinar si R es normal o anormal. Si R fuera normal, estaría contenido en el conjunto de todos los conjuntos normales (él mismo), y por lo tanto sería anormal; por otro lado, si R fuera anormal, no estaría contenido en el conjunto de todos los conjuntos normales (él mismo), y por lo tanto sería normal. Esto nos lleva a la conclusión de que R no es ni normal ni anormal: la paradoja de Russell.
El término " teoría de conjuntos ingenua " se utiliza de diversas maneras. En un uso, la teoría de conjuntos ingenua es una teoría formal, que se formula en un lenguaje de primer orden con un predicado binario no lógico , y que incluye el axioma de extensionalidad :
y el esquema axiomático de comprensión irrestricta :
para cualquier predicado con x como variable libre dentro de . Sustituya por para obtener
Luego, por instanciación existencial (reutilizando el símbolo ) e instanciación universal tenemos
una contradicción. Por lo tanto, esta teoría de conjuntos ingenua es inconsistente . [7]
Antes de la paradoja de Russell (y de otras paradojas similares descubiertas en la misma época, como la paradoja de Burali-Forti ), una concepción común de la idea de conjunto era el "concepto extensional de conjunto", como lo relataron von Neumann y Morgenstern: [8]
Un conjunto es una colección arbitraria de objetos, sin que exista ninguna restricción en cuanto a la naturaleza y el número de estos objetos, los elementos del conjunto en cuestión. Los elementos constituyen y determinan el conjunto como tal, sin ningún orden ni relación de ninguna clase entre ellos.
En particular, no se hacía distinción entre conjuntos y clases propias como colecciones de objetos. Además, se consideraba que la existencia de cada uno de los elementos de una colección era suficiente para la existencia del conjunto de dichos elementos. Sin embargo, paradojas como la de Russell y la de Burali-Forti mostraban la imposibilidad de esta concepción de conjunto, mediante ejemplos de colecciones de objetos que no forman conjuntos, a pesar de que todos dichos objetos son existentes.
A partir del principio de explosión de la lógica clásica , cualquier proposición puede probarse a partir de una contradicción . Por lo tanto, la presencia de contradicciones como la paradoja de Russell en una teoría de conjuntos axiomática es desastrosa; ya que si se puede demostrar que una fórmula es verdadera, se destruye el significado convencional de verdad y falsedad. Además, dado que la teoría de conjuntos se consideraba la base para un desarrollo axiomático de todas las demás ramas de las matemáticas, la paradoja de Russell amenazó los fundamentos de las matemáticas en su conjunto. Esto motivó una gran cantidad de investigaciones a principios del siglo XX para desarrollar una teoría de conjuntos consistente (libre de contradicciones).
En 1908, Ernst Zermelo propuso una axiomatización de la teoría de conjuntos que evitaba las paradojas de la teoría de conjuntos ingenua al reemplazar la comprensión arbitraria de conjuntos con axiomas de existencia más débiles, como su axioma de separación ( Aussonderung ). (Evitar la paradoja no era la intención original de Zermelo, sino documentar qué supuestos utilizó para demostrar el teorema de buen orden ). [9] Las modificaciones a esta teoría axiomática propuestas en la década de 1920 por Abraham Fraenkel , Thoralf Skolem y por el propio Zermelo dieron como resultado la teoría axiomática de conjuntos llamada ZFC . Esta teoría fue ampliamente aceptada una vez que el axioma de elección de Zermelo dejó de ser controvertido, y ZFC ha seguido siendo la teoría axiomática de conjuntos canónica hasta el día de hoy.
ZFC no supone que, para cada propiedad, existe un conjunto de todas las cosas que satisfacen esa propiedad. Más bien, afirma que dado cualquier conjunto X , existe cualquier subconjunto de X definible mediante lógica de primer orden . El objeto R definido por la paradoja de Russell anterior no puede construirse como un subconjunto de ningún conjunto X y, por lo tanto, no es un conjunto en ZFC. En algunas extensiones de ZFC, en particular en la teoría de conjuntos de von Neumann–Bernays–Gödel , los objetos como R se denominan clases propias .
ZFC no dice nada sobre los tipos, aunque la jerarquía acumulativa tiene una noción de capas que se parecen a los tipos. El propio Zermelo nunca aceptó la formulación de ZFC de Skolem usando el lenguaje de la lógica de primer orden. Como señala José Ferreirós, Zermelo insistió en cambio en que "las funciones proposicionales (condiciones o predicados) utilizadas para separar subconjuntos, así como las funciones de reemplazo, pueden ser 'completamente arbitrarias ' [ganz beliebig ]"; la interpretación moderna que se da a esta afirmación es que Zermelo quería incluir la cuantificación de orden superior para evitar la paradoja de Skolem . Alrededor de 1930, Zermelo también introdujo (aparentemente independientemente de von Neumann), el axioma de fundamento , por lo que -como observa Ferreirós- "al prohibir los conjuntos 'circulares' y 'no fundamentados', [ZFC] incorporó una de las motivaciones cruciales de la TT [teoría de tipos]: el principio de los tipos de argumentos". Este ZFC de segundo orden preferido por Zermelo, incluido el axioma de fundación, permitió una rica jerarquía acumulativa. Ferreirós escribe que "las 'capas' de Zermelo son esencialmente las mismas que los tipos en las versiones contemporáneas de la TT simple [teoría de tipos] ofrecidas por Gödel y Tarski. Se puede describir la jerarquía acumulativa en la que Zermelo desarrolló sus modelos como el universo de una TT acumulativa en la que se permiten los tipos transfinitos. (Una vez que hemos adoptado un punto de vista impredicativo, abandonando la idea de que las clases se construyen, no es antinatural aceptar los tipos transfinitos.) Por lo tanto, la TT simple y la ZFC ahora podrían considerarse como sistemas que 'hablan' esencialmente sobre los mismos objetos previstos. La principal diferencia es que la TT se basa en una lógica fuerte de orden superior, mientras que Zermelo empleó una lógica de segundo orden, y a la ZFC también se le puede dar una formulación de primer orden. La 'descripción' de primer orden de la jerarquía acumulativa es mucho más débil, como lo demuestra la existencia de modelos contables (la paradoja de Skolem), pero disfruta de algunas ventajas importantes". [10]
En ZFC, dado un conjunto A , es posible definir un conjunto B que consta exactamente de los conjuntos en A que no son miembros de sí mismos. B no puede estar en A por el mismo razonamiento de la paradoja de Russell. Esta variación de la paradoja de Russell muestra que ningún conjunto contiene todo.
Gracias al trabajo de Zermelo y otros, especialmente John von Neumann , la estructura de lo que algunos consideran los objetos "naturales" descritos por ZFC finalmente se hizo clara: son los elementos del universo de von Neumann , V , construido a partir del conjunto vacío mediante la iteración transfinita de la operación de conjuntos potencia . Por lo tanto, ahora es posible nuevamente razonar sobre conjuntos de una manera no axiomática sin entrar en conflicto con la paradoja de Russell, es decir, razonando sobre los elementos de V. Si es apropiado pensar en conjuntos de esta manera es un punto de discordia entre los puntos de vista rivales sobre la filosofía de las matemáticas .
Otras soluciones a la paradoja de Russell, con una estrategia subyacente más cercana a la de la teoría de tipos , incluyen los Nuevos Fundamentos de Quine y la teoría de conjuntos de Scott-Potter . Otro enfoque consiste en definir la relación de pertenencia múltiple con un esquema de comprensión modificado apropiadamente, como en la teoría de conjuntos de doble extensión .
Russell descubrió la paradoja en mayo [11] o junio de 1901. [12] Según su propio relato en su Introducción a la filosofía matemática de 1919 , "intentó descubrir algún fallo en la prueba de Cantor de que no existe un cardinal máximo". [13] En una carta de 1902, [14] anunció el descubrimiento de la paradoja a Gottlob Frege en la Begriffsschrift de Frege de 1879 y enmarcó el problema en términos tanto de lógica como de teoría de conjuntos, y en particular en términos de la definición de función de Frege : [a] [b]
Sólo hay un punto en el que he encontrado una dificultad. Usted afirma (p. 17 [p. 23 arriba]) que una función también puede actuar como elemento indeterminado. Esto lo creía antes, pero ahora esta opinión me parece dudosa debido a la siguiente contradicción. Sea w el predicado: ser un predicado que no puede predicarse de sí mismo. ¿Puede w predicarse de sí mismo? De cada respuesta se sigue su opuesto. Por lo tanto, debemos concluir que w no es un predicado. Asimismo, no hay ninguna clase (como totalidad) de aquellas clases que, tomadas cada una como una totalidad, no se pertenecen a sí mismas. De esto concluyo que bajo ciertas circunstancias un conjunto definible [Menge] no forma una totalidad.
Russell continuaría abordándolo en profundidad en su obra de 1903 Principios de las matemáticas , donde repitió su primer encuentro con la paradoja: [15]
Antes de dejar de lado las cuestiones fundamentales, es necesario examinar más en detalle la singular contradicción, ya mencionada, con respecto a los predicados no predicables por sí mismos. ... Puedo mencionar que llegué a ella en el intento de reconciliar la prueba de Cantor....
Russell le escribió a Frege sobre la paradoja justo cuando Frege estaba preparando el segundo volumen de su Grundgesetze der Arithmetik . [16] Frege respondió a Russell muy rápidamente; su carta fechada el 22 de junio de 1902 apareció, con el comentario de van Heijenoort en Heijenoort 1967:126-127. Frege luego escribió un apéndice admitiendo la paradoja, [17] y propuso una solución que Russell respaldaría en su Principles of Mathematics , [18] pero que luego fue considerada por algunos como insatisfactoria. [19] Por su parte, Russell tenía su trabajo en la imprenta y agregó un apéndice sobre la doctrina de los tipos . [20]
Ernst Zermelo, en su obra Una nueva prueba de la posibilidad de un buen ordenamiento (publicada en 1908 al mismo tiempo que publicaba "la primera teoría axiomática de conjuntos") [21], reivindicaba el descubrimiento previo de la antinomia en la teoría ingenua de conjuntos de Cantor. Afirma: "Y, sin embargo, incluso la forma elemental que Russell 9 dio a las antinomias de la teoría de conjuntos podría haberlos persuadido [a J. König, Jourdain, F. Bernstein] de que la solución de estas dificultades no se debe buscar en la renuncia al buen ordenamiento, sino sólo en una restricción adecuada de la noción de conjunto". [22] La nota 9 es donde plantea su afirmación:
9 1903 , págs. 366–368. Sin embargo, yo mismo había descubierto esta antinomia, independientemente de Russell, y la había comunicado antes de 1903 al profesor Hilbert, entre otros. [23]
Frege envió una copia de sus Grundgesetze der Arithmetik a Hilbert; como se señaló anteriormente, el último volumen de Frege mencionaba la paradoja que Russell le había comunicado. Después de recibir el último volumen de Frege, el 7 de noviembre de 1903, Hilbert escribió una carta a Frege en la que decía, refiriéndose a la paradoja de Russell, "Creo que el Dr. Zermelo la descubrió hace tres o cuatro años". Se descubrió un relato escrito del argumento real de Zermelo en el Nachlass de Edmund Husserl . [24]
En 1923, Ludwig Wittgenstein propuso "deshacerse" de la paradoja de Russell de la siguiente manera:
La razón por la que una función no puede ser su propio argumento es que el signo de una función ya contiene el prototipo de su argumento, y no puede contenerse a sí misma. Supongamos que la función F(fx) pudiera ser su propio argumento: en ese caso habría una proposición F(F(fx)) , en la que la función externa F y la función interna F deben tener significados diferentes, ya que la interna tiene la forma O(fx) y la externa tiene la forma Y(O(fx)) . Sólo la letra 'F' es común a las dos funciones, pero la letra por sí misma no significa nada. Esto se vuelve inmediatamente claro si en lugar de F(Fu) escribimos (do) : F(Ou) . Ou = Fu . Esto elimina la paradoja de Russell. ( Tractatus Logico-Philosophicus , 3.333)
Russell y Alfred North Whitehead escribieron sus Principia Mathematica en tres volúmenes con la esperanza de lograr lo que Frege no había podido hacer. Intentaron desterrar las paradojas de la teoría de conjuntos ingenua empleando una teoría de tipos que idearon para este propósito. Si bien lograron fundamentar la aritmética en cierta forma, no es en absoluto evidente que lo hicieran por medios puramente lógicos. Si bien Principia Mathematica evitó las paradojas conocidas y permitió la derivación de una gran cantidad de matemáticas, su sistema dio lugar a nuevos problemas.
En cualquier caso, Kurt Gödel demostró en 1930-31 que, si bien la lógica de gran parte de los Principia Mathematica , hoy conocida como lógica de primer orden, es completa , la aritmética de Peano es necesariamente incompleta si es consistente . Se considera de forma muy generalizada (aunque no universal) que esto demostró que el programa logicista de Frege es imposible de completar.
En 2001 se celebró en Múnich una Conferencia Internacional del Centenario para celebrar los primeros cien años de la paradoja de Russell, y sus actas han sido publicadas. [12]
Existen algunas versiones de esta paradoja que se acercan más a situaciones de la vida real y pueden ser más fáciles de entender para quienes no son lógicos. Por ejemplo, la paradoja del barbero supone que un barbero afeita a todos los hombres que no se afeitan a sí mismos y sólo a aquellos que no se afeitan a sí mismos. Cuando uno piensa en si el barbero debería afeitarse a sí mismo o no, comienza a surgir una paradoja similar. [25]
Una refutación fácil de las "versiones para el profano", como la paradoja del barbero, parece ser que no existe tal barbero, o que el barbero no es un hombre y, por lo tanto, puede existir sin paradoja. El objetivo de la paradoja de Russell es que la respuesta "tal conjunto no existe" significa que la definición de la noción de conjunto dentro de una teoría dada es insatisfactoria. Nótese la diferencia entre las afirmaciones "tal conjunto no existe" y "es un conjunto vacío ". Es como la diferencia entre decir "No hay ningún balde" y decir "El balde está vacío".
Una notable excepción a lo anterior puede ser la paradoja de Grelling-Nelson , en la que las palabras y el significado son los elementos del escenario, en lugar de las personas y el corte de pelo. Aunque es fácil refutar la paradoja del barbero diciendo que ese barbero no existe (y no puede existir), es imposible decir algo similar sobre una palabra definida con significado.
Una forma de dramatizar la paradoja es la siguiente: supongamos que cada biblioteca pública tiene que compilar un catálogo de todos sus libros. Como el catálogo es en sí mismo uno de los libros de la biblioteca, algunos bibliotecarios lo incluyen en el catálogo para que esté completo, mientras que otros lo omiten porque es evidente que es uno de los libros de la biblioteca. Ahora imaginemos que todos estos catálogos se envían a la biblioteca nacional. Algunos de ellos se incluyen a sí mismos en sus listados, otros no. El bibliotecario nacional compila dos catálogos maestros: uno de todos los catálogos que se incluyen a sí mismos y otro de todos los que no se incluyen.
La pregunta es: ¿deberían estos catálogos maestros incluirse a sí mismos en una lista? El «catálogo de todos los catálogos que se incluyen a sí mismos» no es un problema. Si el bibliotecario no lo incluye en su propia lista, sigue siendo un verdadero catálogo de aquellos catálogos que sí se incluyen a sí mismos. Si lo incluye, sigue siendo un verdadero catálogo de aquellos que se incluyen a sí mismos. Sin embargo, así como el bibliotecario no puede equivocarse con el primer catálogo maestro, está condenado a fracasar con el segundo. Cuando se trata del «catálogo de todos los catálogos que no se incluyen a sí mismos», el bibliotecario no puede incluirlo en su propia lista, porque entonces se incluiría a sí mismo y, por lo tanto, pertenecería al otro catálogo, el de los catálogos que sí se incluyen a sí mismos. Sin embargo, si el bibliotecario lo omite, el catálogo está incompleto. De cualquier manera, nunca puede ser un verdadero catálogo maestro de los catálogos que no se incluyen a sí mismos.
Como se ilustra arriba para la paradoja del barbero, la paradoja de Russell no es difícil de extender. Tomemos:
Formar la oración:
A veces el "todos" se sustituye por "todos los ⟨V⟩ ers".
Un ejemplo sería "pintar":
o "elegir"
En el episodio de la temporada 8 de The Big Bang Theory , "The Skywalker Intrusion", Sheldon Cooper analiza la canción " Play That Funky Music ", concluyendo que la letra presenta un ejemplo musical de la paradoja de Russell. [26]
Las paradojas que caen en este esquema incluyen: