La teoría de conjuntos es la rama de la lógica matemática que estudia los conjuntos , que pueden describirse informalmente como colecciones de objetos. Aunque los objetos de cualquier tipo pueden agruparse en un conjunto, la teoría de conjuntos, como rama de las matemáticas , se ocupa principalmente de aquellos que son relevantes para las matemáticas en su conjunto.
El estudio moderno de la teoría de conjuntos fue iniciado por los matemáticos alemanes Richard Dedekind y Georg Cantor en la década de 1870. En particular, Georg Cantor es considerado comúnmente el fundador de la teoría de conjuntos. Los sistemas no formalizados investigados durante esta etapa temprana se conocen como teoría de conjuntos ingenua . Después del descubrimiento de paradojas dentro de la teoría de conjuntos ingenua (como la paradoja de Russell , la paradoja de Cantor y la paradoja de Burali-Forti ), se propusieron varios sistemas axiomáticos a principios del siglo XX, de los cuales la teoría de conjuntos de Zermelo-Fraenkel (con o sin el axioma de elección ) sigue siendo la más conocida y estudiada.
La teoría de conjuntos se emplea comúnmente como un sistema fundacional para toda la matemática, particularmente en la forma de la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección. Además de su papel fundacional, la teoría de conjuntos también proporciona el marco para desarrollar una teoría matemática del infinito , y tiene varias aplicaciones en la ciencia de la computación (como en la teoría del álgebra relacional ), la filosofía , la semántica formal y la dinámica evolutiva . Su atractivo fundacional, junto con sus paradojas y sus implicaciones para el concepto de infinito y sus múltiples aplicaciones han hecho de la teoría de conjuntos un área de gran interés para los lógicos y filósofos de las matemáticas . La investigación contemporánea sobre la teoría de conjuntos cubre una amplia gama de temas, que van desde la estructura de la línea de números reales hasta el estudio de la consistencia de los cardinales grandes .
Los temas matemáticos suelen surgir y evolucionar a través de interacciones entre muchos investigadores. Sin embargo, la teoría de conjuntos fue fundada en un único artículo de 1874 de Georg Cantor : " Sobre una propiedad del conjunto de todos los números algebraicos reales ". [1] [2]
Desde el siglo V a. C., comenzando con el matemático griego Zenón de Elea en Occidente y los primeros matemáticos indios en Oriente, los matemáticos han luchado con el concepto de infinito . Especialmente notable es el trabajo de Bernard Bolzano en la primera mitad del siglo XIX. [3] La comprensión moderna del infinito comenzó en 1870-1874, y fue motivada por el trabajo de Cantor en el análisis real . [4]
La teoría de conjuntos comienza con una relación binaria fundamental entre un objeto o y un conjunto A . Si o es un miembro (o elemento ) de A , se utiliza la notación o ∈ A . Un conjunto se describe enumerando los elementos separados por comas, o por una propiedad caracterizante de sus elementos, entre llaves { }. [5] Dado que los conjuntos son objetos, la relación de pertenencia también puede relacionar conjuntos, es decir, los conjuntos mismos pueden ser miembros de otros conjuntos.
Una relación binaria derivada entre dos conjuntos es la relación de subconjunto, también llamada inclusión de conjuntos . Si todos los miembros del conjunto A son también miembros del conjunto B , entonces A es un subconjunto de B , denotado A ⊆ B. Por ejemplo, {1, 2} es un subconjunto de {1, 2, 3} , y también lo es {2} pero {1, 4} no lo es. Como implica esta definición, un conjunto es un subconjunto de sí mismo. Para los casos en los que esta posibilidad no es adecuada o tendría sentido rechazarla, se define el término subconjunto propio . A se llama subconjunto propio de B si y solo si A es un subconjunto de B , pero A no es igual a B. Además, 1, 2 y 3 son miembros (elementos) del conjunto {1, 2, 3} , pero no son subconjuntos de él; y a su vez, los subconjuntos, como {1} , no son miembros del conjunto {1, 2, 3} . Pueden existir relaciones más complicadas; por ejemplo, el conjunto {1} es a la vez un miembro y un subconjunto propio del conjunto {1, {1}} .
Así como la aritmética incluye operaciones binarias sobre números , la teoría de conjuntos incluye operaciones binarias sobre conjuntos. [6] La siguiente es una lista parcial de ellas:
Algunos conjuntos básicos de importancia central son el conjunto de números naturales , el conjunto de números reales y el conjunto vacío , el único conjunto que no contiene elementos. El conjunto vacío también se denomina ocasionalmente conjunto nulo , [8] aunque este nombre es ambiguo y puede dar lugar a varias interpretaciones.
Un conjunto es puro si todos sus miembros son conjuntos, todos los miembros de sus miembros son conjuntos, y así sucesivamente. Por ejemplo, el conjunto que contiene solo el conjunto vacío es un conjunto puro no vacío. En la teoría de conjuntos moderna, es común restringir la atención al universo de von Neumann de conjuntos puros, y muchos sistemas de teoría de conjuntos axiomáticos están diseñados para axiomatizar solo los conjuntos puros. Hay muchas ventajas técnicas para esta restricción, y se pierde poca generalidad, porque esencialmente todos los conceptos matemáticos pueden ser modelados por conjuntos puros. Los conjuntos en el universo de von Neumann están organizados en una jerarquía acumulativa , basada en qué tan profundamente están anidados sus miembros, miembros de miembros, etc. A cada conjunto en esta jerarquía se le asigna (por recursión transfinita ) un número ordinal , conocido como su rango. El rango de un conjunto puro se define como el menor ordinal que es estrictamente mayor que el rango de cualquiera de sus elementos. Por ejemplo, al conjunto vacío se le asigna el rango 0, mientras que al conjunto {{}} que contiene solo el conjunto vacío se le asigna el rango 1. Para cada ordinal , el conjunto se define como compuesto por todos los conjuntos puros con rango menor que . El universo de von Neumann completo se denota como .
La teoría de conjuntos elemental se puede estudiar de manera informal e intuitiva, y por lo tanto se puede enseñar en las escuelas primarias utilizando diagramas de Venn . El enfoque intuitivo supone tácitamente que un conjunto puede formarse a partir de la clase de todos los objetos que satisfacen cualquier condición definitoria particular. Esta suposición da lugar a paradojas, las más simples y mejor conocidas de las cuales son la paradoja de Russell y la paradoja de Burali-Forti . La teoría de conjuntos axiomática se ideó originalmente para librar a la teoría de conjuntos de tales paradojas. [nota 1]
Los sistemas de teoría de conjuntos axiomáticos más estudiados implican que todos los conjuntos forman una jerarquía acumulativa . [a] Dichos sistemas son de dos tipos: aquellos cuya ontología consiste en:
Los sistemas anteriores se pueden modificar para permitir urelements , objetos que pueden ser miembros de conjuntos pero que no son en sí mismos conjuntos y no tienen ningún miembro.
Los sistemas de las Nuevas Fundaciones de NFU (que permiten urelementos ) y NF (que carecen de ellos), asociados con Willard Van Orman Quine , no se basan en una jerarquía acumulativa. NF y NFU incluyen un "conjunto de todo", en relación con el cual cada conjunto tiene un complemento. En estos sistemas, los urelementos importan, porque NF, pero no NFU, produce conjuntos para los cuales el axioma de elección no se cumple. A pesar de que la ontología de NF no refleja la jerarquía acumulativa tradicional y viola la buena fundamentación, Thomas Forster ha argumentado que sí refleja una concepción iterativa del conjunto. [9]
Los sistemas de teoría de conjuntos constructivos , como CST, CZF e IZF, incorporan sus axiomas de conjuntos en la lógica intuicionista en lugar de la clásica . Sin embargo, otros sistemas aceptan la lógica clásica pero presentan una relación de pertenencia no estándar. Estos incluyen la teoría de conjuntos aproximados y la teoría de conjuntos difusos , en la que el valor de una fórmula atómica que incorpora la relación de pertenencia no es simplemente Verdadero o Falso . Los modelos de valores booleanos de ZFC son un tema relacionado.
Edward Nelson propuso en 1977 un enriquecimiento de ZFC llamado teoría de conjuntos internos. [10]
Muchos conceptos matemáticos pueden definirse con precisión utilizando únicamente conceptos de teoría de conjuntos. Por ejemplo, estructuras matemáticas tan diversas como grafos , variedades , anillos , espacios vectoriales y álgebras relacionales pueden definirse como conjuntos que satisfacen diversas propiedades (axiomáticas). Las relaciones de equivalencia y orden son omnipresentes en las matemáticas, y la teoría de las relaciones matemáticas puede describirse en la teoría de conjuntos. [11] [12]
La teoría de conjuntos es también un prometedor sistema fundacional para gran parte de las matemáticas. Desde la publicación del primer volumen de Principia Mathematica , se ha afirmado que la mayoría (o incluso todos) los teoremas matemáticos pueden derivarse utilizando un conjunto de axiomas adecuadamente diseñado para la teoría de conjuntos, ampliado con muchas definiciones, utilizando lógica de primer o segundo orden . Por ejemplo, las propiedades de los números naturales y reales pueden derivarse dentro de la teoría de conjuntos, ya que cada uno de estos sistemas numéricos puede definirse representando sus elementos como conjuntos de formas específicas. [13]
La teoría de conjuntos como base para el análisis matemático , la topología , el álgebra abstracta y las matemáticas discretas tampoco es controvertida; los matemáticos aceptan (en principio) que los teoremas en estas áreas pueden derivarse de las definiciones relevantes y los axiomas de la teoría de conjuntos. Sin embargo, sigue habiendo pocas derivaciones completas de teoremas matemáticos complejos de la teoría de conjuntos que se hayan verificado formalmente, ya que dichas derivaciones formales suelen ser mucho más largas que las pruebas en lenguaje natural que los matemáticos suelen presentar. Un proyecto de verificación, Metamath , incluye derivaciones escritas por humanos y verificadas por computadora de más de 12 000 teoremas a partir de la teoría de conjuntos ZFC , la lógica de primer orden y la lógica proposicional . [14] ZFC y el axioma de elección han visto recientemente aplicaciones en la dinámica evolutiva , [15] mejorando la comprensión de modelos bien establecidos de evolución e interacción.
La teoría de conjuntos es un área importante de investigación en matemáticas con muchos subcampos interrelacionados:
La teoría de conjuntos combinatorios se ocupa de las extensiones de la combinatoria finita a conjuntos infinitos. Esto incluye el estudio de la aritmética cardinal y el estudio de las extensiones del teorema de Ramsey, como el teorema de Erdős-Rado .
La teoría descriptiva de conjuntos es el estudio de los subconjuntos de la línea real y, de manera más general, de los subconjuntos de los espacios polacos . Comienza con el estudio de las clases puntuales en la jerarquía de Borel y se extiende al estudio de jerarquías más complejas, como la jerarquía proyectiva y la jerarquía de Wadge . Muchas propiedades de los conjuntos de Borel se pueden establecer en ZFC, pero demostrar que estas propiedades se cumplen para conjuntos más complicados requiere axiomas adicionales relacionados con la determinabilidad y los cardinales grandes.
El campo de la teoría de conjuntos descriptivos efectivos se encuentra entre la teoría de conjuntos y la teoría de la recursión . Incluye el estudio de las clases de puntos de luz y está estrechamente relacionado con la teoría hiperaritmética . En muchos casos, los resultados de la teoría de conjuntos descriptivos clásica tienen versiones efectivas; en algunos casos, se obtienen nuevos resultados probando primero la versión efectiva y luego extendiéndola ("relativizándola") para hacerla más ampliamente aplicable.
Un área de investigación reciente se ocupa de las relaciones de equivalencia de Borel y de las relaciones de equivalencia definibles más complejas . Esto tiene importantes aplicaciones en el estudio de invariantes en muchos campos de las matemáticas.
En la teoría de conjuntos, tal como la definió Cantor y la axiomatizaron Zermelo y Fraenkel, un objeto es miembro de un conjunto o no lo es. En la teoría de conjuntos difusos, esta condición fue flexibilizada por Lotfi A. Zadeh , de modo que un objeto tiene un grado de pertenencia a un conjunto, un número entre 0 y 1. Por ejemplo, el grado de pertenencia de una persona al conjunto de "personas altas" es más flexible que una simple respuesta de sí o no y puede ser un número real como 0,75.
Un modelo interno de la teoría de conjuntos de Zermelo-Fraenkel (ZF) es una clase transitiva que incluye todos los ordinales y satisface todos los axiomas de ZF. El ejemplo canónico es el universo construible L desarrollado por Gödel. Una razón por la que el estudio de los modelos internos es de interés es que se puede utilizar para demostrar resultados de consistencia. Por ejemplo, se puede demostrar que independientemente de si un modelo V de ZF satisface la hipótesis del continuo o el axioma de elección , el modelo interno L construido dentro del modelo original satisfará tanto la hipótesis del continuo generalizado como el axioma de elección. Por lo tanto, la suposición de que ZF es consistente (tiene al menos un modelo) implica que ZF junto con estos dos principios es consistente.
El estudio de modelos internos es común en el estudio de la determinación y de cardinales grandes , especialmente cuando se consideran axiomas como el axioma de determinación que contradicen el axioma de elección. Incluso si un modelo fijo de teoría de conjuntos satisface el axioma de elección, es posible que un modelo interno no logre satisfacer el axioma de elección. Por ejemplo, la existencia de cardinales suficientemente grandes implica que existe un modelo interno que satisface el axioma de determinación (y, por lo tanto, no satisface el axioma de elección). [16]
Un cardinal grande es un número cardinal con una propiedad adicional. Se estudian muchas de estas propiedades, incluidos los cardinales inaccesibles , los cardinales medibles y muchos más. Estas propiedades generalmente implican que el número cardinal debe ser muy grande, y la existencia de un cardinal con la propiedad especificada no es demostrable en la teoría de conjuntos de Zermelo-Fraenkel .
La determinación se refiere al hecho de que, bajo supuestos apropiados, ciertos juegos de dos jugadores con información perfecta están determinados desde el principio en el sentido de que un jugador debe tener una estrategia ganadora. La existencia de estas estrategias tiene consecuencias importantes en la teoría descriptiva de conjuntos, ya que el supuesto de que una clase más amplia de juegos está determinada a menudo implica que una clase más amplia de conjuntos tendrá una propiedad topológica. El axioma de determinación (AD) es un importante objeto de estudio; aunque incompatible con el axioma de elección, AD implica que todos los subconjuntos de la línea real se comportan bien (en particular, son medibles y tienen la propiedad de conjunto perfecto). AD se puede utilizar para demostrar que los grados de Wadge tienen una estructura elegante.
Paul Cohen inventó el método de forzar mientras buscaba un modelo de ZFC en el que fallara la hipótesis del continuo , o un modelo de ZF en el que fallara el axioma de elección . Forzar agrega conjuntos adicionales a un modelo dado de teoría de conjuntos para crear un modelo más grande con propiedades determinadas (es decir, "forzadas") por la construcción y el modelo original. Por ejemplo, la construcción de Cohen agrega subconjuntos adicionales de los números naturales sin cambiar ninguno de los números cardinales del modelo original. Forzar es también uno de los dos métodos para probar la consistencia relativa por métodos finitistas, el otro método son los modelos con valores booleanos .
Un invariante cardinal es una propiedad de la línea real medida por un número cardinal. Por ejemplo, un invariante bien estudiado es la cardinalidad más pequeña de una colección de conjuntos magros de números reales cuya unión es la línea real entera. Estos son invariantes en el sentido de que dos modelos isomorfos cualesquiera de la teoría de conjuntos deben dar el mismo cardinal para cada invariante. Se han estudiado muchos invariantes cardinales y las relaciones entre ellos suelen ser complejas y estar relacionadas con axiomas de la teoría de conjuntos.
La topología de teoría de conjuntos estudia cuestiones de topología general que son de naturaleza de teoría de conjuntos o que requieren métodos avanzados de teoría de conjuntos para su solución. Muchos de estos teoremas son independientes de ZFC, lo que requiere axiomas más fuertes para su demostración. Un problema famoso es la cuestión del espacio normal de Moore , una cuestión de topología general que fue objeto de intensa investigación. La respuesta a la cuestión del espacio normal de Moore finalmente demostró ser independiente de ZFC.
Desde el inicio de la teoría de conjuntos, algunos matemáticos han objetado su uso como fundamento de las matemáticas . La objeción más común a la teoría de conjuntos, una que Kronecker expresó en los primeros años de la teoría de conjuntos, parte de la visión constructivista de que las matemáticas están vagamente relacionadas con la computación. Si se acepta esta visión, entonces el tratamiento de los conjuntos infinitos, tanto en la teoría de conjuntos ingenua como en la axiomática, introduce en las matemáticas métodos y objetos que no son computables ni siquiera en principio. La viabilidad del constructivismo como fundamento sustituto de las matemáticas aumentó en gran medida con el influyente libro de Errett Bishop Foundations of Constructive Analysis . [17]
Una objeción diferente planteada por Henri Poincaré es que definir conjuntos utilizando los esquemas axiomáticos de especificación y reemplazo , así como el axioma de conjunto potencia , introduce impredicatividad , un tipo de circularidad , en las definiciones de objetos matemáticos. El alcance de las matemáticas fundamentadas en predicados, si bien es menor que el de la teoría de Zermelo-Fraenkel, comúnmente aceptada, es mucho mayor que el de las matemáticas constructivas, hasta el punto de que Solomon Feferman ha dicho que "todo el análisis científicamente aplicable puede desarrollarse [utilizando métodos predicativos]". [18]
Ludwig Wittgenstein condenó filosóficamente la teoría de conjuntos por sus connotaciones de platonismo matemático . [19] Escribió que "la teoría de conjuntos es errónea", ya que se basa en el "sinsentido" del simbolismo ficticio, tiene "idiomas perniciosos" y que no tiene sentido hablar de "todos los números". [20] Wittgenstein identificó las matemáticas con la deducción humana algorítmica; [21] la necesidad de una base segura para las matemáticas le parecía absurda. [22] Además, dado que el esfuerzo humano es necesariamente finito, la filosofía de Wittgenstein requería un compromiso ontológico con el constructivismo radical y el finitismo . Los enunciados metamatemáticos —que, para Wittgenstein, incluían cualquier enunciado que cuantificara sobre dominios infinitos y, por lo tanto, casi toda la teoría de conjuntos moderna— no son matemáticas. [23] Pocos filósofos modernos han adoptado las opiniones de Wittgenstein después de un espectacular error en Observaciones sobre los fundamentos de las matemáticas : Wittgenstein intentó refutar los teoremas de incompletitud de Gödel después de haber leído sólo el resumen. Como señalaron los revisores Kreisel , Bernays , Dummett y Goodstein , muchas de sus críticas no se aplicaban al artículo en su totalidad. Sólo recientemente filósofos como Crispin Wright han comenzado a rehabilitar los argumentos de Wittgenstein. [24]
Los teóricos de categorías han propuesto la teoría de topos como una alternativa a la teoría de conjuntos axiomáticos tradicional. La teoría de topos puede interpretar varias alternativas a esa teoría, como el constructivismo , la teoría de conjuntos finitos y la teoría de conjuntos computables . [25] [26] Los topos también brindan un entorno natural para el forzamiento y las discusiones sobre la independencia de la elección de ZF, además de proporcionar el marco para la topología sin sentido y los espacios de Stone . [27]
Un área activa de investigación son los fundamentos univalentes y la teoría de tipos homotópicos relacionada con ellos . Dentro de la teoría de tipos homotópicos, un conjunto puede considerarse como un tipo homotópico 0, con propiedades universales de conjuntos que surgen de las propiedades inductivas y recursivas de tipos inductivos superiores . Principios como el axioma de elección y la ley del tercero excluido pueden formularse de una manera correspondiente a la formulación clásica en la teoría de conjuntos o quizás en un espectro de formas distintas exclusivas de la teoría de tipos. Se puede demostrar que algunos de estos principios son una consecuencia de otros principios. La variedad de formulaciones de estos principios axiomáticos permite un análisis detallado de las formulaciones necesarias para derivar varios resultados matemáticos. [28] [29]
A medida que la teoría de conjuntos ganó popularidad como base de las matemáticas modernas, hubo apoyo a la idea de introducir los conceptos básicos de la teoría de conjuntos ingenua en una etapa temprana de la educación matemática .
En los Estados Unidos, en la década de 1960, el experimento New Math tenía como objetivo enseñar la teoría de conjuntos básica, entre otros conceptos abstractos, a los estudiantes de la escuela primaria , pero fue recibido con muchas críticas. El programa de estudios de matemáticas en las escuelas europeas siguió esta tendencia y actualmente incluye la materia en diferentes niveles en todos los grados. Los diagramas de Venn se utilizan ampliamente para explicar las relaciones básicas de la teoría de conjuntos a los estudiantes de la escuela primaria (aunque John Venn los ideó originalmente como parte de un procedimiento para evaluar la validez de las inferencias en la lógica de términos ).
La teoría de conjuntos se utiliza para introducir a los estudiantes a los operadores lógicos (NOT, AND, OR) y la descripción semántica o de reglas ( definición técnicamente intensional [30] ) de conjuntos (p. ej., "meses que comienzan con la letra A "), lo que puede ser útil al aprender programación informática , ya que la lógica booleana se utiliza en varios lenguajes de programación . Del mismo modo, los conjuntos y otros objetos similares a colecciones, como los multiconjuntos y las listas , son tipos de datos comunes en la informática y la programación .
Además de eso, los conjuntos se utilizan comúnmente en la enseñanza de las matemáticas cuando se habla de diferentes tipos de números (los conjuntos de números naturales , de números enteros , de números reales , etc.) y cuando se define una función matemática como una relación de un conjunto (el dominio ) con otro conjunto (el rango ).