En lógica matemática , la teoría de modelos es el estudio de la relación entre las teorías formales (una colección de oraciones en un lenguaje formal que expresan afirmaciones sobre una estructura matemática ) y sus modelos (aquellas estructuras en las que se cumplen las afirmaciones de la teoría). [1] Los aspectos investigados incluyen el número y tamaño de los modelos de una teoría, la relación de los diferentes modelos entre sí y su interacción con el lenguaje formal en sí. En particular, los teóricos de modelos también investigan los conjuntos que se pueden definir en un modelo de una teoría y la relación de dichos conjuntos definibles entre sí. Como disciplina separada, la teoría de modelos se remonta a Alfred Tarski , quien utilizó por primera vez el término "Teoría de modelos" en una publicación en 1954. [2] Desde la década de 1970, el tema ha sido moldeado decisivamente por la teoría de la estabilidad de Saharon Shelah .
En comparación con otras áreas de la lógica matemática, como la teoría de la prueba , la teoría de modelos a menudo se preocupa menos por el rigor formal y se acerca más en espíritu a las matemáticas clásicas. Esto ha provocado el comentario de que "si la teoría de la prueba trata de lo sagrado, entonces la teoría de modelos trata de lo profano" . [3] Las aplicaciones de la teoría de modelos a la geometría algebraica y diofántica reflejan esta proximidad a las matemáticas clásicas, ya que a menudo implican una integración de resultados y técnicas algebraicas y de teoría de modelos. En consecuencia, la teoría de la prueba es de naturaleza sintáctica , en contraste con la teoría de modelos, que es de naturaleza semántica .
La organización académica más destacada en el campo de la teoría de modelos es la Asociación de Lógica Simbólica .
Esta página se centra en la teoría del modelo finitario de primer orden de estructuras infinitas.
El énfasis relativo puesto en la clase de modelos de una teoría en oposición a la clase de conjuntos definibles dentro de un modelo fluctuó en la historia del tema, y las dos direcciones se resumen en las concisas caracterizaciones de 1973 y 1997 respectivamente:
donde el álgebra universal representa las estructuras matemáticas y la lógica las teorías lógicas; y
donde las fórmulas lógicas son a los conjuntos definibles lo que las ecuaciones son a las variedades sobre un campo. [5]
No obstante, la interacción de las clases de modelos y los conjuntos definibles en ellas ha sido crucial para el desarrollo de la teoría de modelos a lo largo de su historia. Por ejemplo, si bien la estabilidad se introdujo originalmente para clasificar las teorías según la cantidad de modelos en una cardinalidad dada , la teoría de la estabilidad resultó crucial para comprender la geometría de los conjuntos definibles.
Una fórmula de primer orden se construye a partir de fórmulas atómicas como o mediante los conectores booleanos y la prefijación de cuantificadores o . Una oración es una fórmula en la que cada ocurrencia de una variable está dentro del alcance de un cuantificador correspondiente. Ejemplos de fórmulas son (o para indicar que es la variable no ligada en ) y (o ), definidas de la siguiente manera:
(Obsérvese que el símbolo de igualdad tiene aquí un doble significado.) Es intuitivamente claro cómo traducir tales fórmulas a un significado matemático. En la estructura σ smr de los números naturales, por ejemplo, un elemento satisface la fórmula si y sólo si es un número primo. La fórmula define de manera similar la irreducibilidad . Tarski dio una definición rigurosa, a veces llamada "definición de verdad de Tarski" , para la relación de satisfacción , de modo que uno puede probar fácilmente:
Un conjunto de oraciones se denomina teoría (de primer orden) , que toma las oraciones del conjunto como sus axiomas. Una teoría es satisfacible si tiene un modelo , es decir, una estructura (de la signatura apropiada) que satisface todas las oraciones del conjunto . Una teoría completa es una teoría que contiene todas las oraciones o su negación. La teoría completa de todas las oraciones satisfechas por una estructura también se denomina teoría de esa estructura .
Una consecuencia del teorema de completitud de Gödel (que no debe confundirse con sus teoremas de incompletitud ) es que una teoría tiene un modelo si y solo si es consistente , es decir, si la teoría no prueba ninguna contradicción. Por lo tanto, los teóricos de modelos a menudo usan "consistente" como sinónimo de "satisfacible".
Una firma o lenguaje es un conjunto de símbolos no lógicos de modo que cada símbolo sea un símbolo constante o un símbolo de función o relación con una aridad especificada . Nótese que en alguna literatura, los símbolos constantes se consideran símbolos de función con aridad cero y, por lo tanto, se omiten. Una estructura es un conjunto junto con interpretaciones de cada uno de los símbolos de la firma como relaciones y funciones (no debe confundirse con la noción formal de una " interpretación " de una estructura en otra).
Ejemplo: Una firma común para anillos ordenados es , donde y son símbolos de función 0-arios (también conocidos como símbolos constantes), y son símbolos de función binarios (= 2-arios), es un símbolo de función unario (= 1-ario) y es un símbolo de relación binaria. Entonces, cuando estos símbolos se interpretan para que correspondan con su significado habitual en (de modo que eg es una función de a y es un subconjunto de ), se obtiene una estructura .
Se dice que una estructura modela un conjunto de oraciones de primer orden en el idioma dado si cada oración en es verdadera en con respecto a la interpretación de la firma previamente especificada para . (Nuevamente, no debe confundirse con la noción formal de una " interpretación " de una estructura en otra) Un modelo de es una estructura que modela .
Una subestructura de una σ-estructura es un subconjunto de su dominio, cerrado bajo todas las funciones en su signatura σ, que se considera una σ-estructura al restringir todas las funciones y relaciones en σ al subconjunto. Esto generaliza los conceptos análogos del álgebra; por ejemplo, un subgrupo es una subestructura en la signatura con multiplicación e inversa.
Se dice que una subestructura es elemental si para cualquier fórmula de primer orden y cualquier elemento a 1 , ..., a n de ,
En particular, si es una oración y una subestructura elemental de , entonces si y sólo si . Por lo tanto, una subestructura elemental es un modelo de una teoría exactamente cuando la superestructura es un modelo.
Ejemplo: Mientras que el campo de los números algebraicos es una subestructura elemental del campo de los números complejos , el campo racional no lo es, ya que podemos expresar "Hay una raíz cuadrada de 2" como una oración de primer orden satisfecha por pero no por .
Una incrustación de una σ-estructura en otra σ-estructura es una función f : A → B entre los dominios que se puede escribir como un isomorfismo de con una subestructura de . Si se puede escribir como un isomorfismo con una subestructura elemental, se denomina incrustación elemental. Toda incrustación es un homomorfismo inyectivo , pero lo inverso se cumple solo si la signatura no contiene símbolos de relación, como en grupos o campos.
Un campo o un espacio vectorial puede considerarse como un grupo (conmutativo) simplemente ignorando parte de su estructura. La noción correspondiente en la teoría de modelos es la de una reducción de una estructura a un subconjunto de la signatura original. La relación opuesta se denomina expansión ; por ejemplo, el grupo (aditivo) de los números racionales , considerado como una estructura en la signatura {+,0}, puede expandirse a un campo con la signatura {×,+,1,0} o a un grupo ordenado con la signatura {+,0,<}.
De manera similar, si σ' es una signatura que extiende otra signatura σ, entonces una σ'-teoría completa puede restringirse a σ intersectando el conjunto de sus oraciones con el conjunto de σ-fórmulas. A la inversa, una σ-teoría completa puede considerarse como una σ'-teoría, y se la puede extender (de más de una manera) a una σ'-teoría completa. Los términos reducción y expansión también se aplican a veces a esta relación.
El teorema de compacidad establece que un conjunto de oraciones S es satisfacible si cada subconjunto finito de S es satisfacible. La afirmación análoga con consistente en lugar de satisfacible es trivial, ya que cada prueba puede tener solo un número finito de antecedentes utilizados en la prueba. El teorema de completitud nos permite transferir esto a la satisfacibilidad. Sin embargo, también hay varias pruebas directas (semánticas) del teorema de compacidad. Como corolario (es decir, su contrapositivo), el teorema de compacidad dice que cada teoría de primer orden insatisfacible tiene un subconjunto insatisfacible finito. Este teorema es de importancia central en la teoría de modelos, donde las palabras "por compacidad" son comunes. [6]
Otra piedra angular de la teoría de modelos de primer orden es el teorema de Löwenheim-Skolem . Según el teorema de Löwenheim-Skolem, cada estructura infinita en una firma contable tiene una subestructura elemental contable. A la inversa, para cualquier cardinal infinito κ, cada estructura infinita en una firma contable que sea de cardinalidad menor que κ puede estar elementalmente incrustada en otra estructura de cardinalidad κ (hay una generalización directa para firmas incontables). En particular, el teorema de Löwenheim-Skolem implica que cualquier teoría en una firma contable con modelos infinitos tiene un modelo contable así como modelos arbitrariamente grandes. [7]
En cierto sentido, precisado por el teorema de Lindström , la lógica de primer orden es la lógica más expresiva para la cual se cumplen tanto el teorema de Löwenheim-Skolem como el teorema de compacidad. [8]
En la teoría de modelos, los conjuntos definibles son objetos de estudio importantes. Por ejemplo, en la fórmula
define el subconjunto de números primos, mientras que la fórmula
define el subconjunto de números pares. De manera similar, las fórmulas con n variables libres definen subconjuntos de . Por ejemplo, en un campo, la fórmula
define la curva de todos tales que .
Ambas definiciones mencionadas aquí no tienen parámetros , es decir, las fórmulas que las definen no mencionan ningún elemento de dominio fijo. Sin embargo, también se pueden considerar definiciones con parámetros del modelo . Por ejemplo, en , la fórmula
utiliza el parámetro from para definir una curva. [9]
En general, los conjuntos definibles sin cuantificadores son fáciles de describir, mientras que los conjuntos definibles que involucran cuantificadores posiblemente anidados pueden ser mucho más complicados. [10]
Esto hace que la eliminación de cuantificadores sea una herramienta crucial para analizar conjuntos definibles: una teoría T tiene eliminación de cuantificadores si cada fórmula de primer orden φ( x 1 , ..., x n ) sobre su firma es equivalente módulo T a una fórmula de primer orden ψ( x 1 , ..., x n ) sin cuantificadores, es decir, se cumple en todos los modelos de T . [11] Si la teoría de una estructura tiene eliminación de cuantificadores, cada conjunto definible en una estructura es definible por una fórmula sin cuantificadores sobre los mismos parámetros que la definición original. Por ejemplo, la teoría de cuerpos algebraicamente cerrados en la firma σ ring = (×,+,−,0,1) tiene eliminación de cuantificadores. [12] Esto significa que en un cuerpo algebraicamente cerrado, cada fórmula es equivalente a una combinación booleana de ecuaciones entre polinomios.
Si una teoría no tiene eliminación de cuantificadores, se pueden agregar símbolos adicionales a su firma para que la tenga. Los resultados de axiomatización y eliminación de cuantificadores para teorías específicas, especialmente en álgebra, estuvieron entre los primeros resultados emblemáticos de la teoría de modelos. [13] Pero a menudo, en lugar de la eliminación de cuantificadores, basta con una propiedad más débil:
Una teoría T se considera modelo-completa si cada subestructura de un modelo de T que es en sí misma un modelo de T es una subestructura elemental. Existe un criterio útil para comprobar si una subestructura es una subestructura elemental, llamado prueba de Tarski-Vaught . [14] De este criterio se deduce que una teoría T es modelo-completa si y solo si cada fórmula de primer orden φ( x 1 , ..., x n ) sobre su signatura es equivalente módulo T a una fórmula existencial de primer orden, es decir, una fórmula de la siguiente forma:
donde ψ es cuantificador libre. Una teoría que no es completa en cuanto al modelo puede tener una completitud del modelo , que es una teoría completa del modelo relacionada que no es, en general, una extensión de la teoría original. Una noción más general es la de un compañero del modelo . [15]
En cada estructura, cada subconjunto finito es definible con parámetros: simplemente use la fórmula
Como podemos negar esta fórmula, cada subconjunto cofinito (que incluye todos los elementos del dominio excepto un número finito) también es siempre definible.
Esto conduce al concepto de una estructura mínima . Una estructura se llama mínima si cada subconjunto definible con parámetros de es finito o cofinito. El concepto correspondiente a nivel de teorías se llama minimalidad fuerte : una teoría T se llama fuertemente mínima si cada modelo de T es mínimo. Una estructura se llama fuertemente mínima si la teoría de esa estructura es fuertemente mínima. Equivalentemente, una estructura es fuertemente mínima si cada extensión elemental es mínima. Dado que la teoría de campos algebraicamente cerrados tiene eliminación de cuantificadores, cada subconjunto definible de un campo algebraicamente cerrado es definible por una fórmula libre de cuantificadores en una variable. Las fórmulas libres de cuantificadores en una variable expresan combinaciones booleanas de ecuaciones polinómicas en una variable, y dado que una ecuación polinómica no trivial en una variable tiene solo un número finito de soluciones, la teoría de campos algebraicamente cerrados es fuertemente mínima. [16]
Por otra parte, el campo de los números reales no es mínimo: considérese, por ejemplo, el conjunto definible
Esto define el subconjunto de números reales no negativos, que no es ni finito ni cofinito. De hecho, se puede utilizar para definir intervalos arbitrarios en la línea de números reales. Resulta que estos son suficientes para representar cada subconjunto definible de . [17] Esta generalización de la minimalidad ha sido muy útil en la teoría de modelos de estructuras ordenadas. Una estructura totalmente ordenada densamente en una firma que incluye un símbolo para la relación de orden se llama o-minimal si cada subconjunto definible con parámetros de es una unión finita de puntos e intervalos. [18]
Particularmente importantes son aquellos conjuntos definibles que también son subestructuras, es decir, contienen todas las constantes y están cerrados bajo la aplicación de funciones. Por ejemplo, uno puede estudiar los subgrupos definibles de un cierto grupo. Sin embargo, no hay necesidad de limitarse a subestructuras en la misma signatura. Dado que las fórmulas con n variables libres definen subconjuntos de , las relaciones n -arias también pueden ser definibles. Las funciones son definibles si el gráfico de la función es una relación definible, y las constantes son definibles si hay una fórmula tal que a es el único elemento de tal que es verdadero. De esta manera, uno puede estudiar grupos y cuerpos definibles en estructuras generales, por ejemplo, lo que ha sido importante en la teoría de la estabilidad geométrica.
Incluso se puede ir un paso más allá y trascender las subestructuras inmediatas. Dada una estructura matemática, muy a menudo hay estructuras asociadas que se pueden construir como cociente de parte de la estructura original mediante una relación de equivalencia. Un ejemplo importante es un grupo de cocientes de un grupo. Se podría decir que para entender la estructura completa hay que entender estos cocientes. Cuando la relación de equivalencia es definible, podemos dar a la oración anterior un significado preciso. Decimos que estas estructuras son interpretables . Un hecho clave es que se pueden traducir oraciones del lenguaje de las estructuras interpretadas al lenguaje de la estructura original. Así se puede demostrar que si una estructura interpreta a otra cuya teoría es indecidible, entonces ella misma es indecidible. [19]
Para una secuencia de elementos de una estructura y un subconjunto A de , se puede considerar el conjunto de todas las fórmulas de primer orden con parámetros en A que se satisfacen por . Esto se llama el (n-)tipo completo realizado por sobre A . Si hay un automorfismo de que es constante en A y envía a respectivamente, entonces y realizan el mismo tipo completo sobre A .
La línea de números reales , vista como una estructura con solo la relación de orden {<}, servirá como un ejemplo en ejecución en esta sección. Cada elemento satisface el mismo 1-tipo sobre el conjunto vacío. Esto es claro ya que dos números reales cualesquiera a y b están conectados por el automorfismo de orden que desplaza todos los números por ba . El 2-tipo completo sobre el conjunto vacío realizado por un par de números depende de su orden: o bien , o bien . Sobre el subconjunto de números enteros, el 1-tipo de un número real no entero a depende de su valor redondeado hacia abajo al entero más cercano.
En términos más generales, siempre que sea una estructura y A un subconjunto de , un n-tipo (parcial) sobre A es un conjunto de fórmulas p con como máximo n variables libres que se realizan en una extensión elemental de . Si p contiene cada una de esas fórmulas o su negación, entonces p es completo . El conjunto de n -tipos completos sobre A se escribe a menudo como . Si A es el conjunto vacío, entonces el espacio de tipos solo depende de la teoría de . La notación se utiliza comúnmente para el conjunto de tipos sobre el conjunto vacío consistente con . Si hay una única fórmula tal que la teoría de implica para cada fórmula en p , entonces p se llama aislado .
Como los números reales son arquimedianos , no existe ningún número real mayor que cualquier entero. Sin embargo, un argumento de compacidad muestra que existe una extensión elemental de la recta de números reales en la que hay un elemento mayor que cualquier entero. Por lo tanto, el conjunto de fórmulas es un sobre de tipo 1 que no se realiza en la recta de números reales .
Un subconjunto de eso puede expresarse como exactamente aquellos elementos de la realización de un cierto tipo sobre A se llama definible por tipo sobre A . Para un ejemplo algebraico, supongamos que es un cuerpo algebraicamente cerrado . La teoría tiene eliminación de cuantificadores . Esto nos permite mostrar que un tipo está determinado exactamente por las ecuaciones polinómicas que contiene. Por lo tanto, el conjunto de -tipos completos sobre un subcuerpo corresponde al conjunto de ideales primos del anillo polinómico , y los conjuntos definibles por tipo son exactamente las variedades afines. [20]
Si bien no todos los tipos se realizan en todas las estructuras, cada estructura realiza sus tipos aislados. Si los únicos tipos del conjunto vacío que se realizan en una estructura son los tipos aislados, entonces la estructura se denomina atómica .
Por otra parte, ninguna estructura realiza todos los tipos sobre todos los conjuntos de parámetros; si se toma todo de como conjunto de parámetros, entonces cada 1-tipo sobre realizado en se aísla mediante una fórmula de la forma a = x para un . Sin embargo, cualquier extensión elemental adecuada de contiene un elemento que no está en . Por lo tanto, se ha introducido una noción más débil que captura la idea de una estructura que realiza todos los tipos que se podría esperar que realice. Una estructura se llama saturada si realiza todos los tipos sobre un conjunto de parámetros que es de cardinalidad menor que ella misma.
Si bien un automorfismo que es constante en A siempre preservará los tipos en A , generalmente no es cierto que dos secuencias cualesquiera y que satisfagan el mismo tipo en A puedan mapearse entre sí mediante dicho automorfismo. Una estructura en la que este recíproco se cumple para todos los A de cardinalidad menor que se denomina homogénea .
La línea de números reales es atómica en el lenguaje que contiene solo el orden , ya que todos los n -tipos sobre el conjunto vacío realizados por en están aislados por las relaciones de orden entre los . Sin embargo, no está saturada, ya que no realiza ningún 1-tipo sobre el conjunto contable que implique que x sea mayor que cualquier entero. La línea de números racionales está saturada, en contraste, ya que es en sí misma contable y, por lo tanto, solo tiene que realizar tipos sobre subconjuntos finitos para estar saturada. [21]
El conjunto de subconjuntos definibles de sobre algunos parámetros es un álgebra de Boole . Por el teorema de representación de Stone para álgebras de Boole existe un espacio topológico dual natural , que consiste exactamente en los -tipos completos sobre . La topología generada por conjuntos de la forma para fórmulas simples . Esto se llama el espacio de Stone de n-tipos sobre A . [22] Esta topología explica parte de la terminología utilizada en la teoría de modelos: El teorema de compacidad dice que el espacio de Stone es un espacio topológico compacto, y un tipo p está aislado si y solo si p es un punto aislado en la topología de Stone.
Mientras que los tipos en cuerpos algebraicamente cerrados corresponden al espectro del anillo polinomial, la topología en el espacio de tipos es la topología construible : un conjunto de tipos es básicamente abierto si y solo si es de la forma o de la forma . Esto es más fino que la topología de Zariski . [23]
Construir modelos que implementen ciertos tipos y no implementen otros es una tarea importante en la teoría de modelos. No implementar un tipo se conoce como omitirlo , y generalmente es posible mediante el teorema de omisión de tipos (contables) :
Esto implica que si una teoría en una firma contable solo tiene un número contable de tipos en el conjunto vacío, entonces esta teoría tiene un modelo atómico.
Por otra parte, siempre existe una extensión elemental en la que se realiza cualquier conjunto de tipos sobre un conjunto de parámetros fijos:
Sin embargo, dado que el conjunto de parámetros es fijo y no se menciona aquí la cardinalidad de , esto no implica que cada teoría tenga un modelo saturado. De hecho, el hecho de que cada teoría tenga un modelo saturado es independiente de los axiomas de Zermelo-Fraenkel de la teoría de conjuntos, y es cierto si se cumple la hipótesis del continuo generalizado . [26]
Los ultraproductos se utilizan como una técnica general para construir modelos que materializan ciertos tipos. Un ultraproducto se obtiene a partir del producto directo de un conjunto de estructuras sobre un conjunto de índices I mediante la identificación de aquellas tuplas que coinciden en casi todas las entradas, donde casi todas se precisan mediante un ultrafiltro U sobre I. Un ultraproducto de copias de la misma estructura se conoce como ultrapotencia . La clave para utilizar ultraproductos en la teoría de modelos es el teorema de Łoś :
En particular, cualquier ultraproducto de modelos de una teoría es en sí mismo un modelo de esa teoría y, por lo tanto, si dos modelos tienen ultrapotencias isomorfas, son elementalmente equivalentes. El teorema de Keisler-Shelah proporciona una respuesta inversa:
Por lo tanto, los ultraproductos proporcionan una forma de hablar sobre la equivalencia elemental que evita mencionar las teorías de primer orden. Los teoremas básicos de la teoría de modelos, como el teorema de compacidad, tienen demostraciones alternativas utilizando ultraproductos [29] y pueden usarse para construir extensiones elementales saturadas si existen [30] .
En un principio, se decía que una teoría era categórica si determinaba una estructura hasta el isomorfismo. Resulta que esta definición no es útil debido a las serias restricciones en la expresividad de la lógica de primer orden. El teorema de Löwenheim-Skolem implica que si una teoría T tiene un modelo infinito para algún número cardinal infinito , entonces tiene un modelo de tamaño κ para cualquier número cardinal κ suficientemente grande . Como dos modelos de diferentes tamaños no pueden ser isomorfos, una teoría categórica solo puede describir estructuras finitas.
Sin embargo, la noción más débil de κ -categoricidad para un cardinal κ se ha convertido en un concepto clave en la teoría de modelos. Una teoría T se llama κ -categórica si dos modelos de T que son de cardinalidad κ son isomorfos. Resulta que la cuestión de κ -categoricidad depende críticamente de si κ es mayor que la cardinalidad del lenguaje (es decir , donde | σ | es la cardinalidad de la firma). Para firmas finitas o contables esto significa que hay una diferencia fundamental entre ω -cardinalidad y κ -cardinalidad para κ incontables .
Las teorías ω -categóricas se pueden caracterizar por las propiedades de su espacio de tipos:
La teoría de , que es también la teoría de , es ω -categórica, ya que cada n -tipo sobre el conjunto vacío está aislado por la relación de orden por pares entre los . Esto significa que cada orden lineal denso contable es orden-isomorfo a la línea de números racionales. Por otro lado, las teorías de ℚ, ℝ y ℂ como cuerpos no son -categóricas. Esto se deduce del hecho de que en todos esos cuerpos, cualquiera de los infinitos números naturales puede definirse por una fórmula de la forma .
-Las teorías categóricas y sus modelos contables también tienen fuertes vínculos con los grupos oligomórficos :
Las caracterizaciones equivalentes de esta subsección, debidas independientemente a Engeler , Ryll-Nardzewski y Svenonius , se denominan a veces teorema de Ryll-Nardzewski.
En las firmas combinatorias, una fuente común de teorías ω -categóricas son los límites de Fraïssé , que se obtienen como el límite de amalgamar todas las configuraciones posibles de una clase de estructuras relacionales finitas.
Michael Morley demostró en 1963 que sólo existe una noción de categoricidad incontable para las teorías en lenguajes contables. [31]
La prueba de Morley reveló profundas conexiones entre la categoricidad incontable y la estructura interna de los modelos, que se convirtió en el punto de partida de la teoría de la clasificación y la teoría de la estabilidad. Las teorías categóricas incontables son, desde muchos puntos de vista, las teorías que mejor se comportan. En particular, las teorías mínimas fuertes completas son categóricas incontables. Esto muestra que la teoría de cuerpos algebraicamente cerrados de una característica dada es categórica incontable, y el grado de trascendencia del cuerpo determina su tipo de isomorfismo.
Una teoría que es a la vez ω -categórica y incontablemente categórica se denomina totalmente categórica .
Un factor clave en la estructura de la clase de modelos de una teoría de primer orden es su lugar en la jerarquía de estabilidad .
Una teoría se denomina estable si es -estable para algún cardinal infinito . Tradicionalmente, las teorías que son -estables se denominan -estables . [32]
Un resultado fundamental en la teoría de la estabilidad es el teorema del espectro de estabilidad , [33] que implica que cada teoría completa T en una firma contable cae en una de las siguientes clases:
Una teoría del primer tipo se llama inestable , una teoría del segundo tipo se llama estrictamente estable y una teoría del tercer tipo se llama superestable . Además, si una teoría es -estable, es estable en cada cardinal infinito, [34] por lo que la -estabilidad es más fuerte que la superestabilidad.
Muchas construcciones en teoría de modelos son más fáciles cuando se restringen a teorías estables; por ejemplo, cada modelo de una teoría estable tiene una extensión elemental saturada, independientemente de si la hipótesis del continuo generalizado es verdadera. [35]
La motivación original de Shelah para estudiar teorías estables era decidir cuántos modelos tiene una teoría contable de cualquier cardinalidad incontable. [36] Si una teoría es incontablemente categórica, entonces es -estable. De manera más general, el teorema de la brecha principal implica que si hay un cardinal incontable tal que una teoría T tiene menos de modelos de cardinalidad , entonces T es superestable.
La jerarquía de estabilidad también es crucial para analizar la geometría de los conjuntos definibles dentro de un modelo de una teoría. En las teorías -estables, el rango de Morley es una noción de dimensión importante para los conjuntos definibles S dentro de un modelo. Se define por inducción transfinita :
Una teoría T en la que cada conjunto definible tiene un rango de Morley bien definido se llama totalmente trascendental ; si T es numerable, entonces T es totalmente trascendental si y solo si T es -estable. El rango de Morley se puede extender a los tipos estableciendo que el rango de Morley de un tipo sea el mínimo de los rangos de Morley de las fórmulas en el tipo. Por lo tanto, también se puede hablar del rango de Morley de un elemento a sobre un conjunto de parámetros A , definido como el rango de Morley del tipo de a sobre A . También hay análogos del rango de Morley que están bien definidos si y solo si una teoría es superestable ( rango U ) o simplemente estable ( rango de Shelah). Esas nociones de dimensión se pueden utilizar para definir nociones de independencia y de extensiones genéricas.
Más recientemente, la estabilidad se ha descompuesto en simplicidad y "propiedad no independiente" (NIP). Las teorías simples son aquellas teorías en las que se puede definir una noción de independencia que se comporta bien, mientras que las teorías NIP generalizan estructuras o-minimales. Están relacionadas con la estabilidad, ya que una teoría es estable si y solo si es NIP y simple, [37] y varios aspectos de la teoría de la estabilidad se han generalizado a teorías en una de estas clases.
Los resultados de la teoría de modelos se han generalizado más allá de las clases elementales, es decir, las clases axiomatizables mediante una teoría de primer orden.
La teoría de modelos en lógicas de orden superior o lógicas infinitarias se ve obstaculizada por el hecho de que la completitud y la compacidad en general no se cumplen para estas lógicas. Esto se concreta mediante el teorema de Lindström , que afirma aproximadamente que la lógica de primer orden es esencialmente la lógica más fuerte en la que se cumplen tanto los teoremas de Löwenheim-Skolem como la compacidad. Sin embargo, las técnicas de teoría de modelos también se han desarrollado ampliamente para estas lógicas. [38] Resulta, sin embargo, que gran parte de la teoría de modelos de lenguajes lógicos más expresivos es independiente de la teoría de conjuntos de Zermelo-Fraenkel . [39]
Más recientemente, junto con el cambio de enfoque hacia teorías estables y categóricas completas, se ha trabajado en clases de modelos definidos semánticamente en lugar de axiomatizados por una teoría lógica. Un ejemplo es la teoría de modelos homogéneos , que estudia la clase de subestructuras de modelos homogéneos arbitrariamente grandes. Los resultados fundamentales de la teoría de la estabilidad y la teoría de la estabilidad geométrica se generalizan a este contexto. [40] Como generalización de teorías fuertemente mínimas, las clases cuasiminimalmente excelentes son aquellas en las que cada conjunto definible es contable o co-contable. Son clave para la teoría de modelos de la función exponencial compleja . [41] El marco semántico más general en el que se estudia la estabilidad son las clases elementales abstractas , que se definen por una fuerte relación de subestructura que generaliza la de una subestructura elemental. Aunque su definición es puramente semántica, cada clase elemental abstracta puede presentarse como los modelos de una teoría de primer orden que omite ciertos tipos. La generalización de nociones de teoría de la estabilidad a clases elementales abstractas es un programa de investigación en curso. [42]
Entre los primeros éxitos de la teoría de modelos se encuentran las pruebas de Tarski de eliminación de cuantificadores para varias clases algebraicamente interesantes, como los cuerpos reales cerrados , las álgebras de Boole y los cuerpos algebraicamente cerrados de una característica dada . La eliminación de cuantificadores permitió a Tarski demostrar que las teorías de primer orden de los cuerpos reales cerrados y algebraicamente cerrados, así como la teoría de primer orden de las álgebras de Boole son decidibles, clasificar las álgebras de Boole hasta la equivalencia elemental y demostrar que las teorías de los cuerpos reales cerrados y los cuerpos algebraicamente cerrados de una característica dada son únicas. Además, la eliminación de cuantificadores proporcionó una descripción precisa de las relaciones definibles en cuerpos algebraicamente cerrados como variedades algebraicas y de las relaciones definibles en cuerpos reales cerrados como conjuntos semialgebraicos [43] [44]
En la década de 1960, la introducción de la construcción del ultraproducto condujo a nuevas aplicaciones en álgebra. Esto incluye el trabajo de Ax sobre campos pseudofinitos , que demuestra que la teoría de campos finitos es decidible, [45] y la prueba de Ax y Kochen de un caso especial de la conjetura de Artin sobre ecuaciones diofánticas, el teorema de Ax-Kochen . [46] La construcción del ultraproducto también condujo al desarrollo del análisis no estándar por parte de Abraham Robinson , que tiene como objetivo proporcionar un cálculo riguroso de infinitesimales . [47]
Más recientemente, la conexión entre la estabilidad y la geometría de conjuntos definibles condujo a varias aplicaciones de la geometría algebraica y diofántica, incluida la prueba de Ehud Hrushovski de 1996 de la conjetura geométrica de Mordell-Lang en todas las características [48]. En 2001, se utilizaron métodos similares para demostrar una generalización de la conjetura de Manin-Mumford. En 2011, Jonathan Pila aplicó técnicas en torno a la o-minimalidad para demostrar la conjetura de André-Oort para productos de curvas modulares. [49]
En una línea de investigación separada que también surgió en torno a las teorías estables, Laskowski demostró en 1992 que las teorías NIP describen exactamente aquellas clases definibles que se pueden aprender mediante PAC en la teoría del aprendizaje automático. Esto ha dado lugar a varias interacciones entre estas áreas separadas. En 2018, la correspondencia se amplió cuando Hunter y Chase demostraron que las teorías estables corresponden a clases que se pueden aprender en línea . [50]
La teoría de modelos como tema existe desde aproximadamente mediados del siglo XX, y el nombre fue acuñado por Alfred Tarski , miembro de la escuela de Lwów-Varsovia , en 1954. [51] Sin embargo, algunas investigaciones anteriores, especialmente en lógica matemática , a menudo se consideran de naturaleza teórica de modelos en retrospectiva. [52] El primer resultado significativo en lo que ahora es la teoría de modelos fue un caso especial del teorema descendente de Löwenheim-Skolem, publicado por Leopold Löwenheim en 1915. El teorema de compacidad estaba implícito en el trabajo de Thoralf Skolem , [53] pero se publicó por primera vez en 1930, como un lema en la prueba de Kurt Gödel de su teorema de completitud . El teorema de Löwenheim-Skolem y el teorema de compacidad recibieron sus respectivas formas generales en 1936 y 1941 de Anatoly Maltsev . El desarrollo de la teoría de modelos como disciplina independiente fue impulsado por Alfred Tarski durante el período de entreguerras . El trabajo de Tarski incluía la consecuencia lógica , los sistemas deductivos , el álgebra de la lógica, la teoría de la definibilidad y la definición semántica de la verdad , entre otros temas. Sus métodos semánticos culminaron en la teoría de modelos que él y varios de sus estudiantes de Berkeley desarrollaron en los años 50 y 60.
En la historia posterior de la disciplina, comenzaron a surgir diferentes vertientes y el enfoque del tema cambió. En la década de 1960, las técnicas en torno a los ultraproductos se convirtieron en una herramienta popular en la teoría de modelos. [54] Al mismo tiempo, investigadores como James Ax estaban investigando la teoría de modelos de primer orden de varias clases algebraicas, y otros como H. Jerome Keisler estaban extendiendo los conceptos y resultados de la teoría de modelos de primer orden a otros sistemas lógicos. Luego, inspirado por el problema de Morley , Shelah desarrolló la teoría de la estabilidad . Su trabajo en torno a la estabilidad cambió la complexión de la teoría de modelos, dando lugar a una nueva clase de conceptos. Esto se conoce como el cambio de paradigma. [55] Durante las siguientes décadas, se hizo evidente que la jerarquía de estabilidad resultante está estrechamente relacionada con la geometría de los conjuntos que son definibles en esos modelos; esto dio lugar a la subdisciplina ahora conocida como teoría de la estabilidad geométrica. Un ejemplo de una prueba influyente de la teoría de modelos geométricos es la prueba de Hrushovski de la conjetura de Mordell-Lang para cuerpos de funciones. [56]
La teoría de modelos finitos , que se concentra en estructuras finitas, diverge significativamente del estudio de estructuras infinitas tanto en los problemas estudiados como en las técnicas utilizadas. [57] En particular, muchos resultados centrales de la teoría de modelos clásica que fallan cuando se restringen a estructuras finitas. Esto incluye el teorema de compacidad , el teorema de completitud de Gödel y el método de ultraproductos para lógica de primer orden . En la interfaz de la teoría de modelos finitos e infinitos se encuentran la teoría de modelos algorítmicos o computables y el estudio de las leyes 0-1, donde los modelos infinitos de una teoría genérica de una clase de estructuras proporcionan información sobre la distribución de modelos finitos. [58] Las áreas de aplicación prominentes de FMT son la teoría de la complejidad descriptiva , la teoría de bases de datos y la teoría del lenguaje formal . [59]
Toda teoría de conjuntos (que se expresa en un lenguaje contable ), si es consistente, tiene un modelo contable; esto se conoce como la paradoja de Skolem , ya que hay oraciones en la teoría de conjuntos que postulan la existencia de conjuntos incontables y, sin embargo, estas oraciones son verdaderas en nuestro modelo contable. En particular, la prueba de la independencia de la hipótesis del continuo requiere considerar conjuntos en modelos que parecen incontables cuando se los ve desde dentro del modelo, pero que son contables para alguien fuera del modelo. [60]
El punto de vista de la teoría de modelos ha sido útil en la teoría de conjuntos ; por ejemplo, en el trabajo de Kurt Gödel sobre el universo construible, que, junto con el método de forzamiento desarrollado por Paul Cohen, puede demostrar la independencia (de nuevo filosóficamente interesante) del axioma de elección y la hipótesis del continuo respecto de los otros axiomas de la teoría de conjuntos. [61]
En la otra dirección, la teoría de modelos se formaliza en sí misma dentro de la teoría de conjuntos de Zermelo-Fraenkel. Por ejemplo, el desarrollo de los fundamentos de la teoría de modelos (como el teorema de compacidad) se basa en el axioma de elección y, de hecho, es equivalente, en la teoría de conjuntos de Zermelo-Fraenkel sin elección, al teorema del ideal primo de Boole. [62] Otros resultados de la teoría de modelos dependen de axiomas de la teoría de conjuntos más allá del marco estándar de ZFC. Por ejemplo, si se cumple la Hipótesis del Continuo, entonces cada modelo numerable tiene una ultrapotencia que está saturada (en su propia cardinalidad). De manera similar, si se cumple la Hipótesis del Continuo Generalizado, entonces cada modelo tiene una extensión elemental saturada. Ninguno de estos resultados es demostrable solo en ZFC. Finalmente, se ha demostrado que algunas cuestiones que surgen de la teoría de modelos (como la compacidad para lógicas infinitarias) son equivalentes a axiomas cardinales grandes. [63]