stringtranslate.com

Teoría de modelos

En lógica matemática , la teoría de modelos es el estudio de la relación entre teorías formales (una colección de oraciones en un lenguaje formal que expresan enunciados sobre una estructura matemática ) y sus modelos (aquellas estructuras en las que se sostienen los enunciados de la teoría). [1] Los aspectos investigados incluyen el número y tamaño de los modelos de una teoría, la relación de los diferentes modelos entre sí y su interacción con el lenguaje formal mismo. En particular, los teóricos de modelos también investigan los conjuntos que se pueden definir en un modelo de una teoría y la relación de dichos conjuntos definibles entre sí. Como disciplina separada, la teoría de modelos se remonta a Alfred Tarski , quien utilizó por primera vez el término "Teoría de modelos" en una publicación de 1954. [2] Desde la década de 1970, el tema ha sido moldeado decisivamente por la teoría de la estabilidad de Saharon Shelah .

En comparación con otras áreas de la lógica matemática, como la teoría de la prueba , la teoría de modelos suele estar menos preocupada por el rigor formal y más cercana en espíritu a las matemáticas clásicas. Esto ha suscitado el comentario de que "si la teoría de la prueba trata de lo sagrado, entonces la teoría del modelo trata de lo profano" . [3] Las aplicaciones de la teoría de modelos a la geometría algebraica y diofántica reflejan esta proximidad a las matemáticas clásicas, ya que a menudo implican una integración de resultados y técnicas algebraicos y teóricos de modelos. En consecuencia, la teoría de la prueba es de naturaleza sintáctica , en contraste con la teoría de modelos, que es de naturaleza semántica .

La organización académica más destacada en el campo de la teoría de modelos es la Asociación para la Lógica Simbólica .

Descripción general

Esta página se centra en la teoría del modelo finito de primer orden de estructuras infinitas.

El énfasis relativo puesto en la clase de modelos de una teoría en contraposición a la clase de conjuntos definibles dentro de un modelo fluctuó en la historia del tema, y ​​las dos direcciones se resumen en las concisas caracterizaciones de 1973 y 1997 respectivamente:

teoría de modelos = álgebra universal + lógica [4]

donde el álgebra universal representa las estructuras matemáticas y la lógica las teorías lógicas; y

teoría de modelos = geometría algebraica - campos .

donde las fórmulas lógicas corresponden a conjuntos definibles y las ecuaciones a variedades en un campo. [5]

No obstante, la interacción de clases de modelos y los conjuntos definibles en ellos ha sido crucial para el desarrollo de la teoría de modelos a lo largo de su historia. Por ejemplo, si bien la estabilidad se introdujo originalmente para clasificar teorías por su número de modelos en una cardinalidad determinada , la teoría de la estabilidad resultó crucial para comprender la geometría de conjuntos definibles.

Nociones fundamentales de la teoría de modelos de primer orden

Lógica de primer orden

Una fórmula de primer orden se construye a partir de fórmulas atómicas como o mediante conectivos booleanos y prefijos de cuantificadores o . Una oración es una fórmula en la que cada aparición de una variable está en el alcance de un cuantificador correspondiente. Ejemplos de fórmulas son (o para marcar el hecho de que como máximo es una variable independiente en ) y se definen de la siguiente manera:

(Nótese que el símbolo de igualdad tiene aquí un doble significado). Es intuitivamente claro cómo traducir tales fórmulas a un significado matemático. En la estructura σ smr de los números naturales, por ejemplo, un elemento satisface la fórmula si y sólo si es un número primo. La fórmula define de manera similar la irreductibilidad . Tarski dio una definición rigurosa, a veces llamada "definición de verdad de Tarski" , para la relación de satisfacción , de modo que se prueba fácilmente:

es un número primo.
es irreductible.

Un conjunto de oraciones se llama teoría (de primer orden) , que toma las oraciones del conjunto como sus axiomas. Una teoría es satisfactoria si tiene un modelo , es decir, una estructura (de la firma apropiada) que satisface todas las oraciones del conjunto . Una teoría completa es una teoría que contiene cada oración o su negación. La teoría completa de todas las oraciones satisfechas por una estructura también se llama teoría de esa estructura .

Es una consecuencia del teorema de completitud de Gödel (que no debe confundirse con sus teoremas de incompletitud ) que una teoría tiene un modelo si y sólo si es consistente , es decir, la teoría no prueba ninguna contradicción. Por lo tanto, los teóricos de modelos suelen utilizar "consistente" como sinónimo de "satisfactible".

Conceptos básicos de teoría de modelos.

Una firma o lenguaje es un conjunto de símbolos no lógicos de modo que cada símbolo es un símbolo constante o un símbolo de función o relación con una aridad específica . Tenga en cuenta que en alguna literatura, los símbolos constantes se consideran símbolos de funciones con aridad cero y, por lo tanto, se omiten. Una estructura es un conjunto de interpretaciones de cada uno de los símbolos de la firma como relaciones y funciones (no debe confundirse con la noción formal de una " interpretación " de una estructura en otra).

Ejemplo: una firma común para anillos ordenados es , donde y son símbolos de función 0-aria (también conocidos como símbolos constantes), y son símbolos de función binaria (= 2-aria), es un símbolo de función unaria (= 1-aria), y es un símbolo de relación binaria. Luego, cuando se interpreta que estos símbolos corresponden con su significado habitual en (de modo que, por ejemplo, es una función de a y es un subconjunto de ), se obtiene una estructura .

Se dice que una estructura modela [ se necesita aclaración ] un conjunto de oraciones de primer orden en el idioma dado si cada oración es verdadera con respecto a la interpretación de la firma especificada previamente para . (Nuevamente, no debe confundirse con la noción formal de una " interpretación " de una estructura en otra)

Una subestructura de una estructura σ es un subconjunto de su dominio, cerrado bajo todas las funciones en su firma σ, que se considera una estructura σ al restringir todas las funciones y relaciones en σ al subconjunto. Esto generaliza los conceptos análogos del álgebra; por ejemplo, un subgrupo es una subestructura en la firma con multiplicación e inversa.

Se dice que una subestructura es elemental si para cualquier fórmula de primer orden φ y cualesquiera elementos a 1 , ..., a n de ,

si y solo si .

En particular, si φ es una oración y una subestructura elemental de , entonces si y solo si . Así, una subestructura elemental es un modelo de una teoría exactamente cuando la superestructura es un modelo.

Ejemplo: Mientras que el campo de los números algebraicos es una subestructura elemental del campo de los números complejos , el campo racional no lo es, pues podemos expresar "Hay una raíz cuadrada de 2" como una oración de primer orden satisfecha por pero no por .

Una incrustación de una estructura σ en otra estructura σ es un mapa f : AB entre los dominios que puede escribirse como un isomorfismo de con una subestructura de . Si se puede escribir como un isomorfismo con una subestructura elemental, se llama incrustación elemental. Cada incrustación es un homomorfismo inyectivo , pero lo contrario sólo se cumple si la firma no contiene símbolos de relación, como en grupos o campos.

Un campo o un espacio vectorial puede considerarse como un grupo (conmutativo) simplemente ignorando parte de su estructura. La noción correspondiente en la teoría de modelos es la de reducción de una estructura a un subconjunto de la firma original. La relación opuesta se llama expansión ; por ejemplo, el grupo (aditivo) de los números racionales , considerado como una estructura en la firma {+,0}, se puede expandir a un campo con la firma {×,+,1,0} o a un grupo ordenado con la firma {+,0,<}.

De manera similar, si σ' es una firma que extiende otra firma σ, entonces una teoría σ' completa puede restringirse a σ cruzando el conjunto de sus oraciones con el conjunto de fórmulas σ. Por el contrario, una teoría σ completa puede considerarse como una teoría σ', y se puede extender (en más de una forma) a una teoría σ' completa. Los términos reducción y expansión a veces también se aplican a esta relación.

La compacidad y el teorema de Löwenheim-Skolem

El teorema de compacidad establece que un conjunto de oraciones S es satisfactible si todo subconjunto finito de S es satisfacible. La afirmación análoga con consistente en lugar de satisfactible es trivial, ya que cada prueba sólo puede tener un número finito de antecedentes utilizados en la prueba. El teorema de completitud nos permite transferir esto a la satisfacibilidad. Sin embargo, también existen varias demostraciones directas (semánticas) del teorema de la compacidad. Como corolario (es decir, su contrapositivo), el teorema de la compacidad dice que toda teoría de primer orden insatisfactoria tiene un subconjunto finito insatisfactorio. Este teorema es de importancia central en la teoría de modelos, donde las palabras "por compacidad" son comunes. [6]

Otra piedra angular de la teoría de modelos de primer orden es el teorema de Löwenheim-Skolem . Según el teorema de Löwenheim-Skolem, toda estructura infinita en una firma contable tiene una subestructura elemental contable. Por el contrario, para cualquier cardinal infinito κ, cada estructura infinita en una firma contable que tenga una cardinalidad menor que κ puede estar elementalmente incrustada en otra estructura de cardinalidad κ (existe una generalización sencilla para firmas incontables). En particular, el teorema de Löwenheim-Skolem implica que cualquier teoría en una firma contable con modelos infinitos tiene un modelo contable así como modelos arbitrariamente grandes. [7]

En cierto sentido, precisado por el teorema de Lindström , la lógica de primer orden es la lógica más expresiva para la cual se cumplen tanto el teorema de Löwenheim-Skolem como el teorema de compacidad. [8]

Definibilidad

Conjuntos definibles

En la teoría de modelos, los conjuntos definibles son importantes objetos de estudio. Por ejemplo, en la fórmula

define el subconjunto de números primos, mientras que la fórmula

define el subconjunto de números pares. De manera similar, las fórmulas con n variables libres definen subconjuntos de . Por ejemplo, en un campo, la fórmula

define la curva de todos los tales que .

Ambas definiciones mencionadas aquí no tienen parámetros , es decir, las fórmulas de definición no mencionan ningún elemento de dominio fijo. Sin embargo, también se pueden considerar definiciones con parámetros del modelo . Por ejemplo, en , la fórmula

utiliza el parámetro from para definir una curva. [9]

Eliminando cuantificadores

En general, los conjuntos definibles sin cuantificadores son fáciles de describir, mientras que los conjuntos definibles que involucran cuantificadores posiblemente anidados pueden ser mucho más complicados. [10]

Esto hace que la eliminación de cuantificadores sea una herramienta crucial para analizar conjuntos definibles: una teoría T tiene eliminación de cuantificadores si cada fórmula de primer orden φ( x 1 , ..., x n ) sobre su firma es equivalente en módulo T a una fórmula de primer orden ψ ( x 1 , ..., x n ) sin cuantificadores, es decir, se cumple en todos los modelos de T . [11] Si la teoría de una estructura tiene eliminación de cuantificadores, cada conjunto definible en una estructura se puede definir mediante una fórmula sin cuantificadores sobre los mismos parámetros que la definición original. Por ejemplo, la teoría de campos algebraicamente cerrados en la firma σ anillo = (×,+,−,0,1) tiene eliminación de cuantificadores. [12] Esto significa que en un campo algebraicamente cerrado, cada fórmula es equivalente a una combinación booleana de ecuaciones entre polinomios.

Si una teoría no tiene eliminación de cuantificadores, se pueden agregar símbolos adicionales a su firma para que así sea. Los resultados de axiomatizabilidad y eliminación de cuantificadores para teorías específicas, especialmente en álgebra, estuvieron entre los primeros resultados históricos de la teoría de modelos. [13] Pero a menudo, en lugar de la eliminación del cuantificador, basta con una propiedad más débil:

Una teoría T se llama modelo completo si cada subestructura de un modelo de T que es en sí mismo un modelo de T es una subestructura elemental. Existe un criterio útil para probar si una subestructura es una subestructura elemental, llamado prueba de Tarski-Vaught . [14] De este criterio se deduce que una teoría T es un modelo completo si y sólo si cada fórmula de primer orden φ( x 1 , ..., x n ) sobre su firma es equivalente en módulo T a una fórmula existencial de primer orden. fórmula, es decir, una fórmula de la siguiente forma:

,

donde ψ está libre de cuantificadores. Una teoría que no es de modelo completo puede tener una teoría de modelo completo , que es una teoría de modelo completo relacionada que no es, en general, una extensión de la teoría original. Una noción más general es la de acompañante modelo . [15]

Minimalidad

En cada estructura, cada subconjunto finito se puede definir con parámetros: simplemente use la fórmula

.

Como podemos negar esta fórmula, cada subconjunto cofinito (que incluye todos los elementos del dominio excepto un número finito) también es siempre definible.

Esto lleva al concepto de estructura mínima . Una estructura se llama mínima si cada subconjunto definible con parámetros de es finito o cofinito. El concepto correspondiente a nivel de teorías se llama minimalidad fuerte : una teoría T se llama fuertemente mínima si todo modelo de T es mínimo. Una estructura se llama fuertemente mínima si la teoría de esa estructura es fuertemente mínima. De manera equivalente, una estructura es fuertemente mínima si cada extensión elemental es mínima. Dado que la teoría de campos algebraicamente cerrados tiene eliminación de cuantificadores, cada subconjunto definible de un campo algebraicamente cerrado se puede definir mediante una fórmula sin cuantificadores en una variable. Las fórmulas sin cuantificadores en una variable expresan combinaciones booleanas de ecuaciones polinomiales en una variable, y dado que una ecuación polinómica no trivial en una variable tiene solo un número finito de soluciones, la teoría de campos algebraicamente cerrados es fuertemente mínima. [dieciséis]

Por otro lado, el campo de los números reales no es mínimo: considérese, por ejemplo, el conjunto definible

.

Esto define el subconjunto de números reales no negativos, que no es ni finito ni cofinito. De hecho, se puede utilizar para definir intervalos arbitrarios en la recta numérica real. Resulta que estos son suficientes para representar cada subconjunto definible de . [17] Esta generalización de la minimalidad ha sido muy útil en la teoría de modelos de estructuras ordenadas. Una estructura densamente ordenada en una firma que incluye un símbolo para la relación de orden se llama o-mínimo si cada subconjunto definible con parámetros de es una unión finita de puntos e intervalos. [18]

Estructuras definibles e interpretables.

Particularmente importantes son aquellos conjuntos definibles que también son subestructuras, es decir, contienen todas las constantes y están cerrados bajo la aplicación de funciones. Por ejemplo, se pueden estudiar los subgrupos definibles de un determinado grupo. Sin embargo, no es necesario limitarse a subestructuras en la misma firma. Dado que las fórmulas con n variables libres definen subconjuntos de , las relaciones n -arias también pueden ser definibles. Las funciones son definibles si la gráfica de la función es una relación definible, y las constantes son definibles si existe una fórmula tal que a sea el único elemento que sea verdadero. De esta manera, se pueden estudiar grupos y campos definibles en estructuras generales, por ejemplo, lo que ha sido importante en la teoría de la estabilidad geométrica.

Incluso se puede ir un paso más allá y ir más allá de las subestructuras inmediatas. Dada una estructura matemática, muy a menudo hay estructuras asociadas que pueden construirse como un cociente de parte de la estructura original mediante una relación de equivalencia. Un ejemplo importante es el grupo cociente de un grupo. Se podría decir que para entender la estructura completa hay que entender estos cocientes. Cuando la relación de equivalencia es definible, podemos darle a la oración anterior un significado preciso. Decimos que estas estructuras son interpretables . Un hecho clave es que se pueden traducir oraciones del lenguaje de las estructuras interpretadas al lenguaje de la estructura original. Así, se puede demostrar que si una estructura interpreta otra cuya teoría es indecidible, entonces ella misma es indecidible. [19]

Tipos

Nociones básicas

Para una secuencia de elementos de una estructura y un subconjunto A de , se puede considerar el conjunto de todas las fórmulas de primer orden con parámetros en A que son satisfechos por . Esto se llama tipo (n-) completo realizado por más de A . Si hay un automorfismo que es constante en A y se envía a respectivamente, entonces y realiza el mismo tipo completo en A .

La recta numérica real , vista como una estructura con solo la relación de orden {<}, servirá como ejemplo continuo en esta sección. Cada elemento satisface el mismo tipo 1 en el conjunto vacío. Esto está claro ya que dos números reales cualesquiera a y b están conectados por el automorfismo de orden que desplaza todos los números ba . El tipo 2 completo sobre el conjunto vacío realizado por un par de números depende de su orden: o , o . Sobre el subconjunto de números enteros, el tipo 1 de un número real no entero a depende de su valor redondeado hacia abajo al entero más cercano.

De manera más general, siempre que una estructura y A sean un subconjunto de , un tipo n (parcial) sobre A es un conjunto de fórmulas p con como máximo n variables libres que se realizan en una extensión elemental de . Si p contiene todas esas fórmulas o su negación, entonces p es completo . El conjunto de n tipos completos sobre A a menudo se escribe como . Si A es el conjunto vacío, entonces el espacio de tipos sólo depende de la teoría de . La notación se usa comúnmente para el conjunto de tipos sobre el conjunto vacío consistente con . Si hay una única fórmula tal que la teoría de implica para cada fórmula en p , entonces p se llama aislada .

Como los números reales son de Arquímedes , no existe un número real mayor que todo número entero. Sin embargo, un argumento de compacidad muestra que existe una extensión elemental de la recta numérica real en la que hay un elemento mayor que cualquier número entero. Por lo tanto, el conjunto de fórmulas es de tipo 1 y no se realiza en la recta de números reales .

Un subconjunto de eso se puede expresar como exactamente aquellos elementos de realizar un cierto tipo sobre A se llama tipo definible sobre A . Para un ejemplo algebraico, supongamos que es un campo algebraicamente cerrado . La teoría tiene eliminación de cuantificadores. Esto nos permite demostrar que un tipo está determinado exactamente por las ecuaciones polinómicas que contiene. Así, el conjunto de tipos completos sobre un subcampo corresponde al conjunto de ideales primos del anillo polinomial , y los conjuntos definibles por tipo son exactamente las variedades afines. [20]

Estructuras y tipos

Si bien no todos los tipos se realizan en todas las estructuras, cada estructura realiza sus tipos aislados. Si los únicos tipos sobre el conjunto vacío que se realizan en una estructura son los tipos aislados, entonces la estructura se llama atómica .

Por otro lado, ninguna estructura realiza todos los tipos en cada conjunto de parámetros; Si se toma todo como conjunto de parámetros, entonces cada tipo 1 realizado en exceso se aísla mediante una fórmula de la forma a = x para an . Sin embargo, cualquier extensión elemental adecuada de contiene un elemento que no está en . Por lo tanto, se ha introducido una noción más débil que captura la idea de una estructura que realiza todos los tipos que se podría esperar que realice. Una estructura se llama saturada si realiza todos los tipos sobre un conjunto de parámetros que tiene una cardinalidad menor que ella misma.

Si bien un automorfismo que es constante en A siempre preservará los tipos sobre A , generalmente no es cierto que dos secuencias cualesquiera que satisfagan el mismo tipo sobre A puedan mapearse entre sí mediante dicho automorfismo. Una estructura en la que lo contrario se cumple para todo A de cardinalidad menor que la que se denomina homogénea .

La recta numérica real es atómica en el lenguaje que contiene sólo el orden , ya que todos los n tipos sobre el conjunto vacío realizado por in están aislados por las relaciones de orden entre . Sin embargo, no está saturado, ya que no realiza ningún tipo 1 en el conjunto contable que implique que x sea mayor que cualquier número entero. La recta numérica racional , por el contrario, está saturada, ya que es en sí misma contable y, por lo tanto, sólo tiene que realizar tipos sobre subconjuntos finitos para ser saturada. [21]

Espacios de piedra

El conjunto de subconjuntos definibles de algunos parámetros es un álgebra booleana . Según el teorema de representación de Stone para las álgebras de Boole, existe un espacio topológico dual natural , que consta exactamente de los tipos completos sobre . La topología generada por conjuntos del formulario para fórmulas individuales . Esto se llama espacio Stone de tipos n sobre A. [22] Esta topología explica parte de la terminología utilizada en la teoría de modelos: El teorema de compacidad dice que el espacio de Stone es un espacio topológico compacto, y un tipo p está aislado si y sólo si p es un punto aislado en la topología de Stone.

Mientras que los tipos en campos algebraicamente cerrados corresponden al espectro del anillo polinomial, la topología en el espacio de tipos es la topología construible : un conjunto de tipos es básico abierto si es de la forma o de la forma . Esto es mejor que la topología de Zariski . [23]

Construyendo modelos

Realizar y omitir tipos

Construir modelos que realicen ciertos tipos y no realicen otros es una tarea importante en la teoría de modelos. No darse cuenta de un tipo se conoce como omitirlo , y generalmente es posible según el teorema de tipos de omisión (contables) :

Sea una teoría en una firma contable y sea un conjunto contable de tipos no aislados sobre el conjunto vacío.
Luego hay un modelo que omite todos los tipos . [24]

Esto implica que si una teoría en una firma contable tiene solo un número contable de tipos en el conjunto vacío, entonces esta teoría tiene un modelo atómico.

Por otro lado, siempre existe una extensión elemental en la que se realiza cualquier conjunto de tipos sobre un conjunto de parámetros fijo:

Sea una estructura y sea un conjunto de tipos completos sobre un conjunto de parámetros dado.
Luego hay una extensión elemental de la que se realiza todo tipo en . [25]

Sin embargo, dado que el conjunto de parámetros es fijo y no se menciona aquí la cardinalidad de , esto no implica que cada teoría tenga un modelo saturado. De hecho, si cada teoría tiene un modelo saturado es independiente de los axiomas de Zermelo-Fraenkel de la teoría de conjuntos, y es cierto si se cumple la hipótesis del continuo generalizado . [26]

Ultraproductos

Los ultraproductos se utilizan como técnica general para construir modelos que realicen ciertos tipos. Un ultraproducto se obtiene del producto directo de un conjunto de estructuras sobre un conjunto de índices I identificando aquellas tuplas que concuerdan en casi todas las entradas, donde casi todo se precisa mediante un ultrafiltro U en I. Un ultraproducto de copias de una misma estructura se conoce como ultrapotencia . La clave para utilizar ultraproductos en la teoría de modelos es el teorema de Łoś :

Sea un conjunto de estructuras indexadas por un conjunto de índices I y U un ultrafiltro en I . Entonces cualquier fórmula es verdadera en el ultraproducto de by si el conjunto de todos para el cual se encuentra en U . [27]

En particular, cualquier ultraproducto de modelos de una teoría es en sí mismo un modelo de esa teoría y, por tanto, si dos modelos tienen ultrapoderes isomórficos, son elementalmente equivalentes. El teorema de Keisler-Shelah proporciona lo contrario:

Si y son equivalentes elementales, entonces hay un conjunto I y un ultrafiltro U en I tales que las ultrapotencias de U de y : son isomorfas. [28]

Por lo tanto, los ultraproductos proporcionan una forma de hablar de equivalencia elemental que evita mencionar teorías de primer orden. Los teoremas básicos de la teoría de modelos, como el teorema de la compacidad, tienen pruebas alternativas que utilizan ultraproductos [29] y pueden usarse para construir extensiones elementales saturadas, si existen. [30]

Categoricidad

Originalmente, una teoría se llamaba categórica si determina una estructura hasta el isomorfismo. Resulta que esta definición no es útil debido a serias restricciones en la expresividad de la lógica de primer orden. El teorema de Löwenheim-Skolem implica que si una teoría T tiene un modelo infinito para algún número cardinal infinito , entonces tiene un modelo de tamaño κ para cualquier número cardinal κ suficientemente grande. Dado que dos modelos de diferentes tamaños no pueden ser isomórficos, una teoría categórica sólo puede describir estructuras finitas.

Sin embargo, la noción más débil de κ-categoricidad para un κ cardinal se ha convertido en un concepto clave en la teoría de modelos. Una teoría T se llama κ-categórica si dos modelos cualesquiera de T que son de cardinalidad κ son isomorfos. Resulta que la cuestión de la κ-categoricidad depende fundamentalmente de si κ es mayor que la cardinalidad del idioma (es decir,  + |σ|, donde |σ| es la cardinalidad de la firma). Para firmas finitas o contables, esto significa que existe una diferencia fundamental entre -cardinalidad y κ-cardinalidad para κ incontables.

ω-categoricidad

-Las teorías categóricas se pueden caracterizar por las propiedades de su espacio tipo:

Para una teoría completa de primer orden T en una firma finita o contable, las siguientes condiciones son equivalentes:
  1. T es -categórico.
  2. Cada tipo en S n ( T ) está aislado.
  3. Para todo número natural n , S n ( T ) es finito.
  4. Para cada número natural n , el número de fórmulas φ( x 1 , ..., x n ) en n variables libres, hasta el módulo de equivalencia T , es finito.

La teoría de , que también es la teoría de , es categórica, ya que cada tipo n sobre el conjunto vacío está aislado por la relación de orden por pares entre . Esto significa que todo orden lineal denso contable es de orden isomorfo a la recta numérica racional. Por otro lado, las teorías de los campos , y as no son categóricas. Esto se desprende del hecho de que en todos esos campos, cualquiera de los infinitos números naturales puede definirse mediante una fórmula de la forma .

-Las teorías categóricas y sus modelos contables también tienen fuertes vínculos con grupos oligomórficos :

Una teoría completa de primer orden T en una firma finita o contable es categórica si y sólo si su grupo de automorfismo es oligomórfico.

Las caracterizaciones equivalentes de esta subsección, debidas independientemente a Engeler , Ryll-Nardzewski y Svenonius , a veces se denominan teorema de Ryll-Nardzewski.

En firmas combinatorias, una fuente común de teorías categóricas son los límites de Fraïssé , que se obtienen como el límite de amalgamar todas las configuraciones posibles de una clase de estructuras relacionales finitas.

Categoridad incontable

Michael Morley demostró en 1963 que sólo existe una noción de categoricidad incontable para las teorías en lenguajes contables. [31]

Teorema de categoricidad de Morley
Si una teoría de primer orden T en una firma finita o contable es κ-categórica para algún cardinal incontable κ, entonces T es κ-categórica para todos los cardinales incontables κ.

La prueba de Morley reveló conexiones profundas entre la categoricidad incontable y la estructura interna de los modelos, que se convirtió en el punto de partida de la teoría de la clasificación y la teoría de la estabilidad. Las teorías incontables categóricas son, desde muchos puntos de vista, las teorías que mejor se comportan. En particular, las teorías completas fuertemente minimalistas son incontablemente categóricas. Esto muestra que la teoría de campos algebraicamente cerrados de una característica dada es incontablemente categórica, y el grado de trascendencia del campo determina su tipo de isomorfismo.

Una teoría que es a la vez categórica e incontablemente categórica se llama totalmente categórica .

Teoría de la estabilidad

Un factor clave en la estructura de la clase de modelos de una teoría de primer orden es su lugar en la jerarquía de estabilidad .

Una teoría completa T se llama estable para un cardinal si para cualquier modelo de T y cualquier conjunto de parámetros de cardinalidad que no exceda , hay como máximo tipos T completos sobre A.

Una teoría se llama estable si es estable para algún cardinal infinito . Tradicionalmente, las teorías que son estables se denominan estables . [32]

La jerarquía de estabilidad

Un resultado fundamental en la teoría de la estabilidad es el teorema del espectro de estabilidad , [33] que implica que toda teoría completa T en una firma contable cae en una de las siguientes clases:

  1. No existen cardinales tales que T sea -estable.
  2. T es estable si y sólo si (consulte Exponenciación cardinal para obtener una explicación de ).
  3. T es estable para cualquiera (donde está la cardinalidad del continuo ).

Una teoría del primer tipo se llama inestable , una teoría del segundo tipo se llama estrictamente estable y una teoría del tercer tipo se llama superestable . Además, si una teoría es estable, lo es en cada cardinal infinito, [34] por lo que la estabilidad es más fuerte que la superestabilidad.

Muchas construcciones en teoría de modelos son más fáciles cuando se restringen a teorías estables; por ejemplo, todo modelo de una teoría estable tiene una extensión elemental saturada, independientemente de si la hipótesis del continuo generalizado es cierta. [35]

La motivación original de Shelah para estudiar teorías estables era decidir cuántos modelos tiene una teoría contable de cualquier cardinalidad incontable. [36] Si una teoría es incontablemente categórica, entonces es estable. De manera más general, el teorema de la brecha principal implica que si hay un cardinal incontable tal que una teoría T tiene menos que modelos de cardinalidad , entonces T es superestable.

Teoría de la estabilidad geométrica

La jerarquía de estabilidad también es crucial para analizar la geometría de conjuntos definibles dentro de un modelo de teoría. En las teorías estables, el rango de Morley es una noción de dimensión importante para conjuntos definibles S dentro de un modelo. Se define por inducción transfinita :

Una teoría T en la que todo conjunto definible tiene un rango de Morley bien definido se llama totalmente trascendental ; si T es contable, entonces T es totalmente trascendental si y sólo si T es estable. El rango de Morley se puede extender a los tipos estableciendo el rango de Morley de un tipo como el mínimo de los rangos de Morley de las fórmulas del tipo. Así, también se puede hablar del rango de Morley de un elemento a sobre un conjunto de parámetros A , definido como el rango de Morley del tipo de a sobre A . También hay análogos del rango de Morley que están bien definidos si y sólo si una teoría es superestable ( rango U ) o simplemente estable (rango -de Shelah ). Esas nociones de dimensión pueden usarse para definir nociones de independencia y de extensiones genéricas.

Más recientemente, la estabilidad se ha descompuesto en simplicidad y "no en propiedad de independencia" (NIP). Las teorías simples son aquellas teorías en las que se puede definir una noción de independencia bien comportada, mientras que las teorías NIP generalizan estructuras o-mínimas. Están relacionados con la estabilidad, ya que una teoría es estable si y sólo si es NIP y simple, [37] y varios aspectos de la teoría de la estabilidad se han generalizado a teorías de una de estas clases.

Teoría de modelos no elementales

Los resultados de la teoría de modelos se han generalizado más allá de las clases elementales, es decir, clases axiomatizables por una teoría de primer orden.

La teoría de modelos en lógicas de orden superior o lógicas infinitas se ve obstaculizada por el hecho de que la completitud y la compacidad en general no se aplican a estas lógicas. Esto se concreta en el teorema de Lindstrom , que establece aproximadamente que la lógica de primer orden es esencialmente la lógica más fuerte en la que se cumplen tanto los teoremas de Löwenheim-Skolem como la compacidad. Sin embargo, también se han desarrollado ampliamente técnicas de teoría de modelos para estas lógicas. [38] Resulta, sin embargo, que gran parte de la teoría de modelos de lenguajes lógicos más expresivos es independiente de la teoría de conjuntos de Zermelo-Fraenkel . [39]

Más recientemente, junto con el cambio de enfoque hacia teorías categóricas y estables completas, se ha trabajado en clases de modelos definidos semánticamente en lugar de axiomatizados por una teoría lógica. Un ejemplo es la teoría de modelos homogéneos , que estudia la clase de subestructuras de modelos homogéneos arbitrariamente grandes. Los resultados fundamentales de la teoría de la estabilidad y la teoría de la estabilidad geométrica se generalizan a este contexto. [40] Como generalización de teorías fuertemente mínimas, las clases casi mínimamente excelentes son aquellas en las que cada conjunto definible es contable o co-contable. Son clave para la teoría del modelo de la función exponencial compleja . [41] El marco semántico más general en el que se estudia la estabilidad son las clases elementales abstractas , que se definen por una fuerte relación de subestructura que generaliza la de una subestructura elemental. Aunque su definición es puramente semántica, cada clase elemental abstracta puede presentarse como modelos de una teoría de primer orden que omite ciertos tipos. La generalización de nociones teóricas de estabilidad a clases abstractas de primaria es un programa de investigación en curso. [42]

Aplicaciones seleccionadas

Entre los primeros éxitos de la teoría de modelos se encuentran las pruebas de eliminación de cuantificadores de Tarski para varias clases algebraicamente interesantes, como los campos cerrados reales , las álgebras de Boole y los campos algebraicamente cerrados de una característica determinada . La eliminación de cuantificadores permitió a Tarski demostrar que las teorías de primer orden de campos reales cerrados y algebraicamente cerrados, así como la teoría de primer orden de las álgebras de Boole, son decidibles, clasificar las álgebras de Boole hasta la equivalencia elemental y demostrar que las teorías de las álgebras de Boole son decidibles. Los campos cerrados y los campos algebraicamente cerrados de una característica determinada son únicos. Además, la eliminación del cuantificador proporcionó una descripción precisa de las relaciones definibles en campos algebraicamente cerrados como variedades algebraicas y de las relaciones definibles en campos reales cerrados como conjuntos semialgebraicos [43] [44]

En la década de 1960, la introducción de la construcción de ultraproductos condujo a nuevas aplicaciones en álgebra. Esto incluye el trabajo de Ax sobre campos pseudofinitos , que demuestra que la teoría de campos finitos es decidible, [45] y la prueba de Ax y Kochen de un caso especial de la conjetura de Artin sobre ecuaciones diofánticas, el teorema de Ax-Kochen . [46] La construcción del ultraproducto también llevó al desarrollo de Abraham Robinson del análisis no estándar , cuyo objetivo es proporcionar un cálculo riguroso de infinitesimales . [47]

Más recientemente, la conexión entre la estabilidad y la geometría de conjuntos definibles condujo a varias aplicaciones de la geometría algebraica y diofántica, incluida la prueba de Ehud Hrushovski de 1996 de la conjetura geométrica de Mordell-Lang en todas las características [48] . En 2001, se utilizaron métodos similares. para demostrar una generalización de la conjetura de Manin-Mumford. En 2011, Jonathan Pila aplicó técnicas en torno a o-minimidad para demostrar la conjetura de André-Oort para productos de curvas modulares. [49]

En una línea separada de investigaciones que también crecieron en torno a teorías estables, Laskowski demostró en 1992 que las teorías NIP describen exactamente aquellas clases definibles que se pueden aprender mediante PAC en la teoría del aprendizaje automático. Esto ha dado lugar a varias interacciones entre estas áreas separadas. En 2018, la correspondencia se amplió cuando Hunter y Chase demostraron que las teorías estables corresponden a clases que se pueden aprender en línea . [50]

Historia

La teoría de modelos como materia ha existido aproximadamente desde mediados del siglo XX, y el nombre fue acuñado por Alfred Tarski , miembro de la escuela de Lwów-Varsovia , en 1954. [51] Sin embargo, algunas investigaciones anteriores, especialmente en lógica matemática , En retrospectiva, a menudo se considera que es de naturaleza teórica de modelos. [52] El primer resultado significativo en lo que ahora es la teoría de modelos fue un caso especial del teorema descendente de Löwenheim-Skolem, publicado por Leopold Löwenheim en 1915. El teorema de compacidad estaba implícito en el trabajo de Thoralf Skolem , [53] pero fue el primero publicado en 1930, como lema en la demostración de Kurt Gödel de su teorema de completitud . El teorema de Löwenheim-Skolem y el teorema de la compacidad recibieron sus respectivas formas generales en 1936 y 1941 de manos de Anatoly Maltsev . El desarrollo de la teoría de modelos como disciplina independiente fue impulsado por Alfred Tarski durante el período entre guerras . El trabajo de Tarski incluyó consecuencias lógicas , sistemas deductivos , el álgebra de la lógica, la teoría de la definibilidad y la definición semántica de la verdad , entre otros temas. Sus métodos semánticos culminaron en la teoría de modelos que él y varios de sus estudiantes de Berkeley desarrollaron en las décadas de 1950 y 1960.

En la historia posterior de la disciplina, comenzaron a surgir diferentes corrientes y el enfoque del tema cambió. En la década de 1960, las técnicas relacionadas con los ultraproductos se convirtieron en una herramienta popular en la teoría de modelos. [54] Al mismo tiempo, investigadores como James Ax estaban investigando la teoría de modelos de primer orden de varias clases algebraicas, y otros como H. Jerome Keisler estaban extendiendo los conceptos y resultados de la teoría de modelos de primer orden a otros sistemas lógicos. . Luego, inspirado por el problema de Morley , Sela desarrolló la teoría de la estabilidad . Su trabajo en torno a la estabilidad cambió la complexión de la teoría de modelos, dando lugar a una clase completamente nueva de conceptos. Esto se conoce como cambio de paradigma. [55] Durante las siguientes décadas, quedó claro que la jerarquía de estabilidad resultante está estrechamente relacionada con la geometría de los conjuntos que son definibles en esos modelos; esto dio lugar a la subdisciplina ahora conocida como teoría de la estabilidad geométrica. Un ejemplo de una prueba influyente de la teoría de modelos geométricos es la prueba de Hrushovski de la conjetura de Mordell-Lang para campos funcionales. [56]

Conexiones con ramas relacionadas de la lógica matemática

Teoría del modelo finito

La teoría de modelos finitos , que se concentra en estructuras finitas, difiere significativamente del estudio de estructuras infinitas tanto en los problemas estudiados como en las técnicas utilizadas. [57] En particular, muchos resultados centrales de la teoría de modelos clásicos fallan cuando se restringen a estructuras finitas. Esto incluye el teorema de compacidad , el teorema de completitud de Gödel y el método de los ultraproductos para la lógica de primer orden . En la interfaz de la teoría de modelos finitos e infinitos se encuentran la teoría de modelos algorítmicos o computables y el estudio de las leyes 0-1, donde los modelos infinitos de una teoría genérica de una clase de estructuras proporcionan información sobre la distribución de modelos finitos. [58] Las áreas de aplicación destacadas del FMT son la teoría descriptiva de la complejidad , la teoría de bases de datos y la teoría del lenguaje formal . [59]

Teoría de conjuntos

Cualquier teoría de conjuntos (que se expresa en un lenguaje contable ), si es consistente, tiene un modelo contable; esto se conoce como paradoja de Skolem , ya que hay oraciones en la teoría de conjuntos que postulan la existencia de conjuntos incontables y, sin embargo, estas oraciones son verdaderas en nuestro modelo contable. En particular, la prueba de la independencia de la hipótesis del continuo requiere considerar conjuntos en modelos que parecen incontables cuando se ven desde dentro del modelo, pero que son contables para alguien fuera del modelo. [60]

El punto de vista de la teoría de modelos ha sido útil en la teoría de conjuntos ; por ejemplo, en el trabajo de Kurt Gödel sobre el universo construible, que, junto con el método de forzamiento desarrollado por Paul Cohen, puede demostrar la (nuevamente filosóficamente interesante) independencia del axioma de elección y la hipótesis del continuo de los otros axiomas. de la teoría de conjuntos. [61]

En la otra dirección, la teoría de modelos está formalizada dentro de la teoría de conjuntos de Zermelo-Fraenkel. Por ejemplo, el desarrollo de los fundamentos de la teoría de modelos (como el teorema de la compacidad) se basa en el axioma de elección y, de hecho, es equivalente, en comparación con la teoría de conjuntos de Zermelo-Fraenkel sin elección, al teorema del ideal primo booleano. [62] Otros resultados en la teoría de modelos dependen de axiomas de la teoría de conjuntos más allá del marco estándar ZFC. Por ejemplo, si se cumple la hipótesis del continuo, entonces cada modelo contable tiene un ultrapoder que está saturado (en su propia cardinalidad). De manera similar, si se cumple la hipótesis del continuo generalizado, entonces todo modelo tiene una extensión elemental saturada. Ninguno de estos resultados se puede demostrar únicamente en ZFC. Finalmente, se ha demostrado que algunas cuestiones que surgen de la teoría de modelos (como la compacidad de la lógica infinita) son equivalentes a grandes axiomas cardinales. [63]

Ver también

Notas

  1. ^ Chang y Keisler, pag. 1
  2. ^ "Teoría de modelos". La Enciclopedia de Filosofía de Stanford . Laboratorio de Investigación en Metafísica, Universidad de Stanford. 2020.
  3. ^ Dirk van Dalen, (1980; Quinta revisión 2013) "Lógica y estructura" Springer. (Ver página 1. )
  4. ^ Chang y Keisler, pag. 1
  5. ^ Hodges (1997), pág. viii
  6. ^ Marcador (2002), pág. 32
  7. ^ Marcador (2002), pág. 45
  8. ^ Barwise y Feferman, pag. 43
  9. ^ Marcador (2002), pág. 19
  10. ^ Marcador (2002), pág. 71
  11. ^ Marcador (2002), pág. 72
  12. ^ Marcador (2002), pág. 85
  13. ^ Döner, John; Hodges, Wilfrid (1988). "Alfred Tarski y las teorías decidibles". La revista de lógica simbólica . 53 (1): 20. doi :10.2307/2274425. ISSN  0022-4812. JSTOR  2274425.
  14. ^ Marcador (2002), pág. 45
  15. ^ Marcador (2002), pág. 106
  16. ^ Marcador (2002), pág. 208
  17. ^ Marcador (2002), pág. 97
  18. ^ Hodges (1993), págs.31, 92
  19. ^ Tarski, Alfred (1953), "I: Un método general en pruebas de indecidibilidad", Teorías indecidibles , estudios de lógica y fundamentos de las matemáticas, Elsevier, vol. 13, págs. 1–34, doi :10.1016/s0049-237x(09)70292-7, ISBN 9780444533784, recuperado el 26 de enero de 2022
  20. ^ Marcador (2002), págs. 115-124
  21. ^ Marcador (2002), págs. 125-155
  22. ^ Hodges (1993), pág. 280
  23. ^ Marcador (2002), págs. 124-125
  24. ^ Hodges (1993), pág. 333
  25. ^ Hodges (1993), pág. 451
  26. ^ Hodges (1993), 492
  27. ^ Hodges (1993), pág. 450
  28. ^ Hodges (1993), pág. 452
  29. ^ Bell y Slomson, pag. 102
  30. ^ Hodges (1993), pág. 492
  31. ^ Morley, Michael (1963). "Sobre teorías categóricas en potencias incontables". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 49 (2): 213–216. Código bibliográfico : 1963PNAS...49..213M. doi : 10.1073/pnas.49.2.213 . PMC 299780 . PMID  16591050. 
  32. ^ Marcador (2002), pág. 135
  33. ^ Marcador (2002), pág. 172
  34. ^ Marcador (2002), pág. 136
  35. ^ Hodges (1993), pág. 494
  36. ^ Saharon., Sela (1990). Teoría de clasificación y número de modelos no isomorfos. Holanda del Norte. ISBN 0-444-70260-1. OCLC  800472113.
  37. ^ Wagner, Frank (2011). Teorías simples. Saltador. doi :10.1007/978-94-017-3002-0. ISBN 978-90-481-5417-3.
  38. ^ Barwise, J. (2016), Barwise, J; Feferman, S (eds.), "Lógicas teóricas de modelos: antecedentes y objetivos", Lógicas teóricas de modelos , Cambridge: Cambridge University Press, págs. 3-24, doi :10.1017/9781316717158.004, ISBN 9781316717158, recuperado el 15 de enero de 2022
  39. ^ Sela, Saharon (2000). "Sobre lo que no entiendo y tengo algo que decir (teoría de modelos)". Fundamentos Mathematicae . 166 (1): 1–82. arXiv : matemáticas/9910158 . doi :10.4064/fm-166-1-2-1-82. ISSN  0016-2736. S2CID  116922041.
  40. ^ Buechler, Steven; Lessmann, Olivier (8 de octubre de 2002). "Modelos homogéneos simples". Revista de la Sociedad Matemática Estadounidense . 16 (1): 91-121. doi : 10.1090/s0894-0347-02-00407-1 . ISSN  0894-0347. S2CID  12044966.
  41. ^ Marker, David (2016), "Excelencia cuasi mínima", Conferencias sobre teoría de modelos infinitos , Cambridge: Cambridge University Press, págs. 97-112, doi :10.1017/cbo9781316855560.009, ISBN 9781316855560, recuperado el 23 de enero de 2022
  42. ^ Baldwin, John (24 de julio de 2009). Categoricidad . Ciclo de conferencias universitarias. vol. 50. Providence, Rhode Island: Sociedad Matemática Estadounidense. doi :10.1090/ulect/050. ISBN 9780821848937.
  43. ^ Hodges (1993), pág. 68-69
  44. ^ Döner, John; Hodges, Wilfrid (marzo de 1988). "Alfred Tarski y las teorías decidibles". La revista de lógica simbólica . 53 (1): 20. doi :10.2307/2274425. ISSN  0022-4812. JSTOR  2274425.
  45. ^ Eklof, Paul C. (1977), "Ultraproductos para algebristas", MANUAL DE LÓGICA MATEMÁTICA , Estudios de lógica y fundamentos de las matemáticas, Elsevier, vol. 90, págs. 105–137, doi :10.1016/s0049-237x(08)71099-1, ISBN 9780444863881, recuperado el 23 de enero de 2022
  46. ^ Hacha, James; Kochen, Simón (1965). "Problemas diofánticos en campos locales: I". Revista Estadounidense de Matemáticas . 87 páginas = 605-630.
  47. ^ Cherlin, Greg; Hirschfeld, Joram (1972), "Ultrafiltros y ultraproductos en análisis no estándar", Contribuciones al análisis no estándar , Estudios de lógica y fundamentos de las matemáticas, Elsevier, vol. 69, págs. 261–279, doi :10.1016/s0049-237x(08)71563-5, ISBN 9780720420654, recuperado el 23 de enero de 2022
  48. ^ Ehud Hrushovski, La conjetura de Mordell-Lang para campos funcionales. Revista de la Sociedad Matemática Estadounidense 9:3 (1996), págs. 667-690.
  49. ^ Jonathan Pila, Puntos racionales de conjuntos definibles y resultados del tipo André-Oort-Manin-Mumford, O-minimidad y la conjetura de André-Oort para C n . Annals of Mathematics 173:3 (2011), págs. 1779–1840. doi=10.4007/anales.2011.173.3.11
  50. ^ PERSECUCIÓN, CAZADOR; FREITAG, JAMES (15 de febrero de 2019). "Teoría de modelos y aprendizaje automático". El Boletín de Lógica Simbólica . 25 (3): 319–332. arXiv : 1801.06566 . doi :10.1017/bsl.2018.71. ISSN  1079-8986. S2CID  119689419.
  51. ^ Tarski, Alfred (1954). "Aportes a la Teoría de Modelos. I". Indagaciones Mathematicae . 57 : 572–581. doi :10.1016/S1385-7258(54)50074-0. ISSN  1385-7258.
  52. ^ Wilfrid Hodges (24 de mayo de 2018). "Apéndice histórico: una breve historia de la teoría de modelos". Filosofía y teoría de modelos . Por botón, Tim; Walsh, Sean. pag. 439. doi :10.1093/oso/9780198790396.003.0018.
  53. ^ "Los tres comentaristas [es decir, Vaught, van Heijenoort y Dreben] están de acuerdo en que tanto los teoremas de completitud como de compacidad estaban implícitos en Skolem 1923...." [ Dawson, JW (1993). "La compacidad de la lógica de primer orden: de Gödel a Lindström". Historia y Filosofía de la Lógica . 14 : 15–37. doi :10.1080/01445349308837208.]
  54. ^ Hodges (1993), pág. 475
  55. ^ Baldwin, John T. (19 de enero de 2018). Teoría de modelos y filosofía de la práctica matemática. Prensa de la Universidad de Cambridge. doi :10.1017/9781316987216. ISBN 978-1-107-18921-8. S2CID  126311148.
  56. ^ Sacos, Gerald (2003). Lógica matemática en el siglo XX . Prensa de la Universidad de Singapur. doi :10.1142/4800. ISBN 981-256-489-6. OCLC  62715985.
  57. ^ Ebbinghaus, Heinz-Dieter; Flum, Jörg (1995). Teoría de modelos finitos. Perspectivas en lógica matemática. pag. contra doi :10.1007/978-3-662-03182-7. ISBN 978-3-662-03184-1.
  58. ^ Ebbinghaus, Heinz-Dieter; Flum, Jörg (1995). "Leyes 0-1". Teoría de modelos finitos. Perspectivas en lógica matemática. doi :10.1007/978-3-662-03182-7. ISBN 978-3-662-03184-1.
  59. ^ Ebbinghaus, Heinz-Dieter; Flum, Jörg (1995). Teoría de modelos finitos. Perspectivas en lógica matemática. doi :10.1007/978-3-662-03182-7. ISBN 978-3-662-03184-1.
  60. ^ Kunen, Kenneth (2011). "Modelos de teoría de conjuntos". Teoría de conjuntos . Publicaciones universitarias. ISBN 978-1-84890-050-9.
  61. ^ Kunen, Kenneth (2011). Teoría de conjuntos . Publicaciones universitarias. ISBN 978-1-84890-050-9.
  62. ^ Hodges (1993), pág. 272
  63. ^ Baldwin, John T. (19 de enero de 2018). "Teoría de modelos y teoría de conjuntos". Teoría de modelos y filosofía de la práctica matemática. Prensa de la Universidad de Cambridge. doi :10.1017/9781316987216. ISBN 978-1-107-18921-8. S2CID  126311148.

Referencias

Libros de texto canónicos

Otros libros de texto

Textos online gratis