En lógica matemática , la aritmética de segundo orden es una colección de sistemas axiomáticos que formalizan los números naturales y sus subconjuntos . Es una alternativa a la teoría de conjuntos axiomáticos como base para gran parte de las matemáticas, pero no todas.
Un precursor de la aritmética de segundo orden que involucra parámetros de tercer orden fue introducido por David Hilbert y Paul Bernays en su libro Grundlagen der Mathematik . [1] La axiomatización estándar de la aritmética de segundo orden se denota por Z 2 .
La aritmética de segundo orden incluye, pero es significativamente más fuerte que, su contraparte de primer orden, la aritmética de Peano . A diferencia de la aritmética de Peano, la aritmética de segundo orden permite la cuantificación sobre conjuntos de números naturales así como sobre los números mismos. Debido a que los números reales pueden representarse como conjuntos ( infinitos ) de números naturales de formas bien conocidas, y debido a que la aritmética de segundo orden permite la cuantificación sobre dichos conjuntos, es posible formalizar los números reales en la aritmética de segundo orden. Por esta razón, la aritmética de segundo orden a veces se denomina " análisis ". [2]
La aritmética de segundo orden también puede considerarse una versión débil de la teoría de conjuntos en la que cada elemento es un número natural o un conjunto de números naturales. Aunque es mucho más débil que la teoría de conjuntos de Zermelo-Fraenkel , la aritmética de segundo orden puede demostrar esencialmente todos los resultados de las matemáticas clásicas expresables en su lenguaje.
Un subsistema de la aritmética de segundo orden es una teoría en el lenguaje de la aritmética de segundo orden, cada axioma del cual es un teorema de la aritmética de segundo orden completa (Z 2 ). Tales subsistemas son esenciales para las matemáticas inversas , un programa de investigación que investiga cuánto de las matemáticas clásicas se puede derivar en ciertos subsistemas débiles de fuerza variable. Gran parte de las matemáticas básicas se pueden formalizar en estos subsistemas débiles, algunos de los cuales se definen a continuación. Las matemáticas inversas también aclaran el alcance y la manera en que las matemáticas clásicas son no constructivas .
El lenguaje de la aritmética de segundo orden es de dos tipos . El primer tipo de términos y en particular las variables , que normalmente se indican con letras minúsculas, consiste en individuos , cuya interpretación prevista es como números naturales. El otro tipo de variables, llamadas de diversas formas "variables de conjunto", "variables de clase" o incluso "predicados", normalmente se indican con letras mayúsculas. Se refieren a clases/predicados/propiedades de individuos, por lo que pueden considerarse conjuntos de números naturales. Tanto los individuos como las variables de conjunto pueden cuantificarse de forma universal o existencial . Una fórmula sin variables de conjunto acotadas (es decir, sin cuantificadores sobre las variables de conjunto) se denomina aritmética . Una fórmula aritmética puede tener variables de conjunto libres y variables individuales acotadas.
Los términos individuales se forman a partir de la constante 0, la función unaria S (la función sucesora ) y las operaciones binarias + y (suma y multiplicación). La función sucesora suma 1 a su entrada. Las relaciones = (igualdad) y < (comparación de números naturales) relacionan dos individuos, mientras que la relación ∈ (pertenencia) relaciona un individuo y un conjunto (o clase). Así, en notación, el lenguaje de la aritmética de segundo orden se da mediante la signatura .
Por ejemplo, , es una fórmula bien formada de aritmética de segundo orden que es aritmética, tiene una variable de conjunto libre X y una variable individual ligada n (pero no variables de conjunto ligadas, como se requiere de una fórmula aritmética), mientras que es una fórmula bien formada que no es aritmética, que tiene una variable de conjunto ligada X y una variable individual ligada n .
Son posibles varias interpretaciones diferentes de los cuantificadores. Si se estudia la aritmética de segundo orden utilizando la semántica completa de la lógica de segundo orden , entonces los cuantificadores de conjunto abarcan todos los subconjuntos del rango de las variables individuales. Si se formaliza la aritmética de segundo orden utilizando la semántica de la lógica de primer orden ( semántica de Henkin ), entonces cualquier modelo incluye un dominio sobre el cual se extienden las variables del conjunto, y este dominio puede ser un subconjunto propio del conjunto potenciado completo del dominio de las variables individuales. [3]
Los siguientes axiomas se conocen como axiomas básicos o, en ocasiones, axiomas de Robinson. La teoría de primer orden resultante , conocida como aritmética de Robinson , es esencialmente aritmética de Peano sin inducción. El dominio del discurso para las variables cuantificadas son los números naturales , denotados colectivamente por N , e incluyendo el miembro distinguido , llamado " cero ".
Las funciones primitivas son la función sucesora unaria , denotada por el prefijo , y dos operaciones binarias , la suma y la multiplicación , denotadas por el operador infijo "+" y " ", respectivamente. También existe una relación binaria primitiva llamada orden , denotada por el operador infijo "<".
Axiomas que rigen la función sucesora y el cero :
Adición definida recursivamente :
Multiplicación definida recursivamente:
Axiomas que rigen la relación de orden "<":
Estos axiomas son todos enunciados de primer orden . Es decir, todas las variables abarcan los números naturales y no sus conjuntos , un hecho aún más fuerte que el de que sean aritméticas. Además, sólo hay un cuantificador existencial , en el axioma 3. Los axiomas 1 y 2, junto con un esquema axiomático de inducción, conforman la definición habitual de Peano-Dedekind de N. Añadir a estos axiomas cualquier tipo de esquema axiomático de inducción hace redundantes los axiomas 3, 10 y 11.
Si φ ( n ) es una fórmula de aritmética de segundo orden con una variable individual libre n y posiblemente otras variables individuales o de conjunto libres (escritas m 1 ,..., m k y X 1 ,..., X l ), el axioma de inducción para φ es el axioma:
El esquema de inducción de segundo orden ( completo ) consta de todas las instancias de este axioma, sobre todas las fórmulas de segundo orden.
Un ejemplo particularmente importante del esquema de inducción es cuando φ es la fórmula " " que expresa el hecho de que n es un miembro de X ( siendo X una variable de conjunto libre): en este caso, el axioma de inducción para φ es
Esta oración se llama axioma de inducción de segundo orden .
Si φ ( n ) es una fórmula con una variable libre n y posiblemente otras variables libres, pero no la variable Z , el axioma de comprensión para φ es la fórmula
Este axioma permite formar el conjunto de los números naturales que satisfacen φ ( n ). Existe una restricción técnica: la fórmula φ no puede contener la variable Z , ya que de lo contrario la fórmula conduciría al axioma de comprensión
lo cual es inconsistente. Esta convención se asume en el resto de este artículo.
La teoría formal de la aritmética de segundo orden (en el lenguaje de la aritmética de segundo orden) consta de los axiomas básicos, el axioma de comprensión para cada fórmula φ (aritmética o no) y el axioma de inducción de segundo orden. Esta teoría a veces se denomina aritmética completa de segundo orden para distinguirla de sus subsistemas, definidos a continuación. Debido a que la semántica completa de segundo orden implica que existe todo conjunto posible, los axiomas de comprensión pueden considerarse parte del sistema deductivo cuando se emplea la semántica completa de segundo orden. [3]
Esta sección describe la aritmética de segundo orden con semántica de primer orden. De este modo, un modelo del lenguaje de la aritmética de segundo orden consta de un conjunto M (que forma el rango de las variables individuales) junto con una constante 0 (un elemento de M ), una función S de M a M , dos operaciones binarias + y · sobre M , una relación binaria < sobre M , y una colección D de subconjuntos de M , que es el rango de las variables del conjunto. Omitiendo D se obtiene un modelo del lenguaje de la aritmética de primer orden.
Cuando D es el conjunto potencia completo de M , el modelo se denomina modelo completo . El uso de la semántica completa de segundo orden es equivalente a limitar los modelos de la aritmética de segundo orden a los modelos completos. De hecho, los axiomas de la aritmética de segundo orden tienen solo un modelo completo. Esto se deduce del hecho de que los axiomas de Peano con el axioma de inducción de segundo orden tienen solo un modelo bajo la semántica de segundo orden.
Las funciones de primer orden que son demostrablemente totales en la aritmética de segundo orden son precisamente las mismas que las que se pueden representar en el sistema F. [ 4] Casi de manera equivalente, el sistema F es la teoría de los funcionales que corresponden a la aritmética de segundo orden de una manera paralela a cómo el sistema T de Gödel corresponde a la aritmética de primer orden en la interpretación de Dialéctica .
Cuando un modelo del lenguaje de la aritmética de segundo orden tiene determinadas propiedades, también puede recibir estos otros nombres:
Hay muchos subsistemas con nombre de aritmética de segundo orden.
Un subíndice 0 en el nombre de un subsistema indica que incluye solo una porción restringida del esquema completo de inducción de segundo orden. [9] Tal restricción reduce significativamente la fuerza teórica de prueba del sistema. Por ejemplo, el sistema ACA 0 descrito a continuación es equiconsistente con la aritmética de Peano . La teoría correspondiente ACA, que consiste en ACA 0 más el esquema completo de inducción de segundo orden, es más fuerte que la aritmética de Peano.
Muchos de los subsistemas bien estudiados están relacionados con las propiedades de clausura de los modelos. Por ejemplo, se puede demostrar que todo ω-modelo de aritmética completa de segundo orden es cerrado bajo el salto de Turing , pero no todo ω-modelo cerrado bajo el salto de Turing es un modelo de aritmética completa de segundo orden. El subsistema ACA 0 incluye justo los axiomas suficientes para capturar la noción de clausura bajo el salto de Turing.
Se define ACA 0 como la teoría que consta de los axiomas básicos, el esquema axiomático de comprensión aritmética (en otras palabras, el axioma de comprensión para toda fórmula aritmética φ ) y el axioma de inducción ordinario de segundo orden. Sería equivalente incluir también todo el esquema axiomático de inducción aritmética, es decir, incluir el axioma de inducción para toda fórmula aritmética φ .
Se puede demostrar que una colección S de subconjuntos de ω determina un ω-modelo de ACA 0 si y solo si S está cerrado bajo salto de Turing, reducibilidad de Turing y unión de Turing. [10]
El subíndice 0 en ACA 0 indica que no todas las instancias del esquema del axioma de inducción están incluidas en este subsistema. Esto no hace ninguna diferencia para los modelos ω, que satisfacen automáticamente todas las instancias del axioma de inducción. Sin embargo, es importante en el estudio de los modelos no ω. El sistema que consiste en ACA 0 más la inducción para todas las fórmulas a veces se denomina ACA sin subíndice.
El sistema ACA 0 es una extensión conservadora de la aritmética de primer orden (o axiomas de Peano de primer orden), definida como los axiomas básicos, más el esquema de axiomas de inducción de primer orden (para todas las fórmulas φ que no involucran variables de clase en absoluto, acotadas o no), en el lenguaje de la aritmética de primer orden (que no permite variables de clase en absoluto). En particular, tiene el mismo ordinal de demostración teórica ε 0 que la aritmética de primer orden, debido al esquema de inducción limitado.
Una fórmula se denomina aritmética acotada , o Δ 0 0 , cuando todos sus cuantificadores tienen la forma ∀ n < t o ∃ n < t (donde n es la variable individual que se cuantifica y t es un término individual), donde
significa
y
significa
Una fórmula se llama Σ 0 1 (o a veces Σ 1 ), respectivamente Π 0 1 (o a veces Π 1 ) cuando tiene la forma ∃ mφ , respectivamente ∀ mφ donde φ es una fórmula aritmética acotada y m es una variable individual (que es libre en φ ). De manera más general, una fórmula se llama Σ 0 n , respectivamente Π 0 n cuando se obtiene añadiendo cuantificadores individuales existenciales, respectivamente universales, a una fórmula Π 0 n −1 , respectivamente Σ 0 n −1 (y Σ 0 0 y Π 0 0 son ambos iguales a Δ 0 0 ). Por construcción, todas estas fórmulas son aritméticas (nunca se acotan variables de clase) y, de hecho, al poner la fórmula en forma prenex de Skolem se puede ver que cada fórmula aritmética es lógicamente equivalente a una fórmula Σ 0 n o Π 0 n para todos los n suficientemente grandes .
El subsistema RCA 0 es un sistema más débil que ACA 0 y se utiliza a menudo como sistema base en matemáticas inversas . Consiste en: los axiomas básicos, el esquema de inducción Σ 0 1 y el esquema de comprensión Δ 0 1. El primer término es claro: el esquema de inducción Σ 0 1 es el axioma de inducción para cada fórmula Σ 0 1 φ . El término "comprensión Δ 0 1 " es más complejo, porque no existe tal cosa como una fórmula Δ 0 1 . El esquema de comprensión Δ 0 1 en cambio afirma el axioma de comprensión para cada fórmula Σ 0 1 que sea lógicamente equivalente a una fórmula Π 0 1 . Este esquema incluye, para cada fórmula Σ 0 1 φ y cada fórmula Π 0 1 ψ , el axioma:
El conjunto de consecuencias de primer orden de RCA 0 es el mismo que el del subsistema IΣ 1 de la aritmética de Peano en el que la inducción está restringida a fórmulas Σ 0 1. A su vez, IΣ 1 es conservativa respecto de la aritmética recursiva primitiva (PRA) para oraciones. Además, el ordinal de la teoría de la demostración de es ω ω , el mismo que el de la PRA.
Se puede observar que una colección S de subconjuntos de ω determina un ω-modelo de RCA 0 si y solo si S es cerrado bajo la reducibilidad de Turing y la unión de Turing. En particular, la colección de todos los subconjuntos computables de ω da un ω-modelo de RCA 0 . Esta es la motivación detrás del nombre de este sistema: si se puede demostrar que existe un conjunto utilizando RCA 0 , entonces el conjunto es recursivo (es decir, computable).
A veces se desea un sistema aún más débil que el RCA 0. Uno de esos sistemas se define de la siguiente manera: primero se debe aumentar el lenguaje de la aritmética con un símbolo de función exponencial (en sistemas más fuertes, la exponencial se puede definir en términos de adición y multiplicación mediante el truco habitual, pero cuando el sistema se vuelve demasiado débil esto ya no es posible) y los axiomas básicos con los axiomas obvios que definen la exponenciación inductivamente a partir de la multiplicación; luego el sistema consta de los axiomas básicos (enriquecidos), más Δ 0 1 comprensión, más Δ 0 0 inducción.
Sobre ACA 0 , cada fórmula de aritmética de segundo orden es equivalente a una fórmula Σ 1 n o Π 1 n para todo n suficientemente grande . El sistema Π 1 1 -comprensión es el sistema que consiste en los axiomas básicos, más el axioma de inducción de segundo orden ordinario y el axioma de comprensión para cada ( en negrita [11] ) fórmula Π 1 1 φ . Esto es equivalente a Σ 1 1 -comprensión (por otro lado, Δ 1 1 -comprensión, definida análogamente a Δ 0 1 -comprensión, es más débil).
La determinación proyectiva es la afirmación de que todo juego de información perfecta entre dos jugadores con movimientos que son números naturales, duración del juego ω y conjunto de pagos proyectivos está determinado, es decir, uno de los jugadores tiene una estrategia ganadora. (El primer jugador gana el juego si la jugada pertenece al conjunto de pagos; de lo contrario, gana el segundo jugador). Un conjunto es proyectivo si y solo si (como predicado) es expresable mediante una fórmula en el lenguaje de la aritmética de segundo orden, permitiendo números reales como parámetros, por lo que la determinación proyectiva es expresable como un esquema en el lenguaje de Z 2 .
Muchas proposiciones naturales expresables en el lenguaje de la aritmética de segundo orden son independientes de Z 2 e incluso de ZFC pero son demostrables a partir de la determinación proyectiva. Los ejemplos incluyen la propiedad de subconjunto perfecto coanalítico , la mensurabilidad y la propiedad de Baire para conjuntos, la uniformización , etc. Sobre una teoría de base débil (como RCA 0 ), la determinación proyectiva implica comprensión y proporciona una teoría esencialmente completa de la aritmética de segundo orden: es difícil encontrar enunciados naturales en el lenguaje de Z 2 que sean independientes de Z 2 con determinación proyectiva. [12]
ZFC + {hay n cardinales de Woodin : n es un número natural} es conservativo sobre Z 2 con determinación proyectiva [ cita requerida ] , es decir, una afirmación en el lenguaje de la aritmética de segundo orden es demostrable en Z 2 con determinación proyectiva si y solo si su traducción al lenguaje de la teoría de conjuntos es demostrable en ZFC + {hay n cardinales de Woodin: n ∈N}.
La aritmética de segundo orden formaliza directamente los números naturales y los conjuntos de números naturales. Sin embargo, es capaz de formalizar otros objetos matemáticos indirectamente a través de técnicas de codificación, un hecho que fue observado por primera vez por Weyl . [13] Los números enteros , los números racionales y los números reales pueden formalizarse en el subsistema RCA 0 , junto con espacios métricos separables completos y funciones continuas entre ellos. [14]
El programa de investigación de matemáticas inversas utiliza estas formalizaciones de las matemáticas en aritmética de segundo orden para estudiar los axiomas de existencia de conjuntos necesarios para demostrar teoremas matemáticos. [15] Por ejemplo, el teorema del valor intermedio para funciones de los números reales a los reales es demostrable en RCA 0 , [16] mientras que el teorema de Bolzano – Weierstrass es equivalente a ACA 0 sobre RCA 0 . [17]
La codificación antes mencionada funciona bien para funciones continuas y totales, asumiendo una teoría base de orden superior más el lema de König débil . [18] Como quizás se esperaba, en el caso de la topología , la codificación no está libre de problemas. [19]