En teoría de la computabilidad , la tesis de Church-Turing (también conocida como tesis de computabilidad , [1] tesis de Turing-Church , [2] conjetura de Church -Turing , tesis de Church , conjetura de Church y tesis de Turing ) es una tesis sobre la naturaleza de las funciones computables . Establece que una función sobre los números naturales puede calcularse mediante un método eficaz si y solo si es computable por una máquina de Turing . La tesis recibe su nombre del matemático estadounidense Alonzo Church y del matemático británico Alan Turing . Antes de la definición precisa de función computable, los matemáticos solían utilizar el término informal efectivamente calculable para describir funciones que son computables mediante métodos de papel y lápiz. En la década de 1930, se realizaron varios intentos independientes para formalizar la noción de computabilidad :
Church, [7] Kleene , [8] y Turing [9] [11] demostraron que estas tres clases formalmente definidas de funciones computables coinciden: una función es λ-computable si y solo si es computable según el método de Turing, y si y solo si es recursiva general . Esto ha llevado a los matemáticos y científicos informáticos a creer que el concepto de computabilidad se caracteriza con precisión mediante estos tres procesos equivalentes. Otros intentos formales de caracterizar la computabilidad han reforzado posteriormente esta creencia (véase más adelante).
Por otra parte, la tesis de Church-Turing afirma que las tres clases formalmente definidas de funciones computables mencionadas anteriormente coinciden con la noción informal de función efectivamente calculable. Aunque la tesis tiene una aceptación casi universal, no se puede demostrar formalmente, ya que el concepto de calculabilidad efectiva solo se define informalmente.
Desde su inicio, han surgido variaciones sobre la tesis original, incluyendo afirmaciones sobre lo que puede ser realizado físicamente por una computadora en nuestro universo ( tesis física de Church-Turing ) y lo que puede ser computado eficientemente (tesis de Church-Turing (teoría de la complejidad)). Estas variaciones no se deben a Church o Turing, sino que surgen de trabajos posteriores en teoría de la complejidad y física digital . La tesis también tiene implicaciones para la filosofía de la mente (ver más abajo).
JB Rosser (1939) aborda la noción de "computabilidad efectiva" de la siguiente manera: "Es claro que la existencia de CC y RC (las pruebas de Church y Rosser) presupone una definición precisa de 'efectivo'. 'Método efectivo' se utiliza aquí en el sentido bastante especial de un método cada paso del cual está predeterminado con precisión y que es seguro que producirá la respuesta en un número finito de pasos". [12] Así, el adjetivo-adverbio "efectivo" se utiliza en un sentido de "1a: producir un efecto decidido, decisivo o deseado", y "capaz de producir un resultado". [13] [14]
En lo sucesivo, las palabras "efectivamente calculable" significarán "producido por cualquier medio intuitivamente 'efectivo'" y "efectivamente computable" significará "producido por una máquina de Turing o un dispositivo mecánico equivalente". Las "definiciones" de Turing que aparecen en una nota a pie de página en su tesis doctoral de 1938, Systems of Logic Based on Ordinals (Sistemas de lógica basados en ordinales) , supervisada por Church, son prácticamente las mismas:
† Utilizaremos la expresión "función computable" para significar una función calculable por una máquina, y haremos referencia a "efectivamente calculable" a la idea intuitiva sin identificación particular con ninguna de estas definiciones. [15]
La tesis puede enunciarse así: Toda función efectivamente calculable es una función computable . [16] Church también afirmó que «Ningún procedimiento computacional será considerado un algoritmo a menos que pueda representarse como una máquina de Turing». [ cita requerida ] Turing lo expresó de esta manera:
Se afirmó que "una función es efectivamente calculable si sus valores pueden hallarse mediante algún proceso puramente mecánico". Podemos tomar esto literalmente, entendiendo que mediante un proceso puramente mecánico se entiende uno que podría ser llevado a cabo por una máquina. El desarrollo... conduce a... una identificación de computabilidad † con calculabilidad efectiva. [ † es la nota al pie citada anteriormente.] [15]
Uno de los problemas importantes para los lógicos en la década de 1930 fue el Entscheidungsproblem de David Hilbert y Wilhelm Ackermann , [17] que preguntaba si había un procedimiento mecánico para separar las verdades matemáticas de las falsedades matemáticas. Esta búsqueda requería que la noción de "algoritmo" o "calculabilidad efectiva" estuviera precisada, al menos lo suficientemente bien como para que la búsqueda comenzara. [18] Pero desde el principio los intentos de Alonzo Church comenzaron con un debate que continúa hasta el día de hoy. [19] ¿ Debía [ aclarar ] que la noción de "calculabilidad efectiva" era (i) un "axioma o axiomas" en un sistema axiomático, (ii) meramente una definición que "identificaba" dos o más proposiciones, (iii) una hipótesis empírica que debía verificarse mediante la observación de eventos naturales, o (iv) solo una propuesta por el bien del argumento (es decir, una "tesis")?
En el curso del estudio del problema, Church y su estudiante Stephen Kleene introdujeron la noción de funciones λ-definibles y pudieron demostrar que varias clases grandes de funciones que se encuentran frecuentemente en la teoría de números eran λ-definibles. [20] El debate comenzó cuando Church propuso a Gödel que se definieran las funciones "efectivamente computables" como funciones λ-definibles. Gödel, sin embargo, no estaba convencido y calificó la propuesta de "totalmente insatisfactoria". [21] Más bien, en correspondencia con Church (c. 1934-1935), Gödel propuso axiomatizar la noción de "calculabilidad efectiva"; de hecho, en una carta de 1935 a Kleene, Church informó que:
La única idea que tenía [Gödel] en ese momento era que podría ser posible, en términos de calculabilidad efectiva como una noción indefinida, enunciar un conjunto de axiomas que incorporarían las propiedades generalmente aceptadas de esta noción, y hacer algo sobre esa base. [22]
Pero Gödel no ofreció más indicaciones. Finalmente, sugirió su recursión, modificada por la sugerencia de Herbrand, que Gödel había detallado en sus conferencias de 1934 en Princeton, Nueva Jersey (Kleene y Rosser transcribieron las notas). Pero no creía que las dos ideas pudieran identificarse satisfactoriamente "excepto heurísticamente". [23]
A continuación, fue necesario identificar y demostrar la equivalencia de dos nociones de calculabilidad efectiva. Equipado con el cálculo λ y la recursión "general", Kleene, con la ayuda de Church y J. Barkley Rosser, produjo pruebas (1933, 1935) para demostrar que los dos cálculos son equivalentes. Church posteriormente modificó sus métodos para incluir el uso de la recursión de Herbrand-Gödel y luego demostró (1936) que el Entscheidungsproblem es irresoluble: no existe ningún algoritmo que pueda determinar si una fórmula bien formada tiene una forma normal beta . [24]
Muchos años después, en una carta a Davis (c. 1965), Gödel dijo que "en el momento de estas conferencias [1934], no estaba del todo convencido de que su concepto de recursión comprendiera todas las recursiones posibles". [25] Entre 1963 y 1964, Gödel rechazaría la recursión de Herbrand-Gödel y el cálculo λ en favor de la máquina de Turing como definición de "algoritmo", "procedimiento mecánico" o "sistema formal". [26]
¿Una hipótesis que conduce a una ley natural?: A finales de 1936, el artículo de Alan Turing (que también demostraba que el Entscheidungsproblem era irresoluble) fue presentado oralmente, pero aún no había aparecido impreso. [27] Por otro lado, el artículo de Emil Post de 1936 había aparecido y fue certificado como independiente del trabajo de Turing. [28] Post estaba en total desacuerdo con la "identificación" de Church de la computabilidad efectiva con el cálculo λ y la recursión, afirmando:
En realidad, el trabajo ya realizado por Church y otros lleva esta identificación mucho más allá de la etapa de hipótesis de trabajo. Pero ocultar esta identificación bajo una definición… nos ciega a la necesidad de su verificación continua. [29]
Más bien, consideraba la noción de "calculabilidad efectiva" como una mera "hipótesis de trabajo" que podría llevar por razonamiento inductivo a una " ley natural " en lugar de por "una definición o un axioma". [30] Esta idea fue "duramente" criticada por Church. [31]
Así, Post en su artículo de 1936 también descartaba la sugerencia de Kurt Gödel a Church en 1934-1935 de que la tesis podría expresarse como un axioma o un conjunto de axiomas. [22]
Turing añade otra definición, Rosser equipara las tres : en poco tiempo apareció el artículo de Turing de 1936-1937 "Sobre los números computables, con una aplicación al problema de la endoscopia" [27] . En él, Turing enunciaba otra noción de "computabilidad efectiva" con la introducción de sus máquinas a (ahora conocidas como el modelo computacional abstracto de la máquina de Turing ). Y en un esbozo de prueba añadido como "apéndice" a su artículo de 1936-1937, Turing demostraba que las clases de funciones definidas por el cálculo λ y las máquinas de Turing coincidían. [32] Church reconoció rápidamente lo convincente que era el análisis de Turing. En su reseña del artículo de Turing, dejó claro que la noción de Turing hacía "evidente de inmediato la identificación con la efectividad en el sentido ordinario (no definido explícitamente)". [33]
En pocos años (1939) Turing propondría, como Church y Kleene antes que él, que su definición formal de agente computacional mecánico era la correcta. [34] Así, en 1939, tanto Church (1934) como Turing (1939) habían propuesto individualmente que sus "sistemas formales" deberían ser definiciones de "calculabilidad efectiva"; [35] ninguno de ellos formuló sus afirmaciones como tesis .
Rosser (1939) identificó formalmente las tres nociones como definiciones:
Las tres definiciones son equivalentes, por lo que no importa cuál se utilice. [36]
Kleene propone la Tesis I : Esto dejó en manos de Kleene la expresión explícita de una "tesis". En 1943, Kleene propuso su "Tesis I": [37]
Este hecho heurístico [las funciones recursivas generales son efectivamente calculables]... llevó a Church a enunciar la siguiente tesis. La misma tesis está implícita en la descripción que hace Turing de las máquinas de computación.
Tesis I. Toda función efectivamente calculable (predicado efectivamente decidible) es recursiva general [cursiva de Kleene]
Como no existe una definición matemática precisa del término efectivamente calculable (efectivamente decidible), podemos tomar esta tesis... como una definición del mismo...
...la tesis tiene el carácter de una hipótesis, un punto que Post y Church enfatizaron. Si consideramos la tesis y su recíproca como una definición, entonces la hipótesis es una hipótesis sobre la aplicación de la teoría matemática desarrollada a partir de la definición. Para la aceptación de la hipótesis, existen, como hemos sugerido, razones bastante convincentes.
La tesis de Church-Turing : Stephen Kleene, en Introducción a las metamatemáticas , finalmente pasa a nombrar formalmente "Tesis de Church" y "Tesis de Turing", utilizando su teoría de realizabilidad recursiva. Kleene pasó de presentar su trabajo en la terminología de definibilidad lambda de Church-Kleene a la de recursividad de Gödel-Kleene (funciones recursivas parciales). En esta transición, Kleene modificó las funciones recursivas generales de Gödel para permitir pruebas de la insolubilidad de los problemas en el intuicionismo de EJ Brouwer. En su libro de texto de posgrado sobre lógica, se introduce la "tesis de Church" y se demuestra que los resultados matemáticos básicos son irrealizables. A continuación, Kleene procede a presentar la "tesis de Turing", donde se demuestra que los resultados son incomputables, utilizando su derivación simplificada de una máquina de Turing basada en el trabajo de Emil Post. Ambas tesis se demuestran equivalentes mediante el uso del "Teorema XXX".
Tesis I. Toda función efectivamente calculable (predicado efectivamente decidible) es recursiva general . [38]
Teorema XXX: Las siguientes clases de funciones parciales son coextensivas, es decir, tienen los mismos miembros: (a) las funciones parciales recursivas, (b) las funciones computables... [39]
Tesis de Turing: La tesis de Turing de que toda función que naturalmente sería considerada como computable es computable según su definición, es decir, por una de sus máquinas, es equivalente a la tesis de Church por el Teorema XXX. [39]
Kleene, finalmente, utiliza por primera vez el término "tesis de Church-Turing" en una sección en la que ayuda a dar aclaraciones a conceptos del trabajo de Alan Turing "El problema de las palabras en semigrupos con cancelación", como lo exigía una crítica de William Boone. [40]
En 1980, Robin Gandy (alumno y amigo de Turing) intentó comprender mejor la noción de "computabilidad efectiva" y se dedicó a analizar la computación por máquina (en contraposición a la computación humana realizada por una máquina de Turing). La curiosidad de Gandy por los autómatas celulares (incluido el juego de la vida de Conway ), el paralelismo y los autómatas cristalinos, y su análisis de los mismos, lo llevaron a proponer cuatro "principios (o restricciones)... que, según se afirma, cualquier máquina debe satisfacer". [41] Su cuarto principio, el más importante, "el principio de causalidad", se basa en la "velocidad finita de propagación de efectos y señales; la física contemporánea rechaza la posibilidad de una acción instantánea a distancia". [42] A partir de estos principios y algunas restricciones adicionales (1a) un límite inferior para las dimensiones lineales de cualquiera de las partes, (1b) un límite superior para la velocidad de propagación (la velocidad de la luz), (2) progreso discreto de la máquina y (3) comportamiento determinista), produce un teorema que dice que "Lo que puede calcularse mediante un dispositivo que satisface los principios I a IV es computable". [43]
A finales de los años 1990, Wilfried Sieg analizó las nociones de "calculabilidad efectiva" de Turing y Gandy con la intención de "afinar la noción informal, formular sus características generales de manera axiomática e investigar el marco axiomático". [44] En su trabajo de 1997 y 2002, Sieg presenta una serie de restricciones al comportamiento de un computador -"un agente informático humano que procede mecánicamente". Estas restricciones se reducen a:
El asunto sigue siendo objeto de debate activo dentro de la comunidad académica. [46] [47]
La tesis puede ser vista como nada más que una definición matemática ordinaria. Los comentarios de Gödel sobre el tema sugieren esta visión, por ejemplo, "la definición correcta de computabilidad mecánica fue establecida más allá de cualquier duda por Turing". [48] El caso para ver la tesis como nada más que una definición es presentado explícitamente por Robert I. Soare , [5] donde también se argumenta que la definición de computabilidad de Turing no tiene menos probabilidades de ser correcta que la definición épsilon-delta de una función continua .
Se han propuesto otros formalismos (además de la recursión, el cálculo λ y la máquina de Turing ) para describir la calculabilidad/computabilidad efectiva. Kleene (1952) añade a la lista las funciones " contables en el sistema S 1 " de Kurt Gödel 1936, y los " sistemas canónicos [también llamados normales ] " de Emil Post (1943, 1946) . [49] En la década de 1950, Hao Wang y Martin Davis simplificaron en gran medida el modelo de máquina de Turing de una cinta (véase máquina post-Turing ). Marvin Minsky amplió el modelo a dos o más cintas y simplificó en gran medida las cintas en "contadores arriba-abajo", que Melzak y Lambek desarrollaron aún más en lo que ahora se conoce como el modelo de máquina de contadores . A finales de la década de 1960 y principios de la de 1970, los investigadores ampliaron el modelo de máquina de contadores en la máquina de registros , un primo cercano de la noción moderna de computadora . Otros modelos incluyen la lógica combinatoria y los algoritmos de Markov . Gurevich añade el modelo de máquina de punteros de Kolmogorov y Uspensky (1953, 1958): "... sólo querían... convencerse de que no hay forma de ampliar la noción de función computable". [50]
Todas estas contribuciones implican pruebas de que los modelos son computacionalmente equivalentes a la máquina de Turing; se dice que dichos modelos son Turing completos . Debido a que todos estos diferentes intentos de formalizar el concepto de "calculabilidad/computabilidad efectiva" han producido resultados equivalentes, ahora se asume generalmente que la tesis de Church-Turing es correcta. De hecho, Gödel (1936) propuso algo más fuerte que esto; observó que había algo "absoluto" en el concepto de "calculable en S 1 ":
También se puede demostrar que una función que es computable ['contable'] en uno de los sistemas S i , o incluso en un sistema de tipo transfinito, ya es computable [contable] en S 1 . Así, el concepto 'computable' ['contable'] es en cierto sentido definido 'absoluto', mientras que prácticamente todos los demás conceptos metamatemáticos familiares (por ejemplo, demostrable, definible, etc.) dependen de manera bastante esencial del sistema para el que están definidos... [51]
Las pruebas en la teoría de la computabilidad a menudo invocan la tesis de Church-Turing de manera informal para establecer la computabilidad de funciones, evitando al mismo tiempo los detalles (a menudo muy largos) que estarían involucrados en una prueba formal rigurosa. [52] Para establecer que una función es computable por la máquina de Turing, generalmente se considera suficiente dar una descripción informal en inglés de cómo se puede calcular efectivamente la función y luego concluir "según la tesis de Church-Turing" que la función es computable según el método de Turing (equivalentemente, parcialmente recursiva).
Dirk van Dalen da el siguiente ejemplo para ilustrar este uso informal de la tesis de Church-Turing: [53]
Ejemplo: Cada conjunto recursivamente enumerable (RE) infinito contiene un conjunto recursivo infinito .
Demostración: Sea A un RE infinito. Enumeramos los elementos de A de manera efectiva, n 0 , n 1 , n 2 , n 3 , ...
De esta lista extraemos una sublista creciente: ponemos m 0 = n 0 , después de un número finito de pasos encontramos un n k tal que n k > m 0 , ponemos m 1 = n k . Repetimos este procedimiento para encontrar m 2 > m 1 , etc. esto produce un listado efectivo del subconjunto B={m 0 , m 1 , m 2 ,...} de A, con la propiedad m i < m i+1 .
Afirmación . B es decidible. Para comprobar k en B debemos comprobar si k = m i para algún i. Puesto que la secuencia de m i es creciente, tenemos que producir como máximo k+1 elementos de la lista y compararlos con k. Si ninguno de ellos es igual a k, entonces k no está en B. Puesto que esta prueba es eficaz, B es decidible y, según la tesis de Church , recursiva.
Para que el ejemplo anterior fuera completamente riguroso, habría que construir cuidadosamente una máquina de Turing, o una función λ, o invocar cuidadosamente axiomas de recursión, o en el mejor de los casos, invocar hábilmente varios teoremas de la teoría de la computabilidad. Pero como el teórico de la computabilidad cree que la computabilidad de Turing captura correctamente lo que se puede calcular de manera efectiva, y como se explica en inglés un procedimiento efectivo para decidir el conjunto B, el teórico de la computabilidad acepta esto como prueba de que el conjunto es, en efecto, recursivo.
El éxito de la tesis de Church-Turing dio lugar a la propuesta de variantes de la misma. Por ejemplo, la tesis física de Church-Turing afirma: "Todas las funciones físicamente computables son computables mediante el método de Turing". [54] : 101
La tesis de Church-Turing no dice nada sobre la eficiencia con la que un modelo de computación puede simular otro. Se ha demostrado, por ejemplo, que una máquina de Turing universal (multicinta) solo sufre un factor de desaceleración logarítmico al simular cualquier máquina de Turing. [55]
Una variación de la tesis de Church-Turing aborda si un modelo arbitrario pero "razonable" de computación puede ser simulado eficientemente. Esto se llama la tesis de viabilidad , [56] también conocida como la tesis de Church-Turing de la teoría de la complejidad ( clásica ) o la tesis de Church-Turing extendida , que no se debe a Church o Turing, sino que se realizó gradualmente en el desarrollo de la teoría de la complejidad . Afirma: [57] "Una máquina de Turing probabilística puede simular eficientemente cualquier modelo realista de computación". La palabra "eficientemente" aquí significa hasta reducciones de tiempo polinomial . Esta tesis fue llamada originalmente tesis de Church-Turing de la teoría de la complejidad computacional por Ethan Bernstein y Umesh Vazirani (1997). La tesis de Church-Turing de la teoría de la complejidad, entonces, postula que todos los modelos "razonables" de computación producen la misma clase de problemas que pueden ser calculados en tiempo polinomial. Suponiendo la conjetura de que el tiempo polinomial probabilístico ( BPP ) es igual al tiempo polinomial determinista ( P ), la palabra "probabilístico" es opcional en la tesis de Church-Turing de teoría de la complejidad. Una tesis similar, llamada tesis de la invariancia , fue introducida por Cees F. Slot y Peter van Emde Boas. Establece: " Las máquinas 'razonables' pueden simularse entre sí dentro de una sobrecarga polinomialmente limitada en el tiempo y una sobrecarga de factor constante en el espacio". [58] La tesis apareció originalmente en un artículo en STOC '84, que fue el primer artículo en demostrar que la sobrecarga de tiempo polinomial y la sobrecarga de espacio constante se podían lograr simultáneamente para una simulación de una máquina de acceso aleatorio en una máquina de Turing. [59]
Si se demuestra que BQP es un superconjunto estricto de BPP , invalidaría la tesis de Church-Turing de teoría de la complejidad. En otras palabras, habría algoritmos cuánticos eficientes que realizan tareas que no tienen algoritmos probabilísticos eficientes . Sin embargo, esto no invalidaría la tesis original de Church-Turing, ya que una computadora cuántica siempre puede ser simulada por una máquina de Turing, pero invalidaría la tesis clásica de Church-Turing de teoría de la complejidad por razones de eficiencia. En consecuencia, la tesis de Church-Turing de teoría de la complejidad cuántica establece: [57] "Una máquina de Turing cuántica puede simular eficientemente cualquier modelo realista de computación".
Eugene Eberbach y Peter Wegner afirman que la tesis de Church-Turing a veces se interpreta de forma demasiado amplia, afirmando que "aunque [...] las máquinas de Turing expresan el comportamiento de los algoritmos, la afirmación más amplia de que los algoritmos capturan con precisión lo que se puede calcular no es válida". [60] Afirman que las formas de computación no capturadas por la tesis son relevantes hoy en día, términos que ellos llaman computación super-Turing .
Los filósofos han interpretado la tesis de Church-Turing como algo que tiene implicaciones para la filosofía de la mente . [61] [62] [63] B. Jack Copeland afirma que es una cuestión empírica abierta si existen procesos físicos deterministas reales que, a largo plazo, eluden la simulación por una máquina de Turing; además, afirma que es una cuestión empírica abierta si tales procesos están involucrados en el funcionamiento del cerebro humano. [64] También hay algunas cuestiones abiertas importantes que cubren la relación entre la tesis de Church-Turing y la física, y la posibilidad de hipercomputación . Cuando se aplica a la física, la tesis tiene varios significados posibles:
Hay muchas otras posibilidades técnicas que quedan fuera o entre estas tres categorías, pero sirven para ilustrar el alcance del concepto.
Los aspectos filosóficos de la tesis, tanto en relación con las computadoras físicas como biológicas, también se analizan en el libro de texto de Odifreddi de 1989 sobre la teoría de la recursión. [67] : 101–123
Se pueden definir formalmente funciones que no sean computables. Un ejemplo bien conocido de este tipo de función es la función Busy Beaver . Esta función toma una entrada n y devuelve el mayor número de símbolos que una máquina de Turing con n estados puede imprimir antes de detenerse, cuando se ejecuta sin entrada. Encontrar un límite superior para la función Busy Beaver es equivalente a resolver el problema de la detención , un problema que se sabe que no puede resolverse con máquinas de Turing. Dado que la función Busy Beaver no puede ser calculada por máquinas de Turing, la tesis de Church-Turing afirma que esta función no puede ser calculada de manera efectiva por ningún método.
Varios modelos computacionales permiten el cálculo de funciones no computables (de Church-Turing). Estas se conocen como hipercomputadoras . Mark Burgin sostiene que los algoritmos superrecursivos, como las máquinas de Turing inductivas, refutan la tesis de Church-Turing. [68] [ página requerida ] Su argumento se basa en una definición de algoritmo más amplia que la ordinaria, de modo que las funciones no computables obtenidas de algunas máquinas de Turing inductivas se denominan computables. Esta interpretación de la tesis de Church-Turing difiere de la interpretación comúnmente aceptada en la teoría de la computabilidad, discutida anteriormente. El argumento de que los algoritmos superrecursivos son de hecho algoritmos en el sentido de la tesis de Church-Turing no ha encontrado una amplia aceptación dentro de la comunidad de investigación de la computabilidad. [ cita requerida ]
{{cite book}}
: CS1 maint: location missing publisher (link)