Isabelle (asistente de pruebas)

El demostrador automatizado de teoremas de Isabelle ^[a] es un demostrador de teoremas de lógica de orden superior (HOL) , escrito en Standard ML y Scala . Como demostrador de teoremas de estilo LCF , se basa en un pequeño núcleo lógico (núcleo) para aumentar la confiabilidad de las pruebas sin requerir (aunque respaldar) objetos de prueba explícitos.

Isabelle está disponible dentro de un marco de sistema flexible que permite extensiones lógicamente seguras, que comprenden tanto teorías como implementaciones para la generación de código, documentación y soporte específico para una variedad de métodos formales . Puede verse como un IDE para métodos formales. En los últimos años, un número importante de teorías y ampliaciones de sistemas han sido recopiladas en el Archivo Isabelle de Pruebas Formales ( Isabelle AFP ) ^[2]

Isabelle fue nombrada por Lawrence Paulson en honor a la hija de Gérard Huet . ^[3]

El demostrador del teorema de Isabelle es software libre , publicado bajo la licencia BSD revisada .

Características

Isabelle es genérica: proporciona una metalógica (una teoría de tipos débiles ), que se utiliza para codificar lógicas de objetos como la lógica de primer orden (FOL), la lógica de orden superior (HOL) o la teoría de conjuntos de Zermelo-Fraenkel (ZFC). La lógica de objetos más utilizada es Isabelle/HOL, aunque en Isabelle/ZF se completaron importantes desarrollos en la teoría de conjuntos. El principal método de prueba de Isabelle es una versión de resolución de orden superior , basada en la unificación de orden superior .

Aunque interactiva, Isabelle presenta herramientas eficientes de razonamiento automático, como un motor de reescritura de términos y un probador de cuadros , varios procedimientos de decisión y, a través de la interfaz de automatización de pruebas Sledgehammer , solucionadores externos de teorías de módulo de satisfacibilidad (SMT) (incluido CVC4 ) y resolución . demostradores de teoremas automatizados (ATP) basados en E , SPASS y Vampire (el método de prueba de Metis ^[b] reconstruye las pruebas de resolución generadas por estos ATP). ^[4] También cuenta con dos buscadores de modelos (generadores de contraejemplos ): Nitpick ^[5] y Nunchaku . ^[6]

Isabelle presenta locales que son módulos que estructuran pruebas grandes. Una configuración regional fija tipos, constantes y suposiciones dentro de un alcance específico ^[5] para que no tengan que repetirse para cada lema .

Isar (" razonamiento inteligible semiautomático ") es el lenguaje de prueba formal de Isabelle. Está inspirado en el sistema Mizar . ^[5]

Prueba de ejemplo

Isabelle permite redactar pruebas en dos estilos diferentes, el procesal y el declarativo . Las pruebas procesales especifican una serie de tácticas ( funciones/procedimientos de demostración de teoremas ) a aplicar. Si bien reflejan el procedimiento que un matemático humano podría aplicar para demostrar un resultado, suelen ser difíciles de leer ya que no describen el resultado de estos pasos. Las pruebas declarativas (respaldadas por el lenguaje de prueba de Isabelle, Isar), por otro lado, especifican las operaciones matemáticas reales que se realizarán y, por lo tanto, los humanos las leen y verifican más fácilmente.

El estilo procesal ha quedado obsoleto en versiones recientes de Isabelle. ^{[ cita necesaria ]}

Por ejemplo, una prueba declarativa por contradicción en Isar de que la raíz cuadrada de dos no es racional se puede escribir de la siguiente manera.

teorema sqrt2_not_rational: "sqrt 2 ∉ ℚ" prueba dejemos que ?x = "sqrt 2" asuma "?x ∈ ℚ" y luego obtenga mn :: nat donde sqrt_rat: "¦?x¦ = m / n" y lower_terms: "coprime m n " por (regla Rats_abs_nat_div_natE) por lo tanto "m^2 = ?x^2 * n^2" por (auto simp add: power2_eq_square) por lo tanto eq: "m^2 = 2 * n^2" usando of_nat_eq_iff power2_eq_square por fastforce por lo tanto " 2 dvd m^2" por simp , por lo tanto, "2 dvd m" por simp tiene prueba de "2 dvd n" - de ‹2 dvd m› obtiene k donde "m = 2 * k" ... con eq tiene "2 * n^ 2 = 2^2 * k^2" por simp por lo tanto "2 dvd n^2" por simp por lo tanto "2 dvd n" por simp qed con ‹2 dvd m› tener "2 dvd gcd m n" por (regla gcd_greatest) con lower_terms tiene "2 dvd 1" por simp , por lo que es falso usando odd_one por blast qed

Aplicaciones

Isabelle se ha utilizado para ayudar a los métodos formales para la especificación, desarrollo y verificación de sistemas de software y hardware.

Isabelle se ha utilizado para formalizar numerosos teoremas de matemáticas e informática , como el teorema de completitud de Gödel , el teorema de Gödel sobre la consistencia del axioma de elección , el teorema de los números primos , la corrección de los protocolos de seguridad y las propiedades de la semántica del lenguaje de programación . Muchas de las pruebas formales, como se mencionó, se mantienen en el Archivo de Pruebas Formales, que contiene (a partir de 2019) al menos 500 artículos con más de 2 millones de líneas de prueba en total. ^[7]

En 2009, el proyecto L4.verified en NICTA produjo la primera prueba formal de corrección funcional de un núcleo de sistema operativo de propósito general: ^{[8] el}micronúcleo seL4 ( L4 integrado seguro ) . La prueba se construye y verifica en Isabelle/HOL y comprende más de 200.000 líneas de script de prueba para verificar 7.500 líneas de C. La verificación cubre el código, el diseño y la implementación, y el teorema principal establece que el código C implementa correctamente la especificación formal de el núcleo. La prueba descubrió 144 errores en una versión anterior del código C del kernel seL4 y alrededor de 150 problemas tanto en el diseño como en las especificaciones.

La definición del lenguaje de programación Java ligero fue probada en Isabelle. ^[9]

Larry Paulson mantiene una lista de proyectos de investigación que utilizan Isabelle. ^[10]

Alternativas

Varios lenguajes y sistemas proporcionan una funcionalidad similar:

Agda , escrito en Haskell
Coq , escrito en OCaml
Lean , escrito en C++
LEGO , escrito en Standard ML de Nueva Jersey
Sistema Mizar , escrito en Free Pascal
Metamath , escrito en ANSI C
Prover9 , escrito en C , con una GUI escrita en Python
Doce , escrito en ML estándar

Notas

Referencias

^ Paulson, LC (1986). "Deducción natural como resolución de orden superior". La revista de programación lógica . 3 (3): 237–258. arXiv : cs/9301104 . doi :10.1016/0743-1066(86)90015-4. S2CID 27085090.
^ Eberl, Manuel; Klein, Gerwin; Nipkow, Tobías; Paulson, Larry; Thiemann, René. «Archivo de Pruebas Formales» . Consultado el 1 de mayo de 2021 .
^ Gordon, Mike (16 de noviembre de 1994). "1.2 Historia". Isabelle y HOL . Cambridge AR Research (Grupo de razonamiento automatizado). Archivado desde el original el 5 de marzo de 2017 . Consultado el 28 de abril de 2016 .
^ Jasmin Christian Blanchette, Lukas Bulwahn, Tobias Nipkow, "Prueba y refutación automáticas en Isabelle/HOL", en: Cesare Tinelli, Viorica Sofronie-Stokkermans (eds.), Simposio internacional sobre las fronteras de los sistemas combinados - FroCoS 2011, Springer, 2011 .
^ abc Jasmin Christian Blanchette, Mathias Fleury, Peter Lammich y Christoph Weidenbach, "Un marco de solución SAT verificado con aprendizaje, olvido, reinicio e incrementalidad", Journal of Automated Reasoning 61 :333–365 (2018).
^ Andrew Reynolds, Jasmin Christian Blanchette, Simon Cruanes, Cesare Tinelli, "Búsqueda de modelos para funciones recursivas en SMT", en: Nicola Olivetti, Ashish Tiwari (eds.), Octava conferencia internacional conjunta sobre razonamiento automatizado, Springer, 2016.
^ Eberl, Manuel; Klein, Gerwin; Nipkow, Tobías; Paulson, Larry; Thiemann, René. «Archivo de Pruebas Formales» . Consultado el 22 de octubre de 2019 .
^ Klein, Gerwin; Elphinstone, Kevin; Heiser, Gernot; Andrónico, junio; Polla, David; Derrin, Felipe; Elkaduwe, Dhammika; Engelhardt, Kai; Kolanski, Rafal; Norris, Michael; Sewell, Thomas; Tuch, Harvey; Winwood, Simon (octubre de 2009). "seL4: Verificación formal de un kernel de sistema operativo" (PDF) . 22º Simposio ACM sobre principios de sistemas operativos . Big Sky, Montana, Estados Unidos. págs. 207–200.
^ Strniša, Rok; Parkinson, Mateo (7 de febrero de 2011). "Java ligero". Archivo de pruebas formales (edición de febrero de 2011). ISSN 2150-914X . Consultado el 25 de noviembre de 2019 .
^ "Proyectos - Wiki de la comunidad Isabelle".

Otras lecturas

Lawrence C. Paulson , "The Foundation of a Generic Theorem Prover", Journal of Automated Reasoning , volumen 5, número 3 (septiembre de 1989), páginas: 363–397, ISSN 0168-7433.
Lawrence C. Paulson y Tobias Nipkow , "Tutorial y manual del usuario de Isabelle", 1990.
MA Ozols, KA Eastaughffe y A. Cant, "DOVE: Una herramienta para la verificación y evaluación orientadas al diseño", Actas de AMAST 97 , M. Johnson, editor, Sydney, Australia. Apuntes de conferencias sobre informática (LNCS) vol. 1349, Springer Verlag, 1997.
Tobias Nipkow, Lawrence C. Paulson, Markus Wenzel, "Isabelle/HOL: un asistente de prueba para la lógica de orden superior", 2020.

enlaces externos

Página web oficial
Isabelle en el desbordamiento de pila
El archivo de las pruebas formales
IsarMathLib