Síntesis de programas

En informática , la síntesis de programas es la tarea de construir un programa que satisfaga demostrablemente una especificación formal de alto nivel dada . A diferencia de la verificación de programas , el programa debe construirse en lugar de darse; sin embargo, ambos campos hacen uso de técnicas de prueba formal y ambos comprenden enfoques de diferentes grados de automatización. A diferencia de las técnicas de programación automática , las especificaciones en la síntesis de programas suelen ser declaraciones no algorítmicas en un cálculo lógico apropiado . ^[1]

La principal aplicación de la síntesis de programas es liberar al programador de la carga de escribir código correcto y eficiente que satisfaga una especificación. Sin embargo, la síntesis de programas también tiene aplicaciones en la superoptimización y la inferencia de invariantes de bucles . ^[2]

Origen

Durante el Instituto de Verano de Lógica Simbólica de la Universidad de Cornell en 1957, Alonzo Church definió el problema de sintetizar un circuito a partir de requisitos matemáticos. ^[3] Aunque el trabajo solo se refiere a circuitos y no a programas, se considera que es una de las primeras descripciones de la síntesis de programas y algunos investigadores se refieren a la síntesis de programas como el "problema de Church". En la década de 1960, los investigadores en inteligencia artificial exploraron una idea similar para un "programador automático". ^{[ cita requerida ]}

Desde entonces, varias comunidades de investigación han considerado el problema de la síntesis de programas. Entre los trabajos más destacados se encuentran el enfoque teórico de autómatas de Büchi y Landweber de 1969 [ 4 ] y ^los trabajos de Manna y Waldinger (c. 1980). El desarrollo de los lenguajes de programación de alto nivel modernos también puede entenderse como una forma de síntesis de programas.

Los avances del siglo XXI

A principios del siglo XXI, se ha producido un aumento del interés práctico en la idea de la síntesis de programas en la comunidad de verificación formal y en campos relacionados. Armando Solar-Lezama demostró que es posible codificar problemas de síntesis de programas en lógica booleana y utilizar algoritmos para el problema de satisfacibilidad booleana para encontrar programas automáticamente. ^[5]

Síntesis guiada por sintaxis

En 2013, investigadores de la Universidad de Pensilvania , la Universidad de California en Berkeley y el MIT propusieron un marco unificado para los problemas de síntesis de programas denominado Síntesis guiada por sintaxis (SyGuS estilizado) . ^[6] La entrada a un algoritmo SyGuS consiste en una especificación lógica junto con una gramática de expresiones libre de contexto que restringe la sintaxis de las soluciones válidas. ^[7] Por ejemplo, para sintetizar una función f que devuelve el máximo de dos números enteros, la especificación lógica podría verse así:

$(f (x, y) = x \lor f (x, y) = y) \land f (x, y) \geq x \land f (x, y) \geq y$

y la gramática podría ser:

< Exp >  ::= x | y | 0 | 1 | < Exp > + < Exp > | ite( < Cond > , < Exp > , < Exp > ) < Cond >  ::=  < Exp > <= < Exp >

donde "ite" significa "si-entonces-sino". La expresión

ite(x <= y, y, x)

sería una solución válida, porque se ajusta a la gramática y a la especificación.

Desde 2014 hasta 2019, la competencia anual de síntesis guiada por sintaxis (o SyGuS-Comp) comparó los diferentes algoritmos para la síntesis de programas en un evento competitivo. ^[8] La competencia utilizó un formato de entrada estandarizado, SyGuS-IF, basado en SMT-Lib 2. Por ejemplo, el siguiente SyGuS-IF codifica el problema de sintetizar el máximo de dos números enteros (como se presentó anteriormente):

(lógica de conjuntos LIA)(sintetizador-diversión f ((x Int) (y Int)) Int ((i Int) (c Int) (b Bool)) ((i Int (cxy (+ ii) (ite bii))) (cInt(0 1)) (b booleano ((<= ii)))))(declarar-var x Int)(declarar-var y Int)(restricción (>= (fxy) x))(restricción (>= (fxy) y))(restricción (o (= (fxy) x) (= (fxy) y)))(verificar sintetizador)

Un solucionador compatible podría devolver el siguiente resultado:

((define-fun f ((x Int) (y Int)) Int (ite (<= xy) yx)))

Síntesis inductiva guiada por contraejemplo

La síntesis inductiva guiada por contraejemplos (CEGIS) es un enfoque eficaz para construir sintetizadores de programas de sonido. ^[9]^[10] CEGIS implica la interacción de dos componentes: un generador que genera programas candidatos y un verificador que verifica si los candidatos satisfacen la especificación.

Dado un conjunto de entradas I , un conjunto de programas posibles P y una especificación S , el objetivo de la síntesis de programas es encontrar un programa p en P tal que para todas las entradas i en I , S ( p , i ) se cumpla. CEGIS está parametrizado sobre un generador y un verificador:

El generador toma un conjunto de entradas T y genera un programa candidato c que es correcto en todas las entradas en T , es decir, un candidato tal que para todas las entradas t en T , S ( c , t ) es válido.
El verificador toma un programa candidato c y devuelve verdadero si el programa satisface S en todas las entradas, y de lo contrario devuelve un contraejemplo , es decir, una entrada e en I tal que S ( c , e ) falla.

CEGIS ejecuta el generador y el verificador en un bucle, acumulando contraejemplos:

El algoritmo cegis es  la entrada : Generador de programas genera , verificador verificar , especificación especificación , salida : Programa que satisface la especificación , o falla entradas  := conjunto vacío bucle  candidato  := generar ( especificación , entradas ) si  verificar ( especificación , candidato ) entonces  devolver  candidato  de lo contrario  verificar produce un contraejemplo e agregar e a las entradas  fin si

Las implementaciones de CEGIS normalmente utilizan solucionadores SMT como verificadores.

CEGIS se inspiró en el refinamiento de abstracción guiado por contraejemplos (CEGAR). ^[11]

El marco de Manna y Waldinger

El marco de trabajo de Manna y Waldinger , publicado en 1980, ^[12]^[13] parte de una fórmula de especificación de primer orden dada por el usuario . Para esa fórmula, se construye una prueba, sintetizando así también un programa funcional a partir de sustituciones unificadoras .

El marco se presenta en formato de tabla, cuyas columnas contienen:

Un número de línea ("Nr") para fines de referencia
Fórmulas que ya han sido establecidas, incluyendo axiomas y precondiciones ("Afirmaciones")
Fórmulas aún por demostrar, incluidas las poscondiciones ("Objetivos"), ^{[nota 1]}
Términos que denotan un valor de salida válido ("Programa") ^{[nota 2]}
Una justificación para la línea actual ("Origen")

Inicialmente, se introducen en la tabla los conocimientos previos, las precondiciones y las poscondiciones. Después, se aplican manualmente las reglas de prueba adecuadas. El marco ha sido diseñado para mejorar la legibilidad humana de las fórmulas intermedias: al contrario de la resolución clásica , no requiere una forma normal clausular , pero permite razonar con fórmulas de estructura arbitraria y que contengan cualquier conector (" resolución no clausular "). La prueba está completa cuando se ha derivado en la columna Objetivos o, equivalentemente, en la columna Afirmaciones . Se garantiza que los programas obtenidos mediante este enfoque satisfacen la fórmula de especificación con la que se inició; en este sentido, son correctos por construcción . ^{[14] Solo se admite un}lenguaje de programación minimalista, pero Turing-completo , ^[15] puramente funcional , que consta de operadores condicionales, de recursión y aritméticos y otros ^{[nota 3]} . Los estudios de caso realizados dentro de este marco sintetizaron algoritmos para calcular, por ejemplo, división , resto , ^[16]raíz cuadrada , ^[17]unificación de términos , ^[18] respuestas a consultas de bases de datos relacionales ^[19] y varios algoritmos de ordenamiento . ^[20]^[21] ${\it {verdadero}}$ ${\it {falso}}$

Reglas de prueba

Las reglas de prueba incluyen:

Resolución no clausular (ver tabla).

Por ejemplo, la línea 55 se obtiene resolviendo las fórmulas de aserción de 51 y de 52, que comparten alguna subfórmula común . El resolvente se forma como la disyunción de , con reemplazado por , y , con reemplazado por . Este resolvente se deduce lógicamente de la conjunción de y . De manera más general, y necesitan tener solo dos subfórmulas unificables y , respectivamente; su resolvente se forma entonces a partir de y como antes, donde es el unificador más general de y . Esta regla generaliza la resolución de cláusulas . ^[22]

{\estilo de visualización E}

{\estilo de visualización F}

{\estilo de visualización p}

{\estilo de visualización E}

{\estilo de visualización p}

{\it {verdadero}}

{\estilo de visualización F}

{\estilo de visualización p}

{\it {falso}}

{\estilo de visualización E}

{\estilo de visualización F}

{\estilo de visualización E}

{\estilo de visualización F}

estilo de visualización p_{1}}

estilo de visualización p_{2}

E\theta

{\estilo de visualización F\theta}

{\estilo de visualización \theta}

estilo de visualización p_{1}}

estilo de visualización p_{2}

Los términos del programa de las fórmulas principales se combinan como se muestra en la línea 58 para formar la salida del resolvente. En el caso general, se aplica también a este último. Dado que la subfórmula aparece en la salida, se debe tener cuidado de resolver únicamente en subfórmulas correspondientes a propiedades computables .

{\estilo de visualización \theta}

{\estilo de visualización p}

Transformaciones lógicas.

Por ejemplo, se puede transformar a ) tanto en Afirmaciones como en Metas, ya que ambas son equivalentes.

E\land (F\lor G)

(E\land F)\lor (E\land G)

Desdoblamiento de afirmaciones conjuntivas y de objetivos disyuntivos.

Un ejemplo se muestra en las líneas 11 a 13 del ejemplo de juguete a continuación.

Inducción estructural .

Esta regla permite la síntesis de funciones recursivas . Para una condición previa y posterior dada "Dado tal que , encuentre tal que ", y un orden adecuado dado por el usuario del dominio de , siempre es adecuado agregar una Aserción " ". ^[23] Resolver con esta aserción puede introducir una llamada recursiva a en el término del Programa.

{\estilo de visualización x}

{\textit {pre}}(x)

f(x)=y

{\textit {publicación}}(x,y)

{\estilo de visualización \prec}

{\estilo de visualización x}

x'\prec x\land {\textit {pre}}(x')\implies {\textit {post}}(x',f(x'))

{\estilo de visualización f}

Un ejemplo se da en Manna, Waldinger (1980), p.108-111, donde se sintetiza un algoritmo para calcular el cociente y el resto de dos números enteros dados, utilizando el buen orden definido por (p.110).

(n',d')\prec (n,d)

0\leq n'<n

Murray ha demostrado que estas reglas son completas para la lógica de primer orden . ^[24] En 1986, Manna y Waldinger agregaron reglas generalizadas de E-resolución y paramodulación para manejar también la igualdad; ^[25] más tarde, estas reglas resultaron ser incompletas (pero sin embargo sólidas ). ^[26]

Ejemplo

Como ejemplo de juguete, un programa funcional para calcular el máximo de dos números se puede derivar de la siguiente manera. ^[^{cita requerida}^] ${\estilo de visualización M}$ ${\estilo de visualización x}$ ${\estilo de visualización y}$

Partiendo de la descripción del requisito " El máximo es mayor o igual que cualquier número dado, y es uno de los números dados ", se obtiene la fórmula de primer orden como su traducción formal. Esta fórmula se debe demostrar. Mediante la Skolemización inversa , ^{[nota 4]} se obtiene la especificación de la línea 10, una letra mayúscula y una minúscula que denotan una variable y una constante de Skolem , respectivamente. $\para todo X\para todo Y\existe M:X\leq M\land Y\leq M\land (X=M\lor Y=M)$

Después de aplicar una regla de transformación para la ley distributiva en la línea 11, el objetivo de la prueba es una disyunción y, por lo tanto, se puede dividir en dos casos, a saber, las líneas 12 y 13.

Volviendo al primer caso, resolver la línea 12 con el axioma de la línea 1 conduce a la instanciación de la variable de programa en la línea 14. Intuitivamente, el último conjuntivo de la línea 12 prescribe el valor que debe tomar en este caso. Formalmente, la regla de resolución no clausular que se muestra en la línea 57 anterior se aplica a las líneas 12 y 1, con ${\estilo de visualización M}$ ${\estilo de visualización M}$

$siendo p$ la instancia común $x=x$ de $A=A$ y $x=M$ , obtenida unificando sintácticamentelas últimas fórmulas,
$F[$ $p$ $]$ siendo $verdadero$ $\land$ $x=x$ , obtenido de la línea instanciada 1 (rellenada apropiadamente para hacer visible el contexto $F[\cdot]$ alrededor de $p$ ), y
$G[$ $p$ $]$ siendo $x \leq x \land y \leq x \land$ $x = x$ , obtenido de la línea instanciada 12,

produciendo $verdadero$ $\land$ $falso$ $) \land ($ $x \leq x \land y \leq x \land$ $verdadero$ , lo que se simplifica a . $\lno ($ ${\estilo de visualización )}$ $x\leq x\land y\leq x$

De manera similar, la línea 14 genera la línea 15 y luego la línea 16 por resolución. Asimismo, el segundo caso, en la línea 13, se maneja de manera similar y finalmente genera la línea 18. $x\leq M\land y\leq M\land y=M$

En un último paso, ambos casos (es decir, las líneas 16 y 18) se unen, utilizando la regla de resolución de la línea 58; para que esa regla sea aplicable, se necesitó el paso preparatorio 15→16. Intuitivamente, la línea 18 podría leerse como "en caso de que , la salida sea válida (con respecto a la especificación original), mientras que la línea 15 dice "en caso de que , la salida sea válida; el paso 15→16 estableció que ambos casos 16 y 18 son complementarios. ^{[nota 5]} Dado que tanto la línea 16 como la 18 vienen con un término de programa, una expresión condicional da como resultado la columna de programa. Dado que se ha derivado la fórmula del objetivo , la prueba está hecha y la columna de programa de la línea " " contiene el programa. $x\leq y$ ${\estilo de visualización y}$ $y\leq x$ ${\estilo de visualización x}$ ${\textit {verdadero}}$ ${\textit {verdadero}}$

Véase también

Notas

^ La distinción "Afirmaciones" / "Objetivos" es sólo por conveniencia; siguiendo el paradigma de la prueba por contradicción , un objetivo es equivalente a una afirmación . ${\estilo de visualización F}$ $\lno F$
^ Cuando y son la fórmula de la meta y el término del programa en una línea, respectivamente, entonces, en todos los casos en que se cumple, es una salida válida del programa que se sintetizará. Esta invariancia se mantiene mediante todas las reglas de prueba. Una fórmula de afirmación por lo general no está asociada con un término del programa. ${\estilo de visualización F}$ ${\estilo de visualización s}$ ${\estilo de visualización F}$ ${\estilo de visualización s}$
^ Desde el principio, solo se admite el operador condicional ( ?: ). Sin embargo, se pueden agregar nuevos operadores y relaciones arbitrarios proporcionando sus propiedades como axiomas. En el ejemplo de juguete que se muestra a continuación, solo se han axiomatizado las propiedades de y que realmente se necesitan en la prueba, en las líneas 1 a 3. ${\estilo de visualización =}$ ${\estilo de visualización \leq}$
^ Mientras que la skolemización ordinaria preserva la satisfacibilidad, la skolemización inversa, es decir, reemplazar variables cuantificadas universalmente por funciones, preserva la validez.
^ Para ello era necesario el axioma 3; de hecho, si no hubiera un orden total , no se podría calcular ningún máximo para entradas incomparables . ${\estilo de visualización \leq}$ ${\estilo de visualización x,y}$

Referencias

^ Basin, D.; Deville, Y.; Flener, P.; Hamfelt, A.; Fischer Nilsson, J. (2004). "Síntesis de programas en lógica computacional". En M. Bruynooghe y K.-K. Lau (ed.). Desarrollo de programas en lógica computacional . LNCS. Vol. 3049. Springer. págs. 30–65. CiteSeerX 10.1.1.62.4976 .
^ (Alur, Singh y Fisman)
^ Alonzo Church (1957). "Aplicaciones de la aritmética recursiva al problema de la síntesis de circuitos". Resúmenes del Summer Institute of Symbolic Logic . 1 : 3–50.
^ Richard Büchi, Lawrence Landweber (abril de 1969). "Resolución de condiciones secuenciales mediante estrategias de estados finitos". Transactions of the American Mathematical Society . 138 : 295–311. doi :10.2307/1994916. JSTOR 1994916.
^ (Solar-Lezama)
^ Alur, Rajeev; al., et (2013). "Síntesis guiada por sintaxis". Actas de métodos formales en diseño asistido por computadora . IEEE. pág. 8.
^ (David y Kroening)
^ SyGuS-Comp (Competencia de síntesis guiada por sintaxis)
^ (Solar-Lezama)
^ (David y Kroening)
^ (Solar-Lezama)
^ Zohar Manna, Richard Waldinger (enero de 1980). "Un enfoque deductivo para la síntesis de programas". ACM Transactions on Programming Languages and Systems . 2 : 90–121. doi :10.1145/357084.357090. S2CID 14770735.
^ Zohar Manna y Richard Waldinger (diciembre de 1978). Un enfoque deductivo para la síntesis de programas (PDF) (Nota técnica). SRI International. Archivado (PDF) del original el 27 de enero de 2021.
^ Véase Manna, Waldinger (1980), p.100 para la corrección de las reglas de resolución.
^ Boyer, Robert S.; Moore, J. Strother (mayo de 1983). Una prueba mecánica de la completitud de Turing de Pure Lisp (PDF) (informe técnico). Instituto de Ciencias de la Computación, Universidad de Texas en Austin. 37. Archivado (PDF) desde el original el 22 de septiembre de 2017.
^ Maná, Waldinger (1980), págs. 108-111
^ Zohar Manna y Richard Waldinger (agosto de 1987). "El origen de un paradigma de búsqueda binaria". Ciencia de la programación informática . 9 (1): 37–83. doi :10.1016/0167-6423(87)90025-6.
^ Daniele Nardi (1989). "Síntesis formal de un algoritmo de unificación mediante el método de tabla deductiva". Journal of Logic Programming . 7 : 1–43. doi :10.1016/0743-1066(89)90008-3.
^ Daniele Nardi y Riccardo Rosati (1992). "Síntesis deductiva de programas para responder consultas". En Kung-Kiu Lau y Tim Clement (ed.). Taller internacional sobre síntesis y transformación de programas lógicos (LOPSTR) . Talleres en informática. Springer. págs. 15–29. doi :10.1007/978-1-4471-3560-9_2.
^ Jonathan Traugott (1986). "Síntesis deductiva de programas de ordenación". Actas de la Conferencia Internacional sobre Deducción Automatizada . LNCS . Vol. 230. Springer. págs. 641–660.
^ Jonathan Traugott (junio de 1989). "Síntesis deductiva de programas de ordenación". Journal of Symbolic Computation . 7 (6): 533–572. doi :10.1016/S0747-7171(89)80040-9.
^ Maná, Waldinger (1980), pág. 99
^ Maná, Waldinger (1980), pág. 104
^ Manna, Waldinger (1980), p.103, en referencia a: Neil V. Murray (febrero de 1979). Un procedimiento de prueba para lógica de primer orden no clausular sin cuantificadores (informe técnico). Universidad de Syracuse 2-79.
^ Zohar Manna, Richard Waldinger (enero de 1986). "Relaciones especiales en la deducción automatizada". Revista de la ACM . 33 : 1–59. doi : 10.1145/4904.4905 . S2CID 15140138.
^ Zohar Manna, Richard Waldinger (1992). "Las reglas de relaciones especiales son incompletas". Proc. CADE 11. LNCS. Vol. 607. Springer. págs. 492–506.

David, Cristina; Kroening, Daniel (13 de octubre de 2017). "Síntesis del programa: retos y oportunidades". Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences . 375 (2104): 20150403. doi :10.1098/rsta.2015.0403. ISSN 1364-503X. PMC 5597726 . PMID 28871052.
Alur, Rajeev; Singh, Rishabh; Fisman, Dana; Solar-Lezama, Armando (2018-11-20). "Síntesis de programas basada en búsqueda". Comunicaciones de la ACM . 61 (12): 84–93. doi :10.1145/3208071. ISSN 0001-0782.
Zohar Manna, Richard Waldinger (1975). "Conocimiento y razonamiento en la síntesis de programas". Inteligencia artificial . 6 (2): 175–208. doi :10.1016/0004-3702(75)90008-9.
Solar-Lezama, Armando (2008). Síntesis de programas mediante croquis (PDF) (Ph.D.). Universidad de California, Berkeley.