Golem toma como entrada un programa definido B como conocimiento de fondo junto con conjuntos de ejemplos positivos y negativos, denotados y respectivamente. La idea general es construir la generalización menos general de con respecto al conocimiento de fondo. Sin embargo, si B no es simplemente un conjunto finito de átomos base , entonces esta generalización menos general relativa puede no existir. [4]
Por lo tanto, en lugar de usar B directamente, Golem usa el conjunto de todos los átomos base que se pueden resolver a partir de B en como máximo h pasos de resolución. Una dificultad adicional es que si no está vacío, la generalización menos general de puede implicar un ejemplo negativo. En este caso, Golem generaliza diferentes subconjuntos de por separado para obtener un programa de varias cláusulas. [2]
Golem también emplea algunas restricciones en el espacio de hipótesis, asegurando que las generalizaciones menos generales relativas sean polinómicas en el número de ejemplos de entrenamiento. Golem exige que todas las variables en el encabezado de una cláusula también aparezcan en un literal del cuerpo de la cláusula; que el número de sustituciones necesarias para instanciar variables cuantificadas existencialmente introducidas en un literal esté acotado; y que la profundidad de la cadena de sustituciones necesarias para instanciar dicha variable también está limitada. [3]
Ejemplo
El siguiente ejemplo sobre el aprendizaje de definiciones de relaciones familiares utiliza las abreviaturas
par : padre , fem : mujer , dau : hija , g : George , h : Helen , m : Mary , t : Tom , n : Nancy , y e : Eve .
Se parte del conocimiento previo (ver imagen)
,
Los ejemplos positivos
,
y la proposición trivial verdadera
para denotar la ausencia de ejemplos negativos.
La generalización menos general relativa se calcula ahora de la siguiente manera para obtener una definición de la relación hija .
Relativizar cada literal de ejemplo positivo con el conocimiento de fondo completo:
Anti-unificar cada par [5] de literales compatibles [6] :
desde y ,
desde y ,
desde y ,
de y , similar para todos los demás literales de conocimiento de fondo
de y , y muchos más literales negados
Eliminar todos los literales negados que contengan variables que no aparecen en un literal positivo:
después de eliminar todos los literales negados que contienen otras variables que no sean , solo queda, junto con todos los literales básicos del conocimiento de fondo
Convertir las cláusulas nuevamente a la forma Horn:
La cláusula de Horn resultante es la hipótesis h obtenida por Golem. De manera informal, la cláusula dice " se llama hija de si es padre de y es mujer ", que es una definición comúnmente aceptada.
Referencias
^ Muggleton, Stephen H.; Feng, Cao (1990). Arikawa, Setsuo; Goto, Shigeki; Ohsuga, Setsuo; Yokomori, Takashi (eds.). "Inducción eficiente de programas lógicos". Algorithmic Learning Theory, Primer taller internacional, ALT '90, Tokio, Japón, 8-10 de octubre de 1990, Actas . Springer/Ohmsha: 368–381.
^ ab Nienhuys-Cheng, Shan-hwei; Wolf, Ronald de (1997). Fundamentos de la programación lógica inductiva . Apuntes de clases de informática. Apuntes de clases de inteligencia artificial. Berlín Heidelberg: Springer. pp. 354–358. ISBN978-3-540-62927-6.
^ ab Aha, David W. (1992). "Relating relationshipal learning algorithms" (Relacionar algoritmos de aprendizaje relacional). En Muggleton, Stephen (ed.). Programación lógica inductiva . Londres: Academic Press . pág. 247.
^ Nienhuys-Cheng, Shan-hwei; Wolf, Ronald de (1997). Fundamentos de la programación lógica inductiva . Apuntes de clases de informática. Apuntes de clases de inteligencia artificial. Berlín Heidelberg: Springer. p. 286. ISBN978-3-540-62927-6.
^ es decir, comparten el mismo símbolo de predicado y estado negado/no negado
^ en general: n -tupla cuando se dan n literales de ejemplo positivos