Aprendizaje basado en explicaciones

El aprendizaje basado en explicaciones ( EBL ) es una forma de aprendizaje automático que explota una teoría de dominio muy fuerte, o incluso perfecta, (es decir, una teoría formal de un dominio de aplicación similar a un modelo de dominio en ingeniería ontológica , que no debe confundirse con la teoría de dominio de Scott ) para hacer generalizaciones o formar conceptos a partir de ejemplos de entrenamiento. ^[1] También está vinculado con la codificación (memoria) para ayudar con el aprendizaje . ^[2]

Detalles

Un ejemplo de EBL que utiliza una teoría de dominio perfecto es un programa que aprende a jugar al ajedrez mediante ejemplos. Una posición de ajedrez específica que contiene una característica importante como "Pérdida forzada de la dama negra en dos movimientos" incluye muchas características irrelevantes, como la dispersión específica de los peones en el tablero. EBL puede tomar un solo ejemplo de entrenamiento y determinar cuáles son las características relevantes para formar una generalización. ^[3]

Una teoría de dominio es perfecta o completa si contiene, en principio, toda la información necesaria para decidir cualquier cuestión sobre el dominio. Por ejemplo, la teoría de dominio para ajedrez es simplemente las reglas del ajedrez. Conociendo las reglas, en principio, es posible deducir la mejor jugada en cualquier situación. Sin embargo, hacer realmente tal deducción es imposible en la práctica debido a la explosión combinatoria . EBL utiliza ejemplos de entrenamiento para hacer que la búsqueda de consecuencias deductivas de una teoría de dominio sea eficiente en la práctica.

En esencia, un sistema EBL funciona encontrando una manera de deducir cada ejemplo de entrenamiento a partir de la base de datos existente de teoría de dominios del sistema. Tener una prueba corta del ejemplo de entrenamiento extiende la base de datos de teoría de dominios, lo que permite que el sistema EBL encuentre y clasifique ejemplos futuros que sean similares al ejemplo de entrenamiento muy rápidamente. ^[4] Minton analizó el principal inconveniente del método (el costo de aplicar las macros de prueba aprendidas, a medida que se vuelven numerosas). ^[5]

Formulación básica

El software EBL acepta cuatro entradas:

un espacio de hipótesis (el conjunto de todas las conclusiones posibles)
una teoría de dominio (axiomas sobre un dominio de interés)
Ejemplos de entrenamiento (hechos específicos que descartan alguna hipótesis posible)
Criterios de operacionalidad (criterios para determinar qué características del dominio son reconocibles de manera eficiente, por ejemplo, qué características son directamente detectables mediante sensores) ^[6]

Solicitud

Un dominio de aplicación especialmente bueno para un EBL es el procesamiento del lenguaje natural (NLP). Aquí una teoría de dominio rica, es decir, una gramática del lenguaje natural, aunque no perfecta ni completa, se ajusta a una aplicación particular o un uso particular del lenguaje, utilizando un banco de árboles (ejemplos de entrenamiento). Rayner fue pionero en este trabajo. ^[7] La primera aplicación industrial exitosa fue una interfaz NL comercial para bases de datos relacionales. ^[8] El método se ha aplicado con éxito a varios sistemas de análisis de lenguaje natural a gran escala, ^[9] donde el problema de utilidad se resolvió omitiendo la gramática original (teoría de dominio) y utilizando técnicas especializadas de análisis LR, lo que resultó en enormes aumentos de velocidad, a costa de la cobertura, pero con una ganancia en desambiguación. Las técnicas similares a EBL también se han aplicado a la generación de superficies, lo inverso del análisis. ^[10]

Al aplicar EBL a NLP, los criterios de operacionalidad pueden ser elaborados a mano, ^[11] o pueden inferirse del treebank usando la entropía de sus nodos or ^[12] o un equilibrio entre cobertura de objetivo/desambiguación (= equilibrio entre recuperación/precisión = puntuación f). ^[13] EBL también puede usarse para compilar modelos de lenguaje basados en gramática para reconocimiento de voz , a partir de gramáticas de unificación generales. ^[14] Nótese cómo el problema de utilidad, expuesto por primera vez por Minton, se resolvió descartando la teoría original de gramática/dominio, y que los artículos citados tienden a contener la frase especialización gramatical , todo lo contrario del término original generalización basada en explicación. Quizás el mejor nombre para esta técnica sería reducción del espacio de búsqueda basada en datos. Otras personas que trabajaron en EBL para NLP incluyen a Guenther Neumann, Aravind Joshi, Srinivas Bangalore y Khalil Sima'an.

Véase también

Referencias

^ "Número especial sobre explicación en razonamiento basado en casos". Artificial Intelligence Review . 24 (2). Octubre de 2005.
^ Calin-Jageman, Robert J.; Horn Ratner, Hilary (1 de diciembre de 2005). "El papel de la codificación en el efecto de autoexplicación". Cognición e instrucción . 23 (4): 523–543. doi :10.1207/s1532690xci2304_4. ISSN 0737-0008. S2CID 145410154.
^ Ejemplo de reina negra de Mitchell, Tom (1997). Machine Learning . McGraw-Hill. págs. 308-309. ISBN 0-07-042807-7.
^ Mitchell, Tom (1997). Aprendizaje automático . McGraw-Hill. pp. 320. ISBN. 0-07-042807-7En su forma pura, el EBL implica reformular la teoría del dominio para producir reglas generales que clasifiquen los ejemplos en un solo paso de inferencia .
^ Minton, Steven (1990). "Resultados cuantitativos sobre el problema de utilidad en el aprendizaje basado en explicaciones". Inteligencia artificial . 42 (2–3): 363–392. doi :10.1016/0004-3702(90)90059-9.
^ Keller, Richard (1988). "Definición de la operacionalidad para el aprendizaje basado en la explicación" (PDF) . Inteligencia artificial . 35 (2): 227–241. doi :10.1016/0004-3702(88)90013-6 . Consultado el 22 de febrero de 2009. Definición actual de operacionalidad: una descripción de concepto es operacional si se puede utilizar de manera eficiente para reconocer instancias del concepto que denota.Después de enunciar la definición común, el documento argumenta en contra de ella y favorece criterios más refinados.
^ Rayner, Manny (1988). "Aplicación de la generalización basada en explicaciones al procesamiento del lenguaje natural". Procs. Conferencia internacional sobre informática de quinta generación, Kioto. pp. 1267–1274.
^ Samuelsson, Christer; Manny Rayner (1991). "Evaluación cuantitativa del aprendizaje basado en explicaciones como herramienta de optimización para un sistema de lenguaje natural a gran escala". Procs. 12.ª Conferencia conjunta internacional sobre inteligencia artificial, Sídney, págs. 609–615.{{cite news}}: Mantenimiento de CS1: ubicación ( enlace )
^ Samuelsson, Christer (1994). Análisis rápido del lenguaje natural mediante aprendizaje basado en explicaciones . Estocolmo: Tesis doctoral, Royal Institute of Technology.
^ Samuelsson, Christer (1996). "Optimización basada en ejemplos de tablas de generación de superficies". en R. Mitkov y N. Nicolov (eds.) "Avances recientes en el procesamiento del lenguaje natural", vol. 136 de "Cuestiones actuales en la teoría lingüística": John Benjamins, Ámsterdam.{{cite news}}: Mantenimiento de CS1: ubicación ( enlace )
^ Rayner, Manny; David Carter (1996). "Análisis rápido mediante poda y especialización gramatical". Procs. ACL, Santa Cruz.
^ Samuelsson, Christer (1994). "Especialización gramatical a través de umbrales de entropía". Procs. ACL, Las Cruces. pp. 188–195.
^ Cancedda, Nicola; Christer Samuelsson (2000). "Especialización gramatical basada en corpus". Cuarto taller de aprendizaje computacional del lenguaje natural de Procs.{{cite news}}: Mantenimiento de CS1: ubicación ( enlace )
^ Rayner, Manny; Beth Ann Hockey; Pierrette Bouillon (sin fecha). Poniendo la lingüística en el reconocimiento de voz: el compilador de gramática Regulus . Centro para el estudio del lenguaje y la información. ISBN 1-57586-526-2.