Aprendizaje basado en explicaciones

El aprendizaje basado en explicaciones ( EBL ) es una forma de aprendizaje automático que explota una teoría de dominio muy sólida, o incluso perfecta (es decir, una teoría formal de un dominio de aplicación similar a un modelo de dominio en ingeniería ontológica , que no debe confundirse con el dominio de Scott). teoría ) para hacer generalizaciones o formar conceptos a partir de ejemplos de entrenamiento. ^[1] También está vinculado con la codificación (memoria) para ayudar con el aprendizaje . ^[2]

Detalles

Un ejemplo de EBL que utiliza una teoría de dominio perfecto es un programa que aprende a jugar ajedrez mediante el ejemplo. Una posición de ajedrez específica que contiene una característica importante como "Pérdida forzada de la dama negra en dos movimientos" incluye muchas características irrelevantes, como la dispersión específica de los peones en el tablero. EBL puede tomar un único ejemplo de entrenamiento y determinar cuáles son las características relevantes para formar una generalización. ^[3]

Una teoría de dominio es perfecta o completa si contiene, en principio, toda la información necesaria para decidir cualquier cuestión sobre el dominio. Por ejemplo, la teoría del dominio del ajedrez son simplemente las reglas del ajedrez. Conociendo las reglas, en principio, es posible deducir la mejor jugada en cualquier situación. Sin embargo, en la práctica es imposible hacer tal deducción debido a la explosión combinatoria . EBL utiliza ejemplos de entrenamiento para hacer que la búsqueda de consecuencias deductivas de una teoría de dominio sea eficiente en la práctica.

En esencia, un sistema EBL funciona encontrando una manera de deducir cada ejemplo de entrenamiento de la base de datos de teoría de dominio existente en el sistema. Tener una prueba breve del ejemplo de entrenamiento amplía la base de datos de teoría de dominio, lo que permite que el sistema EBL encuentre y clasifique ejemplos futuros que sean similares al ejemplo de entrenamiento muy rápidamente. ^[4] Minton analizó el principal inconveniente del método: el costo de aplicar las macros de prueba aprendidas, ya que éstas se vuelven numerosas. ^[5]

Formulación básica

El software EBL requiere cuatro entradas:

un espacio de hipótesis (el conjunto de todas las conclusiones posibles)
una teoría de dominio (axiomas sobre un dominio de interés)
ejemplos de entrenamiento (hechos específicos que descartan alguna posible hipótesis)
Criterios de operatividad (criterios para determinar qué características del dominio son reconocibles de manera eficiente, por ejemplo, qué características son detectables directamente mediante sensores) ^[6]

Solicitud

Un dominio de aplicación especialmente bueno para una EBL es el procesamiento del lenguaje natural (NLP). Aquí una rica teoría de dominio, es decir, una gramática del lenguaje natural, aunque no es perfecta ni completa, se adapta a una aplicación o uso particular del lenguaje, utilizando un banco de árboles (ejemplos de entrenamiento). Rayner fue pionero en este trabajo. ^[7] La primera aplicación industrial exitosa fue una interfaz comercial de NL para bases de datos relacionales. ^[8] El método se ha aplicado con éxito a varios sistemas de análisis de lenguaje natural a gran escala, ^[9] donde el problema de utilidad se resolvió omitiendo la gramática original (teoría del dominio) y utilizando técnicas especializadas de análisis de LR, lo que resultó en una enorme velocidad. aumentos, con un costo en cobertura, pero con una ganancia en desambiguación. También se han aplicado técnicas similares a EBL a la generación de superficies, lo contrario del análisis. ^[10]

Al aplicar EBL a PNL, los criterios de operatividad pueden elaborarse manualmente ^[11] o pueden inferirse del banco de árboles utilizando la entropía de sus nodos or ^[12] o una compensación de cobertura objetivo/desambiguación (= recuperación/ compensación de precisión = puntuación f). ^[13] EBL también se puede utilizar para compilar modelos de lenguaje basados en gramáticas para el reconocimiento de voz , a partir de gramáticas de unificación generales. ^[14] Observe cómo el problema de utilidad, expuesto por primera vez por Minton, se resolvió descartando la teoría original de gramática/dominio, y que los artículos citados tienden a contener la frase especialización gramatical , todo lo contrario del término original generalización basada en explicaciones. Quizás el mejor nombre para esta técnica sería reducción del espacio de búsqueda basada en datos. Otras personas que trabajaron en EBL para PNL incluyen a Guenther Neumann, Aravind Joshi, Srinivas Bangalore y Khalil Sima'an.

Ver también

Referencias

^ "Número especial sobre explicación en el razonamiento basado en casos". Revisión de inteligencia artificial . 24 (2). Octubre de 2005.
^ Calin-Jageman, Robert J.; Cuerno Ratner, Hilary (1 de diciembre de 2005). "El papel de la codificación en el efecto de autoexplicación". Cognición e Instrucción . 23 (4): 523–543. doi :10.1207/s1532690xci2304_4. ISSN 0737-0008. S2CID 145410154.
^ Ejemplo de reina negra de Mitchell, Tom (1997). Aprendizaje automático . McGraw-Hill. págs. 308–309. ISBN 0-07-042807-7.
^ Mitchell, Tom (1997). Aprendizaje automático . McGraw-Hill. págs.320. ISBN 0-07-042807-7. En su forma pura, EBL implica reformular la teoría del dominio para producir reglas generales que clasifiquen ejemplos en un solo paso de inferencia.
^ Minton, Steven (1990). "Resultados cuantitativos sobre el problema de la utilidad en el aprendizaje basado en explicaciones". Inteligencia artificial . 42 (2–3): 363–392. doi :10.1016/0004-3702(90)90059-9.
^ Keller, Richard (1988). "Definición de operacionalidad para el aprendizaje basado en explicaciones" (PDF) . Inteligencia artificial . 35 (2): 227–241. doi :10.1016/0004-3702(88)90013-6 . Consultado el 22 de febrero de 2009 . Definición de operacionalidad actual: Una descripción de concepto es operativa si puede usarse eficientemente para reconocer instancias del concepto que denota.Después de exponer la definición común, el documento en realidad argumenta en contra de ella a favor de criterios más refinados.
^ Rayner, Manny (1988). "Aplicación de la generalización basada en explicaciones al procesamiento del lenguaje natural". Procesos. Conferencia internacional sobre informática de quinta generación, Kioto. págs. 1267-1274.
^ Samuelsson, Christer; Manny Rayner (1991). "Evaluación cuantitativa del aprendizaje basado en explicaciones como herramienta de optimización para un sistema de lenguaje natural a gran escala". Procesos. XII Conferencia Internacional Conjunta sobre Inteligencia Artificial, Sydney. págs. 609–615.{{cite news}}: Mantenimiento CS1: ubicación ( enlace )
^ Samuelsson, Christer (1994). Análisis rápido del lenguaje natural mediante el aprendizaje basado en explicaciones . Estocolmo: Tesis Doctoral, Real Instituto de Tecnología.
^ Samuelsson, Christer (1996). "Optimización basada en ejemplos de tablas de generación de superficies". en R. Mitkov y N. Nicolov (eds.) "Avances recientes en el procesamiento del lenguaje natural", vol. 136 de "Temas actuales de la teoría lingüística": John Benjamins, Ámsterdam.{{cite news}}: Mantenimiento CS1: ubicación ( enlace )
^ Rayner, Manny; David Carter (1996). "Análisis rápido mediante poda y especialización gramatical". Procesos. ACL, Santa Cruz.
^ Samuelsson, Christer (1994). "Especialización gramatical a través de umbrales de entropía". Procesos. ACL, Las Cruces. págs. 188-195.
^ Cancedda, Nicola; Christer Samuelsson (2000). "Especialización en gramática basada en corpus". Procs 4to Taller de Aprendizaje Computacional de Lenguajes Naturales.{{cite news}}: Mantenimiento CS1: ubicación ( enlace )
^ Rayner, Manny; Beth Ann Hockey; Pierrette Bouillon (sin fecha). Poner la lingüística en el reconocimiento de voz: el compilador de gramática de Regulus . Centro de Estudios del Lenguaje y la Información. ISBN 1-57586-526-2.