El aprendizaje artificial de gramática ( AGL ) es un paradigma de estudio dentro de la psicología cognitiva y la lingüística . Su objetivo es investigar los procesos que subyacen al aprendizaje del lenguaje humano mediante la prueba de la capacidad de los sujetos para aprender una gramática inventada en un entorno de laboratorio. Fue desarrollado para evaluar los procesos de aprendizaje del lenguaje humano, pero también se ha utilizado para estudiar el aprendizaje implícito en un sentido más general. El área de interés es típicamente la capacidad de los sujetos para detectar patrones y regularidades estadísticas durante una fase de entrenamiento y luego usar su nuevo conocimiento de esos patrones en una fase de prueba. La fase de prueba puede utilizar los símbolos o sonidos utilizados en la fase de entrenamiento o transferir los patrones a otro conjunto de símbolos o sonidos como estructura de superficie.
Muchos investigadores proponen que las reglas de la gramática artificial se aprenden en un nivel implícito, ya que nunca se presentan explícitamente a los participantes. El paradigma también se ha utilizado recientemente en otras áreas de investigación, como la aptitud para el aprendizaje de idiomas , la preparación estructural [1] y para investigar qué estructuras cerebrales están involucradas en la adquisición de la sintaxis y el aprendizaje implícito.
Además de en los humanos, el paradigma también se ha utilizado para investigar el aprendizaje de patrones en otras especies, por ejemplo, los tamarinos de cabeza de algodón y los estorninos .
Hace más de medio siglo, George A. Miller [2] estableció el paradigma del aprendizaje artificial de la gramática para investigar la influencia de las estructuras gramaticales explícitas en el aprendizaje humano. Diseñó un modelo gramatical de letras con diferentes secuencias. Su investigación demostró que era más fácil recordar una secuencia gramatical estructurada que una secuencia aleatoria de letras. Su explicación fue que los estudiantes podían identificar las características comunes entre las secuencias aprendidas y, en consecuencia, codificarlas en un conjunto de memoria. Predijo que los sujetos podrían identificar qué letras probablemente aparecerían juntas como una secuencia repetidamente y cuáles no, y que los sujetos usarían esta información para formar conjuntos de memoria. Esos conjuntos de memoria sirvieron a los participantes como estrategia más adelante durante sus pruebas de memoria.
Reber [3] dudaba de la explicación de Miller. Afirmaba que si los participantes podían codificar las reglas gramaticales como conjuntos de memoria productiva, entonces deberían ser capaces de verbalizar su estrategia en detalle. Realizó una investigación que condujo al desarrollo del paradigma AGL moderno. Esta investigación utilizó un modelo de aprendizaje gramatical sintético para probar el aprendizaje implícito. AGL se convirtió en el modelo más utilizado y probado en el campo. Al igual que en el paradigma original desarrollado por Miller, se pidió a los participantes que memorizaran una lista de cadenas de letras que se crearon a partir de un modelo de regla gramatical artificial. Fue solo durante la fase de prueba que se les dijo a los participantes que había un conjunto de reglas detrás de las secuencias de letras que memorizaban. Luego se les indicó que categorizaran nuevas cadenas de letras basándose en el mismo conjunto de reglas al que no habían estado expuestos previamente. Clasificaron las nuevas cadenas de letras como "gramaticales" (construidas a partir de la regla gramatical), frente a secuencias "construidas aleatoriamente". Si los sujetos ordenaban correctamente las nuevas cadenas por encima del nivel de azar, se podía inferir que los sujetos habían adquirido la estructura de la regla gramatical sin ninguna instrucción explícita de las reglas. Reber [3] descubrió que los participantes ordenaban las nuevas cadenas por encima del nivel de azar. Si bien informaron haber utilizado estrategias durante la tarea de ordenación, en realidad no podían verbalizar esas estrategias. Los sujetos podían identificar qué cadenas eran gramaticalmente correctas, pero no podían identificar las reglas que componían las cadenas gramaticales.
Esta investigación fue replicada y ampliada por muchos otros. [4] [5] [6] [7] Las conclusiones de la mayoría de estos estudios fueron congruentes con la hipótesis de Reber: el proceso de aprendizaje implícito se realizó sin estrategias de aprendizaje intencionales. Estos estudios también identificaron características comunes para el conocimiento adquirido implícitamente:
El paradigma AGL moderno se puede utilizar para investigar el aprendizaje explícito e implícito, aunque se utiliza con más frecuencia para probar el aprendizaje implícito. En un experimento AGL típico, se pide a los participantes que memoricen cadenas de letras generadas previamente por una gramática específica . La longitud de las cadenas suele oscilar entre 2 y 9 letras por cadena. En la figura 1 se muestra un ejemplo de una gramática de este tipo.
Figura 1: Ejemplo de una regla gramatical artificial
Para componer una cadena de letras que cumpla con las reglas gramaticales establecidas, el sujeto debe respetar las reglas de emparejamiento de letras que se muestran en el modelo (figura 1). Si se observa una violación del sistema de reglas gramaticales que compone la cadena, se considera que se trata de una cadena que no cumple con las reglas o que está construida de manera aleatoria.
En el caso de una tarea estándar de aprendizaje implícito de AGL, [3] a los sujetos no se les dice que las cadenas se basan en una gramática específica. En cambio, simplemente se les da la tarea de memorizar las cadenas de letras para un recuerdo. Después de la fase de aprendizaje, se les dice a los sujetos que las cadenas de letras presentadas durante la fase de aprendizaje se basaron en reglas específicas, pero no se les dice explícitamente cuáles son las reglas. Durante una fase de prueba, se les indica a los sujetos que clasifiquen las nuevas cadenas de letras como "con reglas" o "sin reglas". La variable dependiente que se mide generalmente es el porcentaje de cadenas correctamente categorizadas. Se considera que el aprendizaje implícito es exitoso cuando el porcentaje de cadenas correctamente ordenadas es significativamente mayor que el nivel de azar. Si se encuentra esta diferencia significativa, indica la existencia de un proceso de aprendizaje que es más complejo que memorizar las cadenas de letras presentadas. [8]
El mecanismo detrás del aprendizaje implícito que se supone que ocurre mientras las personas participan en el aprendizaje artificial de la gramática es el aprendizaje estadístico o, más específicamente, el aprendizaje bayesiano . El aprendizaje bayesiano tiene en cuenta los tipos de sesgos o "distribuciones de probabilidad previas" que tienen los individuos y que contribuyen al resultado de las tareas de aprendizaje implícito. Estos sesgos pueden considerarse como una distribución de probabilidad que contiene la probabilidad de que cada hipótesis posible sea correcta. Debido a la estructura del modelo bayesiano , las inferencias de salida del modelo tienen la forma de una distribución de probabilidad en lugar de un único evento más probable. Esta distribución de salida es una "distribución de probabilidad posterior". La probabilidad posterior de cada hipótesis en la distribución original es la probabilidad de que la hipótesis sea verdadera dados los datos y la probabilidad de que los datos dados la hipótesis sean verdaderos. [9] Este modelo bayesiano para el aprendizaje es fundamental para comprender el proceso de detección de patrones involucrado en el aprendizaje implícito y, por lo tanto, los mecanismos que subyacen a la adquisición de reglas de aprendizaje artificial de la gramática. Se plantea la hipótesis de que el aprendizaje implícito de la gramática implica predecir la coocurrencia de ciertas palabras en un orden determinado. Por ejemplo, "el perro persiguió la pelota" es una oración que se puede aprender como gramaticalmente correcta en un nivel implícito debido a la alta coocurrencia de "perseguir" siendo una de las palabras que siguen a "perro". Una oración como "el perro, el gato, la pelota" se reconoce implícitamente como gramaticalmente incorrecta debido a la falta de enunciados que contengan esas palabras emparejadas en ese orden específico. Este proceso es importante para distinguir los roles temáticos y las partes del discurso en el procesamiento gramatical (ver gramática ). Si bien el etiquetado de los roles temáticos y las partes del discurso es explícito, la identificación de palabras y partes del discurso es implícita.
Los enfoques tradicionales de AGL sostienen que el conocimiento almacenado obtenido durante la fase de aprendizaje es abstracto. [3] Otros enfoques [5] [10] sostienen que este conocimiento almacenado es concreto y consiste en ejemplos de cadenas encontradas durante la fase de aprendizaje o "fragmentos" de estos ejemplos. [6] [11] En cualquier caso, se supone que la información almacenada en la memoria se recupera en la fase de prueba y se utiliza para ayudar a tomar decisiones sobre cadenas de letras. [12] [13] Tres enfoques principales intentan explicar el fenómeno de AGL:
Las investigaciones con pacientes con amnesia sugieren que el "enfoque de factor dual" puede ser el modelo más preciso. [18] Una serie de experimentos con pacientes amnésicos respaldan la idea de que el AGL involucra tanto conceptos abstractos como ejemplos concretos. Los amnésicos pudieron clasificar los estímulos como "gramaticales" frente a "construidos aleatoriamente" tan bien como los participantes del grupo de control. Si bien pudieron completar la tarea con éxito, los amnésicos no pudieron recordar explícitamente "fragmentos" gramaticales de la secuencia de letras, mientras que el grupo de control pudo recordarlos explícitamente. Al realizar la tarea con las mismas reglas gramaticales pero una secuencia de letras diferente a las que se les había evaluado previamente, tanto los amnésicos como el grupo de control pudieron completar la tarea (aunque el desempeño fue mejor cuando la tarea se completó utilizando el mismo conjunto de letras utilizado para el entrenamiento). Los resultados del experimento respaldan el enfoque de factor dual para el aprendizaje gramatical artificial en el sentido de que las personas utilizan información abstracta para aprender reglas gramaticales y utilizan la memoria concreta y específica de los ejemplos para los fragmentos. Como los amnésicos no podían almacenar "fragmentos" específicos en la memoria, completaron la tarea utilizando un conjunto abstracto de reglas. El grupo de control pudo almacenar estos fragmentos específicos en la memoria y (como se demostró por el recuerdo) almacenó estos ejemplos en la memoria para referencia posterior.
La investigación sobre AGL ha sido criticada debido a la "pregunta automática": ¿se considera que AGL es un proceso automático? Durante la codificación (ver codificación (memoria) ), la ejecución puede ser automática en el sentido de que ocurre sin supervisión consciente (sin guía consciente por las intenciones del ejecutante). En el caso de AGL, se afirmó que el aprendizaje implícito es un proceso automático debido al hecho de que se realiza sin intención de aprender una regla gramatical específica. [3] Esto cumple con la definición clásica de un "proceso automático" como un proceso rápido, inconsciente y sin esfuerzo que puede comenzar de manera involuntaria. Cuando se activa, continúa hasta que termina sin la capacidad de detenerse o ignorar sus consecuencias. [19] [20] [21] Esta definición ha sido cuestionada muchas veces. Se han dado definiciones alternativas para el proceso automático. [22] [23] [24] La presunción de Reber de que AGL es automático podría ser problemática al implicar que un proceso involuntario es un proceso automático en su esencia. Al centrarse en las pruebas AGL, es necesario abordar algunas cuestiones. El proceso es complejo y contiene codificación y recuperación o recuerdo. Tanto la codificación como la recuperación podrían interpretarse como procesos automáticos, ya que lo que se codificó durante la etapa de aprendizaje no es necesario para la tarea realizada intencionalmente durante la etapa de prueba. [25] Los investigadores deben diferenciar entre la implícita en lo que se refiere al proceso de aprendizaje o codificación de conocimientos y también en lo que se refiere al desempeño durante la fase de prueba o recuperación de conocimientos. El conocimiento codificado durante el entrenamiento puede incluir muchos aspectos de los estímulos presentados (cadenas completas, relaciones entre elementos, etc.). La contribución de los diversos componentes al desempeño depende tanto de la instrucción específica en la fase de adquisición como de los requisitos de la tarea de recuperación. [13] Por lo tanto, las instrucciones en cada fase son importantes para determinar si cada etapa requerirá o no procesamiento automático. Cada fase debe evaluarse por separado para determinar su automaticidad.
Una hipótesis que contradice la automaticidad de la AGL es el "efecto de mera exposición". El efecto de mera exposición es un aumento del afecto hacia un estímulo que es el resultado de la exposición repetida y no reforzada al estímulo. [26] Los resultados de más de 200 experimentos sobre este efecto indican que existe una relación positiva entre la calificación media de "bondad" y la frecuencia de exposición al estímulo. Los estímulos para estos experimentos incluyeron dibujos de líneas, polígonos y palabras sin sentido (que son tipos de estímulos utilizados en la investigación de AGL). Estos experimentos expusieron a los participantes a cada estímulo hasta 25 veces. Después de cada exposición, se pidió a los participantes que calificaran el grado en que cada estímulo sugería un efecto "bueno" frente a un efecto "malo" en una escala de 7 puntos. Además del patrón principal de resultados, también se encontró en varios experimentos que los participantes calificaron un afecto positivo más alto para los elementos expuestos previamente que para los elementos nuevos. Dado que la cognición implícita no debería hacer referencia a episodios de estudios anteriores, los efectos sobre las calificaciones de afecto no deberían haberse observado si el procesamiento de este estímulo es verdaderamente implícito. Los resultados de estos experimentos sugieren que puede producirse una categorización diferente de las cadenas debido a diferencias en el afecto asociado con las cadenas y no debido a reglas gramaticales aprendidas implícitamente.
Desde la llegada de las computadoras y la inteligencia artificial , se han adaptado programas informáticos que intentan simular el proceso de aprendizaje implícito observado en el paradigma AGL. Los primeros programas de IA adaptados para simular el aprendizaje gramatical tanto natural como artificial utilizaron la siguiente estructura básica:
Un modelo temprano para el aprendizaje de gramática de IA es el Sistema SNPR de Wolff. [27] [28] El programa adquiere una serie de letras sin pausas ni puntuación entre palabras y oraciones. Luego, el programa examina la cadena en subconjuntos y busca secuencias comunes de símbolos y define "fragmentos" en términos de estas secuencias (estos fragmentos son similares a los fragmentos específicos del ejemplo descritos para AGL). A medida que el modelo adquiere estos fragmentos a través de la exposición, los fragmentos comienzan a reemplazar las secuencias de letras continuas. Cuando un fragmento precede o sigue a un fragmento común, entonces el modelo determina clases disyuntivas en términos del primer conjunto. [28] Por ejemplo, cuando el modelo encuentra "el-perro-persiguió" y "el-gato-persiguió", clasifica "perro" y "gato" como miembros de la misma clase, ya que ambos preceden a "perseguir". Si bien el modelo clasifica los fragmentos en clases, define explícitamente estos grupos (por ejemplo, sustantivo, verbo). Los primeros modelos de IA de aprendizaje de gramática como estos ignoraban la importancia de las instancias negativas del efecto de la gramática en la adquisición de la misma y también carecían de la capacidad de conectar las reglas gramaticales con la pragmática y la semántica . Los modelos más nuevos han intentado tener en cuenta estos detalles. El modelo unificado [29] intenta tener en cuenta ambos factores. El modelo desglosa la gramática según "señales". Los idiomas marcan los roles de los casos utilizando cinco tipos de señales posibles: orden de las palabras, marcado de los casos, concordancia, entonación y expectativa basada en verbos (véase gramática ). La influencia que cada señal tiene sobre la gramática de un idioma está determinada por su "fuerza de señal" y su "validez de señal". Ambos valores se determinan utilizando la misma fórmula, excepto que la fuerza de la señal se define a través de resultados experimentales y la validez de la señal se define a través de recuentos de corpus de bases de datos de idiomas. La fórmula para la fuerza/validez de la señal es la siguiente:
La disponibilidad de la señal es la proporción de veces que la señal está disponible en relación con las veces que se necesita. La fiabilidad de la señal es la proporción de veces que la señal es correcta en relación con el total de apariciones de la señal. Al incorporar la fiabilidad de la señal junto con la disponibilidad de la señal, el modelo unificado puede tener en cuenta los efectos de las instancias negativas de la gramática, ya que tiene en cuenta la precisión y no solo la frecuencia. Como resultado, esto también tiene en cuenta la información semántica y pragmática, ya que las señales que no producen gramática en el contexto apropiado tendrán una fuerza de señal y una validez de señal bajas. Si bien el modelo de MacWhinney [29] también simula el aprendizaje natural de la gramática, intenta modelar los procesos de aprendizaje implícito observados en el paradigma AGL.
Estudios contemporáneos con AGL han intentado identificar qué estructuras están involucradas en la adquisición de la gramática y el aprendizaje implícito. Pacientes afásicos agramaticales (ver Agramatismo ) fueron evaluados con el paradigma AGL. Los resultados muestran que el deterioro del lenguaje en la afasia agramatical está asociado con un deterioro en el aprendizaje de la gramática artificial, lo que indica un daño a los mecanismos neuronales generales del dominio que sirven tanto al lenguaje como al aprendizaje secuencial. [30] De Vries, Barth, Maiworm, Knecht, Zwitserlood y Flöel [31] encontraron que la estimulación eléctrica del área de Broca mejora el aprendizaje implícito de una gramática artificial. La estimulación de corriente directa puede facilitar la adquisición de conocimiento gramatical, un hallazgo de interés potencial para la rehabilitación de la afasia. Petersson, Vasiliki y Hagoort [32] examinan los correlatos neurobiológicos de la sintaxis , el procesamiento de secuencias estructuradas, comparando los resultados de fMRI en la sintaxis del lenguaje artificial y natural. Argumentan que la " jerarquía de Chomsky " no es directamente relevante para los sistemas neurobiológicos a través de las pruebas AGL.