Método de estimación de parámetros para gramáticas probabilísticas independientes del contexto
En el caso de los algoritmos de análisis sintáctico en informática , el algoritmo de dentro a fuera es una forma de reestimar las probabilidades de producción en una gramática probabilística libre de contexto . Fue introducido por James K. Baker en 1979 como una generalización del algoritmo de adelante hacia atrás para la estimación de parámetros en modelos ocultos de Markov a gramáticas estocásticas libres de contexto . Se utiliza para calcular expectativas, por ejemplo, como parte del algoritmo de expectativa-maximización (un algoritmo de aprendizaje no supervisado).
Probabilidades internas y externas
La probabilidad interna es la probabilidad total de generar palabras , dada la raíz no terminal y una gramática : [1]
La probabilidad externa es la probabilidad total de comenzar con el símbolo de inicio y generar el no terminal y todas las palabras externas , dada una gramática : [1]
Calculando probabilidades internas
Caso base:
Caso general:
Supongamos que hay una regla en la gramática, entonces la probabilidad de generar comenzando con un subárbol con raíz en es:
La probabilidad interna es simplemente la suma de todas esas reglas posibles:
Calculando probabilidades externas
Caso base:
Aquí el símbolo de inicio es .
Caso general:
Supongamos que existe una regla en la gramática que genera . Entonces, la contribución izquierda de esa regla a la probabilidad externa es:
Ahora supongamos que existe una regla en la gramática. Entonces, la contribución correcta
de esa regla a la probabilidad externa es:
La probabilidad externa es la suma de las contribuciones izquierda y derecha sobre todas esas reglas:
Referencias
- ^ ab Manning, Christopher D.; Hinrich Schütze (1999). Fundamentos del procesamiento estadístico del lenguaje natural . Cambridge, MA, EE.UU.: MIT Press. págs. 388–402. ISBN 0-262-13360-1.
- J. Baker (1979): Gramáticas entrenables para el reconocimiento de voz. En JJ Wolf y DH Klatt, editores, Speech communication papers presented at the 97th meeting of the Acoustical Society of America , páginas 547–550, Cambridge, MA, junio de 1979. MIT.
- Karim Lari, Steve J. Young (1990): La estimación de gramáticas estocásticas independientes del contexto utilizando el algoritmo interior-exterior. Computer Speech and Language , 4:35–56.
- Karim Lari, Steve J. Young (1991): Aplicaciones de gramáticas estocásticas independientes del contexto utilizando el algoritmo Inside–Outside. Computer Speech and Language , 5:237–257.
- Fernando Pereira, Yves Schabes (1992): Reestimación interna-externa a partir de corpus parcialmente entre corchetes. Actas de la 30.ª reunión anual de la Asociación de Lingüística Computacional, Association for Computational Linguistics , 128–135.
Enlaces externos
- Algoritmo de dentro a fuera - Fei Xia
- El algoritmo de dentro a fuera - Michael Collins