Una gramática estocástica ( gramática estadística ) es un marco gramatical con una noción probabilística de gramaticalidad :
La gramática se realiza como un modelo de lenguaje . Las oraciones permitidas se almacenan en una base de datos junto con la frecuencia con la que una oración es común. [2] El procesamiento estadístico del lenguaje natural utiliza métodos estocásticos , probabilísticos y estadísticos , especialmente para resolver dificultades que surgen porque las oraciones más largas son altamente ambiguas cuando se procesan con gramáticas realistas, lo que produce miles o millones de análisis posibles. Los métodos para la desambiguación a menudo implican el uso de corpus y modelos de Markov . "Un modelo probabilístico consiste en un modelo no probabilístico más algunas cantidades numéricas; no es cierto que los modelos probabilísticos sean inherentemente más simples o menos estructurales que los modelos no probabilísticos". [3]
Ejemplos
Hirjee y Brown [4] implementaron un método probabilístico para la detección de rimas en su estudio de 2013 para encontrar pares de rimas internas e imperfectas en letras de rap. El concepto es una adaptación de una técnica de alineamiento de secuencias que utiliza BLOSUM ( BLO cks SU bstitution Matrix ). Pudieron detectar rimas indetectables mediante modelos no probabilísticos.
Véase también
Referencias
- ^ Carrasco, Rafael C.; Oncina, Jose (1994). Carrasco, Rafael C.; Oncina, Jose (eds.). "Aprendizaje de gramáticas regulares estocásticas mediante un método de fusión de estados". Inferencia gramatical y aplicaciones . Berlín, Heidelberg: Springer: 139–152. doi :10.1007/3-540-58473-0_144. ISBN 978-3-540-48985-6.
- ^ Steve Young; Gerrit Bloothooft (14 de marzo de 2013). Métodos basados en corpus en el procesamiento del lenguaje y del habla. Springer Science & Business Media. pp. 140–. ISBN 978-94-017-1183-8.
- ^ John Goldsmith. 2002. "Modelos probabilísticos de gramática: la fonología como minimización de la información". Phonological Studies #5: 21–46.
- ^ Hirjee, Hussein; Brown, Daniel (2013). "Uso de la detección automática de rimas para caracterizar el estilo de rima en la música rap" (PDF) . Empirical Musicology Review .
Lectura adicional
- Christopher D. Manning, Hinrich Schütze: Fundamentos del procesamiento estadístico del lenguaje natural , MIT Press (1999), ISBN 978-0-262-13360-9 .
- Stefan Wermter, Ellen Riloff, Gabriele Scheler (eds.): Enfoques conexionistas, estadísticos y simbólicos para el aprendizaje del procesamiento del lenguaje natural , Springer (1996), ISBN 978-3-540-60925-4 .
- Pirani, Giancarlo, ed. Algoritmos y arquitecturas avanzadas para la comprensión del habla. Vol. 1. Springer Science & Business Media, 2013.