stringtranslate.com

Gramática estocástica

Una gramática estocástica ( gramática estadística ) es un marco gramatical con una noción probabilística de gramaticalidad :

La gramática se realiza como modelo de lenguaje . Las oraciones permitidas se almacenan en una base de datos junto con la frecuencia y la frecuencia de una oración. [1] El procesamiento estadístico del lenguaje natural utiliza métodos estocásticos , probabilísticos y estadísticos , especialmente para resolver las dificultades que surgen porque las oraciones más largas son muy ambiguas cuando se procesan con gramáticas realistas, lo que produce miles o millones de análisis posibles. Los métodos de desambiguación a menudo implican el uso de corpus y modelos de Markov . "Un modelo probabilístico consta de un modelo no probabilístico más algunas cantidades numéricas; no es cierto que los modelos probabilísticos sean inherentemente más simples o menos estructurales que los modelos no probabilísticos". [2]

Ejemplos

Hirjee & Brown [3] implementaron un método probabilístico para la detección de rimas en su estudio de 2013 para encontrar pares de rimas internas e imperfectas en letras de rap. El concepto está adaptado de una técnica de alineación de secuencias que utiliza BLOSUM ( BLO cks SU bstitution M atrix). Pudieron detectar rimas indetectables mediante modelos no probabilísticos.

Ver también

Referencias

  1. ^ Steve joven; Gerrit Bloothooft (14 de marzo de 2013). Métodos basados ​​en corpus en el procesamiento del lenguaje y el habla. Medios de ciencia y negocios de Springer. págs.140–. ISBN 978-94-017-1183-8.
  2. ^ Juan orfebre. 2002. "Modelos probabilísticos de gramática: fonología como minimización de información". Estudios fonológicos n.° 5: 21–46.
  3. ^ Hirjee, Hussein; Marrón, Daniel (2013). "Uso de la detección automatizada de rimas para caracterizar el estilo de rima en la música rap" (PDF) . Revisión de musicología empírica .

Otras lecturas