Una gramática estocástica ( gramática estadística ) es un marco gramatical con una noción probabilística de gramaticalidad :
La gramática se realiza como modelo de lenguaje . Las oraciones permitidas se almacenan en una base de datos junto con la frecuencia y la frecuencia de una oración. [1] El procesamiento estadístico del lenguaje natural utiliza métodos estocásticos , probabilísticos y estadísticos , especialmente para resolver las dificultades que surgen porque las oraciones más largas son muy ambiguas cuando se procesan con gramáticas realistas, lo que produce miles o millones de análisis posibles. Los métodos de desambiguación a menudo implican el uso de corpus y modelos de Markov . "Un modelo probabilístico consta de un modelo no probabilístico más algunas cantidades numéricas; no es cierto que los modelos probabilísticos sean inherentemente más simples o menos estructurales que los modelos no probabilísticos". [2]
Hirjee & Brown [3] implementaron un método probabilístico para la detección de rimas en su estudio de 2013 para encontrar pares de rimas internas e imperfectas en letras de rap. El concepto está adaptado de una técnica de alineación de secuencias que utiliza BLOSUM ( BLO cks SU bstitution M atrix). Pudieron detectar rimas indetectables mediante modelos no probabilísticos.