Los trigramas son un caso especial de n -gramas , donde n es 3. Se utilizan a menudo en el procesamiento del lenguaje natural para realizar análisis estadísticos de textos y en criptografía para el control y uso de cifras y códigos . Ver resultados del análisis de "Frecuencias de letras en el idioma inglés".
El contexto es muy importante; es fácil obtener diferentes clasificaciones y porcentajes de análisis basándose en diferentes tamaños de muestra, diferentes autores o diferentes tipos de documentos: poesía, ciencia ficción, documentación tecnológica; y niveles de escritura: historias para niños versus adultos, órdenes militares y recetas.
Un análisis de frecuencia criptoanalítico típico descubre que los 16 trigramas a nivel de carácter más comunes en inglés son: [1] [2]
Debido a que los mensajes cifrados enviados por telégrafo a menudo omiten la puntuación y los espacios, el análisis de frecuencia criptográfica de dichos mensajes incluye trigramas que trascienden los límites de las palabras. Esto hace que trigramas como "edt" aparezcan con frecuencia, aunque tal vez nunca aparezcan en ninguna palabra de esos mensajes. [4]
La oración "el rápido zorro rojo salta sobre el perezoso perro marrón" tiene los siguientes trigramas a nivel de palabra:
El rojo rápidoZorro rojo rápidoEl zorro rojo saltaEl zorro salta por encimasalta sobre elSobre los perezososEl marrón perezosoperro marrón perezoso
Y el trigrama a nivel de palabra "el rojo vivo" tiene los siguientes trigramas a nivel de carácter (donde un guión bajo "_" marca un espacio):
elél_e_q_quAquíUICQué ascoCk_k_r_rerojo