En filología , el desciframiento es el descubrimiento del significado de los símbolos que se encuentran en lenguas y/o alfabetos extintos . [1]
El desciframiento se superpone con otro campo técnico conocido como criptoanálisis , un campo que tiene como objetivo descifrar escritos utilizados en la comunicación secreta, conocidos como texto cifrado . Un caso famoso de esto fue el criptoanálisis de Enigma durante la Segunda Guerra Mundial . Muchos otros cifrados de guerras pasadas solo han sido descifrados recientemente. [2] Sin embargo, a diferencia del desciframiento del lenguaje, los actores que usan texto cifrado colocan obstáculos intencionalmente para evitar que terceros descubran el significado del sistema de comunicación. [3]
En la actualidad, al menos una docena de idiomas permanecen sin descifrar. [4] Un desciframiento reciente notable fue el de la escritura elamita lineal . [5]
Según Gelb y Whiting, el enfoque del desciframiento depende de cuatro categorías de situaciones en una lengua no descifrada: [3] [6]
Existen varios métodos para descifrar un sistema de escritura o una lengua extintos. Estos pueden dividirse en enfoques que utilizan información externa o interna. [3]
Muchos cifrados exitosos se han realizado a partir del descubrimiento de información externa, siendo un ejemplo común el uso de inscripciones multilingües , como la Piedra de Rosetta (con el mismo texto en tres escrituras: demótica , jeroglífica y griega ), que permitió descifrar los jeroglíficos egipcios. En principio, un texto multilingüe puede ser insuficiente para un desciframiento, ya que la traducción no es un proceso lineal y reversible, sino que representa una codificación del mensaje en un sistema simbólico diferente. Traducir un texto de un idioma a un segundo, y luego del segundo idioma al primero, rara vez reproduce exactamente la escritura original. Del mismo modo, a menos que un número significativo de palabras estén contenidas en el texto multilingüe, se puede extraer información limitada de él. [3]
Los enfoques internos son de varios pasos: primero hay que asegurarse de que la escritura que se está viendo representa escritura real, en lugar de una agrupación de representaciones pictóricas o una falsificación moderna sin más significado. Esto se aborda comúnmente con métodos del campo de la gramatología . Antes de descifrar el significado, se puede determinar el número de grafemas distintos (lo que, a su vez, permite saber si el sistema de escritura es alfabético, silábico o logosilábico; esto se debe a que dichos sistemas de escritura normalmente no se superponen en el número de grafemas que utilizan [6] ), la secuencia de escritura (ya sea de izquierda a derecha, de derecha a izquierda, de arriba a abajo, etc.) y la determinación de si las palabras individuales están segmentadas correctamente cuando se escribe el alfabeto (como con el uso de un espacio o una marca especial diferente) o no. Si se puede identificar una disposición esquemática repetitiva, esto puede ayudar en el desciframiento. Por ejemplo, si la última línea de un texto tiene un número pequeño, se puede suponer razonablemente que se refiere a la fecha, donde una de las palabras significa "año" y, a veces, también aparece un nombre real. Otro caso es cuando el texto contiene muchos números pequeños, seguidos de una palabra, seguida de un número mayor; en este caso, la palabra probablemente significa "total" o "suma". Una vez que se ha agotado la información que se puede derivar inferencialmente del contenido probable, se debe pasar a la aplicación sistemática de herramientas estadísticas. Estas incluyen métodos relativos a la frecuencia de aparición de cada símbolo, el orden en que estos símbolos aparecen típicamente, si algunos símbolos aparecen al principio o al final de las palabras, etc. Hay situaciones en las que las características ortográficas de un idioma hacen que sea difícil, si no imposible, descifrar características específicas (especialmente sin cierta información externa), como cuando un alfabeto no expresa consonantes dobles. También existen métodos adicionales y más complejos. Con el tiempo, la aplicación de tales métodos estadísticos se vuelve extremadamente laboriosa, en la que se podrían utilizar computadoras para aplicarlos automáticamente. [3]
Los métodos computacionales para descifrar idiomas desconocidos comenzaron a aparecer a fines de la década de 1990. [7] Por lo general, se utilizan dos tipos de métodos computacionales para descifrar idiomas: los que se utilizan para producir traducciones en idiomas conocidos y los que se utilizan para detectar nueva información que pueda permitir futuros esfuerzos de traducción. El segundo método es más común e incluye cosas como la detección de cognados o palabras relacionadas, el descubrimiento del idioma conocido más cercano, alineaciones de palabras y más. [6]
En los últimos años, se ha puesto cada vez más énfasis en los métodos que utilizan inteligencia artificial para descifrar lenguas perdidas, especialmente a través de métodos de procesamiento del lenguaje natural (PLN). Los métodos de prueba de concepto han vuelto a descifrar de forma independiente el ugarítico y el lineal B utilizando datos de lenguas similares, en este caso el hebreo y el griego antiguo . [8]
En relación con los intentos de descifrar el significado de los idiomas y alfabetos, se incluyen los intentos de descifrar cómo se pronunciaban los sistemas de escritura extintos o las versiones más antiguas de los sistemas de escritura contemporáneos (como el inglés en el siglo XVII). Se han desarrollado varios métodos y criterios a este respecto. Los criterios importantes incluyen (1) las rimas y el testimonio de la poesía (2) la evidencia de ortografías y errores ortográficos ocasionales (3) las interpretaciones de material en un idioma de autores en lenguas extranjeras (4) la información obtenida de idiomas relacionados (5) los cambios gramaticales en la ortografía a lo largo del tiempo. [9]
Por ejemplo, el análisis de la poesía se centra en el uso de juegos de palabras o técnicas literarias entre palabras que tienen un sonido similar. La obra de Shakespeare Romeo y Julieta contiene juegos de palabras que se basan en un sonido similar entre las palabras "soul" y "soles", lo que permite confiar en que la pronunciación similar entre los términos hoy también existía en la época de Shakespeare. Otra fuente común de información sobre la pronunciación es cuando los textos anteriores usan rimas , como cuando las líneas consecutivas en la poesía terminan en el mismo sonido o en el mismo sonido. Sin embargo, este método tiene algunas limitaciones, ya que los textos pueden usar rimas que se basan en similitudes visuales entre palabras (como 'love' y 'remove') en lugar de similitudes auditivas, y las rimas pueden ser imperfectas . Otra fuente de información sobre la pronunciación proviene de descripciones explícitas de pronunciaciones de textos anteriores, como en el caso de la Grammatica Anglicana , como en el siguiente comentario sobre la letra <o>: "En el tiempo largo suena naturalmente agudo y alto; como en chósen, hósen, hóly, fólly [. . .] En el tiempo corto más plano, y un pariente de u; como còsen, dòsen, mòther, bròther, lòve, pròve". [10] Otro ejemplo proviene de comentarios detallados sobre pronunciaciones del sánscrito de las obras sobrevivientes de gramáticos sánscritos. [9]
Existen muchos desafíos en el desciframiento de idiomas, incluidos cuando: [4] [6]