Descifre

En filología , el desciframiento es el descubrimiento del significado de los símbolos que se encuentran en lenguas y/o alfabetos extintos . ^[1]

El desciframiento se superpone con otro campo técnico conocido como criptoanálisis , un campo que tiene como objetivo descifrar escritos utilizados en la comunicación secreta, conocidos como texto cifrado . Un caso famoso de esto fue el criptoanálisis de Enigma durante la Segunda Guerra Mundial . Muchos otros cifrados de guerras pasadas solo han sido descifrados recientemente. ^[2] Sin embargo, a diferencia del desciframiento del lenguaje, los actores que usan texto cifrado colocan obstáculos intencionalmente para evitar que terceros descubran el significado del sistema de comunicación. ^[3]

En la actualidad, al menos una docena de idiomas permanecen sin descifrar. ^[4] Un desciframiento reciente notable fue el de la escritura elamita lineal . ^[5]

Categorías

Según Gelb y Whiting, el enfoque del desciframiento depende de cuatro categorías de situaciones en una lengua no descifrada: ^[3]^[6]

Tipo O: escritura conocida y lengua conocida. Aunque el desciframiento en este caso es trivial, se puede obtener información útil cuando una lengua conocida se escribe en un alfabeto distinto del que se usa comúnmente. El estudio de la escritura de las lenguas fenicias o sumerias en el alfabeto griego permite obtener información sobre la pronunciación y la vocalización que no se puede obtener al estudiar la expresión de estas lenguas en su sistema de escritura normal.
Tipo I: escritura desconocida y lengua conocida. Las lenguas descifradas en esta categoría incluyen el fenicio , el ugarítico , el chipriota y el lineal B. En esta situación, los sistemas alfabéticos son los más fáciles de descifrar, seguidos de las lenguas silábicas y, por último, las más difíciles son las logosilábicas .
Tipo II: escritura conocida y lengua desconocida. Un ejemplo es el Lineal A. En sentido estricto, esta situación no es de desciframiento sino de análisis lingüístico. El desciframiento en esta categoría se considera extremadamente difícil de lograr basándose únicamente en información interna.
Tipo III: escritura desconocida y lengua desconocida. Entre los ejemplos se incluyen la escritura de Archanes y la fórmula de Archanes, el disco de Festos , los jeroglíficos cretenses y el silabario chipriota-minoico . Cuando esta situación se da en una cultura aislada y sin la disponibilidad de información externa, el desciframiento suele considerarse imposible.

Métodos

Existen varios métodos para descifrar un sistema de escritura o una lengua extintos. Estos pueden dividirse en enfoques que utilizan información externa o interna. ^[3]

Información externa

Muchos cifrados exitosos se han realizado a partir del descubrimiento de información externa, siendo un ejemplo común el uso de inscripciones multilingües , como la Piedra de Rosetta (con el mismo texto en tres escrituras: demótica , jeroglífica y griega ), que permitió descifrar los jeroglíficos egipcios. En principio, un texto multilingüe puede ser insuficiente para un desciframiento, ya que la traducción no es un proceso lineal y reversible, sino que representa una codificación del mensaje en un sistema simbólico diferente. Traducir un texto de un idioma a un segundo, y luego del segundo idioma al primero, rara vez reproduce exactamente la escritura original. Del mismo modo, a menos que un número significativo de palabras estén contenidas en el texto multilingüe, se puede extraer información limitada de él. ^[3]

Información interna

Los enfoques internos son de varios pasos: primero hay que asegurarse de que la escritura que se está viendo representa escritura real, en lugar de una agrupación de representaciones pictóricas o una falsificación moderna sin más significado. Esto se aborda comúnmente con métodos del campo de la gramatología . Antes de descifrar el significado, se puede determinar el número de grafemas distintos (lo que, a su vez, permite saber si el sistema de escritura es alfabético, silábico o logosilábico; esto se debe a que dichos sistemas de escritura normalmente no se superponen en el número de grafemas que utilizan ^[6] ), la secuencia de escritura (ya sea de izquierda a derecha, de derecha a izquierda, de arriba a abajo, etc.) y la determinación de si las palabras individuales están segmentadas correctamente cuando se escribe el alfabeto (como con el uso de un espacio o una marca especial diferente) o no. Si se puede identificar una disposición esquemática repetitiva, esto puede ayudar en el desciframiento. Por ejemplo, si la última línea de un texto tiene un número pequeño, se puede suponer razonablemente que se refiere a la fecha, donde una de las palabras significa "año" y, a veces, también aparece un nombre real. Otro caso es cuando el texto contiene muchos números pequeños, seguidos de una palabra, seguida de un número mayor; en este caso, la palabra probablemente significa "total" o "suma". Una vez que se ha agotado la información que se puede derivar inferencialmente del contenido probable, se debe pasar a la aplicación sistemática de herramientas estadísticas. Estas incluyen métodos relativos a la frecuencia de aparición de cada símbolo, el orden en que estos símbolos aparecen típicamente, si algunos símbolos aparecen al principio o al final de las palabras, etc. Hay situaciones en las que las características ortográficas de un idioma hacen que sea difícil, si no imposible, descifrar características específicas (especialmente sin cierta información externa), como cuando un alfabeto no expresa consonantes dobles. También existen métodos adicionales y más complejos. Con el tiempo, la aplicación de tales métodos estadísticos se vuelve extremadamente laboriosa, en la que se podrían utilizar computadoras para aplicarlos automáticamente. ^[3]

Enfoques computacionales

Los métodos computacionales para descifrar idiomas desconocidos comenzaron a aparecer a fines de la década de 1990. ^[7] Por lo general, se utilizan dos tipos de métodos computacionales para descifrar idiomas: los que se utilizan para producir traducciones en idiomas conocidos y los que se utilizan para detectar nueva información que pueda permitir futuros esfuerzos de traducción. El segundo método es más común e incluye cosas como la detección de cognados o palabras relacionadas, el descubrimiento del idioma conocido más cercano, alineaciones de palabras y más. ^[6]

Inteligencia artificial

En los últimos años, se ha puesto cada vez más énfasis en los métodos que utilizan inteligencia artificial para descifrar lenguas perdidas, especialmente a través de métodos de procesamiento del lenguaje natural (PLN). Los métodos de prueba de concepto han vuelto a descifrar de forma independiente el ugarítico y el lineal B utilizando datos de lenguas similares, en este caso el hebreo y el griego antiguo . ^[8]

Descifrando la pronunciación

En relación con los intentos de descifrar el significado de los idiomas y alfabetos, se incluyen los intentos de descifrar cómo se pronunciaban los sistemas de escritura extintos o las versiones más antiguas de los sistemas de escritura contemporáneos (como el inglés en el siglo XVII). Se han desarrollado varios métodos y criterios a este respecto. Los criterios importantes incluyen (1) las rimas y el testimonio de la poesía (2) la evidencia de ortografías y errores ortográficos ocasionales (3) las interpretaciones de material en un idioma de autores en lenguas extranjeras (4) la información obtenida de idiomas relacionados (5) los cambios gramaticales en la ortografía a lo largo del tiempo. ^[9]

Por ejemplo, el análisis de la poesía se centra en el uso de juegos de palabras o técnicas literarias entre palabras que tienen un sonido similar. La obra de Shakespeare Romeo y Julieta contiene juegos de palabras que se basan en un sonido similar entre las palabras "soul" y "soles", lo que permite confiar en que la pronunciación similar entre los términos hoy también existía en la época de Shakespeare. Otra fuente común de información sobre la pronunciación es cuando los textos anteriores usan rimas , como cuando las líneas consecutivas en la poesía terminan en el mismo sonido o en el mismo sonido. Sin embargo, este método tiene algunas limitaciones, ya que los textos pueden usar rimas que se basan en similitudes visuales entre palabras (como 'love' y 'remove') en lugar de similitudes auditivas, y las rimas pueden ser imperfectas . Otra fuente de información sobre la pronunciación proviene de descripciones explícitas de pronunciaciones de textos anteriores, como en el caso de la Grammatica Anglicana , como en el siguiente comentario sobre la letra <o>: "En el tiempo largo suena naturalmente agudo y alto; como en chósen, hósen, hóly, fólly [. . .] En el tiempo corto más plano, y un pariente de u; como còsen, dòsen, mòther, bròther, lòve, pròve". ^[10] Otro ejemplo proviene de comentarios detallados sobre pronunciaciones del sánscrito de las obras sobrevivientes de gramáticos sánscritos. ^[9]

Desafíos

Existen muchos desafíos en el desciframiento de idiomas, incluidos cuando: ^[4]^[6]

Cuando no se sabe qué idioma es el más cercano.
Cuando las palabras del guión no están claramente segmentadas, como en algunas lenguas ibéricas .
Cuando no se conoce el sistema de escritura. En concreto, si hay poca certeza sobre el número de grafemas que existen en un determinado sistema de escritura, no se puede determinar si ese sistema es un alfabeto, un silabario, un logosílabario u otro.
Cuando no se conoce la dirección de lectura. Por ejemplo, puede que no esté claro si un sistema de escritura debe leerse de izquierda a derecha o de derecha a izquierda.
Cuando no se sabe si un guión utiliza puntuación o espacios entre palabras.
Cuando no se conoce el idioma de una escritura sujeta a esfuerzos de desciframiento.
Cuando hay un pequeño conjunto de datos disponible para conocer las propiedades de un alfabeto, esto podría generar problemas como que se conozca un vocabulario incompleto para el alfabeto.
Cuando no se conoce el orden típico entre sujetos, objetos y verbos.
Cuando no se sabe si ciertas palabras pueden cambiar su forma o cómo.
Cuando no se sabe cuándo se utilizan múltiples símbolos para representar el mismo sonido, sílaba, palabra, concepto o idea (alógrafos).
Cuando no está claro cómo la caligrafía o el estilo de escritura de un escriba en particular se relaciona con el estilo de escritura de otro escriba que trabaja en el mismo texto (las mismas letras o palabras pueden estar escritas de una manera que parece diferente), en cuyo caso es difícil correlacionar la información entre múltiples ejemplos del uso del sistema de escritura.
Cuando no se sabe si ciertas palabras cambian su significado dependiendo del contexto en el que aparecen (homónimos).
Cuando no se conoce el contexto del descubrimiento de un escrito. Esto se debe a que la información sobre el lugar de origen de un sistema de escritura puede proporcionar información valiosa sobre su relación con los idiomas conocidos.
Cuando no se dispone de conjuntos de datos digitales adecuados para los sistemas de escritura documentados, se limita la capacidad de utilizar métodos computacionales para el desciframiento.
Cuando no se dispone de suficientes recursos de hardware, como computación de alto rendimiento (lo que podría ser necesario para métodos computacionales más intensivos).

Descifradores notables

Véase también

Escrituras descifradas

Escrituras no descifradas

Textos sin descifrar

Referencias

^ Aunque la escritura, líbico-bereber , ha sido descifrada casi en su totalidad, el idioma no.

^ Trask, RL (2000). Diccionario de lingüística histórica y comparada . Fitzroy Dearborn Publishers, pág. 82 ("El proceso de determinar la relación entre un sistema de escritura extinto y desconocido y el idioma que representa. Estrictamente, el desciframiento es la elucidación de la escritura , es decir, determinar los valores de los caracteres escritos")
^ Bauer, Craig P. (4 de marzo de 2023). "La nueva era dorada del desciframiento". Criptología . 47 (2): 97–100. doi :10.1080/01611194.2023.2170158. ISSN 0161-1194.
^ abcde Gelb, IJ; Whiting, RM (1975). "Métodos de desciframiento". Revista de la Royal Asiatic Society . 107 (2): 95–104. doi :10.1017/S0035869X00132769. ISSN 2051-2066.
^ ab Luo, Jiaming; Hartmann, Frederik; Santus, Enrico; Barzilay, Regina; Cao, Yuan (2021). "Descifrando escrituras antiguas subsegmentadas usando el orden fonético anterior". Transacciones de la Asociación de Lingüística Computacional . 9 : 69–81. arXiv : 2010.11054 . doi :10.1162/tacl_a_00354. ISSN 2307-387X.
^ ab Desset, François; Tabibzadeh, Kambiz; Kervran, Matthieu; Basello, Gian Pietro; Marchesi y Gianni (1 de julio de 2022). "El desciframiento de la escritura lineal elamita". Zeitschrift für Assyriologie und vorderasiatische Archäologie . 112 (1): 11–60. doi :10.1515/za-2022-0003. ISSN 1613-1150.
^ abcd Braović, Maja; Krstinić, Damir; Štula, Maja; Ivanda, Antonia (1 de junio de 2024). "Una revisión sistemática de los enfoques computacionales para descifrar las escrituras chipriotas y egeas de la Edad del Bronce". Computational Linguistics . 50 (2): 725–779. doi : 10.1162/coli_a_00514 . ISSN 0891-2017.
^ Knight, Kevin; Yamada, Kenji (1999). "Un enfoque computacional para descifrar escrituras desconocidas" (PDF) . Aprendizaje no supervisado en el procesamiento del lenguaje natural .
^ Luo, Jiaming; Cao, Yuan; Barzilay, Regina (2019). "Desciframiento neuronal mediante flujo de costo mínimo: del ugarítico al lineal B". arXiv . Asociación de Lingüística Computacional: 3146–3155. arXiv : 1906.06718 . doi :10.18653/v1/P19-1303.
^ ab Campbell, Lyle (2021). Lingüística histórica: una introducción (4.ª ed.). MIT Press. págs. 372–375. ISBN 978-0-262-53159-7.
^ Burridge, Kate; Bergs, Alexander (2017). Entender el cambio lingüístico . Serie Entender el lenguaje. Londres Nueva York: Routledge, Taylor & Francis Group. pp. 234–235. ISBN 978-0-415-71339-9.
^ "Cipro-silábico".
^ "Anatomía de un desciframiento", http://images.library.wisc.edu/WI/EFacs/transactions/WT1966/reference/wi.wt1966.adcorre.pdf"

Lectura adicional

Daniels, Peter T. (2020). "El desciframiento de las lenguas antiguas del Cercano Oriente". En Hasselbach-Andee, Rebecca (ed.). Un compañero para las lenguas antiguas del Cercano Oriente . Wiley. págs. 1–25.
Ferrera, Silvia; Tamburini, Fabio (2022). "Técnicas avanzadas para el desciframiento de escrituras antiguas". Lengua y lengua : 239–259.