En un lenguaje escrito , un logograma (del griego antiguo logos 'palabra' y gramma 'lo que se dibuja o escribe'), también logograma o lexígrafo , es un carácter escrito que representa un componente semántico de un idioma, como una palabra o un morfema . Los caracteres chinos que se usan en chino y en otros idiomas son logogramas, al igual que los jeroglíficos egipcios y los caracteres en escritura cuneiforme . Un sistema de escritura que utiliza principalmente logogramas se llama logografía . Los sistemas de escritura no logográficos, como los alfabetos y los silabarios , son fonémicos : sus símbolos individuales representan sonidos directamente y carecen de cualquier significado inherente. Sin embargo, todas las logografías conocidas tienen algún componente fonético, generalmente basado en el principio del rebus , y la adición de un componente fonético a los ideogramas puros se considera una innovación clave para permitir que el sistema de escritura codifique adecuadamente el lenguaje humano.
Los sistemas logográficos incluyen los primeros sistemas de escritura; las primeras civilizaciones históricas de Mesopotamia, Egipto, China y Mesoamérica utilizaron alguna forma de escritura logográfica. [1] [2]
Todas las escrituras logográficas que se han utilizado en las lenguas naturales se basan en el principio del rebus para ampliar un conjunto relativamente limitado de logogramas: se utiliza un subconjunto de caracteres por sus valores fonéticos, ya sean consonánticos o silábicos. El término logosilabario se utiliza para enfatizar la naturaleza parcialmente fonética de estas escrituras cuando el dominio fonético es la sílaba. En los jeroglíficos del Antiguo Egipto , el Ch'olti' y el chino, se ha producido el desarrollo adicional de los determinativos , que se combinan con los logogramas para limitar su posible significado. En chino, se fusionan con elementos logográficos utilizados fonéticamente; estos caracteres " radicales y fonéticos" constituyen la mayor parte de la escritura. El Antiguo Egipto y el Chino relegaron el uso activo del rebus a la ortografía de palabras extranjeras y dialécticas.
Las escrituras logoconsonánticas tienen grafemas que pueden extenderse fonéticamente según las consonantes de las palabras que representan, ignorando las vocales. Por ejemplo, la escritura egipcia
se utilizaba para escribir tanto sȝ 'pato' como sȝ 'hijo', aunque es probable que estas palabras no se pronunciaran igual excepto por sus consonantes. Los principales ejemplos de escrituras logoconsonánticas son los jeroglíficos egipcios , el hierático y el demótico : egipcio antiguo .
Las escrituras logosilábicas tienen grafemas que representan morfemas, a menudo morfemas polisilábicos, pero cuando se extienden fonéticamente representan sílabas individuales. Incluyen la escritura cuneiforme, los jeroglíficos anatolios , los jeroglíficos cretenses , la escritura lineal A y lineal B , los caracteres chinos , la escritura maya , la escritura azteca , la escritura mixteca y las primeras cinco fases de la escritura bamum .
Un sistema peculiar de logogramas desarrollado dentro de las escrituras Pahlavi (desarrolladas a partir del abjad del arameo ) utilizadas para escribir en persa medio durante gran parte del período sasánida ; los logogramas estaban compuestos de letras que formaban la palabra en arameo pero se pronunciaban como en persa (por ejemplo, la combinación mlk se pronunciaría "shah"). Estos logogramas, llamados hozwārishn (una forma de heterogramas ), fueron eliminados por completo después de la conquista árabe de Persia y la adopción de una variante del alfabeto árabe . [ cita requerida ]
Todos los sistemas logográficos históricos incluyen una dimensión fonética, ya que no es práctico tener un carácter básico separado para cada palabra o morfema en una lengua. [a] En algunos casos, como el cuneiforme tal como se usaba para el acadio, la gran mayoría de los glifos se usan por sus valores sonoros en lugar de logográficamente. Muchos sistemas logográficos también tienen un componente semántico/ideográfico (ver ideograma ), llamado "determinativos" en el caso del egipcio y "radicales" en el caso del chino. [b]
El uso típico egipcio era ampliar un logograma, que potencialmente podía representar varias palabras con diferentes pronunciaciones, con un determinante para acotar el significado y un componente fonético para especificar la pronunciación. En el caso del chino, la gran mayoría de los caracteres son una combinación fija de un radical que indica su categoría nominal, más un fonético para dar una idea de la pronunciación. El sistema maya utilizaba logogramas con complementos fonéticos como el egipcio, pero carecía de componentes ideográficos.
Los eruditos chinos han clasificado tradicionalmente los caracteres chinos ( hànzì ) en seis tipos según su etimología.
Los dos primeros tipos son de "cuerpo único", es decir, que el carácter se creó independientemente de otros caracteres. Los pictogramas e ideogramas de "cuerpo único" constituyen solo una pequeña proporción de los logogramas chinos. Más productivos para la escritura china fueron los dos métodos "compuestos", es decir, el carácter se creó a partir del ensamblaje de diferentes caracteres. A pesar de llamarse "compuestos", estos logogramas siguen siendo caracteres únicos y se escriben para ocupar la misma cantidad de espacio que cualquier otro logograma. Los dos últimos tipos son métodos en el uso de caracteres, más que en la formación de caracteres en sí.
El método más productivo de escritura china, la fonética radical, fue posible al ignorar ciertas distinciones en el sistema fonético de sílabas. En el chino antiguo , las consonantes finales post-finales /s/ y /ʔ/ eran típicamente ignoradas; estas se convirtieron en tonos en el chino medio , que también fueron ignorados cuando se crearon nuevos caracteres. También se ignoraron las diferencias en aspiración (entre obstruyentes aspiradas vs. no aspiradas , y sonoras vs. sordas); la diferencia en chino antiguo entre sílabas de tipo A y tipo B (a menudo descritas como presencia vs. ausencia de palatalización o faringealización ); y, a veces, la sonorización de las obstruyentes iniciales y/o la presencia de una /r/ medial después de la consonante inicial. En épocas anteriores, generalmente se permitía una mayor libertad fonética. Durante la época del chino medio, los caracteres recién creados tendían a coincidir exactamente con la pronunciación, aparte del tono, a menudo utilizando como componente fonético un carácter que en sí mismo es un compuesto fonético radical.
Debido al largo período de evolución del lenguaje, tales "pistas" de componentes dentro de los caracteres como las proporcionadas por los compuestos fonéticos radicales son a veces inútiles y pueden ser engañosas en el uso moderno. Como ejemplo, basados en每'cada', pronunciado měi en mandarín estándar , están los caracteres侮'humillar',悔'lamentar' y海'mar', pronunciados respectivamente wǔ , huǐ y hǎi en mandarín. Tres de estos caracteres se pronunciaban de manera muy similar en chino antiguo – /mˤəʔ/ (每), /m̥ˤəʔ/ (悔), y /m̥ˤəʔ/ (海) según una reconstrucción reciente de William H. Baxter y Laurent Sagart [4] – pero los cambios de sonido en los 3.000 años intermedios aproximadamente (incluyendo dos desarrollos dialectales diferentes, en el caso de los dos últimos caracteres) han dado como resultado pronunciaciones radicalmente diferentes.
En el contexto del idioma chino, los caracteres chinos (conocidos como hanzi ) en general representan palabras y morfemas más que ideas puras; sin embargo, la adopción de caracteres chinos por los idiomas japonés y coreano (donde se conocen como kanji y hanja , respectivamente) ha generado algunas complicaciones en esta imagen.
Muchas palabras chinas, compuestas de morfemas chinos, fueron tomadas prestadas al japonés y al coreano junto con sus representaciones en caracteres; en este caso, los morfemas y los caracteres fueron tomados prestados juntos. En otros casos, sin embargo, los caracteres fueron tomados prestados para representar morfemas nativos japoneses y coreanos, basándose únicamente en el significado. Como resultado, un solo carácter puede terminar representando múltiples morfemas de significado similar pero con diferentes orígenes en varios idiomas. Debido a esto, los kanji y los hanja a veces se describen como sistemas de escritura morfográfica . [ cita requerida ]
Debido a que gran parte de la investigación sobre el procesamiento del lenguaje se ha centrado en el inglés y otros idiomas escritos alfabéticamente, muchas teorías del procesamiento del lenguaje han enfatizado el papel de la fonología en la producción del habla. El contraste de los idiomas codificados logográficamente, donde un solo carácter se representa fonética e ideográficamente, con los idiomas escritos fonéticamente/fonémicamente ha proporcionado información sobre cómo los diferentes idiomas dependen de diferentes mecanismos de procesamiento. Los estudios sobre el procesamiento de los idiomas codificados logográficamente han analizado, entre otras cosas, las diferencias neurobiológicas en el procesamiento, siendo un área de particular interés la lateralización hemisférica. Dado que los idiomas codificados logográficamente están más estrechamente asociados con las imágenes que los idiomas codificados alfabéticamente, varios investigadores han planteado la hipótesis de que la activación del lado derecho debería ser más prominente en los idiomas codificados logográficamente. Aunque algunos estudios han arrojado resultados consistentes con esta hipótesis, hay demasiados resultados contrastantes para llegar a conclusiones finales sobre el papel de la lateralización hemisférica en los idiomas codificados ortográficamente frente a los codificados fonéticamente. [5]
Otro tema al que se le ha prestado cierta atención son las diferencias en el procesamiento de homófonos. Verdonschot et al. [6] examinaron las diferencias en el tiempo que se tardaba en leer un homófono en voz alta cuando se presentaba una imagen relacionada o no relacionada [7] con un carácter homofónico antes del carácter. Se examinaron homófonos tanto japoneses como chinos. Mientras que la producción de palabras de idiomas codificados alfabéticamente (como el inglés) ha mostrado una inmunidad relativamente robusta al efecto de los estímulos de contexto, [8] Verdschot et al. [9] encontraron que los homófonos japoneses parecen particularmente sensibles a este tipo de efectos. Específicamente, los tiempos de reacción fueron más cortos cuando a los participantes se les presentó una imagen fonológicamente relacionada antes de que se les pidiera que leyeran un carácter objetivo en voz alta. Un ejemplo de un estímulo fonológicamente relacionado del estudio sería, por ejemplo, cuando a los participantes se les presentó una imagen de un elefante, que se pronuncia zou en japonés, antes de que se les presentara el carácter chino造, que también se lee zou . No se encontró ningún efecto de imágenes de contexto fonológicamente relacionadas para los tiempos de reacción para leer palabras chinas. Una comparación entre los idiomas japonés y chino (parcialmente) codificados logográficamente es interesante porque, mientras que el japonés consta de más de un 60% de heterófonos homógrafos (caracteres que pueden leerse de dos o más formas diferentes), la mayoría de los caracteres chinos solo tienen una lectura. Como ambos idiomas están codificados logográficamente, la diferencia en la latencia al leer en voz alta el japonés y el chino debido a los efectos del contexto no se puede atribuir a la naturaleza logográfica de los sistemas de escritura. En cambio, los autores plantean la hipótesis de que la diferencia en los tiempos de latencia se debe a los costos de procesamiento adicionales en japonés, donde el lector no puede confiar únicamente en una ruta directa de ortografía a fonología, sino que también debe acceder a información a nivel léxico-sintáctico para elegir la pronunciación correcta. Esta hipótesis se confirma con estudios que encontraron que los pacientes japoneses con enfermedad de Alzheimer cuya comprensión de los caracteres se había deteriorado aún podían leer las palabras en voz alta sin ninguna dificultad particular. [10] [11]
Los estudios que contrastan el procesamiento de homófonos ingleses y chinos en tareas de decisión léxica han encontrado una ventaja para el procesamiento de homófonos en chino, y una desventaja para el procesamiento de homófonos en inglés. [12] La desventaja de procesamiento en inglés se describe generalmente en términos de la relativa falta de homófonos en el idioma inglés. Cuando se encuentra una palabra homofónica, primero se activa la representación fonológica de esa palabra. Sin embargo, dado que se trata de un estímulo ambiguo, es necesario un emparejamiento a nivel ortográfico/léxico ("diccionario mental") antes de que se pueda desambiguar el estímulo, y se pueda elegir la pronunciación correcta. En contraste, en un idioma (como el chino) donde existen muchos caracteres con la misma lectura, se plantea la hipótesis de que la persona que lee el carácter estará más familiarizada con los homófonos, y que esta familiaridad ayudará al procesamiento del carácter, y la posterior selección de la pronunciación correcta, lo que lleva a tiempos de reacción más cortos al prestar atención al estímulo. En un intento por comprender mejor los efectos de la homofonía en el procesamiento, Hino et al. [8] llevaron a cabo una serie de experimentos utilizando el japonés como su idioma de destino. Al controlar la familiaridad, encontraron una ventaja de procesamiento para los homófonos sobre los no homófonos en japonés, similar a lo que se había encontrado previamente en chino. Los investigadores también probaron si los homófonos ortográficamente similares producirían una desventaja en el procesamiento, como ha sido el caso con los homófonos ingleses, [13] pero no encontraron evidencia de esto. Es evidente que hay una diferencia en cómo se procesan los homófonos en idiomas codificados logográficamente y codificados alfabéticamente, pero aún queda por ver si la ventaja para el procesamiento de homófonos en los idiomas codificados logográficamente japonés y chino (es decir, sus sistemas de escritura) se debe a la naturaleza logográfica de las escrituras, o si simplemente refleja una ventaja para los idiomas con más homófonos independientemente de la naturaleza de la escritura.
La principal diferencia entre los logogramas y otros sistemas de escritura es que los grafemas no están vinculados directamente a su pronunciación. Una ventaja de esta separación es que no es necesario comprender la pronunciación o el lenguaje del escritor, por ejemplo, 1 se entiende independientemente de si su lector lo llama one , ichi o wāḥid . Del mismo modo, las personas que hablan diferentes variedades de chino pueden no entenderse entre sí al hablar, pero pueden hacerlo en gran medida al escribir incluso si no escriben en chino estándar . Por lo tanto, en China, Vietnam, Corea y Japón antes de los tiempos modernos, la comunicación por escrito (筆談) era la norma del comercio internacional y la diplomacia del este de Asia utilizando el chino clásico . [ cita requerida ] [ dudoso – discutir ]
Sin embargo, esta separación también tiene la gran desventaja de requerir la memorización de los logogramas cuando se aprende a leer y escribir, independientemente de la pronunciación. Aunque no se debe a una característica inherente de los logogramas, sino a su historia única de desarrollo, el japonés tiene la complicación adicional de que casi cada logograma tiene más de una pronunciación. Por el contrario, un conjunto de caracteres fonéticos se escribe exactamente como se habla, pero con la desventaja de que las ligeras diferencias de pronunciación introducen ambigüedades. Muchos sistemas alfabéticos, como los del griego , el latín , el italiano , el español y el finlandés, hacen el compromiso práctico de estandarizar cómo se escriben las palabras manteniendo una relación casi uno a uno entre caracteres y sonidos. Las ortografías en algunos otros idiomas, como el inglés , el francés , el tailandés y el tibetano , son más complicadas que eso; las combinaciones de caracteres a menudo se pronuncian de múltiples maneras, generalmente dependiendo de su historia. Hangul , el sistema de escritura del idioma coreano , es un ejemplo de una escritura alfabética que fue diseñada para reemplazar al hanja logogramático con el fin de aumentar la alfabetización. Este último se utiliza raramente en la actualidad, pero sigue siendo moneda corriente en Corea del Sur, a veces en combinación con el hangul. [ cita requerida ]
Según una investigación encargada por el gobierno, los 3.500 caracteres más utilizados que figuran en la " Tabla de caracteres comunes del chino moderno " (现代汉语常用字表, Xiàndài Hànyǔ Chángyòngzì Biǎo ) de la República Popular China cubren el 99,48% de una muestra de dos millones de palabras. En cuanto al caso de los caracteres chinos tradicionales, 4.808 caracteres están enumerados en la " Tabla de formas estándar de caracteres nacionales comunes " (常用國字標準字體表) del Ministerio de Educación de la República de China , mientras que 4.759 en la " Lista de grafemas de caracteres chinos de uso común " (常用字字形表) de la Oficina de Educación y Mano de Obra de Hong Kong , ambos destinados a ser enseñados durante la educación primaria y secundaria básica . La educación después de la escuela primaria no incluye tantos caracteres nuevos como palabras nuevas, que son en su mayoría combinaciones de dos o más caracteres ya aprendidos. [14]
Introducir caracteres complejos puede resultar complicado en dispositivos electrónicos debido a una limitación práctica en el número de teclas de entrada. Existen varios métodos de entrada para introducir logogramas, ya sea dividiéndolos en sus partes constituyentes, como con los métodos Cangjie y Wubi de mecanografía china, o utilizando sistemas fonéticos como Bopomofo o Pinyin, en los que se introduce la palabra tal como se pronuncia y luego se selecciona de una lista de logogramas que coinciden con ella. Si bien el primer método es (linealmente) más rápido, es más difícil de aprender. Sin embargo, con el sistema alfabético chino, los trazos que forman el logograma se escriben como se escriben normalmente y luego se introduce el logograma correspondiente. [ aclaración necesaria ]
También debido a la cantidad de glifos, en programación y computación en general, se necesita más memoria para almacenar cada grafema, ya que el conjunto de caracteres es más grande. A modo de comparación, ISO 8859 requiere solo un byte para cada grafema, mientras que el Plano Multilingüe Básico codificado en UTF-8 requiere hasta tres bytes. Por otro lado, las palabras en inglés, por ejemplo, tienen un promedio de cinco caracteres y un espacio por palabra [15] [ fuente autopublicada ] y, por lo tanto, necesitan seis bytes para cada palabra. Dado que muchos logogramas contienen más de un grafema, no está claro cuál es más eficiente en términos de memoria. Las codificaciones de ancho variable permiten que un estándar de codificación de caracteres unificado como Unicode use solo los bytes necesarios para representar un carácter, lo que reduce la sobrecarga que resulta de fusionar conjuntos de caracteres grandes con otros más pequeños.