Un código telegráfico es una de las codificaciones de caracteres utilizadas para transmitir información por telegrafía . El código Morse es el código más conocido. La telegrafía generalmente se refiere al telégrafo eléctrico , pero los sistemas telegráficos que utilizan el telégrafo óptico ya se utilizaban antes. Un código consta de una serie de puntos de código , cada uno correspondiente a una letra del alfabeto, un número o algún otro carácter. En los códigos destinados a máquinas en lugar de humanos, se requieren puntos de código para caracteres de control , como el retorno de carro , para controlar el funcionamiento del mecanismo. Cada punto de código está formado por una serie de elementos dispuestos de una manera única para ese carácter. Normalmente hay dos tipos de elemento (un código binario), pero se emplearon más tipos de elementos en algunos códigos no destinados a máquinas. Por ejemplo, el código Morse estadounidense tenía unos cinco elementos, en lugar de los dos (punto y raya) del Código Morse internacional .
Los códigos destinados a la interpretación humana se diseñaron de modo que los caracteres que aparecían con mayor frecuencia tuvieran la menor cantidad de elementos en el punto de código correspondiente. Por ejemplo, el código Morse para E , la letra más común en inglés, es un solo punto ( ▄ ), mientras que Q es ▄▄▄ ▄▄▄ ▄ ▄▄▄ . Estos arreglos significaban que el mensaje podía enviarse más rápidamente y que el operador tardaría más en fatigarse. Los telégrafos siempre fueron operados por humanos hasta finales del siglo XIX. Cuando llegaron los mensajes telegráficos automatizados, los códigos con puntos de código de longitud variable eran inconvenientes para el diseño de máquinas de la época. En su lugar, se utilizaron códigos con una longitud fija. El primero de ellos fue el código Baudot , un código de cinco bits . Baudot solo tiene suficientes puntos de código para imprimir en mayúsculas . Los códigos posteriores tenían más bits ( ASCII tiene siete) para que se pudieran imprimir tanto mayúsculas como minúsculas. Más allá de la era del telégrafo, las computadoras modernas requieren una gran cantidad de puntos de código ( Unicode tiene 21 bits) para que se puedan manejar múltiples idiomas y alfabetos ( conjuntos de caracteres ) sin tener que cambiar la codificación de caracteres. Las computadoras modernas pueden manejar fácilmente códigos de longitud variable como UTF-8 y UTF-16, que ahora se han vuelto omnipresentes.
Antes del telégrafo eléctrico, un método ampliamente utilizado para construir redes telegráficas nacionales era el telégrafo óptico, que consistía en una cadena de torres desde las que se podían enviar señales mediante semáforos o contraventanas de torre a torre. Este método se desarrolló especialmente en Francia y tuvo sus inicios durante la Revolución Francesa . El código utilizado en Francia era el código Chappe, llamado así por Claude Chappe, el inventor. El Almirantazgo británico también utilizaba el telégrafo de semáforos, pero con su propio código. El código británico era necesariamente diferente del utilizado en Francia porque el telégrafo óptico británico funcionaba de una manera diferente. El sistema Chappe tenía brazos móviles, como si estuviera agitando banderas como en el semáforo de banderas . El sistema británico utilizaba una serie de contraventanas que se podían abrir o cerrar. [1]
El sistema Chappe consistía en una gran viga pivotante (el regulador) con un brazo en cada extremo (los indicadores) que pivotaban alrededor del regulador en una extremidad. Los ángulos que estos componentes podían adoptar se limitaban a múltiplos de 45° para facilitar la legibilidad. Esto daba un espacio de código de 8×4×8 puntos de código , pero la posición del indicador en línea con el regulador nunca se usaba porque era difícil distinguirlo del indicador que se doblaba hacia atrás sobre el regulador, lo que dejaba un espacio de código de 7×4×7 = 196. Los símbolos siempre se formaban con el regulador en la diagonal inclinada hacia la izquierda o hacia la derecha (oblicua) y solo se aceptaban como válidos cuando el regulador se movía a la posición vertical u horizontal. La oblicua izquierda siempre se usaba para mensajes, y la oblicua derecha para el control del sistema. Esto reducía aún más el espacio de código a 98, de los cuales cuatro o seis puntos de código (según la versión) eran caracteres de control , lo que dejaba un espacio de código para texto de 94 o 92 respectivamente.
El sistema Chappe transmitía mensajes principalmente mediante un libro de códigos con un gran número de palabras y frases predefinidas. Se utilizó por primera vez en una cadena experimental de torres en 1793 y se puso en servicio desde París hasta Lille en 1794. No se sabe con certeza qué libro de códigos se utilizó en esa época, pero es posible que un libro de códigos no identificado en el Museo Postal de París haya sido el del sistema Chappe. La disposición de este código en columnas de 88 entradas llevó a Holzmann & Pehrson a sugerir que podrían haberse utilizado 88 puntos de código. Sin embargo, la propuesta de 1793 era de diez puntos de código que representaran los números del 0 al 9, y Bouchet dice que este sistema todavía se utilizaba hasta 1800 (Holzmann & Pehrson sitúan el cambio en 1795). El libro de códigos se revisó y simplificó en 1795 para acelerar la transmisión. El código estaba en dos divisiones, la primera división era de 94 caracteres alfabéticos y numéricos más algunas combinaciones de letras de uso común. La segunda división era un libro de códigos de 94 páginas con 94 entradas en cada página. Se asignaba un punto de código a cada número hasta el 94. De este modo, solo se necesitaban enviar dos símbolos para transmitir una frase completa (los números de página y de línea del libro de códigos), en comparación con los cuatro símbolos que se necesitaban con el código de diez símbolos.
En 1799 se añadieron tres divisiones adicionales, que incluían palabras y frases adicionales, lugares geográficos y nombres de personas. Estas tres divisiones requerían que se añadieran símbolos adicionales delante del símbolo del código para identificar el libro correcto. El código se revisó de nuevo en 1809 y se mantuvo estable a partir de entonces. En 1837, Gabriel Flocon introdujo un sistema de codificación horizontal únicamente que no requería mover el pesado regulador. En su lugar, se colocó un indicador adicional en el centro del regulador para transmitir ese elemento del código. [2]
El sistema Edelcrantz se utilizó en Suecia y fue la segunda red más grande construida después de la de Francia. El telégrafo consistía en un conjunto de diez obturadores. Nueve de ellos estaban dispuestos en una matriz de 3x3. Cada columna de obturadores representaba un dígito octal codificado en binario con un obturador cerrado que representaba "1" y el dígito más significativo en la parte inferior. Cada símbolo de transmisión telegráfica era, por tanto, un número octal de tres dígitos. El décimo obturador era uno extragrande en la parte superior. Su significado era que el punto de código debía ir precedido por "A".
Uno de los usos del obturador "A" era que un punto de código numérico precedido por "A" significaba añadir un cero (multiplicar por diez) al dígito. Los números más grandes podían indicarse siguiendo el número con el código de centenas (236), millares (631) o una combinación de estos. Esto requería que se transmitieran menos símbolos que enviando todos los dígitos cero individualmente. Sin embargo, el propósito principal de los puntos de código "A" era un libro de códigos de mensajes predeterminados, muy parecido al libro de códigos de Chappe.
Los símbolos sin "A" eran un gran conjunto de números, letras, sílabas comunes y palabras que ayudaban a compactar el código . Alrededor de 1809, Edelcrantz introdujo un nuevo libro de códigos con 5120 puntos de código, cada uno de los cuales requería una transmisión de dos símbolos para su identificación.
Había muchos puntos de código para la corrección de errores (272, error), control de flujo y mensajes de supervisión. Por lo general, se esperaba que los mensajes se transmitieran a lo largo de toda la línea, pero había circunstancias en las que las estaciones individuales necesitaban comunicarse directamente, generalmente con fines administrativos. La situación más común y más simple era la comunicación entre estaciones adyacentes. Los puntos de código 722 y 227 se usaban para este propósito, para llamar la atención de la siguiente estación hacia el sol o alejarse de él, respectivamente. Para estaciones más remotas se usaban los puntos de código 557 y 755 respectivamente, seguidos de la identificación de las estaciones solicitantes y de destino. [3]
La señalización con banderas se utilizó ampliamente para la señalización punto a punto antes del telégrafo óptico, pero era difícil construir una red nacional con banderas portátiles. Se necesitaba el aparato mecánico mucho más grande de las torres de telégrafo de semáforos para poder lograr una mayor distancia entre enlaces. Sin embargo, durante la Guerra Civil estadounidense se construyó una red extensa con banderas portátiles . Este era el sistema wig-wag que usaba el código inventado por Albert J. Myer . Algunas de las torres utilizadas eran enormes, de hasta 130 pies, para obtener un buen alcance. El código de Myer requería solo una bandera usando un código ternario . Es decir, cada elemento del código consistía en una de tres posiciones de bandera distintas. Sin embargo, los puntos de código alfabéticos requerían solo dos posiciones, y la tercera posición solo se usaba en caracteres de control . El uso de un código ternario en el alfabeto habría resultado en mensajes más cortos porque se requieren menos elementos en cada punto de código, pero un sistema binario es más fácil de leer a larga distancia ya que se necesitan distinguir menos posiciones de bandera. El manual de Myer también describe un alfabeto codificado ternario con una longitud fija de tres elementos para cada punto de código. [4]
Durante el desarrollo inicial del telégrafo eléctrico se inventaron muchos códigos diferentes . Prácticamente cada inventor produjo un código diferente para adaptarse a su aparato en particular. El primer código utilizado comercialmente en un telégrafo eléctrico fue el código de cinco agujas del telégrafo Cooke y Wheatstone (C&W5). Este se utilizó por primera vez en el Great Western Railway en 1838. El C&W5 tenía la gran ventaja de que el operador no necesitaba aprender el código; las letras se podían leer directamente en el tablero de visualización. Sin embargo, tenía la desventaja de que requería demasiados cables. Se desarrolló un código de una aguja, el C&W1, que requería solo un cable. El C&W1 se utilizó ampliamente en el Reino Unido y el Imperio Británico.
Algunos otros países utilizaron el código C&W1, pero nunca se convirtió en un estándar internacional y, en general, cada país desarrolló su propio código. En Estados Unidos se utilizó el código Morse estadounidense , cuyos elementos consistían en puntos y rayas que se distinguían entre sí por la longitud del pulso de corriente en la línea telegráfica. Este código se utilizó en el telégrafo inventado por Samuel Morse y Alfred Vail y se utilizó por primera vez comercialmente en 1844. Morse inicialmente tenía puntos de código solo para números. Planeó que los números enviados por telégrafo se usaran como índice de un diccionario con un conjunto limitado de palabras. Vail inventó un código extendido que incluía puntos de código para todas las letras de modo que se pudiera enviar cualquier palabra deseada. Fue el código de Vail el que se convirtió en el Morse estadounidense. En Francia, el telégrafo utilizó el telégrafo Foy-Breguet , un telégrafo de dos agujas que mostraba las agujas en código Chappe, el mismo código que el telégrafo óptico francés, que todavía se usaba más ampliamente que el telégrafo eléctrico en Francia. Para los franceses, esto tenía la gran ventaja de que no necesitaban volver a capacitar a sus operadores en un nuevo código. [5]
En Alemania, en 1848, Friedrich Clemens Gerke desarrolló una versión muy modificada del código Morse americano para su uso en los ferrocarriles alemanes. El código Morse americano tenía tres longitudes diferentes de guiones y dos longitudes diferentes de espacio entre los puntos y los guiones en un punto de código. El código Gerke tenía solo una longitud de guión y todos los espacios entre elementos dentro de un punto de código eran iguales. Gerke también creó puntos de código para las letras de diéresis alemanas , que no existen en inglés. Muchos países de Europa central pertenecían a la Unión Telegráfica Alemana-Austríaca. En 1851, la Unión decidió adoptar un código común para todos sus países para que los mensajes pudieran enviarse entre ellos sin necesidad de que los operadores los recodificaran en las fronteras. El código Gerke se adoptó para este propósito.
En 1865, una conferencia en París adoptó el código Gerke como estándar internacional, llamándolo Código Morse Internacional . Con algunos cambios muy menores, este es el código Morse que se usa hoy en día. Los instrumentos de aguja del telégrafo Cooke y Wheatstone podían usar el código Morse, ya que los puntos y rayas podían enviarse como movimientos de izquierda a derecha de la aguja. En ese momento, los instrumentos de aguja se estaban fabricando con topes finales que producían dos notas claramente diferentes cuando la aguja los golpeaba. Esto permitía al operador escribir el mensaje sin mirar hacia la aguja, lo que era mucho más eficiente. Esta era una ventaja similar al telégrafo Morse en el que los operadores podían escuchar el mensaje a partir del clic de la armadura del relé. Sin embargo, después de que las compañías telegráficas británicas se nacionalizaran en 1870, la Oficina General de Correos decidió estandarizar el telégrafo Morse y deshacerse de los muchos sistemas diferentes que habían heredado de las empresas privadas.
En Estados Unidos, las compañías de telégrafos se negaron a utilizar el Morse internacional debido al coste de la formación de los operadores y se opusieron a los intentos del gobierno de convertirlo en ley. En la mayoría de los demás países, el telégrafo estaba controlado por el Estado, por lo que el cambio podía simplemente ser obligatorio. En Estados Unidos, no había una única entidad que gestionara el telégrafo, sino que lo gestionaban varias empresas privadas. Esto dio lugar a que los operadores internacionales tuvieran que dominar ambas versiones del Morse y recodificar los mensajes entrantes y salientes. Estados Unidos siguió utilizando el Morse americano en las líneas terrestres ( la radiotelegrafía utilizaba generalmente el Morse internacional) y esto siguió siendo así hasta la llegada de los teletipos, que exigían códigos totalmente diferentes y dejaron la cuestión sin resolver. [6]
La velocidad de envío en un telégrafo manual está limitada por la velocidad con la que el operador puede enviar cada elemento del código. Las velocidades se expresan normalmente en palabras por minuto . Las palabras no tienen todas la misma longitud, por lo que contarlas literalmente dará un resultado diferente según el contenido del mensaje. En cambio, una palabra se define como cinco caracteres con el fin de medir la velocidad, independientemente de cuántas palabras haya realmente en el mensaje. El código Morse, y muchos otros códigos, tampoco tienen la misma longitud de código para cada carácter de la palabra, lo que introduce de nuevo una variable relacionada con el contenido. Para superar esto, se utiliza la velocidad del operador que transmite repetidamente una palabra estándar. Clásicamente se elige PARIS como este estándar porque esa es la longitud de una palabra promedio en Morse. [7]
En el Morse americano, los caracteres son generalmente más cortos que en el Morse internacional. Esto se debe en parte a que el Morse americano utiliza más elementos de punto y en parte a que el guión más común, el guión corto, es más corto que el guión del Morse internacional (dos elementos de punto frente a tres). En principio, el Morse americano se transmitirá más rápido que el Morse internacional si todas las demás variables son iguales. En la práctica, hay dos cosas que lo perjudican. En primer lugar, el Morse americano, con alrededor de cinco elementos de codificación, era más difícil de obtener los tiempos correctos cuando se enviaba rápidamente. Los operadores inexpertos eran propensos a enviar mensajes ilegibles, un efecto conocido como hog Morse . La segunda razón es que el Morse americano es más propenso a la interferencia entre símbolos (ISI) debido a la mayor densidad de puntos muy espaciados. Este problema era particularmente grave en los cables telegráficos submarinos , lo que hacía que el Morse americano fuera menos adecuado para las comunicaciones internacionales. La única solución que un operador tenía a mano de inmediato para lidiar con la ISI era reducir la velocidad de transmisión. [8]
El código Morse para alfabetos no latinos , como el cirílico o el árabe , se logra construyendo una codificación de caracteres para el alfabeto en cuestión utilizando los mismos puntos de código, o casi los mismos, que se utilizan en el alfabeto latino . Los silabarios , como el katakana japonés , también se manejan de esta manera ( código Wabun ). La alternativa de agregar más puntos de código al código Morse para cada nuevo carácter daría como resultado transmisiones de código muy largas en algunos idiomas. [9]
Los idiomas que utilizan logogramas son más difíciles de manejar debido a la gran cantidad de caracteres necesarios. El código telegráfico chino utiliza un libro de códigos de unos 9.800 caracteres (7.000 cuando se lanzó originalmente en 1871), a los que se les asigna un número de cuatro dígitos. Son estos números los que se transmiten, por lo que el código Morse chino consta completamente de números. Los números deben buscarse en el extremo receptor, lo que hace que este sea un proceso lento, pero en la época en que el telégrafo se usaba ampliamente, los telegrafistas chinos expertos podían recordar muchos miles de los códigos comunes de memoria. El código telegráfico chino todavía lo utilizan las fuerzas del orden porque es un método inequívoco para registrar nombres chinos en escrituras no chinas. [10]
Los primeros telégrafos impresos continuaron utilizando el código Morse, pero el operador ya no enviaba los puntos y rayas directamente con una sola tecla. En su lugar, operaban un teclado de piano con los caracteres que se debían enviar marcados en cada tecla. La máquina generaba el punto de código Morse apropiado a partir de la pulsación de la tecla. Émile Baudot desarrolló un tipo de código completamente nuevo , patentado en 1874. El código Baudot era un código binario de 5 bits, con bits enviados en serie . Tener un código de longitud fija simplificó enormemente el diseño de la máquina. El operador ingresaba el código desde un pequeño teclado de piano de 5 teclas, cada tecla correspondía a un bit del código. Al igual que Morse, el código Baudot se organizó para minimizar la fatiga del operador con los puntos de código que requerían la menor cantidad de pulsaciones de teclas asignadas a las letras más comunes.
Los primeros telégrafos de imprenta requerían una sincronización mecánica entre la máquina emisora y la receptora. El telégrafo de imprenta Hughes de 1855 lo consiguió enviando un guión en código Morse en cada revolución de la máquina. Se adoptó una solución diferente junto con el código Baudot. Se añadieron bits de inicio y de parada a cada carácter en la transmisión, lo que permitió la comunicación serial asincrónica . Este esquema de bits de inicio y de parada se siguió en todos los códigos telegráficos importantes posteriores. [11]
En las líneas telegráficas congestionadas se utilizaba una variante del código Baudot con cinta de papel perforada . Se trataba del código Murray, inventado por Donald Murray en 1901. En lugar de transmitir directamente a la línea, las pulsaciones de teclas del operador perforaban agujeros en la cinta. Cada fila de agujeros a lo largo de la cinta tenía cinco posiciones posibles para perforar, correspondientes a los cinco bits del código Murray. A continuación, la cinta pasaba por un lector de cintas que generaba el código y lo enviaba por la línea telegráfica. La ventaja de este sistema era que se podían enviar múltiples mensajes a la línea muy rápidamente desde una cinta, lo que hacía un mejor uso de la línea que la operación manual directa.
Murray reorganizó por completo la codificación de caracteres para minimizar el desgaste de la máquina, ya que la fatiga del operador ya no era un problema. Por lo tanto, los conjuntos de caracteres de los códigos Baudot originales y Murray no son compatibles. Los cinco bits del código Baudot son insuficientes para representar todas las letras, números y signos de puntuación necesarios en un mensaje de texto. Además, los telégrafos de impresión requieren caracteres adicionales para controlar mejor la máquina. Ejemplos de estos caracteres de control son el avance de línea y el retorno de carro . Murray resolvió este problema introduciendo códigos de desplazamiento . Estos códigos indican a la máquina receptora que cambie la codificación de caracteres a un conjunto de caracteres diferente. Se utilizaron dos códigos de desplazamiento en el código Murray: desplazamiento de cifras y desplazamiento de letras. Otro carácter de control introducido por Murray fue el carácter de eliminación (DEL, código 11111) que perforaba los cinco agujeros de la cinta. Su propósito era eliminar caracteres erróneos de la cinta, pero Murray también utilizó varios DEL para marcar el límite entre los mensajes. Al tener todos los agujeros perforados se hacía una perforación que era fácil de rasgar en mensajes separados en el extremo receptor. Una variante del código Baudot-Murray se convirtió en un estándar internacional con el nombre de Alfabeto Telegráfico Internacional n.° 2 (ITA 2) en 1924. El "2" en ITA 2 se debe a que el código Baudot original se convirtió en la base para ITA 1. ITA 2 siguió siendo el código telegráfico estándar en uso hasta la década de 1960 y todavía se usaba en lugares mucho más allá de esa fecha. [12]
En 1915 se inventó el teletipo , un telégrafo impresor con un teclado similar al de una máquina de escribir en el que el operador teclea el mensaje. Sin embargo, los telegramas se siguieron enviando en mayúsculas solo porque no había espacio para un conjunto de caracteres en minúscula en los códigos Baudot-Murray o ITA 2.
Las organizaciones de noticias adoptaron rápidamente los teletipos y se desarrollaron " servicios de noticias " que suministraban artículos a varios periódicos, pero pronto surgió una aplicación adicional: enviar copias terminadas desde una sala de prensa urbana a una planta de impresión remota. El repertorio limitado de caracteres de los códigos de 5 niveles significaba que alguien tenía que volver a escribir manualmente el telegrama con mayúsculas y minúsculas, una operación laboriosa y propensa a errores.
El sistema Monotype ya tenía teclados y ruedas independientes que se comunicaban mediante una cinta de papel, pero utilizaba una cinta de papel muy ancha de 28 posiciones para seleccionar una de las 15 filas y 15 columnas de la caja matricial . Para competir, la Mergenthaler Linotype Company desarrolló un sistema TeleTypeSetter (TTS) que funcionaba de manera similar, pero utilizando un código de 6 niveles más estrecho (el nombre "bit" no se acuñaría hasta 1948 ) que era más económico de transmitir. TTS conservaba los caracteres de control de desplazamiento y anulación del desplazamiento , pero funcionaban de forma muy similar a un teclado moderno: el estado anulado proporcionaba letras minúsculas, dígitos y puntuación común, mientras que el estado de desplazamiento proporcionaba letras mayúsculas y símbolos especiales. TTS también incluía funciones específicas de Linotype, como ligaduras y una segunda función de desplazamiento de "riel superior" que se utiliza habitualmente para la tipografía cursiva .
Un "perforador" parecido a una máquina de escribir creaba una cinta de papel y tenía un dial grande que mostraba la longitud de la línea hasta el ancho de banda mínimo y máximo , de modo que el mecanógrafo podía decidir dónde cortar las líneas. Esta cinta se enviaba luego al "reperforador", y la cinta de papel recreada se introducía en una máquina Linotype con un lector de cinta en la planta de impresión. (El lector de cinta se podía adaptar a una máquina Linotype existente, pero también se fabricaron máquinas Linotype especiales de alta velocidad que podían funcionar más rápido de lo que un operador manual podía escribir a máquina).
Todavía se necesitaba un operador para manejar las cintas, llevar los tipos terminados al diseño, agregar metal para tipos según fuera necesario, eliminar atascos, etc., pero un operador podía gestionar varias máquinas Linotype.
Para mantener las perforaciones de alimentación en el medio de la cinta, el código TTS agregó una fila "0" al lado de la fila "1" en ITA-2. Para mostrar la similitud con el código ITS-2, las siguientes tablas están ordenadas como si este fuera el bit más significativo.
Cada estado de desplazamiento tiene 41 caracteres únicos, lo que hace un total de 82. Si sumamos los 8 caracteres de ancho fijo que se duplican en los dos estados de desplazamiento, obtenemos una capacidad de matriz de 90 caracteres de una máquina Linotype estándar. (Las bandas de espacio de ancho variable son un carácter número 91).
Las primeras computadoras utilizaban teclados e impresoras ITA-2 de 5 bits existentes debido a su fácil disponibilidad, pero el repertorio limitado de caracteres rápidamente se convirtió en un problema.
En la década de 1960, la mejora de la tecnología de teleimpresora hizo que los códigos más largos no fueran un factor tan significativo en los costos de los teleimpresores como lo fueron antes. Los usuarios de computadoras querían caracteres en minúscula y puntuación adicional, mientras que tanto los fabricantes de teleimpresoras como de computadoras deseaban deshacerse de los códigos de desplazamiento. Esto llevó a la Asociación Estadounidense de Estándares a desarrollar un código de 7 bits, el Código Estándar Americano para el Intercambio de Información ( ASCII ). La forma final de ASCII se publicó en 1964 y rápidamente se convirtió en el código estándar de teleimpresora. ASCII fue el último código importante desarrollado explícitamente con el equipo de telegrafía en mente. La telegrafía decayó rápidamente después de esto y fue reemplazada en gran medida por las redes de computadoras , especialmente Internet en la década de 1990.
El ASCII tenía varias características orientadas a ayudar a la programación informática. Los caracteres de las letras estaban en orden numérico de puntos de código, por lo que se podía lograr una clasificación alfabética simplemente ordenando los datos numéricamente. El punto de código para las letras mayúsculas y minúsculas correspondientes difería solo por el valor del bit 6, lo que permitía ordenar una mezcla de mayúsculas y minúsculas alfabéticamente si se ignoraba este bit. Se introdujeron otros códigos, en particular el EBCDIC de IBM derivado del método de entrada de tarjetas perforadas , pero fue el ASCII y sus derivados los que triunfaron como la lengua franca del intercambio de información informática. [18]
La llegada del microprocesador en la década de 1970 y la computadora personal en la década de 1980 con su arquitectura de 8 bits llevó a que el byte de 8 bits se convirtiera en la unidad estándar de almacenamiento de la computadora. Empaquetar datos de 7 bits en un almacenamiento de 8 bits es inconveniente para la recuperación de datos. En cambio, la mayoría de las computadoras almacenaban un carácter ASCII por byte. Esto dejaba un bit de sobra que no hacía nada útil. Los fabricantes de computadoras usaron este bit en ASCII extendido para superar algunas de las limitaciones del ASCII estándar. El problema principal era que ASCII estaba orientado al inglés, particularmente al inglés americano, y carecía de las vocales acentuadas que se usan en otros idiomas europeos como el francés. También se agregaron símbolos monetarios de otros países al conjunto de caracteres. Desafortunadamente, diferentes fabricantes implementaron diferentes ASCII extendidos, lo que los hizo incompatibles entre plataformas . En 1987, la Organización Internacional de Normalización emitió la norma ISO 8859-1 , para una codificación de caracteres de 8 bits basada en ASCII de 7 bits que fue ampliamente adoptada.
Las codificaciones de caracteres ISO 8859 se desarrollaron para alfabetos no latinos como el cirílico , el hebreo , el árabe y el griego . Esto seguía siendo problemático si un documento o dato utilizaba más de un alfabeto. Se requerían múltiples cambios entre codificaciones de caracteres. Esto se resolvió con la publicación en 1991 del estándar para Unicode de 16 bits , en desarrollo desde 1987. Unicode mantuvo los caracteres ASCII en los mismos puntos de código para compatibilidad. Además de soporte para alfabetos no latinos, Unicode proporcionó puntos de código para logogramas como caracteres chinos y muchos caracteres especializados como símbolos astrológicos y matemáticos. En 1996, Unicode 2.0 permitió puntos de código mayores a 16 bits; hasta 20 bits, y 21 bits con un área de uso privado adicional. Unicode de 20 bits proporcionó soporte para idiomas extintos como el alfabeto itálico antiguo y muchos caracteres chinos raramente utilizados. [19]
En 1931, el Código Internacional de Señales , creado originalmente para la comunicación de barcos mediante señales mediante banderas, se amplió añadiendo una colección de códigos de cinco letras para ser utilizados por los operadores de radiotelegrafía.
Una representación alternativa de los códigos de aguja es utilizar el número "1" para la aguja a la izquierda y el "3" para la aguja a la derecha. El número "2", que no aparece en la mayoría de los códigos, representa la aguja en posición vertical neutra. Los puntos de código que utilizan este esquema están marcados en la cara de algunos instrumentos de aguja, especialmente los que se utilizan para el entrenamiento. [32]
Cuando se utiliza con un telégrafo de impresión o un registrador de sifón , las "rayas" de los códigos de punto-raya suelen tener la misma longitud que el "punto". Normalmente, la marca en la cinta para un punto se hace encima de la marca para una raya. Un ejemplo de esto se puede ver en el código Steinheil de 1837, que es casi idéntico al código Steinheil de 1849, excepto que se representan de forma diferente en la tabla. El código Morse internacional se usaba comúnmente en esta forma en los cables telegráficos submarinos . [40]