El código Baudot ( pronunciación francesa: [bodo] ) es un sistema de codificación de caracteres para telegrafía inventado por Émile Baudot en la década de 1870. [1] Fue el predecesor del Alfabeto Telegráfico Internacional N.º 2 (ITA2), el código de teleimpresora más común en uso antes del ASCII . Cada carácter del alfabeto está representado por una serie de cinco bits , enviados a través de un canal de comunicación como un cable telegráfico o una señal de radio mediante comunicación serial asincrónica . La medida de la velocidad de símbolo se conoce como baudios y se deriva del mismo nombre.
En la siguiente tabla, las columnas I, II, III, IV y V muestran el código; las columnas Let. y Fig. muestran las letras y números para las versiones continental y del Reino Unido; y las claves de clasificación presentan la tabla en el orden: alfabético, Gray y del Reino Unido.
Baudot desarrolló su primer telégrafo multiplexado en 1872 [2] [3] y lo patentó en 1874. [3] [4] En 1876, cambió de un código de seis bits a un código de cinco bits, [3] como lo sugirieron Carl Friedrich Gauss y Wilhelm Weber en 1834, [2] [5] con intervalos de encendido y apagado iguales, lo que permitió la transmisión del alfabeto romano e incluyó signos de puntuación y de control. El código en sí no fue patentado (solo la máquina) porque la ley de patentes francesa no permite patentar conceptos. [6]
El código de 5 bits de Baudot fue adaptado para ser enviado desde un teclado manual, y nunca se construyó ningún equipo de teleimpresora que lo utilizara en su forma original. [7] El código se ingresaba en un teclado que tenía solo cinco teclas tipo piano y se operaba usando dos dedos de la mano izquierda y tres dedos de la mano derecha. Una vez que se presionaban las teclas, se bloqueaban hasta que los contactos mecánicos en una unidad distribuidora pasaban por el sector conectado a ese teclado en particular, momento en el cual el teclado se desbloqueaba y estaba listo para que se ingresara el siguiente carácter, con un clic audible (conocido como la "señal de cadencia") para advertir al operador. Los operadores tenían que mantener un ritmo constante, y la velocidad habitual de operación era de 30 palabras por minuto. [8]
La tabla "muestra la asignación del código Baudot que se empleaba en la Oficina Postal Británica para los servicios continentales e interiores. Una serie de caracteres del código continental se sustituyen por fracciones en el código interior. Los elementos de código 1, 2 y 3 se transmiten mediante las teclas 1, 2 y 3, y se accionan con los tres primeros dedos de la mano derecha. Los elementos de código 4 y 5 se transmiten mediante las teclas 4 y 5, y se accionan con los dos primeros dedos de la mano izquierda". [7] [9] [10]
El código de Baudot pasó a conocerse como Alfabeto Telegráfico Internacional N° 1 ( ITA1 ). Ya no se utiliza.
En 1901, el código de Baudot fue modificado por Donald Murray (1865-1945), motivado por su desarrollo de un teclado similar al de una máquina de escribir. El sistema Murray empleaba un paso intermedio: un operador utilizaba un perforador de teclado para perforar una cinta de papel y luego un transmisor para enviar el mensaje desde la cinta perforada . En el extremo receptor de la línea, un mecanismo de impresión imprimiría en una cinta de papel y/o un reperforador haría una copia perforada del mensaje. [11]
Como ya no había una conexión entre el movimiento de la mano del operador y los bits transmitidos, no hubo preocupación por organizar el código para minimizar la fatiga del operador. En cambio, Murray diseñó el código para minimizar el desgaste de la maquinaria asignando las combinaciones de códigos con la menor cantidad de agujeros perforados a los caracteres utilizados con más frecuencia . [12] [13] Por ejemplo, las letras de un agujero son E y T. Las diez letras de dos agujeros son AOINSHRDLZ, muy similares al orden " Etaoin shrdlu " utilizado en las máquinas Linotype . Diez letras más, BCGFJMPUWY, tienen tres agujeros cada una, y las letras de cuatro agujeros son VXKQ.
El código Murray también introdujo lo que se conoció como "afectadores de formato" o " caracteres de control ": los códigos CR (retorno de carro) y LF (salto de línea). Algunos de los códigos de Baudot se trasladaron a las posiciones en las que han permanecido desde entonces: el código NULL o BLANK y el código DEL. NULL/BLANK se utilizaba como código inactivo para cuando no se enviaban mensajes, pero el mismo código se utilizaba para codificar la separación de espacios entre palabras. Se utilizaban secuencias de códigos DEL (columnas completamente perforadas) al principio o al final de los mensajes o entre ellos, lo que facilitaba la separación de mensajes distintos. (Se podían insertar códigos BELL en esas secuencias para indicar al operador remoto que llegaba un nuevo mensaje o que la transmisión de un mensaje había finalizado).
Las primeras máquinas Creed británicas también utilizaban el sistema Murray.
El código de Murray fue adoptado por Western Union , que lo utilizó hasta la década de 1950, con algunos cambios que consistieron en omitir algunos caracteres y agregar más códigos de control. Se introdujo un carácter SPC (espacio) explícito en lugar del BLANK/NULL, y un nuevo código BEL que hacía sonar una campana o producía una señal audible en el receptor. Además, se introdujo el código WRU o "Who aRe yOU?", que hacía que la máquina receptora enviara un flujo de identificación al remitente.
En 1932, el CCITT introdujo el código Alfabeto Telegráfico Internacional N.º 2 ( ITA2 ) [14] como estándar internacional, que se basaba en el código de Western Union con algunos cambios menores. Estados Unidos estandarizó una versión del ITA2 llamada código de teletipo americano (US TTY), que fue la base de los códigos de teletipo de 5 bits hasta el debut del ASCII de 7 bits en 1963. [15]
Algunos puntos de código (marcados en azul en la tabla) se reservaron para uso específico a nivel nacional. [16]
La posición del código asignada a Null se utilizaba de hecho sólo para el estado de reposo de los teleimpresores. Durante largos períodos de inactividad, la frecuencia de impulsos no estaba sincronizada entre ambos dispositivos (que incluso podían estar apagados o no estar interconectados permanentemente en líneas telefónicas conmutadas). Para iniciar un mensaje era necesario primero calibrar la frecuencia de impulsos, una secuencia de pulsos de "marca" sincronizados regularmente (1), mediante un grupo de cinco pulsos, que también podían ser detectados por dispositivos electrónicos pasivos simples para encender el teleimpresor. Esta secuencia de pulsos generaba una serie de caracteres de borrado/eliminación al mismo tiempo que inicializaba el estado del receptor al modo de cambio de letras. Sin embargo, el primer pulso podía perderse, por lo que este procedimiento de encendido podía terminarse con un solo Null seguido inmediatamente por un carácter de borrado/eliminación. Para preservar la sincronización entre dispositivos, el código Nulo no podía usarse arbitrariamente en medio de los mensajes (esto era una mejora con respecto al sistema Baudot inicial, donde los espacios no se diferenciaban explícitamente, por lo que era difícil mantener los contadores de pulsos para repetir los espacios en los teletipos). Pero entonces era posible resincronizar dispositivos en cualquier momento enviando un Nulo en medio de un mensaje (inmediatamente seguido por un control Erasure/Delete/LS si iba seguido de una letra, o por un control FS si iba seguido de una cifra). El envío de controles Nulo tampoco hacía que la banda de papel avanzara a la siguiente fila (ya que no se perforaba nada), por lo que esto ahorraba valiosas longitudes de banda de papel perforable. Por otro lado, el código de control Erasure/Delete/LS siempre se perforaba y siempre se cambiaba al modo de letras (inicial). Según algunas fuentes, el punto de código Nulo estaba reservado solo para uso interno de los países. [16]
El código Shift to Letters (LS) también se puede utilizar como una forma de cancelar/borrar texto de una cinta perforada después de que se haya leído, lo que permite la destrucción segura de un mensaje antes de descartar la banda perforada. [ aclaración necesaria ] Funcionalmente, también puede desempeñar el mismo papel de relleno que el código Delete en ASCII (u otras codificaciones de 7 bits y 8 bits, incluido EBCDIC para tarjetas perforadas). Después de que los códigos en un fragmento de texto se hayan reemplazado por un número arbitrario de códigos LS, lo que sigue aún se conserva y se puede decodificar. También se puede utilizar como iniciador para asegurarse de que la decodificación del primer código no dará un dígito u otro símbolo de la página de figuras (porque el código Nulo se puede insertar arbitrariamente cerca del final o el comienzo de una banda perforada y debe ignorarse, mientras que el código de Espacio es significativo en el texto).
Las celdas marcadas como reservadas para extensiones (que utilizan el código LS nuevamente una segunda vez, justo después del primer código LS, para cambiar de la página de figuras a la página de cambio de letras) se han definido para cambiar a un nuevo modo. En este nuevo modo, la página de letras contiene solo letras minúsculas, pero conserva el acceso a una tercera página de código para letras mayúsculas, ya sea codificando para una sola letra (enviando LS antes de esa letra), o bloqueando (con FS+LS) para un número ilimitado de letras mayúsculas o dígitos antes de desbloquear (con un solo LS) para volver al modo de minúsculas. [18] La celda marcada como "Reservada" también se puede utilizar (usando el código FS de la página de cambio de figuras) para cambiar la página de figuras (que normalmente contiene dígitos y letras minúsculas o símbolos nacionales ) a una cuarta página (donde las letras nacionales están en mayúsculas y se pueden codificar otros símbolos).
El ITA2 todavía se utiliza en dispositivos de telecomunicaciones para sordos (TDD), télex y algunas aplicaciones de radioaficionados , como el radioteletipo ("RTTY"). El ITA2 también se utiliza en Enhanced Broadcast Solution, un protocolo financiero de principios del siglo XXI especificado por Deutsche Börse , para reducir la huella de codificación de caracteres. [19]
Casi todos los equipos de teleimpresora del siglo XX utilizaban el código de Western Union, ITA2, o variantes del mismo. Los radioaficionados llaman a ITA2 y variantes "Baudot" de manera incorrecta, [20] e incluso el Manual de Radioaficionados de la American Radio Relay League lo hace, aunque en ediciones más recientes las tablas de códigos lo identifican correctamente como ITA2.
Los valores que se muestran en cada celda son los puntos de código Unicode , proporcionados para comparación.
Los meteorólogos utilizaron una variante de ITA2 con los símbolos en mayúsculas y minúsculas, excepto los diez dígitos, BEL y algunos otros caracteres, reemplazados por símbolos meteorológicos:
Nota: Esta tabla presupone que el espacio denominado "1" por Baudot y Murray es el más a la derecha y el menos significativo. La forma en que se empaquetaban los bits transmitidos en códigos más grandes variaba según el fabricante. La solución más común asigna los bits desde el bit menos significativo hacia el bit más significativo (dejando sin utilizar los tres bits más significativos de un byte).
En ITA2, los caracteres se expresan utilizando cinco bits. ITA2 utiliza dos subconjuntos de códigos, el "desplazamiento de letras" (LTRS) y el "desplazamiento de cifras" (FIGS). El carácter FIGS (11011) indica que los caracteres siguientes deben interpretarse como pertenecientes al conjunto FIGS, hasta que éste se restablezca mediante el carácter LTRS (11111). [22] En uso, se presiona y suelta la tecla de desplazamiento LTRS o FIGS, transmitiendo el carácter de desplazamiento correspondiente a la otra máquina. A continuación, se escriben las letras o cifras deseadas. A diferencia de una máquina de escribir o un teclado de ordenador moderno, la tecla de desplazamiento no se mantiene pulsada mientras se escriben los caracteres correspondientes. "ENQuiry" activará la respuesta de la otra máquina. Significa "¿Quién es usted?".
CR es retorno de carro , LF es avance de línea , BEL es el carácter de campana que hace sonar una pequeña campana (a menudo utilizada para alertar a los operadores sobre un mensaje entrante), SP es espacio y NUL es el carácter nulo (cinta en blanco).
Nota: las conversiones binarias de los puntos de código se muestran a menudo en orden inverso, dependiendo (presumiblemente) de qué lado se mire la cinta de papel. Nótese además que los caracteres de "control" se eligieron de modo que fueran simétricos o en pares útiles para que insertar una cinta "al revés" no resultara en problemas para el equipo y la impresión resultante pudiera descifrarse. Por lo tanto, FIGS (11011), LTRS (11111) y el espacio (00100) son invariantes, mientras que CR (00010) y LF (01000), generalmente utilizados como un par, son tratados de la misma manera independientemente del orden por las impresoras de páginas. [23] LTRS también podría usarse para sobreperforar caracteres que se eliminarán en una cinta de papel (de manera muy similar a DEL en ASCII de 7 bits ).
La secuencia RYRYRY... se utiliza a menudo en mensajes de prueba y al comienzo de cada transmisión. Dado que R es 01010 e Y es 10101, la secuencia somete a gran parte de los componentes mecánicos de un teleimpresor a una tensión máxima. Además, en un tiempo, el ajuste fino del receptor se hacía utilizando dos luces de colores (una para cada tono). 'RYRYRY...' producía 0101010101..., lo que hacía que las luces brillaran con el mismo brillo cuando la sintonización era correcta. Esta secuencia de sintonización solo es útil cuando se utiliza ITA2 con modulación FSK de dos tonos , como se ve comúnmente en el uso de radioteletipo (RTTY).
Las implementaciones estadounidenses del código Baudot pueden diferir en la adición de algunos caracteres, como # y & en la capa FIGS.
La versión rusa del código Baudot ( MTK-2 ) utilizaba tres modos de cambio; el modo de letra cirílica se activaba con el carácter (00000). Debido a la mayor cantidad de caracteres en el alfabeto cirílico, se omitieron los caracteres ! , & y £ y se reemplazaron por caracteres cirílicos, y BEL tiene el mismo código que la letra cirílica Ю. Se omiten las letras cirílicas Ъ y Ё , y Ч se fusiona con el numeral 4.
*
en impresoras de recibos". [21] [...] En 1872, [Baudot] comenzó a investigar sobre un sistema telegráfico que permitiera a varios operadores transmitir simultáneamente a través de un solo cable y, a medida que se recibían las transmisiones, las imprimiría en caracteres alfabéticos ordinarios en una tira de papel. Recibió una patente para dicho sistema el 17 de junio de 1874. [...] En lugar de un retraso variable seguido de un pulso de una sola unidad, el sistema de Baudot utilizaba seis unidades de tiempo uniformes para transmitir cada carácter. [...] su primer telégrafo probablemente utilizaba el código de seis unidades [...] que atribuye a
Davy
en un artículo de 1877. [...] en 1876 Baudot rediseñó su equipo para utilizar un código de cinco unidades. Sin embargo, a veces todavía se necesitaban signos de puntuación y dígitos, por lo que adoptó de
Hughes
el uso de dos caracteres especiales de espacio entre letras y cifras que hacían que la impresora cambiara de un caso a otro al mismo tiempo que avanzaba el papel sin imprimir. El código de cinco unidades que comenzó a utilizar en esa época [...] estaba estructurado para adaptarse a su teclado [...], que controlaba dos unidades de cada carácter con interruptores accionados con la mano izquierda y las otras tres unidades con la mano derecha. [...][1][2]
Asigné las letras más frecuentemente utilizadas en el idioma inglés a las señales representadas por la menor cantidad de agujeros en la cinta perforada, y así sucesivamente en proporción.
{{cite book}}
: |work=
ignorado ( ayuda )[...] los caracteres relacionados con el "control de transmisión" [...] son simétricos a nivel de bits: los códigos para FIGS, LTRS, espacio y BLANK son los mismos cuando se invierten de izquierda a derecha. Además, los códigos para CR y LF son iguales entre sí cuando se invierten de izquierda a derecha.