stringtranslate.com

Código Baudot

Un teclado Baudot de "piano" temprano

El código Baudot ( pronunciación francesa: [bodo] ) es un sistema de codificación de caracteres para telegrafía inventado por Émile Baudot en la década de 1870. [1] Fue el predecesor del Alfabeto Telegráfico Internacional N.º 2 (ITA2), el código de teleimpresora más común en uso antes del ASCII . Cada carácter del alfabeto está representado por una serie de cinco bits , enviados a través de un canal de comunicación como un cable telegráfico o una señal de radio mediante comunicación serial asincrónica . La medida de la velocidad de símbolo se conoce como baudios y se deriva del mismo nombre.

Historia

Código Baudot (ITA1)

En la siguiente tabla, las columnas I, II, III, IV y V muestran el código; las columnas Let. y Fig. muestran las letras y números para las versiones continental y del Reino Unido; y las claves de clasificación presentan la tabla en el orden: alfabético, Gray y del Reino Unido.

Baudot desarrolló su primer telégrafo multiplexado en 1872 [2] [3] y lo patentó en 1874. [3] [4] En 1876, cambió de un código de seis bits a un código de cinco bits, [3] como lo sugirieron Carl Friedrich Gauss y Wilhelm Weber en 1834, [2] [5] con intervalos de encendido y apagado iguales, lo que permitió la transmisión del alfabeto romano e incluyó signos de puntuación y de control. El código en sí no fue patentado (solo la máquina) porque la ley de patentes francesa no permite patentar conceptos. [6]

El código de 5 bits de Baudot fue adaptado para ser enviado desde un teclado manual, y nunca se construyó ningún equipo de teleimpresora que lo utilizara en su forma original. [7] El código se ingresaba en un teclado que tenía solo cinco teclas tipo piano y se operaba usando dos dedos de la mano izquierda y tres dedos de la mano derecha. Una vez que se presionaban las teclas, se bloqueaban hasta que los contactos mecánicos en una unidad distribuidora pasaban por el sector conectado a ese teclado en particular, momento en el cual el teclado se desbloqueaba y estaba listo para que se ingresara el siguiente carácter, con un clic audible (conocido como la "señal de cadencia") para advertir al operador. Los operadores tenían que mantener un ritmo constante, y la velocidad habitual de operación era de 30 palabras por minuto. [8]

La tabla "muestra la asignación del código Baudot que se empleaba en la Oficina Postal Británica para los servicios continentales e interiores. Una serie de caracteres del código continental se sustituyen por fracciones en el código interior. Los elementos de código 1, 2 y 3 se transmiten mediante las teclas 1, 2 y 3, y se accionan con los tres primeros dedos de la mano derecha. Los elementos de código 4 y 5 se transmiten mediante las teclas 4 y 5, y se accionan con los dos primeros dedos de la mano izquierda". [7] [9] [10]

El código de Baudot pasó a conocerse como Alfabeto Telegráfico Internacional Nº 1 ( ITA1 ). Ya no se utiliza.

Código Murray

Cinta de papel con agujeros que representan el "Código Baudot-Murray". Observe las columnas completamente perforadas de códigos "Eliminar/Seleccionar letras" al final del mensaje (a la derecha), que se usaban para cortar la banda fácilmente entre mensajes distintos. Los últimos símbolos antes de las columnas completamente perforadas al final son BRASIL CR LF CR FS (palabra Brasil, retorno de carro, avance de línea, retorno de carro, cambio a cifras)

En 1901, el código de Baudot fue modificado por Donald Murray (1865-1945), motivado por su desarrollo de un teclado similar al de una máquina de escribir. El sistema Murray empleaba un paso intermedio: un operador utilizaba un perforador de teclado para perforar una cinta de papel y luego un transmisor para enviar el mensaje desde la cinta perforada . En el extremo receptor de la línea, un mecanismo de impresión imprimiría en una cinta de papel y/o un reperforador haría una copia perforada del mensaje. [11]

Como ya no había una conexión entre el movimiento de la mano del operador y los bits transmitidos, no hubo preocupación por organizar el código para minimizar la fatiga del operador. En cambio, Murray diseñó el código para minimizar el desgaste de la maquinaria asignando las combinaciones de códigos con la menor cantidad de agujeros perforados a los caracteres utilizados con más frecuencia . [12] [13] Por ejemplo, las letras de un agujero son E y T. Las diez letras de dos agujeros son AOINSHRDLZ, muy similares al orden " Etaoin shrdlu " utilizado en las máquinas Linotype . Diez letras más, BCGFJMPUWY, tienen tres agujeros cada una, y las letras de cuatro agujeros son VXKQ.

El código Murray también introdujo lo que se conoció como "afectadores de formato" o " caracteres de control ": los códigos CR (retorno de carro) y LF (salto de línea). Algunos de los códigos de Baudot se trasladaron a las posiciones en las que han permanecido desde entonces: el código NULL o BLANK y el código DEL. NULL/BLANK se utilizaba como código inactivo para cuando no se enviaban mensajes, pero el mismo código se utilizaba para codificar la separación de espacios entre palabras. Se utilizaban secuencias de códigos DEL (columnas completamente perforadas) al principio o al final de los mensajes o entre ellos, lo que facilitaba la separación de mensajes distintos. (Se podían insertar códigos BELL en esas secuencias para indicar al operador remoto que llegaba un nuevo mensaje o que la transmisión de un mensaje había finalizado).

Las primeras máquinas británicas Creed también utilizaban el sistema Murray.

Western Union

Teclado de un teleimpresor que utiliza el código Baudot (variante estadounidense), con teclas de desplazamiento FIGS y LTRS

El código de Murray fue adoptado por Western Union , que lo utilizó hasta la década de 1950, con algunos cambios que consistieron en omitir algunos caracteres y agregar más códigos de control. Se introdujo un carácter SPC (espacio) explícito, en lugar del BLANK/NULL, y un nuevo código BEL que hacía sonar una campana o producía una señal audible en el receptor. Además, se introdujo el código WRU o "Who aRe yOU?", que hacía que la máquina receptora enviara un flujo de identificación al remitente.

ITA2

En 1932, el CCITT introdujo el código Alfabeto Telegráfico Internacional N.º 2 ( ITA2 ) [14] como estándar internacional, que se basaba en el código de Western Union con algunos cambios menores. Estados Unidos estandarizó una versión del ITA2 llamada código de teletipo americano (US TTY), que fue la base de los códigos de teletipo de 5 bits hasta el debut del ASCII de 7 bits en 1963. [15]

Algunos puntos de código (marcados en azul en la tabla) se reservaron para uso específico a nivel nacional. [16]

Un teclado de teletipo de cuatro filas con letras romanas y cirílicas.

La posición del código asignada a Null se utilizaba de hecho sólo para el estado de reposo de los teleimpresores. Durante largos períodos de inactividad, la frecuencia de impulsos no estaba sincronizada entre ambos dispositivos (que incluso podían estar apagados o no estar interconectados permanentemente en líneas telefónicas conmutadas). Para iniciar un mensaje era necesario primero calibrar la frecuencia de impulsos, una secuencia de pulsos de "marca" sincronizados regularmente (1), mediante un grupo de cinco pulsos, que también podían ser detectados por dispositivos electrónicos pasivos simples para encender el teleimpresor. Esta secuencia de pulsos generaba una serie de caracteres de borrado/eliminación al mismo tiempo que inicializaba el estado del receptor al modo de cambio de letras. Sin embargo, el primer pulso podía perderse, por lo que este procedimiento de encendido podía terminarse con un solo Null seguido inmediatamente por un carácter de borrado/eliminación. Para preservar la sincronización entre dispositivos, el código Nulo no podía usarse arbitrariamente en medio de los mensajes (esto era una mejora con respecto al sistema Baudot inicial, donde los espacios no se diferenciaban explícitamente, por lo que era difícil mantener los contadores de pulsos para repetir los espacios en los teletipos). Pero entonces era posible resincronizar dispositivos en cualquier momento enviando un Nulo en medio de un mensaje (inmediatamente seguido por un control Erasure/Delete/LS si iba seguido de una letra, o por un control FS si iba seguido de una cifra). El envío de controles Nulo tampoco hacía que la banda de papel avanzara a la siguiente fila (ya que no se perforaba nada), por lo que esto ahorraba valiosas longitudes de banda de papel perforable. Por otro lado, el código de control Erasure/Delete/LS siempre se perforaba y siempre se cambiaba al modo de letras (inicial). Según algunas fuentes, el punto de código Nulo estaba reservado solo para uso interno de los países. [16]

El código Shift to Letters (LS) también se puede utilizar como una forma de cancelar/borrar texto de una cinta perforada después de que se haya leído, lo que permite la destrucción segura de un mensaje antes de descartar la banda perforada. [ aclaración necesaria ] Funcionalmente, también puede desempeñar el mismo papel de relleno que el código Delete en ASCII (u otras codificaciones de 7 bits y 8 bits, incluido EBCDIC para tarjetas perforadas). Después de que los códigos en un fragmento de texto se hayan reemplazado por un número arbitrario de códigos LS, lo que sigue aún se conserva y se puede decodificar. También se puede utilizar como iniciador para asegurarse de que la decodificación del primer código no dará un dígito u otro símbolo de la página de figuras (porque el código Nulo se puede insertar arbitrariamente cerca del final o el comienzo de una banda perforada y debe ignorarse, mientras que el código de Espacio es significativo en el texto).

Las celdas marcadas como reservadas para extensiones (que utilizan el código LS nuevamente una segunda vez, justo después del primer código LS, para cambiar de la página de figuras a la página de cambio de letras) se han definido para cambiar a un nuevo modo. En este nuevo modo, la página de letras contiene solo letras minúsculas, pero conserva el acceso a una tercera página de código para letras mayúsculas, ya sea codificando para una sola letra (enviando LS antes de esa letra), o bloqueando (con FS+LS) para un número ilimitado de letras mayúsculas o dígitos antes de desbloquear (con un solo LS) para volver al modo de minúsculas. [18] La celda marcada como "Reservada" también se puede utilizar (usando el código FS de la página de cambio de figuras) para cambiar la página de figuras (que normalmente contiene dígitos y letras minúsculas o símbolos nacionales ) a una cuarta página (donde las letras nacionales están en mayúsculas y se pueden codificar otros símbolos).

El ITA2 todavía se utiliza en dispositivos de telecomunicaciones para sordos (TDD), télex y algunas aplicaciones de radioaficionados , como el radioteletipo ("RTTY"). El ITA2 también se utiliza en Enhanced Broadcast Solution, un protocolo financiero de principios del siglo XXI especificado por Deutsche Börse , para reducir la huella de codificación de caracteres. [19]

Nomenclatura

Casi todos los equipos de teleimpresora del siglo XX utilizaban el código de Western Union, ITA2, o variantes del mismo. Los radioaficionados llaman a ITA2 y variantes "Baudot" de manera incorrecta, [20] e incluso el Manual de Radioaficionados de la American Radio Relay League lo hace, aunque en ediciones más recientes las tablas de códigos lo identifican correctamente como ITA2.

Conjunto de caracteres

Los valores que se muestran en cada celda son los puntos de código Unicode , proporcionados para comparación.

Variantes originales de Baudot

Baudot original, nacional del Reino Unido

Baudot original, Europa continental

Baudot original, ITA 1

Variantes de Baudot-Murray

Código Murray

ITA 2 y US-TTY

Código meteorológico

Los meteorólogos utilizaron una variante de ITA2 con los símbolos en mayúsculas y minúsculas, excepto los diez dígitos, BEL y algunos otros caracteres, reemplazados por símbolos meteorológicos:

Codificación de teleimpresora meteorológica

Detalles

Nota: Esta tabla presupone que el espacio denominado "1" por Baudot y Murray es el más a la derecha y el menos significativo. La forma en que se empaquetaban los bits transmitidos en códigos más grandes variaba según el fabricante. La solución más común asigna los bits desde el bit menos significativo hacia el bit más significativo (dejando sin utilizar los tres bits más significativos de un byte).

Tabla de códigos ITA2 (expresados ​​como números hexadecimales )

En ITA2, los caracteres se expresan utilizando cinco bits. ITA2 utiliza dos subconjuntos de códigos, el "desplazamiento de letras" (LTRS) y el "desplazamiento de cifras" (FIGS). El carácter FIGS (11011) indica que los caracteres siguientes deben interpretarse como pertenecientes al conjunto FIGS, hasta que éste se restablezca mediante el carácter LTRS (11111). [22] En uso, se presiona y suelta la tecla de desplazamiento LTRS o FIGS, transmitiendo el carácter de desplazamiento correspondiente a la otra máquina. A continuación, se escriben las letras o cifras deseadas. A diferencia de una máquina de escribir o un teclado de ordenador moderno, la tecla de desplazamiento no se mantiene pulsada mientras se escriben los caracteres correspondientes. "ENQuiry" activará la respuesta de la otra máquina. Significa "¿Quién es usted?".

CR es retorno de carro , LF es avance de línea , BEL es el carácter de campana que hace sonar una pequeña campana (a menudo utilizada para alertar a los operadores sobre un mensaje entrante), SP es espacio y NUL es el carácter nulo (cinta en blanco).

Nota: las conversiones binarias de los puntos de código se muestran a menudo en orden inverso, dependiendo (presumiblemente) de qué lado se mire la cinta de papel. Nótese además que los caracteres de "control" se eligieron de modo que fueran simétricos o en pares útiles para que insertar una cinta "al revés" no resultara en problemas para el equipo y la impresión resultante pudiera descifrarse. Por lo tanto, FIGS (11011), LTRS (11111) y el espacio (00100) son invariantes, mientras que CR (00010) y LF (01000), generalmente utilizados como un par, son tratados de la misma manera independientemente del orden por las impresoras de páginas. [23] LTRS también podría usarse para sobreperforar caracteres que se eliminarán en una cinta de papel (de manera muy similar a DEL en ASCII de 7 bits ).

La secuencia RYRYRY... se utiliza a menudo en mensajes de prueba y al comienzo de cada transmisión. Dado que R es 01010 e Y es 10101, la secuencia somete a gran parte de los componentes mecánicos de un teleimpresor a una tensión máxima. Además, en un tiempo, el ajuste fino del receptor se hacía utilizando dos luces de colores (una para cada tono). 'RYRYRY...' producía 0101010101..., lo que hacía que las luces brillaran con el mismo brillo cuando la sintonización era correcta. Esta secuencia de sintonización solo es útil cuando se utiliza ITA2 con modulación FSK de dos tonos , como se ve comúnmente en el uso de radioteletipo (RTTY).

Las implementaciones estadounidenses del código Baudot pueden diferir en la adición de algunos caracteres, como # y & en la capa FIGS.

La versión rusa del código Baudot ( MTK-2 ) utilizaba tres modos de cambio; el modo de letra cirílica se activaba con el carácter (00000). Debido a la mayor cantidad de caracteres en el alfabeto cirílico, se omitieron los caracteres ! , & y £ y se reemplazaron por caracteres cirílicos, y BEL tiene el mismo código que la letra cirílica Ю. Se omiten las letras cirílicas Ъ y Ё , y Ч se fusiona con el numeral 4.

Véase también

Notas explicativas

  1. ^ abcd "A disposición de cada administración para su servicio interno" [21]
  2. ^ ab "Proporciona corrección invisible en impresoras de páginas y *en impresoras de recibos". [21]

Referencias

  1. ^ Ralston, Anthony; Reilly, Edwin D., eds. (1993), "Código Baudot", Enciclopedia de Ciencias de la Computación (tercera edición), Nueva York: IEEE Press/Van Nostrand Reinhold, ISBN 0-442-27679-6
  2. ^ ab HA Emmons (1 de mayo de 1916). "Sistemas de impresora". Comunicaciones por cable y radio . 34 : 209.
  3. ^ abc Fischer, Eric N. (20 de junio de 2000). "La evolución de los códigos de caracteres, 1874-1968". ark:/13960/t07x23w8s . Consultado el 20 de diciembre de 2020 . [...] En 1872, [Baudot] comenzó a investigar sobre un sistema telegráfico que permitiera a varios operadores transmitir simultáneamente a través de un solo cable y, a medida que se recibían las transmisiones, las imprimiría en caracteres alfabéticos ordinarios en una tira de papel. Recibió una patente para dicho sistema el 17 de junio de 1874. [...] En lugar de un retraso variable seguido de un pulso de una sola unidad, el sistema de Baudot utilizaba seis unidades de tiempo uniformes para transmitir cada carácter. [...] su primer telégrafo probablemente utilizaba el código de seis unidades [...] que atribuye a Davy en un artículo de 1877. [...] en 1876 Baudot rediseñó su equipo para utilizar un código de cinco unidades. Sin embargo, a veces todavía se necesitaban signos de puntuación y dígitos, por lo que adoptó de Hughes el uso de dos caracteres especiales de espacio entre letras y cifras que hacían que la impresora cambiara de un caso a otro al mismo tiempo que avanzaba el papel sin imprimir. El código de cinco unidades que comenzó a utilizar en esa época [...] estaba estructurado para adaptarse a su teclado [...], que controlaba dos unidades de cada carácter con interruptores accionados con la mano izquierda y las otras tres unidades con la mano derecha. [...][1][2]
  4. ^ Baudot, Jean-Maurice-Émile (junio de 1874). "Système de télégraphie rapide" (en francés). Archivos del Instituto Nacional de la Propriété Industrielle (INPI). Patente Brevet 103.898. Archivado desde el original el 16 de diciembre de 2017.
  5. ^ William V. Vansize (25 de enero de 1901). "Un nuevo telégrafo con impresión de páginas". Transacciones . 18 . Instituto Americano de Ingenieros Eléctricos: 22.
  6. ^ Proceso de Amiens Baudot contra Mimault
  7. ^ ab Jennings, Tom (2020). "Una historia comentada de algunos códigos de caracteres: el código de Baudot".
  8. ^ Beauchamp, KG (2001). Historia de la telegrafía: su tecnología y aplicación . Instituto de Ingeniería y Tecnología . Págs. 394-395. ISBN. 0-85296-792-6.
  9. ^ Alan G. Hobbs, 5 Códigos de unidad , sección Sistema multiplex Baudot
  10. ^ Gleick, James (2011). La información: una historia, una teoría, un diluvio. Londres: Fourth Estate. p. 203. ISBN 978-0-00-742311-8.
  11. ^ Foster, Maximilian (agosto de 1901). "Un telégrafo impreso de éxito". El trabajo del mundo: una historia de nuestro tiempo . II : 1195–1199 . Consultado el 9 de julio de 2009 .
  12. ^ Copeland 2006, pág. 38
  13. ^ Telegraph and Telephone Age. 1921. Asigné las letras más frecuentemente utilizadas en el idioma inglés a las señales representadas por la menor cantidad de agujeros en la cinta perforada, y así sucesivamente en proporción.
  14. «Reglamento Telegráfico y Protocolo Final (Madrid, 1932)» (PDF) . Archivado desde el original el 21 de agosto de 2023. Consultado el 10 de mayo de 2024 .
  15. ^ Smith, Gil (2001). «Teletype Communication Codes» (PDF) . Baudot.net. Archivado (PDF) desde el original el 20 de agosto de 2008. Consultado el 11 de julio de 2008 .
  16. ^ ab Steinbuch, Karl W .; Weber, Wolfgang, eds. (1974) [1967]. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín, Alemania: Springer Verlag . págs. 328–329. ISBN 3-540-06242-4. Número de LCCN  73-80607. {{cite book}}: |work=ignorado ( ayuda )
  17. ^ dataIP Limited. «El código «Baudot»». Archivado desde el original el 23 de diciembre de 2017. Consultado el 16 de julio de 2017 .
  18. ^ Recomendación UIT-T S.2/11/1988, publicada en el fascículo VII.1 del Libro Azul
  19. ^ "Enhanced Broadcast Solution – Interface Specification Final Version" (PDF) . Deutsche Börse. 17 de mayo de 2010. Archivado desde el original (PDF) el 8 de febrero de 2012 . Consultado el 10 de agosto de 2011 .
  20. ^ Gillam, Richard (2002). Unicode desmitificado . Addison-Wesley. pág. 30. ISBN 0-201-70052-2.
  21. ^ abcdefghi «Códigos de cinco unidades». Museo NADCOMM. Archivado desde el original el 4 de noviembre de 1999. Consultado el 5 de diciembre de 2001 .
  22. ^ Este artículo se basa en material tomado de Baudot+code en el Diccionario gratuito en línea de computación antes del 1 de noviembre de 2008 e incorporado bajo los términos de "relicencia" del GFDL , versión 1.3 o posterior.
  23. ^ Jennings, Tom (5 de febrero de 2020). "Una historia anotada de algunos códigos de caracteres: ITA2" . Consultado el 1 de junio de 2022 . [...] los caracteres relacionados con el "control de transmisión" [...] son ​​simétricos a nivel de bits: los códigos para FIGS, LTRS, espacio y BLANK son los mismos cuando se invierten de izquierda a derecha. Además, los códigos para CR y LF son iguales entre sí cuando se invierten de izquierda a derecha.
  24. ^ Bacon, Francis (1605). La eficiencia y el avance del conocimiento divino y humano .

Lectura adicional

Enlaces externos