stringtranslate.com

código baudot

Uno de los primeros teclados Baudot de "piano"

El código Baudot ( pronunciación francesa: [boˈdo] ) es una de las primeras codificaciones de caracteres para telegrafía inventada por Émile Baudot en la década de 1870. [1] Fue el predecesor del Alfabeto Telegráfico Internacional No. 2 (ITA2), el código de teletipo más común en uso antes del ASCII . Cada carácter del alfabeto está representado por una serie de cinco bits , enviados a través de un canal de comunicación como un cable de telégrafo o una señal de radio mediante comunicación en serie asíncrona . La medición de la velocidad de símbolo se conoce como baudios y se deriva del mismo nombre.

Historia

Código Baudot (ITA1)

En la siguiente tabla, las columnas I, II, III, IV y V muestran el código; el Let. y las columnas de la figura muestran las letras y números de las versiones continental y británica; y las claves de clasificación presentan la tabla en orden: alfabético, gris y Reino Unido.

Baudot desarrolló su primer telégrafo multiplexado en 1872 [2] [3] y lo patentó en 1874. [3] [4] En 1876, cambió de un código de seis bits a uno de cinco bits, [3] como sugirió Carl Friedrich Gauss y Wilhelm Weber en 1834, [2] [5] con intervalos iguales de encendido y apagado, lo que permitía la transmisión del alfabeto romano e incluía puntuación y señales de control. El código en sí no fue patentado (sólo la máquina) porque la ley de patentes francesa no permite patentar conceptos. [6]

El código de 5 bits de Baudot se adaptó para ser enviado desde un teclado manual y nunca se construyó ningún equipo de teleimpresor que lo utilizara en su forma original. [7] El código se introducía en un teclado que tenía sólo cinco teclas tipo piano y se operaba con dos dedos de la mano izquierda y tres dedos de la mano derecha. Una vez presionadas las teclas, se bloqueaban hasta que unos contactos mecánicos en una unidad distribuidora pasaban sobre el sector conectado a ese teclado en particular, momento en el que el teclado se desbloqueaba listo para ingresar el siguiente carácter, con un clic audible (conocido como "señal de cadencia") para advertir al operador. Los operadores debían mantener un ritmo constante y la velocidad habitual de funcionamiento era de 30 palabras por minuto. [8]

La tabla "muestra la asignación del código Baudot que se utilizó en la Oficina de Correos británica para servicios continentales e interiores. Varios caracteres del código continental se sustituyen por fracciones en el código interior. Se transmiten los elementos del código 1, 2 y 3 mediante las teclas 1, 2 y 3, y éstas se accionan con los tres primeros dedos de la mano derecha. Los elementos de código 4 y 5 se transmiten mediante las teclas 4 y 5, y éstas se accionan con los dos primeros dedos de la mano izquierda." [7] [9] [10]

El código de Baudot pasó a ser conocido como Alfabeto Telegráfico Internacional N° 1 ( ITA1 ). Ya no se usa.

código murray

Cinta de papel con agujeros que representa el "Código Baudot-Murray". Tenga en cuenta las columnas completamente perforadas de códigos "Eliminar/Seleccionar letras" al final del mensaje (a la derecha) que se utilizaron para cortar la banda fácilmente entre distintos mensajes. Los últimos símbolos antes de las columnas completamente perforadas al final son BRASIL CR LF CR FS (palabra Brasil, retorno de carro, avance de línea, retorno de carro, cambio a cifras)

En 1901, Donald Murray (1865-1945) modificó el código de Baudot , impulsado por el desarrollo de un teclado similar a una máquina de escribir. El sistema Murray empleó un paso intermedio; un perforador de teclado, que permitía al operador perforar una cinta de papel, y un transmisor de cinta para enviar el mensaje desde la cinta perforada . En el extremo receptor de la línea, un mecanismo de impresión imprimiría en una cinta de papel y/o se podría utilizar un reperforador para hacer una copia perforada del mensaje. [11] Como ya no había una conexión entre el movimiento de la mano del operador y los bits transmitidos, no hubo preocupación por organizar el código para minimizar la fatiga del operador y, en cambio, Murray diseñó el código para minimizar el desgaste de la maquinaria, asignando las combinaciones de códigos. con la menor cantidad de agujeros perforados hasta los caracteres más utilizados . [12] [13]

Por ejemplo, las letras de un orificio son E y T. Las diez letras de dos orificios son AOINSHRDLZ, muy similar al orden " Etaoin shrdlu " utilizado en las máquinas linotipia . Diez letras más, BCGFJMPUWY, tienen tres agujeros cada una, y las letras de cuatro agujeros son VXKQ.

El código Murray también introdujo lo que se conoció como "efectores de formato" o " caracteres de control ": los códigos CR (retorno de carro) y LF (salto de línea). Algunos de los códigos de Baudot se trasladaron a las posiciones en las que han permanecido desde entonces: el código NULL o BLANK y el código DEL. NULL/BLANK se usó como código inactivo cuando no se enviaban mensajes, pero se usó el mismo código para codificar la separación de espacios entre palabras. Se utilizaron secuencias de códigos DEL (columnas completamente perforadas) al principio o al final de los mensajes o entre ellos, lo que permitió una fácil separación de mensajes distintos. (Se podrían insertar códigos BELL en esas secuencias para indicar al operador remoto que estaba llegando un nuevo mensaje o que se había terminado la transmisión de un mensaje).

Las primeras máquinas británicas Creed también utilizaban el sistema Murray.

Western Union

Teclado de una teleimpresora que utiliza el código Baudot (variante estadounidense), con teclas de mayúsculas FIGS y LTRS

El código de Murray fue adoptado por Western Union , que lo utilizó hasta la década de 1950, con algunos cambios que consistieron en omitir algunos caracteres y agregar más códigos de control. Se introdujo un carácter SPC (espacio) explícito, en lugar de BLANK/NULL, y un nuevo código BEL hizo sonar una campana o produjo de otra manera una señal audible en el receptor. Además, la WRU o "¿Quién eres tú?" Se introdujo un código, lo que provocó que una máquina receptora enviara un flujo de identificación al remitente.

ITA2

En 1924, el CCITT introdujo el código del Alfabeto Telegráfico Internacional N° 2 ( ITA2 ) [14] como estándar internacional, que se basó en el código de Western Union con algunos cambios menores. Estados Unidos estandarizó una versión de ITA2 llamada código American Teletypewriter (US TTY), que fue la base para los códigos de teletipo de 5 bits hasta el debut del ASCII de 7 bits en 1963. [15]

Algunos puntos del código (marcados en azul en la tabla) estaban reservados para uso específico a nivel nacional. [dieciséis]

Un teclado de teletipo de cuatro filas con letras romanas y cirílicas.

De hecho, la posición del código asignada a Null se utilizaba sólo para el estado inactivo de los teleimpresores. Durante largos períodos de inactividad, la tasa de impulso no estaba sincronizada entre ambos dispositivos (que incluso podían estar apagados o no interconectados permanentemente en líneas telefónicas conmutadas). Para iniciar un mensaje, primero era necesario calibrar la tasa de impulso, una secuencia de pulsos de "marca" (1) sincronizados regularmente, mediante un grupo de cinco pulsos, que también podían detectarse mediante simples dispositivos electrónicos pasivos al encender el teleimpresor. Esta secuencia de pulsos generó una serie de caracteres de borrado/eliminación al mismo tiempo que inicializaba el estado del receptor al modo de cambio de letras. Sin embargo, el primer pulso podría perderse, por lo que este procedimiento de encendido podría terminar con un único carácter Nulo seguido inmediatamente por un carácter de Borrado/Eliminación. Para preservar la sincronización entre dispositivos, el código nulo no se podía usar arbitrariamente en medio de los mensajes (esto fue una mejora del sistema Baudot inicial donde los espacios no estaban explícitamente diferenciados, por lo que era difícil mantener los contadores de pulsos para espacios repetidos en teleimpresores). Pero entonces era posible resincronizar dispositivos en cualquier momento enviando un Null en medio de un mensaje (seguido inmediatamente de un control Erasure/Delete/LS si iba seguido de una letra, o de un control FS si iba seguido de una cifra). El envío de controles nulos tampoco provocó que la banda de papel avanzara a la siguiente fila (ya que no se perforó nada), por lo que esto ahorró longitudes preciosas de banda de papel perforable. Por otro lado, el código de control Borrar/Eliminar/LS siempre se marcaba y siempre se cambiaba al modo de letras (iniciales). Según algunas fuentes, el punto de código nulo estaba reservado únicamente para uso interno del país. [dieciséis]

El código de cambio a letras (LS) también se puede utilizar como una forma de cancelar/eliminar texto de una cinta perforada después de haber sido leído, lo que permite la destrucción segura de un mensaje antes de descartar la banda perforada. [ se necesita aclaración ] Funcionalmente, también puede desempeñar el mismo papel de relleno que el código de eliminación en ASCII (u otras codificaciones de 7 y 8 bits, incluido EBCDIC para tarjetas perforadas). Después de que los códigos de un fragmento de texto hayan sido reemplazados por un número arbitrario de códigos LS, lo que sigue aún se conserva y se puede decodificar. También se puede utilizar como iniciador para garantizar que la decodificación del primer código no proporcione un dígito u otro símbolo de la página de figuras (porque el código nulo se puede insertar arbitrariamente cerca del final o del comienzo de una banda de ponche, y debe ignorarse, mientras que el código de espacio es significativo en el texto).

Las celdas marcadas como reservadas para extensiones (que usan el código LS nuevamente por segunda vez, justo después del primer código LS, para pasar de la página de figuras a la página de cambio de letras) se han definido para cambiar a un nuevo modo. En este nuevo modo, la página de letras contiene solo letras minúsculas, pero conserva el acceso a una tercera página de códigos para letras mayúsculas, ya sea codificando una sola letra (enviando LS antes de esa letra) o bloqueando (con FS+LS) para un número ilimitado de letras mayúsculas o dígitos antes de desbloquear (con un solo LS) para volver al modo minúsculas. [18] La celda marcada como "Reservada" también se puede utilizar (usando el código FS de la página de cambio de cifras) para cambiar la página de cifras (que normalmente contiene dígitos y letras minúsculas o símbolos nacionales ) a una cuarta página (donde las letras nacionales están en mayúsculas y es posible que se codifiquen otros símbolos).

ITA2 todavía se utiliza en dispositivos de telecomunicaciones para sordos (TDD), télex y algunas aplicaciones de radioaficionados , como el radioteletipo ("RTTY"). ITA2 también se utiliza en Enhanced Broadcast Solution, un protocolo financiero de principios del siglo XXI especificado por Deutsche Börse , para reducir la huella de codificación de caracteres. [19]

Nomenclatura

Casi todos los equipos de teleimpresores del siglo XX utilizaban el código de Western Union, ITA2, o variantes del mismo. Los radioaficionados casualmente llaman incorrectamente a ITA2 y sus variantes "Baudot", [20] e incluso el Manual de radioaficionados de la American Radio Relay League lo hace, aunque en ediciones más recientes las tablas de códigos lo identifican correctamente como ITA2.

Conjunto de caracteres

Los valores que se muestran en cada celda son los puntos de código Unicode , proporcionados para comparación.

Variantes originales de Baudot

Baudot original, nacional en el Reino Unido.

Baudot original, europeo continental.

Baudot original, ITA 1

Variantes de Baudot-Murray

Código Murray

ITA 2 y EE.UU.-TTY

Código meteorológico

Los meteorólogos utilizaron una variante de ITA2 con los símbolos de cifras y cajas, excepto los diez dígitos, BEL y algunos otros caracteres, reemplazados por símbolos meteorológicos:

Codificación del teleimpresor meteorológico

Detalles

Nota: Esta tabla supone que el espacio llamado "1" por Baudot y Murray está más a la derecha y es el menos significativo. La forma en que los bits transmitidos se empaquetaban en códigos más grandes variaba según el fabricante. La solución más común asigna los bits desde el bit menos significativo hacia el bit más significativo (dejando los tres bits más significativos de un byte sin utilizar).

Tabla de códigos ITA2 (expresados ​​como números hexadecimales )

En ITA2, los caracteres se expresan mediante cinco bits. ITA2 utiliza dos subconjuntos de códigos, el "cambio de letras" (LTRS) y el "cambio de cifras" (FIGS). El carácter FIGS (11011) indica que los siguientes caracteres deben interpretarse como si estuvieran en el conjunto FIGS, hasta que el carácter LTRS (11111) lo restablezca. En uso, la tecla de cambio LTRS o FIGS se presiona y suelta, transmitiendo el carácter de cambio correspondiente a la otra máquina. Luego se escriben las letras o cifras deseadas. A diferencia de una máquina de escribir o un teclado de computadora moderno, la tecla Mayús no se mantiene presionada mientras se escriben los caracteres correspondientes. "ENQuiry" activará el contestador de la otra máquina. Significa "¿Quién eres?"

CR es retorno de carro , LF es avance de línea , BEL es el carácter de campana que hace sonar una pequeña campana (usado a menudo para alertar a los operadores sobre un mensaje entrante), SP es espacio y NUL es el carácter nulo (cinta en blanco).

Nota: las conversiones binarias de los puntos de código a menudo se muestran en orden inverso, dependiendo (presumiblemente) de qué lado se ve la cinta de papel. Tenga en cuenta además que los caracteres de "control" se eligieron de modo que fueran simétricos o en pares útiles para que insertar una cinta "al revés" no causara problemas al equipo y la impresión resultante pudiera descifrarse. Por lo tanto, FIGS (11011), LTRS (11111) y espacio (00100) son invariantes, mientras que CR (00010) y LF (01000), generalmente utilizados como un par, son tratados de la misma manera independientemente del orden por parte de los impresores de páginas. [22] LTRS también podría usarse para sobreperforar caracteres que se van a eliminar en una cinta de papel (muy parecido a DEL en ASCII de 7 bits ).

La secuencia RYRYRY... se utiliza a menudo en mensajes de prueba y al comienzo de cada transmisión. Dado que R es 01010 e Y es 10101, la secuencia ejercita gran parte de los componentes mecánicos de un teleimpresor bajo tensión máxima. Además, en un momento, la sintonización fina del receptor se realizaba mediante dos luces de colores (una para cada tono). 'RYRYRY...' produjo 0101010101..., lo que hacía que las luces brillaran con el mismo brillo cuando la sintonización era correcta. Esta secuencia de sintonización sólo es útil cuando ITA2 se utiliza con modulación FSK de dos tonos , como se ve comúnmente en el uso de radioteletipo (RTTY).

Las implementaciones estadounidenses del código Baudot pueden diferir en la adición de algunos caracteres, como # y en la capa FIGS.

La versión rusa del código Baudot ( MTK-2 ) utilizaba tres modos de cambio; el modo de letra cirílica fue activado por el carácter (00000). Debido al mayor número de caracteres del alfabeto cirílico, los caracteres ! , & , £ fueron omitidos y reemplazados por cirílicos, y BEL tiene el mismo código que la letra cirílica Ю. Se omiten las letras cirílicas Ъ y Ё y Ч se fusiona con el número 4.

Ver también

Notas explicatorias

  1. ^ abcd "A disposición de cada administración para su servicio interno" [21]
  2. ^ ab "[Da] corrección invisible en impresoras de páginas y *en impresoras de recibos". [21]

Referencias

  1. ^ Ralston, Antonio; Reilly, Edwin D., eds. (1993), "Código Baudot", Encyclopedia of Computer Science (Tercera ed.), Nueva York: IEEE Press/Van Nostrand Reinhold, ISBN 0-442-27679-6
  2. ^ ab HA Emmons (1 de mayo de 1916). "Sistemas de impresión". Comunicaciones por cable y radio . 34 : 209.
  3. ^ abc Fischer, Eric N. (20 de junio de 2000). "La evolución de los códigos de caracteres, 1874-1968". arca:/13960/t07x23w8s . Consultado el 20 de diciembre de 2020 . [...] En 1872, [Baudot] comenzó a investigar hacia un sistema de telégrafo que permitiría a múltiples operadores transmitir simultáneamente a través de un solo cable y, a medida que se recibieran las transmisiones, las imprimiría en caracteres alfabéticos ordinarios en una tira de papel. Recibió una patente para dicho sistema el 17 de junio de 1874. [...] En lugar de un retraso variable seguido de un pulso de una sola unidad, el sistema de Baudot utilizaba seis unidades de tiempo uniformes para transmitir cada carácter. [...] su primer telégrafo probablemente utilizó el código de seis unidades [...] que atribuye a Davy en un artículo de 1877. [...] Baudot rediseñó su equipo para utilizar un código de cinco unidades. Sin embargo, a veces todavía se necesitaban la puntuación y los dígitos, por lo que adoptó de Hughes el uso de dos caracteres especiales de espacio entre letras y figuras que harían que la impresora cambiara entre cajas al mismo tiempo que avanzaba el papel sin imprimir. El código de cinco unidades que comenzó a utilizar en ese momento [...] estaba estructurado para adaptarse a su teclado [...], que controlaba dos unidades de cada carácter con interruptores operados con la mano izquierda y las otras tres unidades con la derecha. mano. [...][1][2]
  4. ^ Baudot, Jean-Maurice-Émile (junio de 1874). "Système de télégraphie rapide" (en francés). Archivos del Instituto Nacional de la Propriété Industrielle (INPI). Patente Brevet 103.898. Archivado desde el original el 16 de diciembre de 2017.
  5. ^ William V. Vansize (25 de enero de 1901). "Un nuevo telégrafo de impresión de páginas". Transacciones . Instituto Americano de Ingenieros Eléctricos. 18 : 22.
  6. ^ Proceso de Amiens Baudot contra Mimault
  7. ^ ab Jennings, Tom (2020). "Una historia comentada de algunos códigos de caracteres: el código de Baudot".
  8. ^ Beauchamp, KG (2001). Historia de la Telegrafía: su tecnología y aplicación . Institución de Ingeniería y Tecnología . págs. 394–395. ISBN 0-85296-792-6.
  9. ^ Alan G. Hobbs, Códigos de 5 unidades , sección Sistema multiplex Baudot
  10. ^ Gleick, James (2011). La información: una historia, una teoría, una inundación. Londres: Cuarto Poder. pag. 203.ISBN _ 978-0-00-742311-8.
  11. ^ Foster, Maximilian (agosto de 1901). "Un telégrafo de impresión exitoso". El trabajo del mundo: una historia de nuestro tiempo . II : 1195-1199 . Consultado el 9 de julio de 2009 .
  12. ^ Copeland 2006, pag. 38
  13. ^ Edad del telégrafo y el teléfono. 1921. Asigné las letras más utilizadas en idioma inglés a las señales representadas por el menor número de agujeros en la cinta perforada, y así sucesivamente en proporción.
  14. ^ "BruXy: Comunicación por radioteletipo". 10 de octubre de 2005 . Consultado el 9 de mayo de 2016 . El código transmitido utiliza el Alfabeto Telegráfico Internacional No. 2 (ITA-2), que fue introducido por el CCITT en 1924.
  15. ^ Smith, Gil (2001). "Códigos de comunicación de teletipo" (PDF) . Baudot.net. Archivado (PDF) desde el original el 20 de agosto de 2008 . Consultado el 11 de julio de 2008 .
  16. ^ ab Steinbuch, Karl W .; Weber, Wolfgang, eds. (1974) [1967]. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín, Alemania: Springer Verlag . págs. 328–329. ISBN 3-540-06242-4. LCCN  73-80607. {{cite book}}: |work=ignorado ( ayuda )
  17. ^ datosIP limitado. "El Código" Baudot "". Archivado desde el original el 23 de diciembre de 2017 . Consultado el 16 de julio de 2017 .
  18. ^ Recomendación UIT-T S.2/11/1988, publicada en el fascículo VII.1 del Libro Azul
  19. ^ "Solución de transmisión mejorada: versión final de especificación de interfaz" (PDF) . Bolsa Alemana. 17 de mayo de 2010. Archivado desde el original (PDF) el 8 de febrero de 2012 . Consultado el 10 de agosto de 2011 .
  20. ^ Gillam, Richard (2002). Unicode desmitificado . Addison-Wesley. pag. 30.ISBN _ 0-201-70052-2.
  21. ^ abcdefghi "Códigos de cinco unidades". Museo NADCOMM. Archivado desde el original el 4 de noviembre de 1999 . Consultado el 5 de diciembre de 2001 .
  22. ^ Jennings, Tom (5 de febrero de 2020). "Un historial comentado de algunos códigos de caracteres: ITA2" . Consultado el 1 de junio de 2022 . [...] los caracteres relacionados con el 'control de transmisión' [...] son ​​simétricos en bits (los códigos para FIGS, LTRS, espacio y BLANK) son los mismos invertidos de izquierda a derecha. Además, los códigos para CR y LF son iguales cuando se invierten de izquierda a derecha.
  23. ^ Tocino, Francisco (1605). La competencia y el avance del aprendizaje divino y humano .

Otras lecturas

enlaces externos