Estándar internacional para ASCII de 7 bits y modificaciones nacionales
ISO/IEC 646 es un conjunto de normas ISO / IEC , descritas como Tecnología de la información — Conjunto de caracteres codificados ISO de 7 bits para el intercambio de información , y desarrolladas en cooperación con ASCII al menos desde 1964. [1] [2] Desde su primera edición en 1967 [3] ha especificado un código de caracteres de 7 bits del cual se derivan varias normas nacionales.
La ISO/IEC 646 también fue ratificada por la ECMA como ECMA-6 . La primera versión de la ECMA-6 se había publicado en 1965, [4] basándose en el trabajo que el Comité Técnico TC1 de la ECMA había llevado a cabo desde diciembre de 1960. [4]
Los caracteres del conjunto de caracteres básicos de la norma ISO/IEC 646 son caracteres invariables . [5] Dado que esa parte de la norma ISO/IEC 646, es decir, el conjunto de caracteres invariables compartido por todos los países, especificaba únicamente las letras utilizadas en el alfabeto latino básico de la norma ISO , los países que utilizaban letras adicionales debían crear variantes nacionales de la norma ISO/IEC 646 para poder utilizar sus alfabetos nativos. Dado que la transmisión y el almacenamiento de códigos de 8 bits no era estándar en ese momento, los caracteres nacionales tuvieron que ajustarse a las limitaciones de 7 bits, lo que significa que algunos caracteres que aparecen en ASCII no aparecen en otras variantes nacionales de la norma ISO/IEC 646.
Historia
La norma ISO/IEC 646 y su predecesora ASCII (ASA X3.4) respaldaron en gran medida la práctica existente respecto a las codificaciones de caracteres en la industria de las telecomunicaciones .
Como ASCII no proporcionaba una cantidad de caracteres necesarios para idiomas distintos del inglés, se crearon varias variantes nacionales que sustituyeron algunos caracteres menos utilizados por otros necesarios. Debido a la incompatibilidad de las diversas variantes nacionales, se introdujo una versión de referencia internacional (IRV) de ISO/IEC 646, en un intento de al menos restringir el conjunto reemplazado a los mismos caracteres en todas las variantes. La versión original (ISO 646 IRV) se diferenciaba de ASCII solo en que el punto de código 0x24, el signo de dólar de ASCII ($) fue reemplazado por el símbolo de moneda internacional (¤). La versión final de 1991 del código ISO/IEC 646:1991 también se conoce como ITU T.50 , Alfabeto de referencia internacional o IRA, anteriormente Alfabeto internacional n.º 5 (IA5). Esta norma permite a los usuarios ejercitar los 12 caracteres variables (es decir, dos caracteres gráficos alternativos y 10 caracteres definidos a nivel nacional). Entre estos ejercicios, la norma ISO 646:1991 IRV (International Reference Version) está explícitamente definida y es idéntica a ASCII . [6]
La serie de normas ISO/IEC 8859 que regulan las codificaciones de caracteres de 8 bits sustituye a la norma internacional ISO/IEC 646 y sus variantes nacionales, al proporcionar 96 caracteres adicionales con el bit adicional y evitar así cualquier sustitución de códigos ASCII. La norma ISO/IEC 10646 , directamente relacionada con Unicode , sustituye a todos los conjuntos ISO646 e ISO/IEC 8859 con un conjunto unificado de codificaciones de caracteres que utilizan un valor mayor de 21 bits.
Un legado de ISO/IEC 646 es visible en Windows, donde en muchas configuraciones regionales de Asia Oriental el carácter de barra invertida usado en los nombres de archivo se representa como ¥ u otros caracteres como ₩ . A pesar del hecho de que un código diferente para ¥ estaba disponible incluso en la página de códigos 437 del IBM PC original , y un código de doble byte separado para ¥ está disponible en Shift JIS (aunque esto a menudo usa mapeo alternativo ), tanto texto fue creado con el código de barra invertida usado para ¥ (debido a que Shift_JIS está oficialmente basado en ISO 646:JP, aunque Microsoft lo mapea como ASCII) que incluso las fuentes modernas de Windows han encontrado necesario representar el código de esa manera. Una situación similar existe con ₩ y EUC-KR . Otro legado es la existencia de trígrafos en el lenguaje de programación C .
Normas publicadas
ECMA-6 (1965-04-30), primera edición (retirada) [4]
ISO/R646-1967 (retirada), [3] o ECMA-6 (1967-06), segunda edición (retirada) [3] [4]
ISO 646:1972 (retirada), o ECMA-6 (1973-08), cuarta edición (retirada) [4] [7]
ISO 646:1983 (retirada), [8] o ECMA-6 (1984-12, 1985-03), quinta edición (retirada) [4]
Recomendación UIT-T T.50 IA5 (1988-11-25) (retirada), [9] [10] o ISO/IEC 646:1991 (en vigor), [11] [12] o ECMA-6 (1991-12, 1997-08), sexta edición (en vigor) [11]
Recomendación UIT-T T.50 IRA (1992-09-18) (en vigor) [9] [13]
Diseño de la página de códigos
La siguiente tabla muestra el conjunto de caracteres invariantes ISO/IEC 646. Cada carácter se muestra con su equivalente Unicode . Los puntos de código nacionales están en gris con el carácter ASCII que se reemplaza. El amarillo indica un carácter que, en algunas regiones, podría combinarse con un carácter anterior como diacrítico utilizando el carácter de retroceso , lo que puede afectar la elección del glifo .
Además de las restricciones de conjunto invariantes, 0x23 está restringido a ser # o £ y 0x24 está restringido a ser $ o ¤ en ECMA-6:1991, equivalente a ISO/IEC 646:1991. [11] Sin embargo, estas restricciones no se cumplen en todas las variantes nacionales. [14] [15]
Códigos de variantes y descripciones
Variantes nacionales de la norma ISO/IEC 646
Algunas variantes nacionales de la norma ISO/IEC 646 son las siguientes:
Derivados nacionales
También existen algunos conjuntos de caracteres nacionales que se basan en la norma ISO/IEC 646 pero que no siguen estrictamente su conjunto invariante (véase también § Derivados de otros alfabetos):
Personajes de control
Todas las variantes enumeradas anteriormente son únicamente conjuntos de caracteres gráficos y deben utilizarse con un conjunto de caracteres de control C0 como el que se detalla en la siguiente tabla:
Conjuntos de caracteres complementarios asociados
La siguiente tabla enumera conjuntos de caracteres gráficos complementarios definidos por la misma norma como variantes específicas de ISO/IEC 646. Estos se seleccionarían mediante un mecanismo como el desplazamiento hacia afuera o el superdesplazamiento NATS (desplazamiento simple), [49] o configurando el octavo bit en entornos donde estuviera disponible:
Cuadro comparativo de variantes
En la siguiente tabla se detallan los cambios específicos de algunas de estas variantes. No se muestran las asignaciones de caracteres que no han cambiado en todas las variantes enumeradas (es decir, que siguen siendo iguales que ASCII).
Para facilitar la comparación, las variantes detalladas incluyen variantes nacionales de ISO/IEC 646, la serie de caracteres de reemplazo nacionales (NRCS) estrechamente relacionada de DEC que se utiliza en terminales VT200 , la serie de codificación de teletexto del Sistema Mundial Europeo relacionada definida en ETS 300 706 y algunas otras codificaciones estrechamente relacionadas basadas en ISO/IEC 646. Los gráficos de códigos individuales están vinculados desde la segunda columna. Las celdas con fondo que no es blanco enfatizan las diferencias con US-ASCII (también el subconjunto de latín básico de ISO/IEC 10646 y Unicode).
Más tarde, cuando conjuntos de caracteres más amplios ganaron mayor aceptación, ISO/IEC 8859 , los conjuntos de caracteres específicos del proveedor y, finalmente, Unicode se convirtieron en los métodos preferidos para codificar la mayoría de estas variantes.
^ abc es un subconjunto de una de las versiones de referencia internacionales de ISO 646, pero no incluye todos los caracteres presentes en el conjunto invariante. Se incluye para comparación.
^ También teletexto del Reino Unido.
^ abcdefghijklmno No se ajusta completamente al conjunto invariante, pero es un derivado estrechamente relacionado de ISO 646. Se incluye aquí para comparación.
^ abcde Variante ISO 646 idéntica a la variante NRCS.
^ También Teletexto del Sistema Mundial (DE)
^ También Teletexto del Sistema Mundial (SE/FI/HU)
^ ab Los conjuntos de caracteres NATS (por ejemplo, NATS-SEFI [74] ) reemplazan @(0x40) y `(0x60) con "Espacio de unidad A" (UA) y "Espacio de unidad B" (UB). El espacio simple (0x20) se expande en la justificación. UA y UB son para anchos fijos, UA debe ser al menos tan ancho como UB. RFC 1345 asigna UA y UB a los puntos de código ISO 10646 (UCS) U+E002 y U+E003, ambos en el Área de uso privado , respectivamente (aunque también enumera asignaciones PUA para varios otros caracteres que ahora tienen puntos de código UCS). Unicode contiene una cantidad de caracteres de espacio que podrían corresponderse aproximadamente.
^ La conformidad con el conjunto invariante de la norma ISO 646 es cuestionable, pero es un derivado estrechamente relacionado de la norma ISO 646. Se incluye aquí para comparación.
Familias de codificación relacionadas
Conjunto de caracteres de reemplazo nacional
El National Replacement Character Set ( NRCS ) es una familia de codificaciones de 7 bits introducida en 1983 por DEC con la serie de terminales de ordenador VT200 . Está estrechamente relacionada con ISO/IEC 646, ya que se basa en un subconjunto invariante similar de ASCII, y difiere en que se mantiene $como invariante pero no _(aunque la mayoría de las variantes de NRCS conservan el _, y por lo tanto cumplen con el conjunto invariante de ISO/IEC 646). La mayoría de las variantes de NRCS están estrechamente relacionadas con las variantes nacionales correspondientes de ISO/IEC 646 cuando existen, con la excepción de la variante holandesa .
Teletexto del sistema mundial
La norma europea de telecomunicaciones ETS 300 706, "Especificación de teletexto mejorado", define conjuntos de códigos en latín, griego, cirílico, árabe y hebreo con varias variantes nacionales tanto para el latín como para el cirílico. [63] Al igual que NRCS e ISO/IEC 646, dentro de las variantes latinas, la familia de codificaciones conocida como el conjunto G0 se basa en un subconjunto invariante similar de ASCII, pero no conserva ni $ni _como invariante. A diferencia de NRCS, las variantes a menudo difieren considerablemente de las variantes nacionales correspondientes de ISO/IEC 646.
caballos de fuerza
HP tiene la página de códigos 1054 , que agrega el tono medio (▒, U+2592) en 0x7F. [91] La página de códigos 1052 reemplaza algunos caracteres ASCII de la página de códigos 1054. [92]
Diferencias con ASCII
Derivados de otros alfabetos
Algunos conjuntos de caracteres de 7 bits para alfabetos no latinos se derivan de la norma ISO/IEC 646: estos no constituyen en sí mismos la norma ISO/IEC 646 debido a que no siguen sus puntos de código invariables (que a menudo reemplazan las letras de al menos un caso) y debido a que admiten diferentes alfabetos para los cuales el conjunto de puntos de código nacionales no proporciona suficiente espacio de codificación. Algunos ejemplos incluyen:
Turkmenistán de 7 bits (ISO-IR-230). [93]
Griego de 7 bits.
En ELOT 927 (ISO-IR-088), [46] el alfabeto griego se asigna en orden alfabético (excepto la sigma final) a las posiciones 0x61–0x71 y 0x73–0x79, encima de las letras minúsculas latinas.
ISO-IR-018 [94] asigna el alfabeto griego a ambas mayúsculas y minúsculas utilizando un esquema diferente (no en orden alfabético, sino intentando, cuando es posible, hacer coincidir las letras griegas con las letras romanas que se corresponden en algún sentido), e ISO-IR-019 [95] asigna el alfabeto griego en mayúsculas a las letras latinas en minúsculas utilizando el mismo esquema que ISO-IR-018.
La mitad inferior de la codificación de caracteres de la fuente Symbol [96] utiliza su propio esquema para mapear letras griegas de ambos casos sobre las letras romanas ASCII, intentando también mapear letras griegas sobre letras romanas que se corresponden en algún sentido, pero tomando decisiones diferentes al respecto (ver el cuadro a continuación). También reemplaza los puntos de código invariantes 0x22 y 0x27 y cinco puntos de código nacionales con símbolos matemáticos. Aunque no está pensado para usarse en la composición tipográfica de prosa griega, a veces se utiliza para ese propósito.
La norma ISO-IR-027 [47] (detallada en el cuadro anterior en lugar del siguiente) incluye el alfabeto latino sin cambios, pero agrega algunas letras mayúsculas griegas que no se pueden representar con homóglifos de escritura latina ; si bien se basa explícitamente en ISO/IEC 646, algunas de ellas se asignan a puntos de código que son invariantes en ISO/IEC 646 (0x21, 0x3A y 0x3F) y, por lo tanto, no es una verdadera variante de ISO/IEC 646.
La codificación del teletexto del Sistema Mundial para el griego utiliza otro esquema de mapeo de letras griegas en orden alfabético sobre las letras ASCII de ambos casos, incluyendo notablemente varias letras con diacríticos. [97]
Cirílico de 7 bits
KOI-7 o KOI abreviado, utilizado para el ruso . Los caracteres cirílicos se asignan a las posiciones 0x60–0x7E, sobre las letras minúsculas latinas, y coinciden con las letras homólogas cuando es posible (donde в se asigna a w, no a v). Reemplazado por las variantes KOI-8 .
SRPSCII y MAKSCII , variantes cirílicas de YUSCII (la variante latina es YU/ISO-IR-141 en el gráfico anterior), utilizadas para el serbio y el macedonio respectivamente. En gran medida homólogas a la variante latina de YUSCII (siguiendo las reglas de digrafía serbia ), excepto Љ (lj), Њ (nj), Џ (dž) y ѕ (dz), que corresponden a dígrafos en la ortografía de la escritura latina y se asignan sobre letras que no se utilizan en serbio o macedonio (q, w, x, y).
Los conjuntos G0 para las codificaciones de teletexto del Sistema Mundial para ruso/búlgaro [98] y ucraniano [99] utilizan conjuntos G0 similares a KOI-7 con algunas modificaciones. El conjunto G0 correspondiente para cirílico serbio [a] [100] utiliza un esquema basado en la codificación de teletexto para serbocroata y esloveno en alfabeto latino , a diferencia del significativamente diferente YUSCII.
Hebreo de 7 bits, SI 960. El alfabeto hebreo está asignado a las posiciones 0x60–0x7A, sobre las letras latinas minúsculas (y el acento grave para aleph). El hebreo de 7 bits siempre se almacenó en orden visual. Esta asignación con el bit alto establecido, es decir, con las letras hebreas en 0xE0–0xFA, es ISO/IEC 8859-8 . La codificación de teletexto del sistema mundial para hebreo utiliza las mismas asignaciones de letras, pero utiliza BS_Viewdata como su codificación base (mientras que SI 960 utiliza US-ASCII) e incluye un signo de shekel en 0x7B.
Árabe de 7 bits, ASMO 449 (ISO-IR-089). [101] El alfabeto árabe está asignado a las posiciones 0x41–0x5A y 0x60–0x6A, encima de letras latinas mayúsculas y minúsculas.
A continuación se muestra una comparación de algunas de estas codificaciones. Solo se muestra un caso, excepto en los casos en que los casos se asignan a letras diferentes. En tales casos, se muestra primero la asignación con el código más pequeño. Se dan posibles transcripciones para algunas letras; cuando esto se omite, se puede considerar que la letra corresponde a la romana sobre la que se asigna.
^ ab Etiquetado como "Conjunto primario cirílico G0 - Opción 1 - Serbio/Croata", pero incluye las letras macedonias Ќ y Ѓ (pero no Ѕ ). Un subconjunto de letras romanas, en su mayoría aquellas sin homóglifos en el conjunto G0, están incluidas en el conjunto G1 (15.6.7 Tabla 41), incluyendo S /s en 0x6B/7B. El croata se escribe en alfabeto latino .
Referencias
^ Mullendore, Ralph Elvin (1964) [1963]. Ptak, John F. (ed.). "Sobre el desarrollo temprano de ASCII - La historia de ASCII". JF Ptak Science Books (publicado en marzo de 2012). Archivado desde el original el 26 de mayo de 2016. Consultado el 26 de mayo de 2016 .
^ Conjuntos de caracteres codificados de 6 y 7 bits para el intercambio de procesamiento de información (borrador), Organización Internacional de Normalización , julio de 1964(NB. 21 páginas. Con carta de presentación para los miembros de los grupos de trabajo X3.2 y X3.3 de Eric Clamons.)
^ abc Mackenzie, Charles E. (1980). Conjuntos de caracteres codificados, historia y desarrollo (PDF) . The Systems Programming Series (1.ª edición). Addison-Wesley Publishing Company, Inc., págs. 7, 9, 412. ISBN978-0-201-14460-4. LCCN 77-90165. Archivado (PDF) del original el 26 de mayo de 2016. Consultado el 25 de agosto de 2019 .
^ abcdefg Norma ECMA-6: conjunto de caracteres codificados de 7 bits (PDF) (5.ª ed.). Ginebra, Suiza: Asociación Europea de Fabricantes de Computadoras (Ecma). Marzo de 1985. Consultado el 28 de mayo de 2024. El Comité Técnico TC1 de la ECMA se reunió por primera vez en diciembre de 1960 para preparar códigos estándar para fines de entrada/salida. El [30] de abril de 1965, la Asamblea General de la ECMA adoptó la Norma ECMA-6.
^ Bodfish, John; Wilson, Mark; Gregory, Stephen; Nye, Julie Blume. Bodfish, John (ed.). "Manejo de caracteres invariantes". Protocolo de intercambio de circulación NISO . Departamento de Educación de Colorado, EE. UU.: Comité Permanente del NCIP (NCIP-SC). Archivado desde el original el 24 de diciembre de 2013. Consultado el 30 de mayo de 2016 .
^ Demchenko, Yuri (2000) [1997]. "Estandarización internacional de códigos de 7 bits, ISO 646". TERENA. 4. Archivado desde el original el 17 de junio de 2016. Consultado el 13 de agosto de 2012 .
^ ab Norma ECMA-6: conjunto de caracteres codificados de entrada/salida de 7 bits (PDF) (4.ª ed.). Ginebra (Suiza): Asociación Europea de Fabricantes de Computadoras (Ecma). Agosto de 1973. Consultado el 28 de mayo de 2024 .
^ "Procesamiento de información - Conjunto de caracteres codificados ISO de 7 bits para el intercambio de información". 1 de julio de 1983. ISO 646:1983. Archivado desde el original el 30 de mayo de 2016. Consultado el 30 de mayo de 2016 .
^ ab Salste, Tuomas (enero de 2016). «Conjuntos de caracteres de 7 bits: revisiones de ASCII». Aivosto Oy. urn : nbn:fi-fe201201011004. Archivado desde el original el 13 de junio de 2016. Consultado el 13 de junio de 2016 .
^ abc Norma ECMA-6: conjunto de caracteres codificados de 7 bits (PDF) (6.ª ed.). Ginebra (Suiza): Asociación Europea de Fabricantes de Computadoras (Ecma). Agosto de 1997 [diciembre de 1991] . Consultado el 28 de mayo de 2024 .
^ "Tecnología de la información: conjunto de caracteres codificados ISO de 7 bits para el intercambio de información" (3.ª ed.). 16 de diciembre de 1991. ISO/IEC 646:1991. Archivado desde el original el 30 de mayo de 2016. Consultado el 30 de mayo de 2016 .
^ Alfabeto de referencia internacional (IRA) - Tecnología de la información - Conjunto de caracteres codificados de 7 bits para el intercambio de información - Recomendación T.50, Unión Internacional de Telecomunicaciones (UIT) - Comité Consultivo Internacional Telegráfico y Telefónico (CCITT) - Equipos terminales y protocolos para servicios telemáticos, 1993-04-16 [1992-09-18], E 3177, archivado desde el original el 2014-12-19 , consultado el 2017-03-18
^ ab Norge Standardiseringforbund (1 de junio de 1982). Norma noruega NS 4551 Versión 2 (PDF) . ITSCJ/ IPSJ . ISO-IR -61.
^ ab Asociación China de Normalización (1982-06-01). Conjunto de caracteres codificados de 7 bits para el intercambio de información (PDF) . ITSCJ/ IPSJ . ISO-IR -57.
^ "Información de la página de códigos SBCS - CPGID: 01020 / Nombre: Variante canadiense (francesa)". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ abcdefghijklmnopqrst "Guía comparativa de referencia PCL/PJL de HP PCL 5" (PDF) (2.ª ed.). Hewlett-Packard Company, LP . Junio de 2003. Número de pieza de HP 502-0378. Archivado desde el original (PDF) el 2016-08-10 . Consultado el 2016-08-10 .
^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah ai aj ak al am an ao ap Bemer, Robert William (1980). "Capítulo 1: Dentro de ASCII". Software de propósito general (PDF) . Lo mejor de Interface Age. Vol. 2. Portland, OR, EE. UU.: dilithium Press. págs. 1–50. ISBN0-918398-37-1LCCN 79-67462. Archivado desde el original el 27 de agosto de 2016. Consultado el 27 de agosto de 2016 .de: Bemer, Robert William (mayo de 1978). "Inside ASCII - Part I". Interface Age . 3 (5). Portland, OR, EE. UU.: dilithium Press: 96–102., Bemer, Robert William (junio de 1978). "Inside ASCII - Part II". Interface Age . 3 (6). Portland, OR, EE. UU.: dilithium Press: 64–74., Bemer, Robert William (julio de 1978). "Inside ASCII - Part III". Interface Age . 3 (7). Portland, OR, EE. UU.: dilithium Press: 80–87.
^ de Sveriges standardiseringskommission (1975). El conjunto gráfico principal de caracteres NATS para la transmisión de textos de periódicos en Dinamarca y Noruega (PDF) . ITSCJ/ IPSJ . ISO-IR -9-1.
^ "Información de la página de códigos SBCS - CPGID: 01011 / Nombre: 7-Bit Germany FR" IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ abcde «Identificadores de páginas de códigos». Microsoft Developer Network . Microsoft . 2014. Archivado desde el original el 19 de junio de 2016. Consultado el 19 de junio de 2016 .
^ abcde "Codificaciones web - Internet Explorer - Codificaciones". Wiki WHATWG . 23 de octubre de 2012. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación alemana (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Norma danesa DS 2089: Aplicación del conjunto de caracteres codificados ISO de 7 bits . Febrero de 1974. UDC 681.3:003.62.
^ "Información de la página de códigos SBCS - CPGID: 01017 / Nombre: 7-Bit Denmark". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 01023 / Nombre: Variante de España". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 01014 / Nombre: 7-Bit Spain". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-10-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ ab "Información de la página de códigos SBCS - CPGID: 01018 / Nombre: 7-Bit Finland/Sweden". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 01010 / Nombre: 7-Bit France". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 01104 / Nombre: Conjunto NRC francés". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-21 . Consultado el 2016-06-21 .
^ "Información de la página de códigos SBCS - CPGID: 01013 / Nombre: 7-Bit United Kingdom". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ ab ISO/TC 97/SC 2 (1975). El conjunto gráfico de caracteres de la versión de referencia internacional de la norma ISO 646 (PDF) . ITSCJ/ IPSJ . ISO-IR -2.{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
^ "Información de la página de códigos SBCS - CPGID: 01009 / Nombre: ISO IRV". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1990-04-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ Foller, Antonin (2014) [2011]. "Codificación de Europa occidental (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ "Información de la página de códigos SBCS - CPGID: 01012 / Nombre: 7-Bit Italy". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 00895 / Nombre: Japan 7-Bit Latin". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1986-10-01. Archivado desde el original el 2016-06-18 . Consultado el 2016-06-18 .
^ "Información de la página de códigos SBCS - CPGID: 01019 / Nombre: 7-Bit Netherlands". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ "Información de la página de códigos SBCS - CPGID: 01016 / Nombre: 7-Bit Norway". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ Foller, Antonin (2014) [2011]. "Codificación noruega (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ "Información de la página de códigos SBCS - CPGID: 01015 / Nombre: 7-Bit Portugal". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ Foller, Antonin (2014) [2011]. "Codificación sueca (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ "Información de la página de códigos SBCS - CPGID: 00367 / Nombre: ASCII". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1978-01-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ Foller, Antonin (2014) [2011]. "Codificación US-ASCII - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ ab BSI (1981-06-01). Alfanuméricos para visualización de datos y teletexto de difusión (PDF) . ITSCJ/ IPSJ . ISO-IR -47.
^ ab ELOT (1984-07-01). Conjunto de caracteres griegos para el idioma griego (PDF) . ITSCJ/ IPSJ . ISO-IR -88.
^ "Información de la página de códigos SBCS - CPGID: 01021 / Nombre: Variante Suiza". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 2016-06-17 . Consultado el 2016-06-17 .
^ Comisión de normalización de Suecia (1975). Conjunto de control NATS para la transmisión de textos de periódicos (PDF) . ITSCJ/ IPSJ . ISO-IR -7.
^ ISO/TC 97/SC 2 (1 de agosto de 1985). Conjunto básico de caracteres gráficos OCR-B japonés (PDF) . ITSCJ/ IPSJ . ISO-IR -92.{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
^ ab Lunde, Ken (2008). "3. Estándares de conjuntos de caracteres (§ CJKV-Roman)". Procesamiento de información CJKV (2.ª ed.). O'Reilly Media . págs. 91–92. ISBN9780596514471.
^ BSI (1975-12-01). El conjunto de caracteres gráficos del código de datos de 7 bits del Reino Unido (PDF) . ITSCJ/ IPSJ . ISO-IR -4.
^ IBM (1992). "Página de códigos 01101" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ NSAI (7 de diciembre de 1999). Variante del conjunto de caracteres codificados ISO de 7 bits para el idioma gaélico irlandés (PDF) . ITSCJ/ IPSJ . ISO-IR -207.
^ ECMA (1976). Variante del conjunto de caracteres codificados ISO de 7 bits (sólo gráficos) para el idioma italiano (PDF) . ITSCJ/ IPSJ . ISO-IR -15.
^ abcdefghijkl "15.6.2 Subconjuntos de opciones nacionales latinas, tabla 36", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), pág. 115
^ AFNOR (1 de junio de 1983). Juego de caracteres gráficos franceses para la lengua francesa (PDF) . ITSCJ/ IPSJ . ISO-IR -69.
^ AFNOR (1975). Conjunto de caracteres gráficos para la lengua francesa (PDF) . ITSCJ/ IPSJ . ISO-IR -25.
^ Consejo Canadiense de Normas (1 de febrero de 1986). Conjunto de gráficos primarios alternativos n.º 1 (PDF) . ITSCJ/ IPSJ . ISO-IR -121.
^ Consejo Canadiense de Normas (1 de febrero de 1986). Conjunto alternativo de gráficos primarios n.° 2 (PDF) . ITSCJ/ IPSJ . ISO-IR -122.
^ IBM (1992). "Página de códigos 01021" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ DIN (1975). Versión de referencia alemana del conjunto de caracteres codificados ISO de 7 bits (sólo gráficos) para el idioma alemán según se define en la norma alemana DIN 66 003–junio de 1974 (PDF) . ITSCJ/ IPSJ . ISO-IR -21.
^ Comisión de Normalización de Suecia (1975). Conjunto básico de caracteres gráficos suecos (PDF) . ITSCJ/ IPSJ . ISO-IR -10.
^ Comisión de Normalización de Suecia (1975). Conjunto gráfico sueco de caracteres para la escritura oficial de nombres (PDF) . ITSCJ/ IPSJ . ISO-IR -11.
^ IBM (1992). "Página de códigos 01106" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ IBM (1992). "Página de códigos 01103" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ de Sveriges Standardiseringskommission (1975). El conjunto gráfico principal de caracteres NATS para la transmisión de textos de periódicos en Finlandia y Suecia (PDF) . ITSCJ/ IPSJ . ISO-IR -8-1.
^ IBM (1987). "Página de códigos 01017" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ IBM (1992). "Página de códigos 01105" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ IBM (1992). "Página de códigos 01107" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ Norge Standardiseringforbund (1 de junio de 1982). Norma noruega NS 4551 - Versión 1 (PDF) . ITSCJ/ IPSJ . ISO-IR -60.
^ ab Dagienė, Valentina; Grigas, Gintautas; Jevsikova, Tatjana (2010). "3.2.2. Código ISO 646". Programinės įrangos lokalizavimas (PDF) (en lituano). Matematikos ir informatikos institutas. pag. 67.ISBN978-9986-680-47-5.(nota: el cuadro que se muestra a veces confunde las mayúsculas y minúsculas , por ejemplo, ġ y Ġ aparecen como Ġ en la fila maltesa, o Ä y ä aparecen como Ä en las filas suecas)
^ ECMA (1976). Variante del conjunto de caracteres codificados ISO de 7 bits (sólo gráficos) para el idioma español (PDF) . ITSCJ/ IPSJ . ISO-IR -17.
^ ECMA (1984-07-01). Conjunto de caracteres gráficos para las lenguas españolas (PDF) . ITSCJ/ IPSJ . ISO-IR -85.
^ Úrad pro normalizaci a měřeni (1 de julio de 1989). Juego de caracteres gráficos de la República Cuba (PDF) . ITSCJ/ IPSJ . ISO-IR -151.
^ ECMA (30-12-1976). Conjunto de caracteres gráficos para la lengua portuguesa (PDF) . ITSCJ/ IPSJ . ISO-IR -16.
^ ECMA (1984-07-01). Conjunto de caracteres gráficos para la lengua portuguesa (PDF) . ITSCJ/ IPSJ . ISO-IR -84.
^ Instituto Federal de Normalización (1987-11-01). Alfabeto latino serbocroata y esloveno (PDF) . ITSCJ/ IPSJ . ISO-IR -141.
^ IBM (1987). "Página de códigos 01019" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ IBM (1992). "Página de códigos 01102" (PDF) . REGISTRO: Conjuntos de caracteres gráficos y páginas de códigos .
^ Oficina Húngara de Normalización (1 de julio de 1984). Versión de referencia húngara de ISO 646 (HRV) (PDF) . ITSCJ/ IPSJ . ISO-IR -86.
^ "Apéndice D: Conjuntos de caracteres (§ Página de códigos n.° 3041 maltés)" (PDF) . Manual del usuario: Impresora matricial LC-8021 . Star Micronics . 1997. pág. 62. Archivado (PDF) desde el original el 8 de septiembre de 2004 . Consultado el 9 de abril de 2024 .
^ Microsoft Corporation . "charsets.hpp: define tablas de traducción para los distintos conjuntos de caracteres VT utilizados en la clase TerminalOutput". Windows Terminal .
^ "Página de códigos 1054" (PDF) . Archivado desde el original (PDF) el 21 de enero de 2013.
^ "Página de códigos 1052" (PDF) . Archivado desde el original (PDF) el 21 de enero de 2013.
^ Turkmenistán estándar (14 de septiembre de 2000). Alfabeto turcomano (PDF) . ITSCJ/ IPSJ . ISO-IR -230.
^ ab ECMA (1976). Conjunto gráfico griego (PDF) . ITSCJ/ IPSJ . ISO-IR -18.
^ "Mapa (versión externa) del conjunto de caracteres Símbolo de Mac OS a Unicode 4.0 y posteriores".
^ "15.6.8: Conjunto G0 griego", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), pág. 121
^ "15.6.5: Conjunto cirílico G0 - Opción 2 - Ruso/Búlgaro", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), pág. 118
^ "15.6.6: Conjunto cirílico G0 - Opción 3 - Ucraniano", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), pág. 119
^ "15.6.4: Conjunto cirílico G0 - Opción 1 - Serbio/Croata", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), pág. 117
^ ASMO (1985-01-01). Conjunto de caracteres árabes codificados de 7 bits para el intercambio de información (PDF) . ITSCJ/ IPSJ . ISO-IR -89.
Lectura adicional
Fischer, Eric, ed. (1975) [1972]. Documentos fuente sobre la historia de los códigos de caracteres, 1972-1975 (Recopilación). Archivado desde el original el 7 de junio de 2020. Consultado el 7 de junio de 2020.{{cite book}}: CS1 maint: bot: estado de URL original desconocido ( enlace )(79 páginas) incluyendo: Bemer, Robert William (1972). "Una visión de la historia del conjunto de caracteres ISO". Honeywell Computer Journal . 6 (4). Phoenix, Arizona, EE. UU.: Honeywell Information Systems: 274–286, 287–291.(13+5 páginas) y muchos otros documentos y correspondencia.
Enlaces externos
ISO/IEC 646:1991 Tecnología de la información: conjunto de caracteres codificados ISO de 7 bits para el intercambio de información
Tablas de caracteres ISO646 Tablas de caracteres de Koichi Yasuoka (安岡孝) (ver Tablas de caracteres ISO646 nacionales y Tablas de caracteres cuasi-ISO646 )
Desasciificador de texto turco es una herramienta (basada en el análisis estadístico de pentagramas del idioma turco) que revierte un texto turco ASCII'ficado determinando los diacríticos apropiados (pero ambiguos) normalmente necesarios en turco pero que faltan en el conjunto US-ASCII.