stringtranslate.com

ISO 2033

La norma ISO 2033:1983 ( "Codificación de caracteres legibles por máquina (MICR y OCR)" ) [1] define conjuntos de caracteres para su uso con sistemas de reconocimiento óptico de caracteres o de reconocimiento de caracteres de tinta magnética . La norma japonesa JIS X 9010:1984 ( "Codificación de caracteres legibles por máquina (OCR y MICR)" , originalmente denominada JIS C 6229-1984 ) está estrechamente relacionada. [2]

Conjunto de caracteres para OCR-A

La versión de la codificación de la fuente OCR-A registrada en el registro ISO-IR como ISO-IR-91 es la versión japonesa (JIS X 9010 / JIS C 6229), que difiere de la codificación definida por ISO 2033 solo en la adición de un signo de Yen a 5C. [2]

  Redefinido en comparación con JIS-Roman

Conjunto de caracteres para OCR-B

La versión del conjunto G0 para la fuente OCR-B registrada en el registro ISO-IR como ISO-IR-92 es la versión japonesa (JIS X 9010 / JIS C 6229), que difiere de la codificación definida por ISO 2033 solo en que se basa en JIS-Roman (con un signo de dólar en 0x24 y un signo de yen en 0x5C) en lugar de en ISO 646 IRV (con una barra invertida en 0x5C y, en ese momento, un signo de moneda universal (¤) en 0x24). [3] Además de esos puntos de código, se diferencia de ASCII solo en que omite la comilla invertida (`) y la tilde (~). [3] Un conjunto suplementario adicional registrado como ISO-IR-93 asigna el signo de libra (£), el signo de moneda universal (¤) y el signo de sección (§) a sus puntos de código ISO-8859-1 , y la barra invertida al punto de código ISO-8859-1 para el signo del yen. [4]

Conjunto de caracteres para JIS X 9008 (JIS C 6257)

JIS X 9010 (JIS C 6229) también define conjuntos de caracteres para la fuente OCR "impresa a mano" JIS X 9008:1981 (anteriormente JIS C 6257-1981). [5] : fn1  Estos incluyen subconjuntos del conjunto JIS X 0201 Roman (registrado como ISO-IR-94 y omitiendo la comilla invertida (`), letras minúsculas, llaves ({, }) y línea superior (‾)), [5] y el conjunto kana (registrado como ISO-IR-96 y omitiendo la coma de estilo del este de Asia (、) y el punto (。), el interpunto (・) y el kana minúsculo), [6] además de un conjunto (registrado como ISO-IR-95 ) que contiene solo la barra invertida, que se asigna al mismo punto de código que en ISO-IR-93. [7]

La fuente JIS C 6527 estiliza los caracteres de barra [5] y barra invertida [7] con una apariencia duplicada. Los nombres de caracteres que se dan son "Solidus" [5] y "Reverse Solidus", [7] coincidiendo con los nombres de caracteres Unicode para la barra y la barra invertida ASCII. [8] Sin embargo, el bloque de Reconocimiento Óptico de Caracteres Unicode incluye un punto de código adicional para una "Barra invertida doble OCR" (⑊), aunque no para una barra doble (hacia adelante), [9] aunque una barra doble está disponible en otros lugares, como U+2AFD OPERADOR DOBLE SOLIDUS .

Conjunto de caracteres para E-13B

La fuente MICR E-13B, que muestra el repertorio de caracteres ISO-IR-98.

La codificación ISO-IR-98 definida por ISO 2033 codifica el repertorio de caracteres de la fuente E13B , tal como se utiliza con el reconocimiento de caracteres de tinta magnética . [10] Aunque ISO 2033 también especifica otras codificaciones, la codificación para E-13B es la codificación a la que se refiere ISO_2033_1983Perl libintl , [11] y como ISO_2033-1983o csISO2033por la IANA . [12] Otras etiquetas registradas incluyen iso-ir-98, su número de registro ISO-IR y simplemente e13b. [12]

Los dígitos se conservan en sus ubicaciones ASCII . Se omiten las letras y los símbolos que no están disponibles en la fuente E13B, mientras que se agrega la puntuación especializada para cheques bancarios incluidos en la fuente E13B. Los mismos símbolos están disponibles en Unicode en el bloque de Reconocimiento óptico de caracteres .

  Redefinido en comparación con ASCII

Referencias

  1. ^ ISO/IEC JTC 1/SC 2 (1983). Procesamiento de la información: codificación de caracteres legibles por máquina (MICR y OCR). ISO . ISO 2033:1983.{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  2. ^ ab ISO/TC97/SC2 (1985-08-01). ISO-IR-91: Conjunto de caracteres gráficos OCR-A japoneses (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  3. ^ ab ISO/TC97/SC2 (1985-08-01). ISO-IR-92: Conjunto de caracteres gráficos básicos OCR-B japoneses (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  4. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-93: OCR-B japonés - Conjunto de caracteres gráficos adicionales (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  5. ^ abcd ISO/TC97/SC2 (1985-08-01). ISO-IR-94: Conjunto básico de caracteres gráficos japoneses impresos a mano para OCR (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  6. ^ ISO/TC97/SC2 (1 de agosto de 1985). ISO-IR-96: Conjunto de caracteres gráficos impresos a mano en katakana para OCR (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  7. ^ abc ISO/TC97/SC2 (1985-08-01). ISO-IR-95: Conjunto adicional de caracteres gráficos impresos a mano en japonés para OCR (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  8. ^ Consorcio Unicode . «Controles C0 y latín básico» (PDF) . El estándar Unicode .
  9. ^ Consorcio Unicode . «Reconocimiento óptico de caracteres» (PDF) . El estándar Unicode .
  10. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-98: Un conjunto de 14 caracteres gráficos de la fuente E13B (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  11. ^ ab Flohr, Guido. "Rutinas de conversión para ISO_2033_1983". libintl . Configuración regional::RecodeData::ISO_2033_1983.
  12. ^ ab "Conjuntos de caracteres". IANA.

Enlaces externos