stringtranslate.com

Reconocimiento óptico de caracteres (bloque Unicode)

El reconocimiento óptico de caracteres es un bloque Unicode que contiene caracteres de señal para los estándares OCR y MICR .

Bloquear

Subtítulos

El bloque de reconocimiento óptico de caracteres tiene tres subtítulos informales (agrupaciones) dentro de su colección de caracteres: OCR-A, MICR y OCR. [3]

OCR-A

Un cheque alemán parcialmente redactado , que muestra el uso de ⑂, ⑀ y ⑁ en la línea legible por máquina

El subtítulo OCR-A contiene seis caracteres extraídos de la fuente OCR-A descrita en la norma ISO 1073-1:1976: U+2440 OCR HOOK , U+2441OCR CHAIR , U+2442OCR FORK , U+2443OCR INVERTED FORK , U+2444OCR BELT BUCKLE y U+2445OCR BOW TIE . La pajarita OCR recibe el alias informativo "asterisco único".

El gancho, la silla y el tenedor, además de una barra vertical larga, están incluidos en el nivel de implementación "numérico" más básico de OCR-A, que incluye dígitos pero excluye letras y puntuación convencional. [4] Por el contrario, el nivel de implementación más básico de OCR-B incluye los dígitos, el signo más , el signo menor que , el signo mayor que , una barra vertical larga y siete de las letras mayúsculas; [5] como tal, no hay caracteres específicos de OCR-B en el bloque de Reconocimiento óptico de caracteres.

Micrómetro

Un cheque firmado por Richard Nixon , que muestra el uso de ⑆, ⑇, ⑈ y ⑉ en la línea legible por máquina

El subtítulo MICR contiene cuatro caracteres de puntuación para identificadores de cheques bancarios , tomados de la fuente de reconocimiento de caracteres de tinta magnética E-13B (codificada en la norma ISO 1004:1995): U+2446OCR IDENTIFICACIÓN DE SUCURSAL BANCARIA , U+2447OCR MONTO DEL CHEQUE , U+2448OCR GUIÓN , y U+2449OCR NÚMERO DE CUENTA DE CLIENTE .

Los dos últimos caracteres tienen nombres erróneos: sus nombres se cambiaron inadvertidamente cuando se les nombró en la edición de 1993 (primera) de ISO/IEC 10646 , [6] un error que había estado presente desde Unicode 1.0.0. [7] Aunque sus nombres formales permanecen sin cambios debido a la política de estabilidad de Unicode, ambos tienen alias normativos corregidos : U+2448 ⑈ es MICR ON US SYMBOL , y U+2449 ⑉ es MICR DASH SYMBOL [8] (el estándar señala que "los nombres de caracteres Unicode incluyen varios nombres erróneos").

Estos símbolos habían sido codificados previamente mediante la codificación ISO-IR-98 definida por ISO 2033 :1983, en la que simplemente se los denominaba SÍMBOLO UNO a SÍMBOLO CUATRO . [9] Los cuatro caracteres tienen alias informativos en las tablas Unicode: "tránsito", "cantidad", "por nuestra cuenta" y "guión", respectivamente.

LOC

El subtítulo OCR consta de un solo carácter: U+244AOCR DOBLE BARRA INVERSA .

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de reconocimiento óptico de caracteres:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ "Gráficos de códigos Unicode: reconocimiento óptico de caracteres" (PDF) . El estándar Unicode, versión 6.3 . Consultado el 27 de febrero de 2014 .
  4. ^ Asociación Europea de Fabricantes de Computadoras (1977). "Dimensiones nominales de caracteres de la fuente numérica OCR-A" (PDF) (2.ª ed.). ECMA-8.
  5. ^ ISO/IEC JTC1/SC2/WG3 (28 de septiembre de 1998). "9.1: Subconjunto 1: Subconjunto alfanumérico mínimo" (PDF) . Propuesta de informe técnico de tipo 3, TR 15907, Tecnología de la información: revisión de la norma OCR-B (ISO 1073-2:1976) . pág. 8. ISO/IEC JTC1/SC2/WG3 N470.{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  6. ^ ISO/IEC JTC 1/SC 2/WG 2 (3 de enero de 2012). "T.3. Reconocimiento óptico de caracteres". Actas no confirmadas de la reunión 58 del WG 2 (PDF) . pág. 29. SC2 N4188 / WG2 N4103. Los bancos utilizan estos símbolos de reconocimiento de caracteres de tinta magnética (MICR) en los cheques. Los nombres de estos caracteres se mezclaron inadvertidamente en la edición de 1993 de la norma ISO/IEC 10646.{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  7. ^ "3.8: Gráficos bloque por bloque" (PDF) . El estándar Unicode . versión 1.0. Consorcio Unicode .
  8. ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken (10 de abril de 2017). Anomalías conocidas en los nombres de caracteres Unicode (4.ª edición). Consorcio Unicode . Nota técnica Unicode n.º 27.
  9. ^ ISO/TC97/SC2 (1 de agosto de 1985). ISO-IR-98: Conjunto de caracteres gráficos E13B (PDF) . ITSCJ/ IPSJ .{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )