stringtranslate.com

Conjunto de caracteres ARIB STD B24

El volumen 1 de la norma STD-B24 de la Asociación de Industrias y Negocios de Radio ( ARIB ) para el lenguaje de marcado de radiodifusión [2] especifica, entre otros detalles, una codificación de caracteres para su uso en radiodifusión en japonés. Se introdujo el 26 de octubre de 1999. [2] La última revisión es la versión 6.3 del 6 de julio de 2016 .

Incluye una serie de caracteres extendidos ARIB ( ARIB外字, ARIB gaiji ) que no se encuentran en los estándares base ( JIS X 0208 y JIS X 0201 ). Fue el estándar fuente para muchos caracteres de símbolos que se agregaron a Unicode , incluidas partes de los bloques Símbolos varios , Suplemento alfanumérico adjunto y Suplemento ideográfico adjunto . [3] Sus contribuciones se superponen parcialmente con los emoji de Unicode , pero se agregaron un año antes, en Unicode 5.2. [4]

El fascículo 1 del estándar ARIB STD-B62, publicado en 2014, define asignaciones Unicode para una selección de los caracteres extendidos B24 (excluyendo, por ejemplo, aquellos duplicados por JIS X 0213 ), así como algunos kanji extendidos. [5] También incluye una asignación de caracteres utilizados fuera del plano multilingüe básico al área de uso privado del BMP .

Conjuntos y códigos

El estándar ARIB STD B24 define varios conjuntos de caracteres y un método para cambiar entre ellos. Estos incluyen un conjunto Kanji (una extensión de JIS X 0208 ), un conjunto Alfanumérico, un conjunto Hiragana, conjuntos Katakana de dos diseños distintos y cuatro conjuntos de mosaico . [6] Los conjuntos se seleccionan utilizando mecanismos ISO 2022 para conjuntos de 94 caracteres, utilizando los siguientes códigos (los conjuntos proporcionales utilizan el mismo diseño que los no proporcionales correspondientes): [7]

Gráficos de códigos

Conjunto de kanji (doble byte)

Este es un conjunto de caracteres de doble byte que extiende JIS X 0208 .

Byte principal

Los bytes de codificación corresponden al número de fila o celda más 0x20, o 32 en decimal (ver más abajo). Por lo tanto, el conjunto de códigos que comienza con 0x21 tiene un número de fila de 1, y su celda 1 tiene un byte de continuación de 0x21 (o 33), y así sucesivamente. La mayor parte del código corresponde a JIS X 0208.

Conjuntos de caracteres 0x21-0x74 (números de fila 1-84: puntuación, alfabetos, números, kana, kanji)

Conjunto de caracteres 0x7A (número de fila 90, símbolos de tráfico)

Los caracteres 90-45 a 90-63 y 90-66 a 90-84 (mostrados sombreados a continuación) se enumeran en el estándar B24 solo en la tabla 7-10 (la lista de caracteres de extensión), y también son los únicos caracteres en las filas 90 a 91 que no son símbolos relacionados con el transporte; esto se indica en el estándar B24 en una nota al final de la tabla 7-10. [10] El resto de las extensiones se enumeran tanto en la tabla 7-4 (la tabla de códigos de doble byte) como en la tabla 7-10. [10]

Conjunto de caracteres 0x7B (número de fila 91, símbolos de mapa)

Los caracteres de ARIB STD-B24 que no se conservaron en ARIB STD-B62 se muestran sombreados.

Conjunto de caracteres 0x7C (número de fila 92, unidades, formas adjuntas, marcadores de lista, flechas)

Los caracteres de ARIB STD-B24 que no se conservaron en ARIB STD-B62 se muestran sombreados.

Conjunto de caracteres 0x7D (número de fila 93, símbolos de juegos y clima, fracciones, unidades, formas adjuntas)

Los caracteres de ARIB STD-B24 que no se conservaron en ARIB STD-B62 se muestran sombreados.

Conjunto de caracteres 0x7E (número de fila 94, marcadores de lista)

Los caracteres de ARIB STD-B24 que no se conservaron en ARIB STD-B62 se muestran sombreados.

Conjuntos de un solo byte

Conjunto alfanumérico

Conjunto de hiragana

Conjunto de katakana

Conjunto de katakana JIS X 0201

Conjuntos de mosaicos

La mayor parte del conjunto de mosaicos D de ARIB STD-B24 no existe en Unicode.

Variante Shift_JIS

Además de la codificación ISO 2022 modificada, el estándar B24 también especifica una codificación Shift JIS según JIS X 0208:1997, pero con la adición de los caracteres extendidos en el conjunto kanji. [1]


Véase también

Notas al pie

  1. ^ Se menciona como "templo" (es decir, templo budista ) en la tabla B24 7-10 (la lista de caracteres de extensión).
  2. ^ abcdef Forma pequeña (70 % del tamaño según la tabla de códigos 7-10) de un carácter kanji. Se muestra aquí de forma simulada. Los puntos de código de área de uso privado que se muestran son los utilizados por la fuente Nishiki-teki. [13]
  3. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad Abreviatura musical (o la mitad de la misma) que no está presente en Unicode, simulada aquí con múltiples caracteres. Los puntos de código de área de uso privado que se muestran son los utilizados por la fuente Nishiki-teki.

Referencias

  1. ^ ab ARIB (2008), pág. 105, parte 2, sección 7.3
  2. ^ desde ARIB (2008)
  3. ^ Suignard, Michel (11 de marzo de 2008). "ISO/IEC JTC1/SC2/WG2 N 3397: Símbolos de televisión japoneses" (PDF) .
  4. ^ "Lista de emojis Unicode 5.2". Emojipedia.
  5. ^ abcdef ARIB (2014), págs. 33–50, parte 2, tabla 5-2
  6. ^ ARIB (2008), págs. 48-52
  7. ^ ab ARIB (2008), pág. 39, parte 2, Tabla 7-3
  8. ^ Comité Nacional Japonés sobre ISO/TC97/SC2 (1984-07-01). Conjunto de caracteres gráficos japoneses para el intercambio de información (PDF) . ITSCJ/ IPSJ . ISO-IR -87.{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  9. ^ desde RFC  1468 (IETF)
  10. ^ de ARIB (2008), pág. 72
  11. ^ abcde ARIB (2008), págs. 54–72, parte 2, tabla 7-10
  12. ^ abcd ARIB (2008), págs. 46–47, parte 2, tabla 7-4
  13. ^ "Nishiki-teki Versión 3.82b (2021-07-23) - 6,416 caracteres en las áreas de uso privado" (PDF) .
  14. ^ ARIB (2008), pág. 48, parte 2, Tabla 7-5
  15. ^ ARIB (2008), pág. 50, parte 2, Tabla 7-7
  16. ^ ARIB (2008), pág. 49, parte 2, Tabla 7-6
  17. ^ ARIB (2008), pág. 52, parte 2, Tabla 7-9
  18. ^ ARIB (2008), pág. 51, parte 2, Tabla 7-8
  19. ^ CCITT (1983-10-01). Segundo conjunto suplementario de caracteres mosaicos (PDF) . ITSCJ/ IPSJ . ISO-IR -71.
  20. ^ ARIB (2008), pág. 51, parte 2, Tabla 7-8
  21. ^ CCITT (31 de julio de 1987). Mosaic-1 Conjunto de sintaxis de datos 1 de la Rec. T.101 del CCITT (PDF) . ITSCJ/ IPSJ . ISO-IR -137.
  22. ^ ARIB (2008), pág. 51, parte 2, Tabla 7-8

Lectura adicional

Enlaces externos