stringtranslate.com

Formas de ancho medio y ancho completo

Un símbolo del sistema ( cmd.exe ) con localización coreana, que muestra caracteres de ancho medio y ancho completo

En la informática CJK (chino, japonés y coreano), los caracteres gráficos se clasifican tradicionalmente en caracteres de ancho completo [a] y de ancho medio [b] . A diferencia de las fuentes monoespaciadas , un carácter de ancho medio ocupa la mitad del ancho de un carácter de ancho completo, de ahí el nombre.

Halfwidth and Fullwidth Forms es también el nombre de un bloque Unicode U+FF00–FFEF, proporcionado para que las codificaciones más antiguas que contienen caracteres de medio ancho y ancho completo puedan tener una traducción sin pérdidas hacia y desde Unicode.

Razón fundamental

Los caracteres que aparecen tanto en JIS X 0201 (un solo byte) como en JIS X 0208 / JIS X 0213 (doble byte) tienen formato de ancho medio y ancho completo en Shift JIS .

En la época de la informática en modo texto , los caracteres occidentales normalmente se disponían en una cuadrícula en la pantalla, a menudo de 80 columnas por 24 o 25 líneas. Cada carácter se mostraba como una pequeña matriz de puntos , a menudo de unos 8 píxeles de ancho, y generalmente se usaba un SBCS (juego de caracteres de un solo byte) para codificar caracteres de idiomas occidentales.

Por razones estéticas y de legibilidad, es preferible que los caracteres chinos tengan una forma aproximadamente cuadrada y, por lo tanto, el doble de ancho que estos caracteres SBCS de ancho fijo. Como normalmente estaban codificados en un DBCS (juego de caracteres de doble byte), esto también significaba que su ancho en la pantalla en una fuente a doble espacio era proporcional a su longitud en bytes. Algunos terminales y programas de edición no podían manejar caracteres de doble byte que comenzaran en columnas impares, solo columnas pares (algunos ni siquiera podían poner caracteres de doble byte y de un solo byte en la misma línea). Por lo tanto, los conjuntos DBCS generalmente también incluían caracteres y dígitos romanos, para usar junto con los caracteres CJK en la misma línea.

Por otro lado, la informática japonesa temprana utilizaba una página de códigos de un solo byte llamada JIS X 0201 para katakana . Estos se representarían con el mismo ancho que los demás caracteres de un solo byte, lo que los convertiría en caracteres kana de medio ancho en lugar de kana de proporciones normales. Aunque el estándar JIS X 0201 en sí no especificaba una visualización de medio ancho para katakana, esto se convirtió en la característica visualmente distintiva en Shift JIS entre el katakana JIS X 0201 de un solo byte y el JIS X 0208 de doble byte . Algunas páginas de códigos de IBM utilizaron un tratamiento similar para el jamo coreano , [1] basado en el código Hangul de N bytes y su traducción EBCDIC .

En Unicode

Para compatibilidad con los conjuntos de caracteres existentes que contenían versiones de ancho medio y completo del mismo carácter, Unicode asignó un solo bloque en U+FF00–FFEF que contenía los caracteres de "ancho alternativo" necesarios. Esto incluye una versión de ancho completo de todos los caracteres ASCII y algunos signos de puntuación que no son ASCII, como el signo Yen, versiones de ancho medio de katakana y hangul , y versiones de ancho medio de algunos otros símbolos como círculos. Sólo se asignaron los caracteres necesarios para un viaje de ida y vuelta sin pérdidas a los conjuntos de caracteres existentes, en lugar de (por ejemplo) crear una versión de ancho completo de cada carácter con acento latino.

Unicode asigna a cada punto de código una propiedad de "ancho del este de Asia" . Esto puede ser: [2]

Los emuladores de terminal pueden usar esta propiedad para decidir si un personaje debe consumir una o dos "columnas" al determinar las pestañas y la posición del cursor.

En tipo abierto

OpenType tiene las etiquetas de característica fwid, halt, hwidy vhalque se utilizarán para reproducir la forma de ancho completo o medio ancho de un carácter. CSS proporciona control sobre estas características usando font-variant-east-asiany font-feature-settingspropiedades. [3]

Ver también

Notas

  1. ^ En Taiwán y Hong Kong : 全形; en CJK: 全角.
  2. ^ En Taiwán y Hong Kong : 半形; en CJK: 半角.

Referencias

  1. ^ "Demostración de la UCI: Explorador de convertidores". demo.icu-project.org . Consultado el 7 de mayo de 2018 .
  2. ^ Lunde, Ken (25 de enero de 2019). "Anexo n.º 11 del estándar Unicode®: ancho de Asia oriental". Consorcio Unicode .
  3. ^ "Sintaxis de las funciones OpenType en CSS". Adobe . Consultado el 20 de septiembre de 2023 .

enlaces externos