stringtranslate.com

Nombres de alias y abreviaturas Unicode

En Unicode , los caracteres pueden tener un nombre único . Un personaje también puede tener uno o más alias . Un nombre de alias puede ser una abreviatura, un nombre de control C0 o C1, una corrección, un nombre alternativo o una invención. Un alias también es único entre todos los nombres y alias y, por tanto, identificable.

Fondo

El nombre Unicode principal y formal es único entre todos los nombres, solo utiliza ciertos caracteres y formatos y se garantiza que nunca cambiará. El nombre formal consta de caracteres A–Z (mayúsculas), 0–9, " " (espacio) y "-" (guion). Junto a este nombre, un personaje puede tener uno o más alias formales (normativos) . Un nombre de alias de este tipo también sigue las reglas de un nombre: caracteres utilizados (AZ, -, 0-9, <espacio>) y no utilizados (az, %, $, etc.). Los nombres de alias también son únicos en el conjunto de nombres completo (es decir, todos los nombres y nombres de alias son únicos en su conjunto combinado). Los nombres de alias se describen formalmente en el estándar Unicode. [1] [2] En este sentido, una abreviatura también se considera un nombre Unicode .

Razón para agregar un alias

Hay cinco razones posibles para asignar un nombre de alias a un punto de código. [1] Un personaje puede tener varios alias: por ejemplo, U+0008 <control-0008> tiene el alias de control BACKSPACE y el alias de abreviatura BS .

1. Abreviatura
Abreviaturas (o acrónimos) que aparecen comúnmente para códigos de control, caracteres de formato, espacios y selectores de variación.
Hay 354 alias de este tipo, incluidos 256 alias para selectores de variantes (VS-1... VS-256).
Por ejemplo, U+00A0 ESPACIO NO-BREAK tiene alias NBSP .  
Presentación: en las tablas de códigos, la abreviatura se muestra en un cuadro discontinuo:
nbsp
.
2. Controlar
Los nombres ISO 6429 para las funciones de control C0 y C1 y nombres similares que aparecen comúnmente se agregan como alias al carácter.
Hay 84 alias de este tipo.
Por ejemplo, U+0008 <control-0008> tiene el alias RETROCESO .
Presentación: Los caracteres de control no tienen nombre principal, están etiquetados como <control-0008>. Su alias, como RETROCESO, se utiliza en la documentación del gráfico, pero nunca como nombre principal. Esto evita la sustitución involuntaria (automatizada) por el carácter de control perturbador real. Por ejemplo, el uso del nombre de alias BEL en la línea se reemplazaría por U+0007 <control-0007> , lo que activaría el sonido de la campana.
3. Corrección
Esta es una corrección para un "problema grave" en el nombre del personaje principal, generalmente un error.
Hay 31 alias de este tipo.
Por ejemplo, U+2118SCRIPT CAPITAL P es en realidad una p minúscula , por lo que se le da un nombre de alias ※ WEIERSTRASS ELIPTIC FUNCTION : "en realidad, esto tiene la forma de una p caligráfica minúscula, a pesar de su nombre, y a través del alias la ortografía correcta está agregado."
Presentación: Un nombre corregido va precedido del símbolo ※ (la marca de referencia ).
4. Alternativo
Para un nombre alternativo ampliamente utilizado para un personaje.
Hay 1 de esos alias.
Ejemplo: U+FEFF ANCHO CERO ESPACIO SIN INTERRUPCIÓN tiene una MARCA DE ORDEN DE BYTE alternativa .
Presentación: descripción detallada en las tablas de personajes.
5. ficción
Varias etiquetas documentadas para puntos del código de control C1 que nunca fueron aprobados en ninguna norma ( figment = fingido, en ficción).
Hay 3 alias de este tipo.
Por ejemplo, U+0099 <control-0099> tiene un alias de producto INTRODUCTOR DE CARÁCTER GRÁFICO ÚNICO . Este nombre es un concepto arquitectónico de los primeros borradores de ISO/IEC 10646-1, pero nunca fue aprobado ni estandarizado.
Presentación: Estas abreviaturas de productos no están publicadas en Standard; el cuadro muestra "XXX" para cada uno de manera informal, es decir: no es una abreviatura única o identificativa.

Lista de alias

Nombres alternativos informales

El estándar Unicode también utiliza y publica nombres alternativos que no son formales y no figuran como alias normativos. Es posible que estas etiquetas no sean únicas y que utilicen caracteres irregulares en su nombre. Se utilizan en tablas de códigos Unicode, por ejemplo U+070F MARCA DE ABREVIATURA SIRIACA :   Sam. [3]

Ver también

Referencias

  1. ^ ab "NombreAliases-15.1.0.txt". El Consorcio Unicode. 2023-01-05 . Consultado el 12 de septiembre de 2023 .
  2. ^ El estándar Unicode (PDF) . 15.0.0. El Consorcio Unicode. 2022.ISBN _ 978-1-936213-32-0.
  3. ^ "Tablas de códigos de caracteres Unicode 14.0: siríaco" (PDF) .