Esta documentación se comparte entre las plantillas {{ Bloques Unicode }} y {{ Códigos de script ISO 15924 y datos Unicode relacionados }} .
La plantilla se puede utilizar de la forma habitual. No es un cuadro de navegación, por lo que puede aparecer en cualquier parte del artículo. Las notas se incluyen en la plantilla y no aparecerán en la parte principal de Referencias.
{{ISO 15924/wp-article}}
TemplateData para códigos de script ISO 15924 y datos Unicode relacionados
Sin descripción.
Tenga en cuenta que un alfabeto no es un idioma . Un solo alfabeto, como el alfabeto latino, se utiliza en muchos idiomas. Unicode solo se refiere a los alfabetos, no a los idiomas que utilizan ese alfabeto. Aun así, puede haber matices, como el uso de acentos en las letras en el caso del inglés y el polaco.
La ISO define y publica una escritura en la lista ISO 15924. Define el código Alfa-4 (Aaaa-Zzzz), el código Numérico (000-999) y el Nombre formal para cada escritura aceptada. Actualmente hay unas 160 escrituras definidas en esta lista. Se incluyen escrituras como "Notación matemática (Zmth)" y "Código para escritura indeterminada (también conocida como Común, Zyyy)". La lista es mantenida y publicada formalmente por la ISO, y prácticamente por la oficina del Consorcio Unicode. Se publica en el sitio web de Unicode. Técnicamente, la lista es un archivo iso15924.txt
.
Luego, Unicode (no ISO) mantiene una lista de nombres de scripts de Alias junto a los scripts definidos por ISO, para cada script que Unicode haya codificado. El nombre de Alias es un nombre en inglés para ese script.
Por lo tanto, el código ISO alfa-4 obtiene un nombre de alias único por Unicode: Mymr:ISO Name=Myanmar (Burmese), Alias=Myanmar
. [1]
Estos nombres de alias también están presentes en el archivo de definición iso15924.txt
.
A partir de esa lista, Unicode puede traducir cualquier código alpha4 al nombre de alias del script y viceversa. Unicode no utiliza el nombre ISO formal.
En el nombre Unicode de un carácter se utiliza un nombre de script: " U+05BF ֿ HEBREW POINT RAFE ".
En la base de datos Unicode, Unicode agrega un código alfa-4 único apropiado a cada carácter de escritura individual . De modo que cada letra, puntuación, número, etc. de una escritura recibe ese código. Los caracteres utilizados por varias escrituras, como el punto (.), tienen el código de escritura "Zyyy" (Común). Unicode no utiliza los códigos de "escritura" para Matemáticas y Símbolos; los símbolos y caracteres matemáticos tienen la propiedad script="Desconocido".
Luego, en el archivo Scripts.txt
, Unicode publica el nombre del script de Alias por carácter (posiblemente por un rango de caracteres). Una parte de ese archivo se ve así:
...0591..05BD ; Hebreo # Mn [45] ACENTO HEBREO ETNAHTA..PUNTO HEBREO METEG05BE ; Hebreo # Pd PUNTUACIÓN HEBREA MAQAF05BF ; Hebreo # Mn PUNTO HEBREO RAFE05C0 ; Hebreo # Po PUNTUACIÓN HEBREA PASEQ05C1..05C2 ; Hebreo # Mn [2] PUNTO HEBREO PUNTO SHIN..PUNTO HEBREO PUNTO SIN05C3; Hebreo # Po PUNTUACIÓN HEBREA SOF PASUQ...
Este archivo de datos define qué scripts están presentes en Unicode y qué script se encuentra en un determinado punto de código.
Dado un rango de bloques de puntos de código, ¿qué secuencias de comandos están presentes en ese bloque? Consulte {{ Bloques Unicode }} : esta tabla se construye señalando cada secuencia de comandos que está presente como un bloque (una vez).
No existe una relación segura entre el nombre de un script y el nombre de un bloque. Algunos scripts se encuentran en un solo bloque, pero otros se encuentran distribuidos entre varios bloques.