El bloque Unicode de latín básico , [3] a veces llamado informalmente Controles C0 y Latín básico , [4] es el primer bloque del estándar Unicode , y el único bloque que está codificado en un byte en UTF-8 . El bloque contiene todas las letras y códigos de control de la codificación ASCII. Varía de U+0000 a U+007F, contiene 128 caracteres e incluye los controles C0 , puntuación y símbolos ASCII , dígitos ASCII , tanto las mayúsculas como las minúsculas del alfabeto inglés y un carácter de control .
El bloque de latín básico se incluyó en su forma actual a partir de la versión 1.0.0 del estándar Unicode, sin adición ni alteración del repertorio de caracteres. [5] Su nombre de bloque en Unicode 1.0 era ASCII . [6]
El bloque de Controles C0 y latín básico contiene seis subtítulos. [8]
Los controles C0 , denominados códigos de control ASCII C0 en la versión 1.0, son heredados de ASCII y otros esquemas de codificación de 7 y 8 bits. Los nombres de alias para los controles C0 se toman de la norma ISO/IEC 6429:1992 . [8]
Este subtítulo se refiere a caracteres de puntuación estándar, operadores matemáticos simples y símbolos como el signo de dólar, el porcentaje, el ampersand, el guión bajo y la barra vertical. [8]
El subtítulo Dígitos ASCII contiene los caracteres numéricos europeos estándar 1–9 y 0. [8]
El subtítulo Alfabeto latino en mayúsculas contiene el alfabeto latino estándar de 26 letras sin acento en mayúscula . [8]
El subtítulo Alfabeto latino en minúsculas contiene el alfabeto latino estándar de 26 letras sin acento en minúsculas . [8]
El subtítulo Carácter de control contiene el carácter "Eliminar" . [8]
La siguiente tabla muestra el número de letras , símbolos y códigos de control en cada una de las subpartidas del bloque de Controles C0 y Latín Básico.
Varios de los caracteres están definidos para representarse como una variante estandarizada si van seguidos de indicadores de variante.
Se define una variante para un cero con un trazo diagonal corto: U+0030 DÍGITO CERO, U+FE00 VS1 (0︀). [9] [10]
Doce caracteres (#, * y los dígitos) pueden ir seguidos de U+FE0E VS15 o U+FE0F VS16 para crear variantes de emoji . [11] [12] [13] [14] Son caracteres base de teclas , por ejemplo #️⃣ (U+0023 SIGNO DE NÚMERO U+FE0F VS16 U+20E3 TECLA QUE ENCIerra COMBINACIÓN). La versión VS15 es de "presentación de texto", mientras que la versión VS16 es de "estilo emoji". [10]
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de latín básico: