stringtranslate.com

Latín básico (bloque Unicode)

El bloque Unicode latino básico , [3] a veces llamado informalmente controles C0 y latín básico , [4] es el primer bloque del estándar Unicode y el único bloque que está codificado en un byte en UTF-8 . El bloque contiene todas las letras y códigos de control de la codificación ASCII. Va desde U+0000 hasta U+007F, contiene 128 caracteres e incluye los controles C0 , puntuación y símbolos ASCII , dígitos ASCII , tanto mayúsculas como minúsculas del alfabeto inglés y un carácter de control .

El bloque Latín Básico se incluyó en su forma actual a partir de la versión 1.0.0 del Estándar Unicode, sin adición ni alteración del repertorio de caracteres. [5] Su nombre de bloque en Unicode 1.0 era ASCII . [6]

tabla de personajes

R La letra U+005C (\) puede aparecer como un signo Yen(¥) o Won(₩) en fuentes japonesas/coreanas, confundiendo Unicode (especialmente UTF-8 ) con un conjunto de caracteres heredado que reemplazó la barra invertida con estos signos. [7]

Subtítulos

El bloque Controles C0 y latín básico contiene seis subtítulos. [8]

controles de CO

Los controles C0 , denominados códigos de control C0 ASCII en la versión 1.0, se heredan de ASCII y otros esquemas de codificación de 7 y 8 bits. Los nombres de alias para los controles C0 se toman del estándar ISO/IEC 6429:1992. [8]

Puntuación y símbolos ASCII

Este subtítulo se refiere a caracteres de puntuación estándar, operadores matemáticos simples y símbolos como el signo de dólar, el porcentaje, el signo comercial, el guión bajo y la barra vertical. [8]

dígitos ASCII

El subtítulo Dígitos ASCII contiene los caracteres numéricos estándar europeos del 1 al 9 y 0. [8]

Alfabeto latino en mayúsculas

El subtítulo del alfabeto latino en mayúsculas contiene el alfabeto latino estándar de 26 letras sin acentos en mayúscula . [8]

Alfabeto latino en minúsculas

El subtítulo del alfabeto latino en minúsculas contiene el alfabeto latino estándar de 26 letras sin acentos en minúscula . [8]

Carácter de control

El subtítulo Carácter de control contiene el carácter "Eliminar" . [8]

Número de símbolos, letras y códigos de control.

La siguiente tabla muestra el número de letras , símbolos y códigos de control en cada uno de los subtítulos del bloque Controles C0 y Latín básico.

Cuadro

Variantes

Varios de los caracteres están definidos para representarse como una variante estandarizada si van seguidos de indicadores de variante.

Se define una variante para un cero con trazo diagonal corto: U+0030 DIGIT ZERO, U+FE00 VS1 (0︀). [9] [10]

Doce caracteres (#, * y los dígitos) pueden ir seguidos de U+FE0E VS15 o U+FE0F VS16 para crear variantes de emoji . [11] [12] [13] [14] Son caracteres base de teclas , por ejemplo #️⃣ (U+0023 SIGNO DE NÚMERO U+FE0F VS16 U+20E3 COMBINACIÓN DE TECLAS ENCERRADAS). La versión VS15 es "presentación de texto" mientras que la versión VS16 es "estilo emoji". [10]

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de latín básico:

Ver también

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ "bloque.txt". El Consorcio Unicode . Consultado el 23 de marzo de 2023 .
  4. ^ "Controles C0 y latín básico" (PDF) . El estándar Unicode, versión 15.0 . Unicode, Inc. 2022 . Consultado el 22 de marzo de 2023 .
  5. ^ El estándar Unicode versión 1.0, volumen 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  6. ^ "3.8: Gráficos bloque por bloque" (PDF) . El estándar Unicode . versión 1.0. Consorcio Unicode .
  7. ^ Michael S. Kaplan (17 de septiembre de 2005). "¿Cuándo una barra invertida no es una barra invertida?". Ordenándolo todo . Microsoft. Archivado desde el original el 12 de junio de 2010.También disponible en: http://archives.miloush.net/michkap/archive/2005/09/17/469941.html
  8. ^ abcdefg "Tablas de códigos Unicode 6.2" (PDF) . El estándar Unicode . Consultado el 1 de abril de 2013 .
  9. ^ Beeton, Bárbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30 de octubre de 2015). "L2/15-268: Propuesta para representar la variante cero recortada del conjunto vacío" (PDF) .
  10. ^ ab "Secuencias de variaciones de emojis UTS n.° 51". El Consorcio Unicode.
  11. ^ Edberg, Peter (22 de diciembre de 2011). "L2/11-438: Secuencias de variación de emojis (revisión de L2/11-429)" (PDF) .
  12. ^ Pournader, Roozbeh (1 de noviembre de 2015). "L2/15-301: Una propuesta para 278 secuencias de variación estandarizadas para emoji" (PDF) .
  13. ^ "UTR n.° 51: emoji Unicode". Consorcio Unicode. 2023-09-05.
  14. ^ "UCD: datos de emoji para UTR n.° 51". Consorcio Unicode. 2023-02-01.

enlaces externos

Escuche este artículo ( 5 minutos )
Icono de Wikipedia hablado
Este archivo de audio se creó a partir de una revisión de este artículo con fecha del 8 de noviembre de 2023 y no refleja ediciones posteriores. ( 2023-11-08 )