stringtranslate.com

Latín básico (bloque Unicode)

El bloque Unicode de latín básico , [3] a veces llamado informalmente Controles C0 y Latín básico , [4] es el primer bloque del estándar Unicode , y el único bloque que está codificado en un byte en UTF-8 . El bloque contiene todas las letras y códigos de control de la codificación ASCII. Varía de U+0000 a U+007F, contiene 128 caracteres e incluye los controles C0 , puntuación y símbolos ASCII , dígitos ASCII , tanto las mayúsculas como las minúsculas del alfabeto inglés y un carácter de control .

El bloque de latín básico se incluyó en su forma actual a partir de la versión 1.0.0 del estándar Unicode, sin adición ni alteración del repertorio de caracteres. [5] Su nombre de bloque en Unicode 1.0 era ASCII . [6]

Tabla de personajes

La letra U+005C (\) puede aparecer como un signo de Yen (¥) o Won (₩) en fuentes japonesas/coreanas, confundiendo Unicode (especialmente UTF-8 ) con un conjunto de caracteres heredado que reemplazó la barra invertida con estos signos. [7]

Subtítulos

El bloque de Controles C0 y latín básico contiene seis subtítulos. [8]

Controles de CO

Los controles C0 , denominados códigos de control ASCII C0 en la versión 1.0, son heredados de ASCII y otros esquemas de codificación de 7 y 8 bits. Los nombres de alias para los controles C0 se toman de la norma ISO/IEC 6429:1992 . [8]

Puntuación y símbolos ASCII

Este subtítulo se refiere a caracteres de puntuación estándar, operadores matemáticos simples y símbolos como el signo de dólar, el porcentaje, el ampersand, el guión bajo y la barra vertical. [8]

Dígitos ASCII

El subtítulo Dígitos ASCII contiene los caracteres numéricos europeos estándar 1–9 y 0. [8]

Alfabeto latino en mayúsculas

El subtítulo Alfabeto latino en mayúsculas contiene el alfabeto latino estándar de 26 letras sin acento en mayúscula . [8]

Alfabeto latino en minúscula

El subtítulo Alfabeto latino en minúsculas contiene el alfabeto latino estándar de 26 letras sin acento en minúsculas . [8]

Personaje de control

El subtítulo Carácter de control contiene el carácter "Eliminar" . [8]

Número de símbolos, letras y códigos de control

La siguiente tabla muestra el número de letras , símbolos y códigos de control en cada una de las subpartidas del bloque de Controles C0 y Latín Básico.

Cuadro

Variantes

Varios de los caracteres están definidos para representarse como una variante estandarizada si van seguidos de indicadores de variante.

Se define una variante para un cero con un trazo diagonal corto: U+0030 DÍGITO CERO, U+FE00 VS1 (0︀). [9] [10]

Doce caracteres (#, * y los dígitos) pueden ir seguidos de U+FE0E VS15 o U+FE0F VS16 para crear variantes de emoji . [11] [12] [13] [14] Son caracteres base de teclas , por ejemplo #️⃣ (U+0023 SIGNO DE NÚMERO U+FE0F VS16 U+20E3 TECLA QUE ENCIerra COMBINACIÓN). La versión VS15 es de "presentación de texto", mientras que la versión VS16 es de "estilo emoji". [10]

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de latín básico:

Véase también

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ "block.txt". El Consorcio Unicode . Consultado el 23 de marzo de 2023 .
  4. ^ "Controles C0 y latín básico" (PDF) . El estándar Unicode, versión 15.0 . Unicode, Inc. 2022 . Consultado el 22 de marzo de 2023 .
  5. ^ Versión estándar Unicode 1.0, volumen 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  6. ^ "3.8: Gráficos bloque por bloque" (PDF) . El estándar Unicode . versión 1.0. Consorcio Unicode .
  7. ^ Michael S. Kaplan (17 de septiembre de 2005). "¿Cuándo una barra invertida no es una barra invertida?". Poniéndolo todo en orden . Microsoft. Archivado desde el original el 12 de junio de 2010.También disponible en: http://archives.miloush.net/michkap/archive/2005/09/17/469941.html
  8. ^ abcdefg «Gráficos de códigos Unicode 6.2» (PDF) . El estándar Unicode . Consultado el 1 de abril de 2013 .
  9. ^ Beeton, Bárbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30 de octubre de 2015). "L2/15-268: Propuesta para representar la variante cero recortada del conjunto vacío" (PDF) .
  10. ^ ab "Secuencias de variación de emojis UTS #51". El Consorcio Unicode.
  11. ^ Edberg, Peter (22 de diciembre de 2011). "L2/11-438: Secuencias de variación de emojis (revisión de L2/11-429)" (PDF) .
  12. ^ Pournader, Roozbeh (1 de noviembre de 2015). "L2/15-301: Una propuesta para 278 secuencias de variación estandarizadas para emojis" (PDF) .
  13. ^ "UTR #51: Emoji Unicode". Consorcio Unicode. 5 de septiembre de 2023.
  14. ^ "UCD: Datos de emojis para UTR n.° 51". Consorcio Unicode. 1 de febrero de 2023.

Enlaces externos

Escuche este artículo ( 5 minutos )
Icono de Wikipedia hablado
Este archivo de audio se creó a partir de una revisión de este artículo con fecha del 8 de noviembre de 2023 y no refleja ediciones posteriores. ( 08/11/2023 )