stringtranslate.com

Puntuación general

La puntuación general es un bloque Unicode que contiene puntuación , espaciado y caracteres de formato para usar con todos los scripts y sistemas de escritura. Se incluyen espacios de ancho definido , formatos de unión, formatos direccionales, comillas tipográficas , puntuación arcaica y novedosa como el interrobang y operadores matemáticos invisibles.

Los caracteres de puntuación adicionales se encuentran en el bloque de puntuación suplementaria y se encuentran esparcidos en docenas de otros bloques Unicode.

Bloquear

Varios caracteres de este bloque normalmente no se representan con un glifo directamente visible. Diez caracteres de espacio en blanco U+2002 a U+200B ( en fijo o 1⁄2 em , em , 1⁄3 em , 1⁄4 em , 1⁄6 em , espacio de figura y puntuación , variable fino o 1⁄5 em y cabello space , espacio fijo de ancho cero ) y U+205F ( medio matemático o espacio de 2⁄9 em ) difieren por el ancho horizontal, mientras que U+2000 y U+2001 ( en y em quad ) son efectivamente alias de U+2002 y U +2003, respectivamente; otros dos, U+202F y U+2060 (mal llamado unión de palabras ) son variantes de U+2009 o U+2004 y U+200B que prohíben los saltos de línea. Tres caracteres de ancho cero U+200B a U+200D ( espacio, no unido y unidor ) difieren en cómo afectan la ligadura y la configuración de letras adyacentes, como las formas contextuales en árabe. Once caracteres invisibles U+200E, U+200F ( marcas de izquierda a derecha y de derecha a izquierda ), U+202A a U+202E ( incrustaciones, pops y anulaciones ) y U+2066 a U+2069 ( aislamientos ) controlar la direccionalidad del texto a menos que el marcado de nivel superior los anule. Hay separadores explícitos de líneas y párrafos en U+2028 y U+2029.

Selectores de variación

A partir de Unicode 16 (2024), el bloque tiene secuencias de variación definidas para las variantes posicionales de puntuación de Asia Oriental de las comillas '...' y “...”. Utilizan U+FE00 SELECTOR DE VARIACIÓN-1 (VS01) y U+FE01 SELECTOR DE VARIACIÓN-2 (VS02): [3]

Se espera que los formularios que no son de ancho completo estén separados con un espacio en un lado, los formularios de ancho completo no:

Las esquinas de registro rojas marcan las métricas del glifo y muestran cómo se alinea el glifo dentro del espacio asignado al carácter. Para una visualización de ancho variable (izquierda), se espera un espacio adyacente; para una visualización CJK de ancho completo (derecha), no es necesario un espacio.

En el texto vertical, los formularios de ancho completo deberían mostrarse algo diferentes, e incluso como comillas CJK normales 「...」 y 『...』 si la propiedad de orientación vertical está establecida en "Hans":

Comportamiento CJK de comillas genéricas en texto horizontal y vertical cuando se agrega el selector de variación VS02. La columna 'horizontal' de la izquierda es la columna 'VS2' de la tabla anterior.

emojis

El bloque de puntuación general contiene dos emoji : U+203C y U+2049. [4] [5]

El bloque tiene cuatro variantes estandarizadas definidas para especificar el estilo emoji (U+FE0F VS16) o la presentación de texto (U+FE0E VS15) para los dos emoji, los cuales tienen por defecto una presentación de texto. [6]

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de Puntuación general:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ Lunde, Ken (14 de octubre de 2023). "L2/23-212R: Propuesta para agregar secuencias de variación estandarizadas para cuatro comillas" (PDF) .
  4. ^ "UTR n.° 51: emoji Unicode". Consorcio Unicode. 2023-09-05.
  5. ^ "UCD: datos de emoji para UTR n.° 51". Consorcio Unicode. 2023-02-01.
  6. ^ "Secuencias de variaciones de emojis UTS n.º 51". El Consorcio Unicode.