stringtranslate.com

Puntuación general

Puntuación general es un bloque Unicode que contiene signos de puntuación , espaciado y formato para su uso con todos los sistemas de escritura. Se incluyen los espacios de ancho definido , los formatos de unión, los formatos direccionales, las comillas tipográficas , signos de puntuación arcaicos y novedosos como el interrobang y los operadores matemáticos invisibles.

Los caracteres de puntuación adicionales se encuentran en el bloque de Puntuación suplementaria y dispersos en docenas de otros bloques Unicode.

Bloquear

Varios caracteres de este bloque no suelen representarse con un glifo directamente visible. Diez caracteres de espacio en blanco U+2002 a U+200B ( en fijo o 1⁄2 em , em , 1⁄3 em , 1⁄4 em , 1⁄6 em , espacio de cifras y puntuación , thin variable o 1⁄5 em y hair space , espacio fijo de ancho cero ) y U+205F ( matemático medio o espacio de 2⁄9 em ) difieren en el ancho horizontal, mientras que U+2000 y U+2001 ( en y em quad ) son efectivamente alias de U+2002 y U+2003, respectivamente; otros dos, U+202F y U+2060 (el mal denominado word joiner ) son variantes de U+2009 o U+2004 y U+200B que prohíben los saltos de línea. Tres caracteres de ancho cero, U+200B a U+200D ( espacio, no-joiner y joiner ), difieren en cómo afectan la ligadura y la forma de las letras adyacentes, como las formas contextuales en árabe. Once caracteres invisibles, U+200E, U+200F ( marca de izquierda a derecha y de derecha a izquierda ), U+202A a U+202E ( incrustaciones, sobreimpresiones y anulaciones ) y U+2066 a U+2069 ( aislamientos ), controlan la direccionalidad del texto a menos que un marcado de nivel superior los anule. Hay separadores de línea y párrafo explícitos en U+2028 y U+2029.

Selectores de variación

A partir de Unicode 16 (2024), el bloque tiene secuencias de variación definidas para las variantes posicionales de puntuación de Asia Oriental de las comillas '...' y “...”. Utilizan el SELECTOR DE VARIACIÓN U+FE00-1 (VS01) y el SELECTOR DE VARIACIÓN U+FE01-2 (VS02): [3]

Se espera que los formularios que no son de ancho completo estén separados con un espacio en un lado, los formularios de ancho completo no lo están:

Las esquinas de registro rojas marcan las métricas del glifo y muestran cómo se alinea el glifo dentro del espacio asignado al carácter. Para la visualización de ancho variable (izquierda), se espera un espacio adyacente; para la visualización CJK de ancho completo (derecha), no es necesario un espacio.

En texto vertical, las formas de ancho completo se deben mostrar de manera algo diferente, e incluso como comillas CJK regulares 「...」 y 『...』 si la propiedad de orientación vertical está configurada en "Hans":

Comportamiento de CJK de las comillas genéricas en texto horizontal y vertical cuando se añade el selector de variación VS02. La columna "horizontal" de la izquierda es la columna "VS2" de la tabla anterior.

Emoji

El bloque de puntuación general contiene dos emojis : U+203C y U+2049. [4] [5]

El bloque tiene cuatro variantes estandarizadas definidas para especificar el estilo emoji (U+FE0F VS16) o la presentación de texto (U+FE0E VS15) para los dos emoji, ambos con presentación de texto predeterminada. [6]

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de puntuación general:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ Lunde, Ken (14 de octubre de 2023). "L2/23-212R: Propuesta para agregar secuencias de variación estandarizadas para cuatro comillas" (PDF) .
  4. ^ "UTR #51: Emoji Unicode". Consorcio Unicode. 5 de septiembre de 2023.
  5. ^ "UCD: Datos de emojis para UTR n.° 51". Consorcio Unicode. 1 de febrero de 2023.
  6. ^ "Secuencias de variación de emojis UTS #51". El Consorcio Unicode.