Puntuación general es un bloque Unicode que contiene signos de puntuación , espaciado y formato para su uso con todos los sistemas de escritura. Se incluyen los espacios de ancho definido , los formatos de unión, los formatos direccionales, las comillas tipográficas , signos de puntuación arcaicos y novedosos como el interrobang y los operadores matemáticos invisibles.
Los caracteres de puntuación adicionales se encuentran en el bloque de Puntuación suplementaria y dispersos en docenas de otros bloques Unicode.
Varios caracteres de este bloque no suelen representarse con un glifo directamente visible. Diez caracteres de espacio en blanco U+2002 a U+200B ( en fijo o 1⁄2 em , em , 1⁄3 em , 1⁄4 em , 1⁄6 em , espacio de cifras y puntuación , thin variable o 1⁄5 em y hair space , espacio fijo de ancho cero ) y U+205F ( matemático medio o espacio de 2⁄9 em ) difieren en el ancho horizontal, mientras que U+2000 y U+2001 ( en y em quad ) son efectivamente alias de U+2002 y U+2003, respectivamente; otros dos, U+202F y U+2060 (el mal denominado word joiner ) son variantes de U+2009 o U+2004 y U+200B que prohíben los saltos de línea. Tres caracteres de ancho cero, U+200B a U+200D ( espacio, no-joiner y joiner ), difieren en cómo afectan la ligadura y la forma de las letras adyacentes, como las formas contextuales en árabe. Once caracteres invisibles, U+200E, U+200F ( marca de izquierda a derecha y de derecha a izquierda ), U+202A a U+202E ( incrustaciones, sobreimpresiones y anulaciones ) y U+2066 a U+2069 ( aislamientos ), controlan la direccionalidad del texto a menos que un marcado de nivel superior los anule. Hay separadores de línea y párrafo explícitos en U+2028 y U+2029.
A partir de Unicode 16 (2024), el bloque tiene secuencias de variación definidas para las variantes posicionales de puntuación de Asia Oriental de las comillas '...' y “...”. Utilizan el SELECTOR DE VARIACIÓN U+FE00-1 (VS01) y el SELECTOR DE VARIACIÓN U+FE01-2 (VS02): [3]
Se espera que los formularios que no son de ancho completo estén separados con un espacio en un lado, los formularios de ancho completo no lo están:
En texto vertical, las formas de ancho completo se deben mostrar de manera algo diferente, e incluso como comillas CJK regulares 「...」 y 『...』 si la propiedad de orientación vertical está configurada en "Hans":
El bloque de puntuación general contiene dos emojis : U+203C y U+2049. [4] [5]
El bloque tiene cuatro variantes estandarizadas definidas para especificar el estilo emoji (U+FE0F VS16) o la presentación de texto (U+FE0E VS15) para los dos emoji, ambos con presentación de texto predeterminada. [6]
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de puntuación general: