La puntuación general es un bloque Unicode que contiene puntuación , espaciado y caracteres de formato para usar con todos los scripts y sistemas de escritura. Se incluyen espacios de ancho definido , formatos de unión, formatos direccionales, comillas tipográficas , puntuación arcaica y novedosa como el interrobang y operadores matemáticos invisibles.
Los caracteres de puntuación adicionales se encuentran en el bloque de puntuación suplementaria y se encuentran esparcidos en docenas de otros bloques Unicode.
Varios caracteres de este bloque normalmente no se representan con un glifo directamente visible. Diez caracteres de espacio en blanco U+2002 a U+200B ( en fijo o 1⁄2 em , em , 1⁄3 em , 1⁄4 em , 1⁄6 em , espacio de figura y puntuación , variable fino o 1⁄5 em y cabello space , espacio fijo de ancho cero ) y U+205F ( medio matemático o espacio de 2⁄9 em ) difieren por el ancho horizontal, mientras que U+2000 y U+2001 ( en y em quad ) son efectivamente alias de U+2002 y U +2003, respectivamente; otros dos, U+202F y U+2060 (mal llamado unión de palabras ) son variantes de U+2009 o U+2004 y U+200B que prohíben los saltos de línea. Tres caracteres de ancho cero U+200B a U+200D ( espacio, no unido y unidor ) difieren en cómo afectan la ligadura y la configuración de letras adyacentes, como las formas contextuales en árabe. Once caracteres invisibles U+200E, U+200F ( marcas de izquierda a derecha y de derecha a izquierda ), U+202A a U+202E ( incrustaciones, pops y anulaciones ) y U+2066 a U+2069 ( aislamientos ) controlar la direccionalidad del texto a menos que el marcado de nivel superior los anule. Hay separadores explícitos de líneas y párrafos en U+2028 y U+2029.
A partir de Unicode 16 (2024), el bloque tiene secuencias de variación definidas para las variantes posicionales de puntuación de Asia Oriental de las comillas '...' y “...”. Utilizan U+FE00 SELECTOR DE VARIACIÓN-1 (VS01) y U+FE01 SELECTOR DE VARIACIÓN-2 (VS02): [3]
Se espera que los formularios que no son de ancho completo estén separados con un espacio en un lado, los formularios de ancho completo no:
En el texto vertical, los formularios de ancho completo deberían mostrarse algo diferentes, e incluso como comillas CJK normales 「...」 y 『...』 si la propiedad de orientación vertical está establecida en "Hans":
El bloque de puntuación general contiene dos emoji : U+203C y U+2049. [4] [5]
El bloque tiene cuatro variantes estandarizadas definidas para especificar el estilo emoji (U+FE0F VS16) o la presentación de texto (U+FE0E VS15) para los dos emoji, los cuales tienen por defecto una presentación de texto. [6]
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de Puntuación general: