stringtranslate.com

Unificador de palabras

El carácter de unión de palabras ( WJ ) es un carácter de formato Unicode que se utiliza para indicar que no se deben producir saltos de línea en su posición. [1] No afecta la formación de ligaduras o uniones cursivas y se ignora a los efectos de la segmentación de texto. [1] Se codifica desde la versión Unicode 3.2 (publicada en 2002) como U+2060 WORD JOINER ( ).

El término "joiner" reemplaza al espacio sin separación de ancho cero ( ZWNBSP , U+FEFF), como un uso del espacio sin separación de ancho cero. El ZWNBSP se utiliza originalmente y actualmente como marca de orden de bytes (BOM) al comienzo de un archivo. Sin embargo, si se encuentra en otro lugar, debería, según Unicode, tratarse como un "joiner" de palabras, un espacio sin separación de ancho cero.

El uso deliberado de U+FEFF para este propósito está obsoleto a partir de Unicode 3.2, y se prefiere enfáticamente la palabra joiner . [1] [2]

Véase también

Referencias

  1. ^ abc "Controles de diseño" (PDF) . El estándar Unicode, versión 12.0.0 . El Consorcio Unicode. pág. 871.
  2. ^ Preguntas frecuentes - UTF-8, UTF-16, UTF-32 y BOM, "¿Qué debo hacer con U+FEFF en el medio de un archivo?".