stringtranslate.com

Etiquetas (bloque Unicode)

Tags es un bloque Unicode que contiene caracteres de etiquetas de formato. El bloque está diseñado para reflejar ASCII . Originalmente estaba pensado para etiquetas de idioma, pero ahora se ha reutilizado como modificadores de emoji, específicamente para banderas de región.

Uso heredado

U+E0001, U+E0020–U+E007F fueron originalmente pensados ​​para etiquetar textos de manera invisible por idioma [3] pero ese uso ya no se recomienda. [4] Todos esos caracteres quedaron obsoletos en Unicode 5.1.

Con el lanzamiento de Unicode 8.0, los caracteres U+E0020–U+E007E ya no están en desuso. El cambio se realizó "para despejar el camino para el posible uso futuro de caracteres de etiqueta para un propósito distinto al de representar etiquetas de idioma". [5] Unicode afirma que "el uso de caracteres de etiqueta para representar etiquetas de idioma en un flujo de texto sin formato sigue siendo un mecanismo en desuso para transmitir información de idioma sobre el texto". [5]

Uso actual

Con el lanzamiento de Unicode 9.0, U+E007F ya no es un carácter obsoleto. (U+E0001 ETIQUETA DE IDIOMA sigue estando obsoleto). El lanzamiento de Emoji 5.0 en mayo de 2017 [6] considera que estos caracteres son emojis para usar como modificadores en secuencias especiales.

El único uso especificado es para representar las banderas de las regiones, junto con el uso de símbolos indicadores regionales para las banderas nacionales. [7] Estas secuencias consisten en U+1F3F4 🏴 BANDERA NEGRA ONDEANDO seguida de una secuencia de etiquetas correspondientes a la región tal como se codifica en el CLDR , luego U+E007F CANCELAR ETIQUETA . Por ejemplo, el uso de las etiquetas para "gbeng" (🏴󠁧󠁢󠁥󠁮󠁧󠁿) hará que algunos sistemas muestren la bandera de Inglaterra , las de "gbsct" (🏴󠁧󠁢󠁳󠁣󠁴󠁿) la bandera de Escocia , y las de "gbwls" (🏴󠁧󠁢󠁷󠁬󠁳󠁿) la bandera de Gales . [7]

Las secuencias de etiquetas se derivan de la norma ISO 3166-2 , pero también es posible utilizar este mecanismo para representar otras banderas subnacionales (por ejemplo, estados de EE. UU. ). Sin embargo, a partir de la versión 12.0 de Unicode, solo las tres secuencias de banderas mencionadas anteriormente están "recomendadas para el intercambio general" por el Consorcio Unicode, lo que significa que es "más probable que tengan un amplio respaldo en múltiples plataformas". [8]

Bloque Unicode

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque Etiquetas:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ Whistler, K.; Adams, G. (enero de 1999). "RFC2482: Etiquetado de idioma en texto sin formato Unicode". Grupo de trabajo de redes. doi :10.17487/RFC2482. {{cite journal}}: Requiere citar revista |journal=( ayuda )
  4. ^ Whistler, K.; Adams, G.; Duerst, M.; Klensin, J.; Klensin, J. (noviembre de 2010). Presuhn, R. (ed.). "RFC6082: Desuso de caracteres de etiquetas de lenguaje Unicode: RFC 2482 es histórico". Grupo de trabajo de ingeniería de Internet (IETF). doi : 10.17487/RFC6082 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  5. ^ ab "Unicode 8.0.0, Implicaciones para la migración". Consorcio Unicode.
  6. ^ "Lista de Emojis Versión 5.0". Emojipedia . Consultado el 24 de julio de 2021 .
  7. ^ ab "UTR #51: Emoji Unicode". Consorcio Unicode. 18 de mayo de 2017.
  8. ^ "emoji-sequences.txt". Consorcio Unicode . 2023-06-05 . Consultado el 5 de marzo de 2019 .