stringtranslate.com

Etiquetas (bloque Unicode)

Etiquetas es un bloque Unicode que contiene caracteres de etiqueta de formato. El bloque está diseñado para reflejar ASCII . Originalmente estaba destinado a etiquetas de idioma, pero ahora se ha reutilizado como modificadores de emoji, específicamente para banderas de región.

Uso heredado

U+E0001, U+E0020–U+E007F originalmente estaban destinados a etiquetar textos de forma invisible por idioma [3] , pero ya no se recomienda ese uso. [4] Todos esos caracteres quedaron obsoletos en Unicode 5.1.

Con el lanzamiento de Unicode 8.0, U+E0020–U+E007E ya no son caracteres obsoletos. El cambio se realizó "para despejar el camino para el posible uso futuro de caracteres de etiquetas para un propósito distinto al de representar etiquetas de idioma". [5] Unicode afirma que "el uso de caracteres de etiqueta para representar etiquetas de idioma en una secuencia de texto sin formato sigue siendo un mecanismo obsoleto para transmitir información de idioma sobre el texto". [5]

Uso actual

Con el lanzamiento de Unicode 9.0, U+E007F ya no es un carácter obsoleto. (U+E0001 LANGUAGE TAG sigue en desuso). El lanzamiento de Emoji 5.0 en mayo de 2017 [6] considera que estos caracteres son emoji para su uso como modificadores en secuencias especiales.

El único uso especificado es el de representar las banderas de las regiones, junto con el uso de símbolos indicadores regionales para las banderas nacionales. [7] Estas secuencias constan de U+1F3F4 🏴 BANDERA NEGRA ONDANDO seguida de una secuencia de etiquetas correspondientes a la región codificada en CLDR , luego U+E007F CANCELAR ETIQUETA . Por ejemplo, el uso de las etiquetas para "gbeng" (🏴ڠڠڠڠڠڠ) hará que algunos sistemas muestren la bandera de Inglaterra , los de "gbsct" (🏴ڠڠڠڠڠڠ) la bandera de Escocia y los de "gbwls" (🏴ڠڠڠڠڠڠ), la bandera de Gales . [7]

Las secuencias de etiquetas se derivan de ISO 3166-2 , pero también son posibles secuencias que representan otras banderas subnacionales (por ejemplo, estados de EE. UU .) utilizando este mecanismo. Sin embargo, a partir de la versión 12.0 de Unicode, el Consorcio Unicode sólo las tres secuencias de indicadores enumeradas anteriormente son "recomendadas para intercambio general", lo que significa que "es más probable que sean ampliamente compatibles en múltiples plataformas". [8]

bloque Unicode

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque Etiquetas:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ Whistler, K.; Adams, G. (enero de 1999). "RFC2482: etiquetado de idioma en texto sin formato Unicode". Grupo de Trabajo de Red. doi :10.17487/RFC2482. {{cite journal}}: Citar diario requiere |journal=( ayuda )
  4. ^ Whistler, K.; Adams, G.; Duerst, M.; Klensin, J.; Klensin, J. (noviembre de 2010). Presuhn, R. (ed.). "RFC6082: Caracteres de etiquetas de lenguaje Unicode obsoletos: RFC 2482 es histórico". Grupo de trabajo de ingeniería de Internet (IETF). doi : 10.17487/RFC6082 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  5. ^ ab "Unicode 8.0.0, implicaciones para la migración". Consorcio Unicode.
  6. ^ "Lista de Emoji versión 5.0". Emojipedia . Consultado el 24 de julio de 2021 .
  7. ^ ab "UTR n.° 51: emoji Unicode". Consorcio Unicode. 2017-05-18.
  8. ^ "emoji-secuencias.txt". Consorcio Unicode . 2023-06-05 . Consultado el 5 de marzo de 2019 .