Los símbolos indicadores regionales son un conjunto de 26 caracteres alfabéticos Unicode (A–Z) destinados a ser utilizados para codificar códigos de países de dos letras ISO 3166-1 alfa-2 de un modo que permita un tratamiento especial opcional.
Estos fueron definidos porcomo parte del soporte de Unicode 6.0 para emoji , como una alternativa a la codificación de caracteres separados para cada bandera de país. Aunque se pueden mostrar como letras latinas, se pretende que las implementaciones puedan optar por mostrarlos de otras maneras, como mediante el uso de banderas nacionales . [1] [2] Las preguntas frecuentes de Unicode indican que se debe utilizar este mecanismo y que los símbolos de las banderas nacionales no se codificarán directamente. [3]
Están codificados en el rango U+1F1E6 🇦 SÍMBOLO INDICADOR REGIONAL LETRA A a U+1F1FF 🇿 SÍMBOLO INDICADOR REGIONAL LETRA Z dentro del bloque Suplemento Alfanumérico Incluido en el Plano Multilingüe Suplementario . [4]
Un par de símbolos indicadores regionales se denomina secuencia de banderas emoji (aunque representa una región específica, no una bandera específica para esa región). [6]
De los 676 pares posibles de símbolos indicadores regionales (26 × 26), solo 270 se consideran códigos de región Unicode válidos. Estos son un subconjunto de las secuencias de regiones del Repositorio de datos regionales comunes (CLDR): [6] [7] [8]
Se utiliza un mecanismo independiente ( secuencias de etiquetas emoji ) para las banderas regionales, como Inglaterra 🏴, Escocia 🏴, Gales 🏴, Texas 🏴 o California 🏴. [12] Utiliza U+ 1F3F4 🏴 BANDERA NEGRA ONDEANDO y caracteres de etiqueta de formato en lugar de símbolos indicadores regionales. Se basa en regiones ISO 3166-2 con guion eliminado y en minúsculas, p. ej. GB-ENG → gbeng, que termina en U+ E007F CANCEL TAG . Por lo tanto, la bandera de Inglaterra se representa mediante una secuencia U+1F3F4 , U+E0067 , U+E0062 , U+E0065 , U+E006E , U+E0067 , U+E007F . En la décima revisión, el consorcio Unicode estaba considerando U+ 1F3F3 🏳 WAVING WHITE FLAG en su lugar, [13] pero a partir de la undécima es negra. [14] Algunos proveedores optan por incluir secuencias de unión personalizadas de ancho cero que solo aparecen en su plataforma, como WhatsApp y su Refugee Nation Flag 🏳️🟧⬛️🟧. [15]
En 2007 se presentó un borrador de propuesta al Comité Técnico Unicode para codificar los símbolos emoji , específicamente aquellos de uso generalizado en teléfonos móviles por las compañías de telecomunicaciones japonesas DoCoMo , KDDI y SoftBank . [16] Los símbolos propuestos incluían diez banderas nacionales: [17] China (🇨🇳), Alemania (🇩🇪), España (🇪🇸), Francia (🇫🇷), el Reino Unido (🇬🇧), Italia (🇮🇹), Japón (🇯🇵), Corea del Sur (🇰🇷), Rusia (🇷🇺) y los Estados Unidos (🇺🇸). Algunos consideraron que codificar estas banderas pero no las de otros países era perjudicial. [18] Una solución rechazada fue codificar las diez banderas, pero llamarlas "SÍMBOLO DE COMPATIBILIDAD CON EMOJI-n" y representarlas visualmente en el Estándar como "EC n" en lugar de mostrar las banderas que representan. [19] Otra solución rechazada habría asignado 676 puntos de código (26×26) para cada combinación posible de dos letras de la A a la Z. Representarían entidades políticas basadas en ISO 3166, como "JP" para Japón o ccTLD de Internet ( dominios de nivel superior de código de país ) como "EU" para la Unión Europea. [20]
La solución aceptada fue agregar 26 caracteres para las letras utilizadas para la representación de indicadores regionales, que utilizadas en pares representarían las diez banderas nacionales y posibles extensiones futuras. [2] Según el estándar Unicode , "el propósito principal de dichos pares [de símbolos indicadores regionales] es proporcionar asignaciones de ida y vuelta inequívocas a ciertos caracteres utilizados en los conjuntos centrales de emoji" [21] específicamente las diez banderas nacionales: [22] 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 y 🇺🇸.