stringtranslate.com

Entrada Unicode

La herramienta de mapeo de caracteres KCharSelect muestra un subconjunto de los operadores matemáticos Unicode
El logotipo de Unicode

La entrada Unicode es la inserción de un carácter Unicode específico en una computadora por parte de un usuario ; es una forma común de ingresar caracteres que no son compatibles directamente con un teclado físico . Los caracteres Unicode se pueden producir seleccionándolos desde una pantalla o escribiendo una determinada secuencia de teclas en un teclado físico. Además, un carácter producido por uno de estos métodos en una página web o documento se puede copiar en otro. A diferencia del conjunto de caracteres de 96 elementos de ASCII (que contiene), Unicode codifica cientos de miles de grafemas (caracteres) de casi todos los idiomas escritos del mundo y muchos otros signos y símbolos. [1] [ se necesita una mejor fuente ]

Un sistema de entrada Unicode debe permitir un amplio repertorio de caracteres, idealmente todos los puntos de código Unicode válidos. Esto es diferente de una disposición de teclado que define teclas y sus combinaciones solo para una cantidad limitada de caracteres apropiados para una determinada configuración regional .

Números Unicode

Los caracteres Unicode se distinguen por puntos de código , que se representan convencionalmente con "U+" seguido de cuatro, cinco o seis dígitos hexadecimales , por ejemplo U+00AE o U+1D310. Los caracteres del Plano Multilingüe Básico (BMP), que contiene escrituras modernas  (incluidos muchos caracteres chinos y japoneses) y muchos símbolos, tienen un código de 4 dígitos. Las escrituras históricas, pero también muchos símbolos y pictogramas modernos (como emoticones , emojis , naipes y muchos caracteres CJK ) tienen códigos de 5 dígitos.

Disponibilidad de glifos

El glifo 0 debe asignarse a un glifo .notdef. El glifo .notdef es muy importante para proporcionar al usuario información de que no se encuentra un glifo en la fuente. Este glifo no debe dejarse sin contorno, ya que el usuario solo verá lo que parece un espacio si falta un glifo y no será consciente de la limitación de la fuente activa. [2]

Recomendaciones para fuentes OpenType (Microsoft.com)

Una aplicación puede mostrar un carácter solo si puede acceder a una fuente de computadora que contenga un glifo para ese carácter. [3] Las fuentes generalmente tienen una cobertura Unicode incompleta; la mayoría solo contiene los glifos necesarios para admitir algunos sistemas de escritura . Sin embargo, la mayoría de los navegadores modernos y otras aplicaciones de procesamiento de texto pueden mostrar contenido multilingüe porque realizan una sustitución de fuentes , cambiando automáticamente a una fuente de respaldo cuando es necesario para mostrar caracteres que no son compatibles con la fuente actual. Las fuentes que se usan como respaldo y la minuciosidad de la cobertura Unicode varían según el software y el sistema operativo; algunos programas buscarán un glifo adecuado en todas las fuentes instaladas, otros solo buscan dentro de ciertas fuentes.

Si una aplicación no tiene acceso a un glifo, el carácter generalmente se mostrará como el .notdefglifo de la fuente ⟨􏿮⟩ , que a menudo aparece como un cuadro vacío, ☐ (apodado " tofu " por la forma), un cuadro con una X dentro, ☒, un diamante con un signo de interrogación, �, o un cuadro con un signo de interrogación dentro, ⍰.

Técnicas

Mapeo de teclado extendido

La mayoría de los sistemas operativos admiten el mapeo de teclado extendido  : la posibilidad de aumentar el repertorio de caracteres disponibles utilizando técnicas como el gráfico alternativo ("AltGr") que da un tercer y cuarto significado a cada tecla; tecla de composición (a veces llamada tecla múltiple ), una tecla en un teclado de computadora que indica que las siguientes pulsaciones de teclas (generalmente 2 o más) activan la inserción de un carácter alternativo, generalmente un carácter precompuesto o un símbolo; [4] teclas muertas que se usan típicamente para adjuntar un diacrítico específico a una letra base ; [5] o incluso combinaciones de estos.

Estas técnicas facilitan la entrada de conjuntos de caracteres más allá del conjunto básico que viene de serie con la computadora.

Selección desde una pantalla

Mapa de caracteres de GNOME

Muchos sistemas ofrecen una forma de seleccionar caracteres Unicode visualmente. La norma ISO/IEC 14755 se refiere a esto como un método de entrada de selección de pantalla . [6]

Microsoft Windows ha proporcionado una versión Unicode del programa Mapa de caracteres , que aparece en la edición para consumidores desde XP. Esta se limita a caracteres del Plano Multilingüe Básico (BMP). Los caracteres se pueden buscar por nombre de carácter Unicode y la tabla se puede limitar a un bloque de código en particular. [7] A partir de Windows 10, Microsoft Windows también contiene el llamado "teclado de emojis". Se puede iniciar manteniendo presionada la tecla Windows (la que tiene el símbolo de Windows) y presionando la tecla de punto o coma. El teclado de emojis permite ingresar emojis y símbolos. [8]

También hay disponibles herramientas de terceros más avanzadas del mismo tipo (un ejemplo notable de software gratuito es BabelMap , que admite todos los caracteres Unicode). En la mayoría de los entornos de escritorio Linux , hay disponibles herramientas equivalentes, como gucharmap (GNOME) o kcharselect (KDE). [9]

Generalmente, estas herramientas permiten al usuario "copiar" los caracteres seleccionados en el portapapeles y luego pegarlos en el documento, en lugar de pretender escribirlos directamente.

A menudo resulta práctico simplemente buscar el carácter deseado en la web o en otro documento y copiarlo y pegarlo desde allí.

Entrada decimal (códigos Alt)

Algunos programas que se ejecutan en Microsoft Windows , incluidas las versiones recientes de Word y el Bloc de notas , pueden producir caracteres a partir de sus puntos de código Unicode expresados ​​en decimal e ingresados ​​en el teclado numérico con la Alttecla presionada. Por ejemplo, el símbolo del euro tiene 20AC como su punto de código hexadecimal, que es 8364 en decimal, por lo que + producirá el símbolo. De manera similar, + produce el carácter 𝕄 de doble tachado ( negrita de pizarra ) .Alt8364Alt120132

Los puntos de código decimal en el rango 160–255 deben ingresarse con un cero inicial (para que se elija la página de códigos de Windows ) y, además, la página de códigos de Windows debe configurarse para que coincida con Unicode ( se debe usar CP1252 [a] ). Por ejemplo, + produce un ÷ , correspondiente a su punto de código, pero el carácter producido por + depende de la página de códigos OEM , como la página de códigos 437 , y puede producir un  . Además , + a + producen los caracteres asignados en las filas 8 y 9 en el diseño CP1252 , en lugar de los códigos de control C1 que se asignan a esos números en Unicode.Alt0247Alt247Alt0128Alt0159

En programas que no fueron diseñados para manejar códigos Alt mayores de 255, el carácter recuperado usualmente corresponde al resto cuando el número se divide por 256. [ cita requerida ]

El editor de texto Vim permite especificar caracteres mediante mnemónicos de dos caracteres denominados dígrafos . El conjunto instalado se puede ampliar con mnemónicos personalizados definidos para puntos de código arbitrarios, especificados en decimal. Por ejemplo, como el decimal 9881 es igual al hexadecimal 2699, dig Gr 9881asocia "Gr" con U+2699 GEAR .

Vea a continuación el uso de puntos de código decimal en HTML.

Entrada hexadecimal

La cláusula 5.1 de la norma ISO/IEC 14755 describe un método básico en el que una secuencia inicial va seguida de la representación numérica hexadecimal del punto de código y la secuencia final . La mayoría de los sistemas modernos tienen algún método para emular esto, a veces limitado a cuatro dígitos (por lo tanto, solo el plano multilingüe básico ).

En Microsoft Windows

La entrada Unicode hexadecimal se puede habilitar agregando un valor de tipo cadena (REG_SZ) llamado EnableHexNumpada la clave de registroHKEY_CURRENT_USER\Control Panel\Input Method y asignándole los datos del valor 1. Los usuarios deberán cerrar sesión y volver a iniciarla después de editar el registro para que este método de entrada comience a funcionar. (En versiones anteriores a Windows Vista , los usuarios debían reiniciar para que comenzara a funcionar).

En algunas aplicaciones ( Word , Bloc de notas y programas de LibreOffice ), + reemplazará el número hexadecimal a la izquierda del cursor con el carácter Unicode correspondiente. A menos que tenga seis dígitos hexadecimales, el código no debe estar precedido por ningún dígito o letras a–f, ya que pueden considerarse parte del código que se va a convertir. Por ejemplo, si se ingresa seguido de + (o + si se usa una versión en francés), se producirá '૱' (U+0AF1), pero si se ingresa seguido de + se producirá 'añ' ('a' seguida del carácter U+00F1).AltXaf1AltXAltCa0000f1AltX

Esta función permite introducir caracteres Unicode en otras aplicaciones: se puede crear un carácter deseado en el Bloc de notas, por ejemplo, y luego cortarlo y pegarlo donde se desee.

En MacOS

La entrada hexadecimal de Unicode debe estar habilitada. En Mac OS 8.5 y versiones posteriores, se puede elegir la distribución del teclado de entrada hexadecimal Unicode ; en OS X (10.10) Yosemite , esto se puede agregar en Teclado → Fuentes de entrada.

Manteniendo presionada la tecla , se escribe el punto de código hexadecimal Unicode de cuatro dígitos y aparece el carácter equivalente; luego se puede soltar la tecla. [10] Los caracteres fuera del BMP (el Plano Multilingüe Básico) exceden el límite de cuatro dígitos del mecanismo de ingreso hexadecimal Unicode, pero se pueden ingresar usando pares sustitutos : manteniendo presionada la tecla mientras se ingresa el primer sustituto, el , el segundo sustituto y luego se suelta la tecla Opción.⌥ Option⌥ Option⌥ Option+

En X11 (Linux y otras variantes de Unix, incluido ChromeOS)

En muchas aplicaciones, uno o ambos de los siguientes métodos funcionan para ingresar directamente caracteres Unicode:

Esto es compatible con aplicaciones GTK y Qt, y posiblemente otras. En ChromeOS, esta es una función del sistema operativo. [11]

En aplicaciones independientes de la plataforma

HTML

En HTML y XML , los códigos de caracteres que se van a representar como caracteres van precedidos por un ampersand y un signo de número (&#), y van seguidos de un punto y coma (;). El punto de código puede estar en formato decimal o hexadecimal ; en este último caso va precedido de una "x". Se pueden omitir los ceros iniciales. Una entidad con nombre puede representar una serie de caracteres .

Ejemplo: En HTML/XML, el signo de copyright © ( U+00A9) puede codificarse como:

Esto funciona en muchos programas que aceptan marcado HTML, como Thunderbird y la edición de Wikipedia.

Véase también

Notas

  1. ^ CP1252 es el valor predeterminado en América del Norte y del Sur, incluidas las islas del Caribe, Europa occidental, África central y meridional, Australia, Nueva Zelanda y las (antiguas) colonias y posesiones europeas en Oceanía.

Referencias

  1. ^ Lafontaine, Sylvain (17 de febrero de 2012). «Diferencias y ventajas entre Unicode y ASCII». MSDN . Consultado el 28 de febrero de 2014 .
  2. ^ "Recomendaciones para fuentes OpenType". Microsoft.com.
  3. ^ Andrew Marcuse, "Cómo introducir caracteres Unicode en Microsoft Windows". Fecha de acceso: 13 de septiembre de 2012
  4. ^ "Símbolos de texto del teclado de Linux: atajos de teclado de redacción". FSymbols . 2013-07-24 . Consultado el 2015-07-07 .
  5. ^ "Llave muerta | Definición de llave muerta según Merriam-Webster". Merriam-webster.com . Consultado el 1 de mayo de 2017 .
  6. ^ "ISO/IEC 14755:1997 Tecnología de la información - Métodos de entrada para introducir caracteres del repertorio de ISO/IEC 10646 con un teclado u otro dispositivo de entrada". ISO . Consultado el 14 de octubre de 2017 .
  7. ^ "Cómo usar caracteres especiales en documentos de Windows". support.microsoft.com . 31 de julio de 2019 . Consultado el 17 de octubre de 2020 .
  8. ^ "Consejo de Windows 10: comience a usar el atajo de teclado de emojis". blogs.windows.com . 5 de febrero de 2018 . Consultado el 4 de junio de 2024 .
  9. ^ Peck, Akkana (25 de noviembre de 2009). "Dominar los conjuntos de caracteres en Linux (Personajes extraños, parte 2)". LinuxPlanet . Archivado desde el original el 26 de noviembre de 2010. Consultado el 5 de diciembre de 2018 .
  10. ^ Cómo escribir caracteres especiales y acentuados Archivado el 9 de marzo de 2008 en Wayback Machine.
  11. ^ de Jack Busch (20 de abril de 2018). "Escribir caracteres especiales con una Chromebook (acentos, símbolos, guiones largos)". groovypost.com . Consultado el 28 de febrero de 2020 .
  12. ^ Documentación de Vim: gui_w32