Una fuente Unicode es una fuente de computadora que asigna glifos a puntos de código definidos en el estándar Unicode . [1] La gran mayoría de las fuentes de computadora modernas utilizan asignaciones Unicode, incluso aquellas fuentes que solo incluyen glifos para un solo sistema de escritura , o incluso solo admiten el alfabeto latino básico . Las fuentes que admiten una amplia gama de escrituras Unicode y símbolos Unicode a veces se denominan "fuentes pan-Unicode", aunque como el número máximo de glifos que se pueden definir en una fuente TrueType está restringido a 65.535, no es posible que una sola fuente proporcione glifos individuales para todos los caracteres Unicode definidos (154.998 caracteres, con Unicode 16.0). Este artículo enumera algunas fuentes Unicode ampliamente utilizadas (enviadas con un sistema operativo o producidas por una empresa de fuentes comerciales conocida) que admiten una cantidad comparativamente grande y una amplia gama de caracteres Unicode.
El estándar Unicode no especifica ni crea ninguna fuente ( tipo de letra ), una colección de formas gráficas llamadas glifos, en sí. En lugar de eso, define los caracteres abstractos como un número específico (conocido como punto de código ) y también define los cambios de forma requeridos dependiendo del contexto en el que se utiliza el glifo (por ejemplo, combinación de caracteres , caracteres precompuestos y combinaciones de letras y diacríticos ). La elección de la fuente, que rige cómo los caracteres abstractos en el Conjunto de caracteres codificados universales (UCS) se convierten en un mapa de bits o una salida vectorial que luego se puede ver en una pantalla o imprimir, se deja en manos del usuario. Si se elige una fuente que no contiene un glifo para un punto de código utilizado en el documento, normalmente muestra un signo de interrogación, un cuadro o algún otro carácter sustituto .
Las fuentes de computadora utilizan varias técnicas para mostrar caracteres o glifos. Una fuente de mapa de bits contiene una cuadrícula de puntos conocidos como píxeles que forman una imagen de cada glifo en cada tipo y tamaño. Las fuentes de contorno (también conocidas como fuentes vectoriales) utilizan instrucciones de dibujo o fórmulas matemáticas para describir cada glifo. Las fuentes de trazo utilizan una serie de líneas específicas (para el borde del glifo) e información adicional para definir el perfil , o el tamaño y la forma de la línea en un tipo y tamaño específicos, que en conjunto describen la apariencia del glifo.
Las fuentes también incluyen reglas ortográficas especiales integradas para generar ciertas combinaciones de formas de letras (símbolos alternativos para la misma letra) que se pueden combinar en formas de ligadura especiales (caracteres mixtos). Los sistemas operativos , los navegadores web ( agente de usuario ) y otro software que utiliza ampliamente la tipografía, utilizan una fuente para mostrar texto en la pantalla o en medios impresos, y pueden programarse para utilizar esas reglas integradas. Alternativamente, pueden utilizar tecnologías externas de modelado de escritura (tecnología de renderizado o motor de "fuente inteligente"), y también pueden programarse para utilizar una fuente Unicode grande o utilizar múltiples fuentes diferentes para diferentes caracteres o idiomas.
Ninguna "fuente Unicode" incluye todos los caracteres definidos en la presente revisión de la norma ISO 10646 (Unicode), ya que cada vez se le añaden más idiomas y caracteres, y los formatos de fuentes comunes no pueden contener más de 65.535 glifos (aproximadamente la mitad del número de caracteres codificados en Unicode). Como resultado, los desarrolladores y las fundiciones de fuentes incorporan nuevos caracteres en versiones o revisiones más recientes de una fuente, o en fuentes auxiliares independientes diseñadas específicamente para idiomas concretos.
UCS tiene más de 1,1 millones de puntos de código, pero sólo los primeros 65.536 (el Plano 0: Plano Multilingüe Básico o BMP) habían entrado en uso común antes del año 2000.
Las primeras fuentes Unicode (con conjuntos de caracteres muy grandes y que admiten muchos bloques Unicode ) fueron Lucida Sans Unicode (lanzada en marzo de 1993), Unihan font (1993) y Everson Mono (1995).
Existen ambigüedades tipográficas en Unicode, de modo que algunos de los caracteres Han unificados (que se ven en chino, japonés y coreano) serán tipográficamente diferentes en diferentes regiones. Por ejemplo, el punto Unicode U+9AA8 骨 CJK UNIFIED IDEOGRAPH-9AA8 es tipográficamente diferente entre el chino simplificado y el chino tradicional. Esto tiene implicaciones para la idea de que un único tipo de letra puede satisfacer las necesidades de todas las localidades. [2] El diseño de Unicode garantiza que tales diferencias no creen ambigüedad semántica, pero el uso de formas incorrectas a menudo se considera visualmente incómodo o estéticamente inapropiado para los lectores nativos de idiomas del este de Asia.
Unicode es ahora la codificación estándar para muchos nuevos estándares y protocolos, y está integrado en la arquitectura de los sistemas operativos ( Microsoft Windows , Apple Mac OS y muchas versiones de Unix y Linux ), lenguajes de programación ( Ada , Perl , Python , Java , Common LISP , APL ) y bibliotecas (IBM International Components for Unicode (ICU), junto con los motores de renderizado Pango , Graphite , Scribe , Uniscribe y ATSUI ), formatos de fuente ( TrueType y OpenType ), etc. Muchos otros estándares también se están actualizando para ser compatibles con Unicode.
A continuación se muestra una selección de algunos de los programas de utilidad que pueden identificar los caracteres presentes en un archivo de fuente:
De las muchas fuentes Unicode disponibles, las que se enumeran a continuación son las más utilizadas en todo el mundo en las principales plataformas informáticas .
A continuación se muestra la cantidad de caracteres incluidos en la versión anterior de las fuentes para los diferentes bloques Unicode . Latín básico (128: 0000–007F ) significa que en el rango denominado "Latín básico" hay 128 códigos asignados, numerados del 0 al 7F . Las celdas muestran la cantidad de esos códigos que cubre cada fuente. Los bloques Unicode que se muestran son válidos para la versión Unicode 8.0 .
Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .
Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .
Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .