stringtranslate.com

Fuente Unicode

Una fuente Unicode es una fuente de computadora que asigna glifos a puntos de código definidos en el estándar Unicode . [1] La gran mayoría de las fuentes de computadora modernas utilizan asignaciones Unicode, incluso aquellas fuentes que solo incluyen glifos para un solo sistema de escritura , o incluso solo admiten el alfabeto latino básico . Las fuentes que admiten una amplia gama de escrituras Unicode y símbolos Unicode a veces se denominan "fuentes pan-Unicode", aunque como el número máximo de glifos que se pueden definir en una fuente TrueType está restringido a 65.535, no es posible que una sola fuente proporcione glifos individuales para todos los caracteres Unicode definidos (154.998 caracteres, con Unicode 16.0). Este artículo enumera algunas fuentes Unicode ampliamente utilizadas (enviadas con un sistema operativo o producidas por una empresa de fuentes comerciales conocida) que admiten una cantidad comparativamente grande y una amplia gama de caracteres Unicode.

Fondo

El estándar Unicode no especifica ni crea ninguna fuente ( tipo de letra ), una colección de formas gráficas llamadas glifos, en sí. En lugar de eso, define los caracteres abstractos como un número específico (conocido como punto de código ) y también define los cambios de forma requeridos dependiendo del contexto en el que se utiliza el glifo (por ejemplo, combinación de caracteres , caracteres precompuestos y combinaciones de letras y diacríticos ). La elección de la fuente, que rige cómo los caracteres abstractos en el Conjunto de caracteres codificados universales (UCS) se convierten en un mapa de bits o una salida vectorial que luego se puede ver en una pantalla o imprimir, se deja en manos del usuario. Si se elige una fuente que no contiene un glifo para un punto de código utilizado en el documento, normalmente muestra un signo de interrogación, un cuadro o algún otro carácter sustituto .

Las fuentes de computadora utilizan varias técnicas para mostrar caracteres o glifos. Una fuente de mapa de bits contiene una cuadrícula de puntos conocidos como píxeles que forman una imagen de cada glifo en cada tipo y tamaño. Las fuentes de contorno (también conocidas como fuentes vectoriales) utilizan instrucciones de dibujo o fórmulas matemáticas para describir cada glifo. Las fuentes de trazo utilizan una serie de líneas específicas (para el borde del glifo) e información adicional para definir el perfil , o el tamaño y la forma de la línea en un tipo y tamaño específicos, que en conjunto describen la apariencia del glifo.

Las fuentes también incluyen reglas ortográficas especiales integradas para generar ciertas combinaciones de formas de letras (símbolos alternativos para la misma letra) que se pueden combinar en formas de ligadura especiales (caracteres mixtos). Los sistemas operativos , los navegadores web ( agente de usuario ) y otro software que utiliza ampliamente la tipografía, utilizan una fuente para mostrar texto en la pantalla o en medios impresos, y pueden programarse para utilizar esas reglas integradas. Alternativamente, pueden utilizar tecnologías externas de modelado de escritura (tecnología de renderizado o motor de "fuente inteligente"), y también pueden programarse para utilizar una fuente Unicode grande o utilizar múltiples fuentes diferentes para diferentes caracteres o idiomas.

Ninguna "fuente Unicode" incluye todos los caracteres definidos en la presente revisión de la norma ISO 10646 (Unicode), ya que cada vez se le añaden más idiomas y caracteres, y los formatos de fuentes comunes no pueden contener más de 65.535 glifos (aproximadamente la mitad del número de caracteres codificados en Unicode). Como resultado, los desarrolladores y las fundiciones de fuentes incorporan nuevos caracteres en versiones o revisiones más recientes de una fuente, o en fuentes auxiliares independientes diseñadas específicamente para idiomas concretos.

UCS tiene más de 1,1 millones de puntos de código, pero sólo los primeros 65.536 (el Plano 0: Plano Multilingüe Básico o BMP) habían entrado en uso común antes del año 2000.

Consulte el artículo sobre planos Unicode para obtener más información sobre otros planos, incluidos: Plano 1: Plano multilingüe suplementario (SMP), Plano 2: Plano ideográfico suplementario (SIP), Plano 14: Plano suplementario de propósito especial (SSP), Planos 15 y 16: reservados para áreas de uso privado (PUA).

Las primeras fuentes Unicode (con conjuntos de caracteres muy grandes y que admiten muchos bloques Unicode ) fueron Lucida Sans Unicode (lanzada en marzo de 1993), Unihan font (1993) y Everson Mono (1995).

Asuntos

Existen ambigüedades tipográficas en Unicode, de modo que algunos de los caracteres Han unificados (que se ven en chino, japonés y coreano) serán tipográficamente diferentes en diferentes regiones. Por ejemplo, el punto Unicode U+9AA8 CJK UNIFIED IDEOGRAPH-9AA8 es tipográficamente diferente entre el chino simplificado y el chino tradicional. Esto tiene implicaciones para la idea de que un único tipo de letra puede satisfacer las necesidades de todas las localidades. [2] El diseño de Unicode garantiza que tales diferencias no creen ambigüedad semántica, pero el uso de formas incorrectas a menudo se considera visualmente incómodo o estéticamente inapropiado para los lectores nativos de idiomas del este de Asia.

Aplicación de fuentes Unicode

Unicode es ahora la codificación estándar para muchos nuevos estándares y protocolos, y está integrado en la arquitectura de los sistemas operativos ( Microsoft Windows , Apple Mac OS y muchas versiones de Unix y Linux ), lenguajes de programación ( Ada , Perl , Python , Java , Common LISP , APL ) y bibliotecas (IBM International Components for Unicode (ICU), junto con los motores de renderizado Pango , Graphite , Scribe , Uniscribe y ATSUI ), formatos de fuente ( TrueType y OpenType ), etc. Muchos otros estándares también se están actualizando para ser compatibles con Unicode.

Software de utilidad

A continuación se muestra una selección de algunos de los programas de utilidad que pueden identificar los caracteres presentes en un archivo de fuente:

Lista de fuentes Unicode

De las muchas fuentes Unicode disponibles, las que se enumeran a continuación son las más utilizadas en todo el mundo en las principales plataformas informáticas .

Nota
^‡ OTF+TTO:fuente OpenType con contornos TrueType .
^‡ Las fuentes OpenType a veces no contienen una tabla de pares de kerning uno por uno, sino una tabla de kerning por clases, donde los grupos de caracteres similares se consideran un solo grupo de kerning. Por ejemplo, V y W tienen casi la misma geometría izquierda y derecha. Por lo tanto, “0” no significa que no se admita kerning.
^⸶ Regístrate después de un período "razonable" (palabras del autor).
^⸷ Incluye más de 27 000 glifos Hanzi de la fuente WenQuanYi Bitmap Song.
^⸸ Han Nom A cubre principalmente los ideogramas CJK U Ext A, y Han Nom B cubre principalmente la Ext B.
Sun-Ext A cubre 102 bloques de diferentes idiomas. Sun-ExtB cubre principalmente el Suplemento CJK, los Ideógrafos CJK U Ext B, C y TaiXuan Jing.
^⸹ Zen Hei, Zen Hei Mono y Zen Hei Sharp coexisten en un único archivo TTC; también con mapas de bits integrados. El latín/hangul se deriva de UnDotum, el bopomofo se deriva de cwTeX, el latín monoespaciado se deriva de M+ M2 Light. Cobertura completa de CJK. Incluido con Fedora Linux, Ubuntu Linux.

Comparación de fuentes

A continuación se muestra la cantidad de caracteres incluidos en la versión anterior de las fuentes para los diferentes bloques Unicode . Latín básico (128: 0000–007F ) significa que en el rango denominado "Latín básico" hay 128 códigos asignados, numerados del 0 al 7F . Las celdas muestran la cantidad de esos códigos que cubre cada fuente. Los bloques Unicode que se muestran son válidos para la versión Unicode 8.0 .

Las celdas sombreadas en verde indican una cobertura completa.
Las celdas sombreadas en azul no están completas, pero son las más completas de las fuentes enumeradas.
Las celdas vacías indican que no existe ningún carácter en ese bloque.

0000–077F

0780–139 °F

13A0–1DBF

1DC0–257F

2580–2DFF

2E00–4DBF

4DC0–FAFF

FB00–FFFF

Lista de fuentes Unicode SMP

10000–1F9FF

Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .

Lista de fuentes Unicode SIP

20000–2FFFF

Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .

Lista de fuentes Unicode de SSP

E0000–EFFFF

Los bloques Unicode enumerados son válidos para la versión Unicode 8.0 .

Véase también

Referencias

  1. ^ "Fuentes y teclados". Consorcio Unicode. 28 de junio de 2017. Archivado desde el original el 18 de octubre de 2019. Consultado el 13 de octubre de 2019 .
  2. ^ Ken Lunde, Procesamiento de información CJKV , O'Reilly Inc, 1999. Página 128, "Diferencias en la forma de los caracteres CJKV"
  3. ^ "Arial Unicode MS". Microsoft . Archivado desde el original el 8 de enero de 2010 . Consultado el 15 de enero de 2010 .
  4. ^ "STI Pub Companies Explained". Fuentes STIX. Archivado desde el original el 13 de abril de 2012. Consultado el 21 de agosto de 2012 .
  5. ^ "Fuentes TrueType de Microsoft para la Web". Archivado desde el original el 1 de junio de 2015. Consultado el 21 de abril de 2010 .
  6. ^ "Wen Quan Yi – Código abierto chino: BitmapSong en". Wenq.org. 14 de mayo de 2012. Consultado el 21 de agosto de 2012 .
  7. ^ "Wen Quan Yi – Código abierto chino: MicroHei(en)". Wenq.org . Consultado el 21 de agosto de 2012 .
  8. ^ "Wen Quan Yi - Chino de código abierto: ZenHei (en)". Wenq.org . Consultado el 21 de agosto de 2012 .
  9. ^ "Primero STIX y ahora XITS | خالد حسني". Khaledhosny.org. Archivado desde el original el 25 de marzo de 2012. Consultado el 21 de agosto de 2012 .

Enlaces externos