stringtranslate.com

Subíndices y superíndices Unicode

Diferencia entre los glifos de superíndice/subíndice y numerador/denominador. En muchas fuentes populares, los caracteres "superíndice" y "subíndice" de Unicode son en realidad glifos de numerador y denominador.

Unicode tiene versiones subíndices y superíndices de varios caracteres, incluido un conjunto completo de números arábigos . [1] Estos caracteres permiten representar cualquier polinomio , ecuación química y ciertas otras ecuaciones en texto simple sin utilizar ningún tipo de marcado como HTML o TeX .

El Consorcio World Wide Web y el Consorcio Unicode han hecho recomendaciones sobre la elección entre utilizar marcado y utilizar caracteres superíndices y subíndices:

Cuando se utiliza en un contexto matemático ( MathML ), se recomienda utilizar de forma consistente el marcado de estilo para superíndices y subíndices […] Sin embargo, cuando los superíndices y subíndices deben reflejar distinciones semánticas, es más fácil trabajar con estos significados codificados en el texto en lugar de marcado, por ejemplo, en la transcripción fonética o fonémica . [2]

Usos

El uso previsto [2] cuando se añadieron estos caracteres a Unicode era producir superíndices y subíndices verdaderos para que las fórmulas químicas y algebraicas pudieran escribirse sin marcado. Por lo tanto, se supone que "H₂O" (utilizando un carácter de subíndice 2) es idéntico a "H 2 O" (con marcado de subíndice).

En realidad, muchas fuentes que incluyen estos caracteres ignoran la definición Unicode y, en su lugar, diseñan los dígitos para los glifos matemáticos de numerador y denominador , [3] [4] que están alineados con la línea de tapa y la línea de base , respectivamente. Cuando se utilizan con el solidus , estos glifos son un sustituto común de las fracciones diagonales, como ³/₄ para el glifo ¾. Este cambio se realizó porque el uso de marcado no da una buena aproximación gráfica de las fracciones (compare el marcado 3 / 4 con super/subíndice ³/₄). El cambio también hace que las letras superíndice sean útiles para los indicadores ordinales , coincidiendo más estrechamente con los caracteres ª y º. Sin embargo, las hace incorrectas para el superíndice y el subíndice normales, por lo que las fórmulas químicas y algebraicas se representan mejor mediante el uso de marcado.

Unicode pretendía que las fracciones diagonales se representaran mediante un mecanismo diferente: la barra de fracción U+2044 es visualmente similar a la barra sólida, pero cuando se utiliza con los dígitos ordinarios (no los superíndices y subíndices), instruye al sistema de diseño que una fracción como ¾ debe representarse utilizando la sustitución automática de glifos. [5] [a] El soporte del usuario final fue bastante deficiente durante varios años, pero las fuentes, los navegadores, [b] los procesadores de texto, [c] el software de autoedición [d] y otros admiten cada vez más el comportamiento Unicode previsto.

En la siguiente tabla se muestra una selección de fuentes compatibles. (Estas fuentes no se mostrarán correctamente si no las tiene instaladas o si su navegador no admite este comportamiento).

Bloque de superíndices y subíndices

Los dígitos superíndice más comunes (1, 2 y 3) se encontraban en ISO-8859-1 y, por lo tanto, se trasladaron a esas posiciones en el rango Latin-1 de Unicode. El resto se colocó en una sección dedicada de Unicode en U+ 2070 a U+209F. Las dos tablas siguientes muestran estos caracteres. Cada carácter superíndice o subíndice está precedido por una x normal para mostrar el subíndice/superíndice. La tabla de la izquierda contiene los caracteres Unicode reales; la de la derecha contiene los equivalentes utilizando el marcado HTML para el subíndice o superíndice.

  Reservado para uso futuro.
  Otros caracteres del latín-1 no relacionados con superíndices o subíndices.

Otros caracteres superíndices y subíndices

La versión 15.1 de Unicode también incluye caracteres subíndice y superíndice destinados al uso semántico, en los siguientes bloques: [1] [6]

Sobrescrito
Combinando superíndice
Subíndice
Combinando subíndice

Tablas de latín, griego, cirílico y AFI

En su forma consolidada, el estándar Unicode contiene versiones en superíndice y subíndice de un subconjunto de letras latinas, griegas y cirílicas. Aquí se las organiza en orden alfabético para poder compararlas (o para que sea más fácil copiarlas y pegarlas). Dado que estos caracteres aparecen en diferentes rangos Unicode, es posible que no parezcan tener el mismo tamaño o la misma posición debido a la sustitución de fuentes en el navegador. Las celdas sombreadas marcan las mayúsculas pequeñas que no se distinguen mucho de las minúsculas y las letras griegas que no se distinguen de las latinas y, por lo tanto, no se esperaría que Unicode las admita.

Se codifican pocos signos de puntuación. Los paréntesis se muestran en el bloque básico anterior y el signo de exclamación ⟨ ⟩ se muestra en la tabla AFI que aparece a continuación. Se puede crear un signo de interrogación con un signo de interrogación superíndice y un punto combinado: ⟨ ˀ̣ ⟩, aunque algunas fuentes no lo representan correctamente.

Las mayúsculas superíndice adicionales son ᴭ ᴯ ᴲ ᴻ. Algunas de estas son mayúsculas pequeñas en los documentos fuente de las propuestas Unicode.
La s mayúscula superíndice se ha propuesto para una versión futura del Estándar Unicode . [8] [9]
Se han propuesto versiones superíndice de A y E mayúsculas pequeñas para una versión futura del Estándar Unicode. [10] [11] [9]

  1. ^ ab En algunas fuentes, las letras latinas ᵅ y ípsilon ᶹ se pueden usar como superíndices de las letras griegas ᵋ y ípsilon. ᵋ y ᶥ también son oficialmente letras latinas, pero se muestran igual que las griegas.

Se han propuesto versiones superíndices de los caracteres griegos psi y omega para una versión futura del estándar Unicode. [10] [9]

Muchos de los caracteres cirílicos se agregaron al bloque cirílico Extendido-D , que se agregó a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023.

Véase también versalitas en Unicode .

.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}@media screen{html.skin-theme-clientpref-night .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}@media screen and (prefers-color-scheme:dark){html.skin-theme-clientpref-os .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}IPA superíndice

El bloque Latin Extended-F se creó para las letras superíndice restantes del AFI . Se agregaron a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023. Se han propuesto caracteres adicionales para letras históricas y para-AFI para futuras versiones del estándar Unicode. [11] [9]

Letras consonantes

Los caracteres Unicode para las letras consonánticas superíndice (modificador) del AFI y extIPA son los siguientes. Todo el bloque de la F latina extendida está dedicado al AFI superíndice. Los caracteres para sonidos con articulación secundaria se colocan entre paréntesis debajo de las letras base.

El diacrítico de espaciado para consonantes eyectivas, U+2BC, funciona con letras superíndice a pesar de no ser superíndice en sí mismo: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩. Si es necesario hacer una distinción, se puede utilizar el apóstrofe combinatorio U+315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩. El diacrítico de espaciado se debe utilizar para una letra base con una liberación en superíndice, como [tˢʼ] o [kˣʼ] , donde el alcance del apóstrofo incluye la letra no superíndice, pero el apóstrofo de combinación U+315 se puede utilizar para indicar una consonante eyectiva débilmente articulada como [ᵗ̕] o [ᵏ̕] , donde la consonante completa se escribe como superíndice, o junto con U+2BC cuando los apóstrofos separados tienen alcance sobre las letras base y modificadoras, como en ⟨ pʼᵏˣ̕ ⟩. [14]

Los diacríticos de espaciado, como en ⟨ ⟩, no se pueden superscribir en segundo lugar en texto simple: ⟨ ᵗʲ ⟩. (En este caso, la antigua letra del AFI para [tʲ] , ⟨ ƫ ⟩, tiene una variante de superíndice en Unicode, U+1DB5 ⟨ ⟩, pero ese no suele ser el caso).

Entre las letras más antiguas, ⟨ ⟩ (U+A727) era una variante gráfica de ⟨ ɮ ⟩. Su superíndice se admite en ⟨ ⟩ (U+AB5C). Las letras más comunes con gancho palatal también se admiten; se muestran en la tabla anterior. El AFI alguna vez tuvo un rizo idiosincrásico en algunas de las letras palatalizadas: estas son las letras fricativas ⟨ ʆ ʓ ⟩. Sus formas de superíndice se han propuesto para una versión futura del Estándar Unicode. [11] [9] Las letras retiradas ⟨ ƞ ⟩ y ⟨ ɼ ⟩ también se han propuesto para una versión futura del Estándar Unicode. [11] [9]

Entre las letras para-IPA, se han propuesto los superíndices sinológicos ⟨ ȡ ȴ ȵ ȶ ⟩ para una futura versión del Estándar Unicode. [10] [9] Se han propuesto los superíndices de las oclusivas labiodentales bantuistas ⟨ ȹ ⟩ y ⟨ ȸ ⟩ para una futura versión del Estándar Unicode. [10] [9] Las semivocales centrales ⟨ ɉ ⟩, ɥ̶ y también se han propuesto para una futura versión del Estándar Unicode. [10] [9]

Se han propuesto letras de clic de estilo antiguo para una futura versión del estándar Unicode. [15] [9]

Letras vocales

Los caracteres Unicode para las letras vocálicas superíndice (modificadoras) del AFI, más un par de letras extendidas ⟨ ᵻ ᵿ ⟩ que se encuentran en los diccionarios de inglés, son los siguientes. También se admiten letras alternativas recientemente retiradas, como ⟨ ɩ ɷ ⟩; se colocan entre paréntesis debajo de las letras estándar del AFI:

Las letras vocálicas róticas precompuestas Unicode ⟨ ɚ ɝ ⟩ no se admiten directamente. En su lugar, se debe utilizar el diacrítico rótico U+02DE ◌˞ : ⟨ ᵊ˞ ᶟ˞ ⟩. [16]

ɜ ⟩ y ⟨ ⟩ se invierten ɛ . La antigua AFI convertida en ɛ , ⟨ ⟩, también se admite, en U+1D4C ⟨ ⟩. Sin embargo, la brevemente resucitada letra vocálica ⟨ ʚ ⟩ (U+029A) no se admite, solo se admite su reemplazo invertido ⟨ ɞ ⟩.

Entre las letras más antiguas, ⟨ ⟩ (U+1D1C), una variante gráfica de ⟨ ʊ ⟩, se apoya en ⟨ ⟩ (U+1DB8).

Entre las letras para-IPA, se ha propuesto el superíndice sinológico ⟨ ɿ ʅ ʮ ʯ ⟩ para una futura versión del estándar Unicode. [10] [9]

Marcas de longitud

También se admiten las dos marcas de longitud:

Se utilizan para agregar longitud a otro superíndice, como por ejemplo "aspiración larga".

Comodines

Los comodines superíndices (mayúsculas completas) son ampliamente compatibles: p. ej. , ᴺC (consonante prenasalizada), ꟲN (nasal preoprimida), Pꟳ (liberación fricativa), NᴾF (oclusiva epentética), CVNᵀ (sílaba portadora de tono), Cᴸ (liberación líquida o lateral), Cᴿ (liberación rótica o resonante), Vᴳ (desplazamiento/diptongo), Cⱽ (vocal fugaz). El superíndice S para liberación sibilante se ha propuesto para una versión futura del Estándar Unicode; [8] [9] el superíndice para clic fugaz/epentético no. Otros comodines latinos básicos en superíndice para tonos y sonidos indeterminados débiles, como se describe en el artículo sobre el Alfabeto Fonético Internacional , son en su mayoría compatibles. (Véase la tabla en la sección anterior.)

Combinando marcas y subíndices

Además, unas pocas letras del AFI más allá del alfabeto latino básico tienen formas combinadas o se admiten como subíndices:

Caracteres compuestos

Principalmente para compatibilidad con conjuntos de caracteres anteriores, Unicode contiene una serie de caracteres que componen superíndices y subíndices con otros símbolos. [1] En la mayoría de las fuentes, estos se representan mucho mejor que los intentos de construir estos símbolos a partir de los caracteres anteriores o mediante marcado.

Notas

  1. ^ Para obtener una descripción general e información técnica sobre la sustitución de glifos (aunque no específicamente para fracciones), consulte GSUB — Tabla de sustitución de glifos en la especificación OpenType en el sitio de Microsoft Typography.
  2. ^ Como Chrome , Firefox y Falkon
  3. ^ Como por ejemplo LibreOffice Writer
  4. ^ Como Adobe InDesign y Scribus
  5. ^ El superíndice ⟨ ç ⟩ está compuesto por el superíndice c y una cedilla que lo combina , y que debería mostrarse correctamente en una buena fuente. El superíndice c fue solicitado específicamente para este propósito en la propuesta Unicode L2/03-180.
  6. ^ U+02E4 ˤ LETRA MODIFICADORA MINÚSCULA GLOTAL INVERTIDA es la variante superíndice de U+0295 ʕ LETRA LATINA FRICATIVA FARINGEA SONORA y está definida para uso en AFI. El carácter similar U+02C1 ˁ LETRA MODIFICADORA MINÚSCULA GLOTAL INVERTIDA es una U+02C0 ˀ LETRA MODIFICADORA MINÚSCULA GLOTAL invertida , tal vez un signo de interrogación invertido. Las fuentes son inconsistentes en cuanto a si se ven diferentes y cuál es la diferencia.
  7. ^ En las fuentes de Microsoft, el superíndice ⟨ ɫ ⟩ fue diseñado erróneamente como superíndice ⟨ ⟩.
  8. ^ U+A71D ⟨ ⟩ y A71E ⟨ ⟩ fueron adoptados como los equivalentes africanistas de los caracteres AFI ⟨ downstep y ⟨ upstep . La correspondencia de U+A71D ⟨ ⟩ con la letra de clic AFI ⟨ ǃ ⟩ es, por lo tanto, accidental. Casualmente, U+A71E ⟨ ꜞ ⟩ sirve como la variante superíndice de la consonante percusiva extIPA ⟨ ¡ ⟩; las otras letras percusivas, ⟨ ʬ ⟩ y ⟨ ʭ ⟩, no tienen soporte de superíndice en Unicode.
  9. ^ En realidad, este es el diacrítico vietnamita dấu hỏi , no específicamente AFI, pero gráficamente ambos son signos de interrogación gelificados.

Referencias

  1. ^ abc "UCD: UnicodeData.txt". El estándar Unicode . Consultado el 14 de mayo de 2016 .
  2. ^ por Martin Dürst, Asmus Freytag (16 de mayo de 2007). "Unicode en XML y otros lenguajes de marcado". W3C . Consultado el 13 de septiembre de 2010 .
  3. ^ "fracción | Paquete Dart". Paquetes Dart . 27 de diciembre de 2021 . Consultado el 21 de septiembre de 2022 .
  4. ^ "MathML | Elementos de diseño general | Fracciones". data2type GmbH (en alemán). 30 de marzo de 2021. Consultado el 13 de enero de 2022 .[ enlace muerto ]
  5. ^ Martin Dürst, Asmus Freytag (16 de mayo de 2007). "Talla de fracción". W3C . Consultado el 13 de septiembre de 2010 .
  6. ^ "UCD: Scripts.txt". El estándar Unicode . Consultado el 21 de septiembre de 2022 .
  7. ^ Everson, Michael; West, Andrew (5 de octubre de 2020). "L2/20-268: Propuesta revisada para agregar diez caracteres para el inglés medio al UCS" (PDF) .
  8. ^ por Kirk Miller (30 de enero de 2024). "L2/24-081: Solicitud Unicode para el modificador S mayúscula" (PDF) .
  9. ^ abcdefghijkl "Propuesta de nuevos caracteres: tabla de canalización". Consorcio Unicode . 2024-09-10 . Consultado el 2024-09-21 .
  10. ^ abcdef Kirk Miller (14 de junio de 2024). "L2/24-147: extensiones sinológicas modificadoras del AFI" (PDF) .
  11. ^ abcd Kirk Miller (6 de junio de 2024). "L2/24-171: Cartas modificadoras históricas y para-IPA diversas" (PDF) .
  12. ^ ͺ ⟩ se coloca más abajo que un subíndice normal. Es equivalente al subíndice ⟨ ◌ͅ ⟩ sobre un espacio.
  13. ^ ◌̫ ⟩ se escribe tradicionalmente como omega.
  14. ^ Kirk Miller y Michael Ashby, L2/20-253R Solicitud Unicode de letras modificadoras IPA (b), no pulmonar.
  15. ^ Kirk Miller (26 de abril de 2024). "L2/24-052R: Solicitud Unicode de letras modificadoras previas al clic de Kiel" (PDF) .
  16. ^ Kirk Miller y Michael Ashby, L2/20-252R Solicitud Unicode de letras modificadoras IPA (a), pulmonar
  17. ^ Silva, Eduardo Marín (1 de marzo de 2017). «L2/17-066R: Propuesta de codificación del signo de Marca Registrada» (PDF) .