Unicode tiene versiones con subíndices y superíndices de varios caracteres, incluido un conjunto completo de números arábigos . [1] Estos caracteres permiten representar cualquier polinomio , química y otras ecuaciones en texto plano sin utilizar ningún tipo de marcado como HTML o TeX .
El Consorcio World Wide Web y el Consorcio Unicode han hecho recomendaciones sobre la elección entre usar marcado y caracteres de superíndice y subíndice:
Cuando se usa en un contexto matemático ( MathML ), se recomienda usar consistentemente marcas de estilo para superíndices y subíndices […] Sin embargo, cuando los superíndices y subíndices deben reflejar distinciones semánticas, es más fácil trabajar con estos significados codificados en texto en lugar de marcado, por ejemplo, en la transcripción fonética o fonémica . [2]
El uso previsto [2] cuando se agregaron estos caracteres a Unicode fue producir superíndices y subíndices verdaderos para que se pudieran escribir fórmulas químicas y algebraicas sin marcado. Por lo tanto, se supone que "H₂O" (usando un carácter de subíndice 2) es idéntico a "H 2 O" (con marcado de subíndice).
En realidad, muchas fuentes que incluyen estos caracteres ignoran la definición Unicode y en su lugar diseñan los dígitos para glifos de numerador y denominador matemático , [3] [4] que están alineados con la línea superior y la línea base , respectivamente. Cuando se usan con solidus , estos glifos son un sustituto común de las fracciones diagonales, como ³/₄ para el glifo ¾. Este cambio se realizó porque el uso del marcado no proporciona una buena aproximación gráfica de las fracciones (compare el marcado 3/4 con el superíndice/subíndice ³/₄). El cambio también hace que las letras en superíndice sean útiles para indicadores ordinales , coincidiendo más estrechamente con los caracteres ª y º. Sin embargo, los hace incorrectos para superíndices y subíndices normales, por lo que las fórmulas químicas y algebraicas se representan mejor mediante el uso de marcado.
Unicode pretendía que las fracciones diagonales se representaran mediante un mecanismo diferente: la barra de fracción U+2044 es visualmente similar al solidus, pero cuando se usa con los dígitos ordinarios (no los superíndices y subíndices), le indica al sistema de diseño que una fracción como ¾ se representará mediante sustitución automática de glifos. [5] [a] El soporte para el usuario final fue bastante deficiente durante varios años, pero las fuentes, los navegadores, [b] los procesadores de texto, [c] el software de autoedición [d] y otros soportan cada vez más el comportamiento Unicode previsto.
En la siguiente tabla se muestra una selección de fuentes compatibles. (Estos no se mostrarán correctamente si no tiene las fuentes instaladas o si su navegador no admite este comportamiento).
Los dígitos en superíndice más comunes (1, 2 y 3) estaban en ISO-8859-1 y, por lo tanto, se trasladaron a esas posiciones en el rango Latin-1 de Unicode. El resto se colocó en una sección dedicada de Unicode en U+ 2070 a U+209F. Las dos tablas siguientes muestran estos personajes. Cada carácter de superíndice o subíndice está precedido por una x normal para mostrar el subíndice/superíndice. La tabla de la izquierda contiene los caracteres Unicode reales; el de la derecha contiene los equivalentes que utilizan el marcado HTML para el subíndice o superíndice.
Unicode versión 15.1 también incluye caracteres de subíndice y superíndice destinados al uso semántico, en los siguientes bloques: [1] [6]
Consolidado, el estándar Unicode contiene versiones en superíndice y subíndice de un subconjunto de letras latinas, griegas y cirílicas. Aquí están ordenados alfabéticamente para poder compararlos (o para facilitar la tarea de copiar y pegar). Dado que estos caracteres aparecen en diferentes rangos Unicode, es posible que no parezcan tener el mismo tamaño o posición debido a la sustitución de fuentes en el navegador. Las celdas sombreadas marcan mayúsculas pequeñas que no se diferencian mucho de las minúsculas y letras griegas que no se distinguen del latín, por lo que no se esperaría que Unicode las admitiera.
Se codifica poca puntuación. Los paréntesis y el signo de exclamación se muestran arriba. Se puede crear un signo de interrogación con un signo de interrogación castrado en superíndice y un punto combinado: ⟨ ˀ̣ ⟩, aunque algunas fuentes no lo representan correctamente.
Muchos de los caracteres cirílicos se agregaron al bloque Cyrillic Extended-D , que se agregó a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023.
Véase también versalitas en Unicode .
El bloque Latin Extended-F se creó para las letras IPA en superíndice restantes . Se agregaron a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023. Los caracteres adicionales para letras históricas y para-IPA están pendientes a partir de 2024.
Los caracteres Unicode para las letras consonantes IPA en superíndice (modificador) y extIPA son los siguientes. Los caracteres de sonidos con articulación secundaria se destacan entre paréntesis y se colocan debajo de las letras base. Los pares de letras de clic son la letra actual a la izquierda y una letra tradicional o para-IPA a la derecha; estos últimos están pendientes en Unicode. [mi]
El espaciado diacrítico para consonantes eyectivas, U+2BC, funciona con letras en superíndice a pesar de no ser superíndice en sí: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩. Si es necesario hacer una distinción, se puede utilizar el apóstrofe combinatorio U+315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩. El espaciado diacrítico debe usarse para una letra de referencia con una versión en superíndice, como [tˢʼ] o [kˣʼ] , donde el alcance del apóstrofo incluye la letra que no es superíndice, pero el apóstrofe combinado U+315 podría usarse para indicar una consonante eyectiva débilmente articulada como [ᵗ̕] o [ᵏ̕] , donde la consonante completa se escribe como un superíndice, o junto con U+2BC cuando los apóstrofes separados tienen alcance sobre las letras base y modificadoras, como en ⟨ pʼᵏˣ̕ ⟩. [13]
Los espacios diacríticos, como en ⟨ tʲ ⟩, no pueden tener un superíndice secundario en texto sin formato: ⟨ ᵗʲ ⟩. (En este caso, la antigua letra IPA para [tʲ] , ⟨ ƫ ⟩, tiene una variante de superíndice en Unicode, U+1DB5 ⟨ ᶵ ⟩, pero ese no es generalmente el caso).
Entre las letras más antiguas, ⟨ ꜧ ⟩ (U+A727) era una variante gráfica de ⟨ ɮ ⟩. Su superíndice se admite en ⟨ ꭜ ⟩ (U+AB5C). También se admiten las letras más comunes con gancho palatino ; se muestran en la tabla de arriba. IPA alguna vez tuvo un rizo idiosincrásico en algunas de las letras palatalizadas: estas son las letras fricativas ⟨ ʆ ʓ ⟩ y las ligaduras africadas ⟨ ⟩. En 2024, sus formas de superíndice están pendientes en ⟨ ⟩ (U+1DFE6, 1DFE2, 1DFE4, 1DFE0). Las letras retiradas ⟨ ƞ ⟩ y ⟨ ɼ ⟩ tienen soporte pendiente en ⟨ ⟩ (1DFDC) y ⟨ ⟩ (1DFDD).
Entre las letras para-IPA, el superíndice sinológico ⟨ ȡ ȴ ȵ ȶ ⟩ está pendiente en ⟨ ⟩ (U+1DFEF–1DFF2). [9] Los superíndices de los explosivos labio-dentales bantuistas ⟨ ȹ ⟩ y ⟨ ȸ ⟩ están pendientes en ⟨ ⟩ y ⟨ ⟩. Las semivocales centrales ⟨ ɉ ⟩, ⟨ ⟩ ( ɥ̶ ) y ⟨ ⟩ ( w̶ ) están pendientes en U+1DFD9 ⟨ ⟩, 1DFD8 ⟨ ⟩, 1DFDB ⟨ ⟩.
Los caracteres Unicode para las letras vocales IPA en superíndice (modificador), más un par de letras extendidas ⟨ ᵻ ᵿ ⟩ que se encuentran en los diccionarios de inglés, son los siguientes. También se admiten letras alternativas recientemente retiradas como ⟨ ɩ ɷ ⟩; están entre paréntesis y se colocan debajo de las letras estándar de la IPA:
Las letras vocales róticas Unicode precompuestas ⟨ ɚ ɝ ⟩ no son compatibles directamente. En su lugar, se debe utilizar el signo diacrítico rótico U+02DE ◌˞ : ⟨ ᵊ˞ ᶟ˞ ⟩. [14]
⟨ ɜ ⟩ y ⟨ ᶟ ⟩ están invertidos ɛ . La IPA anterior convertida en ɛ , ⟨ ᴈ ⟩, también es compatible, en U+1D4C ⟨ ᵌ ⟩. Sin embargo, la letra vocal resucitada brevemente ⟨ ʚ ⟩ (U+029A) no es compatible, solo su reemplazo invertido ⟨ ɞ ⟩ sí lo es.
Entre las letras más antiguas, ⟨ ᴜ ⟩ (U+1D1C), una variante gráfica de ⟨ ʊ ⟩, se admite en ⟨ ᶸ ⟩ (U+1DB8).
Entre las letras para-IPA, el superíndice sinológico ⟨ ɿ ʅ ʮ ʯ ⟩ está pendiente en ⟨ ⟩ (U+1DFEB–1DFEE). [9]
También se admiten las dos marcas de longitud:
Se utilizan para añadir longitud a otro superíndice, como una aspiración larga.
Los comodines de superíndice (mayúsculas) se admiten parcialmente: por ejemplo, ᴺC (consonante prenasalizada), ꟲN (nasal preparada), Pꟳ (liberación fricativa), NᴾF (plosiva epentética), CVNᵀ (sílaba portadora de tono), Cᴸ (liberación líquida o lateral). , Cᴿ (liberación rótica o resonante), Vᴳ (deslizamiento/diptongo), Cⱽ (vocal fugaz). El superíndice S para liberación sibilante tiene aprobación preliminar para Unicode 17 (como ); El superíndice Ʞ para clic fugaz/epentético no lo hace. Se admiten en su mayoría otros comodines de superíndice latino básicos para tonos y sonidos débiles e indeterminados, como se describe en el artículo sobre el Alfabeto Fonético Internacional . (Ver tabla en la sección anterior).
Además, muy pocas letras IPA más allá del alfabeto latino básico tienen formas combinadas o se admiten como subíndices:
Principalmente por compatibilidad con conjuntos de caracteres anteriores, Unicode contiene una serie de caracteres que componen superíndices y subíndices con otros símbolos. [1] En la mayoría de las fuentes, estos se representan mucho mejor que los intentos de construir estos símbolos a partir de los caracteres anteriores o mediante el uso de marcas.