Subíndices y superíndices Unicode

Este artículo contiene caracteres especiales . Sin el soporte de renderizado adecuado , es posible que veas signos de interrogación, cuadros u otros símbolos .

Unicode tiene versiones con subíndices y superíndices de varios caracteres, incluido un conjunto completo de números arábigos . ^[1] Estos caracteres permiten representar cualquier polinomio , química y otras ecuaciones en texto plano sin utilizar ningún tipo de marcado como HTML o TeX .

El Consorcio World Wide Web y el Consorcio Unicode han hecho recomendaciones sobre la elección entre usar marcado y caracteres de superíndice y subíndice:

Cuando se usa en un contexto matemático ( MathML ), se recomienda usar consistentemente marcas de estilo para superíndices y subíndices […] Sin embargo, cuando los superíndices y subíndices deben reflejar distinciones semánticas, es más fácil trabajar con estos significados codificados en texto en lugar de marcado, por ejemplo, en la transcripción fonética o fonémica . ^[2]

Usos

El uso previsto ^[2] cuando se agregaron estos caracteres a Unicode fue producir superíndices y subíndices verdaderos para que se pudieran escribir fórmulas químicas y algebraicas sin marcado. Por lo tanto, se supone que "H₂O" (usando un carácter de subíndice 2) es idéntico a "H ₂ O" (con marcado de subíndice).

En realidad, muchas fuentes que incluyen estos caracteres ignoran la definición Unicode y en su lugar diseñan los dígitos para glifos de numerador y denominador matemático , ^[3]^[4] que están alineados con la línea superior y la línea base , respectivamente. Cuando se usan con solidus , estos glifos son un sustituto común de las fracciones diagonales, como ³/₄ para el glifo ¾ . Este cambio _se realizó porque el uso del marcado no proporciona una buena aproximación gráfica de las fracciones (compare el marcado ^3/4 con el super/subíndice ³/₄) . El cambio también hace que las letras en superíndice sean útiles para indicadores ordinales , coincidiendo más estrechamente con los caracteres ª y º. Sin embargo, los hace incorrectos para superíndices y subíndices normales, por lo que las fórmulas químicas y algebraicas se representan mejor mediante el uso de marcado.

Unicode pretendía que las fracciones diagonales se representaran mediante un mecanismo diferente: la barra de fracción U+2044 es visualmente similar al solidus, pero cuando se usa con los dígitos ordinarios (no los superíndices y subíndices), le indica al sistema de diseño que una fracción como ¾ se representará mediante sustitución automática de glifos. ^[5]^[a] El soporte para el usuario final fue bastante deficiente durante varios años, pero los navegadores ^[b] y las fuentes admiten cada vez más el comportamiento Unicode previsto. En la siguiente tabla se muestra una selección de fuentes compatibles. (Estos no se mostrarán correctamente si no tiene las fuentes instaladas o si su navegador no admite este comportamiento).

Bloque de superíndices y subíndices

Los dígitos en superíndice más comunes (1, 2 y 3) estaban en ISO-8859-1 y, por lo tanto, se trasladaron a esas posiciones en el rango Latin-1 de Unicode. El resto se colocó en una sección dedicada de Unicode en U+ 2070 a U+209F. Las dos tablas siguientes muestran estos personajes. Cada carácter de superíndice o subíndice está precedido por una x normal para mostrar el subíndice/superíndice. La tabla de la izquierda contiene los caracteres Unicode reales; el de la derecha contiene los equivalentes que utilizan el marcado HTML para el subíndice o superíndice.

Reservado para uso futuro.

Otros caracteres del Latin-1 no relacionados con superíndices o subíndices.

Otros caracteres en superíndice y subíndice

Unicode versión 15.1 también incluye caracteres de subíndice y superíndice destinados al uso semántico, en los siguientes bloques: ^[1]^[6]

Sobrescrito

El bloque del Suplemento Latin-1 contiene los indicadores ordinales femenino y masculino ª y º.
El bloque Latin Extended-C contiene un superíndice adicional, ⱽ.
El bloque Latin Extended-D contiene seis superíndices: ꝰ ꟲ ꟳ ꟴ ꟸ ꟹ.
El bloque Latin Extended-E contiene cinco superíndices: ꭜ ꭝ ꭞ ꭟ ꭩ.
El bloque latino extendido-F está compuesto completamente de letras IPA en superíndice : 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺.
El bloque Letras modificadoras de espaciado tiene letras en superíndice y símbolos utilizados para la transcripción fonética: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
El bloque Extensiones fonéticas tiene varias letras y símbolos en superíndice: Latín/IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, griego ᵝ ᵞ ᵟ ᵠ ᵡ, cirílico ᵸ, otro ᵎ ᵔ ᵕ ᵙ ᵜ. Estos están destinados a indicar articulación secundaria .
El bloque Suplemento de Extensiones Fonéticas tiene varios más: Latín/IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, griego ᶿ.
El bloque Cirílico Extendido-B contiene dos superíndices cirílicos : ꚜ ꚝ.
El bloque cirílico extendido-D contiene muchos superíndices cirílicos: 𞀰 𞀱 𞀲 𞀳 𞀷 𞀵 𞀶 𞀷 𞀸 𞀹 𞀺 𞀻 𞀼 𞀽 𞀾 𞀿 𞁀 𞁁 𞁂 𞁃 𞁄 𞁅 𞁆 𞁇 𞁈 𞁉 𞁊 𞁋 𞁌 𞁍 𞁎 𞁏 𞁐 𞁫 𞁬 𞁭.
El bloque georgiano contiene una letra Mkhedruli en superíndice : ჼ.
El bloque Kanbun tiene caracteres de anotación en superíndice utilizados en copias japonesas de textos chinos clásicos : ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
El bloque Tifinagh tiene una letra en superíndice: ⵯ.
Las sílabas aborígenes canadienses unificadas y sus bloques extendidos contienen varias letras, en su mayoría solo consonantes , para indicar la coda de la sílaba llamadas finales, junto con algunos caracteres que indican la sílaba medial conocida como mediales: Bloque principal ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ᙾ ᙿ ; Bloque extendido: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.

Combinando superíndice

El bloque Combinación de marcas diacríticas contiene letras diacríticas en superíndice medieval. Estas letras están escritas directamente encima de otras letras que aparecen en manuscritos germánicos medievales, por lo que estos glifos no incluyen espacios, por ejemplo uͤ. Se muestran aquí sobre el marcador de posición del círculo de puntos ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
El bloque ampliado de combinación de marcas diacríticas contiene dos letras combinadas para transcripciones lingüísticas del escocés (◌ᪿ ◌ᫀ) y tres letras insulares combinadas para el ormulum del inglés medio (◌ᫌ ◌ᫍ ◌ᫎ). ^[7]
El bloque Suplemento de combinación de signos diacríticos contiene signos diacríticos de letras en superíndice medievales adicionales, suficientes para completar el alfabeto latino básico en minúsculas, excepto j, q e y, algunas mayúsculas y ligaduras (ae, ao, av) y letras adicionales: ◌᷒ ◌ ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ, griego ◌ᷩ.
Los bloques cirílico extendido-A y -B contienen múltiples letras diacríticas en superíndice medieval, suficientes para completar el alfabeto cirílico minúscula básico utilizado en los textos eslavos eclesiásticos; también incluye una ligadura adicional (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
El bloque cirílico extendido-D tiene un carácter de combinación adicional, que es і: ◌𞂏.

Subíndice

El bloque Latin Extended-C contiene un subíndice adicional, ⱼ.
El bloque Extensiones fonéticas tiene varias letras y símbolos subíndices: latín/IPA ᵢ ᵣ ᵤ ᵥ y griego ᵦ ᵧ ᵨ ᵩ ᵪ.
El bloque cirílico extendido-D también contiene muchos subíndices cirílicos: 𞁑 𞁒 𞁓 𞁔 𞁕 𞁖 𞁗 𞁘 𞁙 𞁚 𞁛 𞁜 𞁝 𞁞 𞁟 𞁠 𞁡 𞁢 𞁣 𞁤 𞁥 𞁦 𞁧 𞁨 𞁩 𞁪.

Combinando subíndice

El bloque Suplemento de combinación de signos diacríticos contiene un subíndice de combinación: ◌᷊.

Tablas latinas, griegas, cirílicas e IPA

Consolidado, el estándar Unicode contiene versiones en superíndice y subíndice de un subconjunto de letras latinas, griegas y cirílicas. Aquí están ordenados alfabéticamente para poder compararlos (o para facilitar la tarea de copiar y pegar). Dado que estos caracteres aparecen en diferentes rangos Unicode, es posible que no parezcan tener el mismo tamaño o posición debido a la sustitución de fuentes en el navegador. Las celdas sombreadas marcan mayúsculas pequeñas que no se diferencian mucho de las minúsculas y letras griegas que no se distinguen del latín, por lo que no se esperaría que Unicode las admitiera.

Se codifica poca puntuación. Los paréntesis y el signo de exclamación se muestran arriba. Se puede crear un signo de interrogación con un signo de interrogación castrado en superíndice y un punto combinado: ⟨ ˀ̣ ⟩ .

^ ab En algunas fuentes, ᵅ y ᶹ se pueden utilizar como superíndice alfa y upsilon. ᵋ y ᶥ también son letras oficialmente latinas, pero se muestran igual que las griegas.

Muchos de los caracteres cirílicos se agregaron a Unicode 15, en el bloque Cyrillic Extended-D , y se publicaron en 2022. ^[8] El bloque D se agregó a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023.

Véase también versalitas en Unicode .

.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}Superíndice IPA

El bloque Latin Extended-F se creó para letras IPA en superíndice . Se agregaron a las fuentes gratuitas Gentium Plus y Andika con la versión 6.2 en febrero de 2023.

Los caracteres Unicode para las letras consonantes IPA en superíndice (modificador) y extIPA son los siguientes. Los caracteres de sonidos con articulación secundaria están entre paréntesis y se colocan debajo de las letras base:

El espaciado diacrítico para consonantes eyectivas, U+2BC, funciona con letras en superíndice a pesar de no ser superíndice en sí: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩ . Si es necesario hacer una distinción, se puede utilizar el apóstrofo combinado U+315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩ . El espaciado diacrítico debe usarse para una letra de referencia con una versión en superíndice, como [tˢʼ] o [kˣʼ] , donde el alcance del apóstrofe incluye la letra que no es superíndice, pero el apóstrofe combinado U+315 podría usarse para indicar una consonante eyectiva débilmente articulada como [ᵗ̕] o [ᵏ̕] , donde la consonante completa se escribe como un superíndice, o junto con U+2BC cuando los apóstrofes separados tienen alcance sobre las letras base y modificadoras, como en ⟨ pʼᵏˣ̕ ⟩ . ^[9]

Los espacios diacríticos, como en ⟨ tʲ ⟩ , no pueden tener un superíndice secundario en texto sin formato: ⟨ ᵗʲ ⟩ . (En este caso, la antigua letra IPA para [tʲ] , ⟨ ƫ ⟩ , tiene una variante de superíndice en Unicode, U+1DB5 ⟨ ᶵ ⟩ , al igual que el lateral, U+1DDA ⟨ ᶪ ⟩ , pero esa no es generalmente la caso.)

Los caracteres Unicode para las letras vocales IPA en superíndice (modificador), más una letra extendida que se encuentra en los diccionarios de inglés, son los siguientes. También se admiten las dos letras alternativas retiradas más recientemente; están entre paréntesis y se colocan debajo de las letras estándar de la IPA:

Tenga en cuenta que se admite la letra para-IPA para una vocal reducida central, ⟨ ᵻ ⟩ , pero su equivalente redondeado, ⟨ ᵿ ⟩ , no. ^[i]

Las letras vocales róticas Unicode precompuestas ⟨ ɚ ɝ ⟩ no son compatibles directamente. En su lugar, se debe utilizar el signo diacrítico rótico: ⟨ ᵊ˞ ᶟ˞ ⟩ . ^[10]

También se admiten las dos marcas de longitud:

Los comodines de superíndice (en mayúsculas) se admiten parcialmente: por ejemplo, ᴺC (consonante prenasalizada), ꟲN (nasal preparada), Pꟳ (liberación fricativa), NᴾF (plosiva epentética), CVNᵀ (sílaba portadora de tono), Cᴸ (liberación líquida o lateral). , Cᴿ (liberación rótica o resonante), Vᴳ (deslizamiento/diptongo), Cⱽ (vocal fugaz). Sin embargo, el superíndice S para liberación sibilante y el superíndice Ʞ para clic fugaz/epentético no son compatibles a partir de Unicode 15. Se admiten en su mayoría otros comodines de superíndice latino básicos para tono y sonidos débiles indeterminados, como se describe en el artículo sobre el Alfabeto Fonético Internacional . (Ver tabla en la sección anterior).

Además, muy pocas letras IPA más allá del alfabeto latino básico tienen formas combinadas de superíndice o se admiten como subíndices:

Caracteres compuestos

Principalmente por compatibilidad con conjuntos de caracteres anteriores, Unicode contiene una serie de caracteres que componen superíndices y subíndices con otros símbolos. ^[1] En la mayoría de las fuentes, estos se representan mucho mejor que los intentos de construir estos símbolos a partir de los caracteres anteriores o mediante el uso de marcas.

El bloque Suplemento Latin-1 contiene las fracciones precompuestas ½, ¼ y ¾. Los signos de copyright © y marca registrada ® también se encuentran en este bloque.
El bloque de puntuación general contiene el signo permille ‰ y el signo por diez mil ‱, y el latín básico tiene el signo de porcentaje %.
El bloque Formas numéricas contiene varias fracciones precompuestas: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉.
El bloque Símbolos tipo letra contiene algunos símbolos compuestos de caracteres de subíndice y superíndice: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
El bloque del Suplemento alfanumérico adjunto contiene tres abreviaturas en superíndice 🅪 🅫 🅬: MC para marque de commerce ( marca registrada ), MD para marque déposée ( marca registrada ), ambas utilizadas en Canadá; MR para marca registrada en países de habla hispana y portuguesa. ^[11]
El bloque Técnico varios tiene un subíndice adicional, un subíndice 10 (⏨), a efectos de notación científica .
Las sílabas aborígenes canadienses unificadas y sus bloques extendidos contienen varias letras compuestas con letras en superíndice para indicar valores de sonido extendidos: Bloque principal ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Bloque extendido ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.

Notas

^ Para obtener una descripción general e información técnica sobre la sustitución de glifos (aunque no específicamente para fracciones): GSUB: tabla de sustitución de glifos en la especificación OpenType en el sitio de tipografía de Microsoft.
^ Como Chrome , Firefox y Falkon
^ El superíndice ⟨ ç ⟩ se compone de un superíndice c y una cedilla combinada , que debería mostrarse correctamente con una buena fuente. El superíndice c se solicitó específicamente para este propósito en la propuesta Unicode L2/03-180.
^ U+02E4 ˤ LETRA MODIFICADORA PEQUEÑA OPERACIÓN GLOTTAL INVERTIDA es la variante en superíndice de U+0295 ʕ LETRA LATINA FRICATIVA VOZ FARINGEA y está definida para uso de IPA. El carácter similar U+02C1 ˁ LETRA MODIFICADORA GLOTTAL INVERTIDA STOP es una U+02C0 ˀ LETRA MODIFICADORA GLOTTAL STOP invertida , quizás un signo de interrogación invertido castrado. Las fuentes son inconsistentes en cuanto a si se ven diferentes y cuál es la diferencia.
^ En las fuentes de Microsoft, este carácter se diseñó erróneamente como superíndice ⟨ ꬸ ⟩ .
^ U + A71D ⟨ ꜝ ⟩ y A71E ⟨ ꜞ ⟩ fueron adoptados como equivalentes africanistas de los caracteres IPA ⟨ ꜜ ⟩ downstep y ⟨ ꜛ ⟩ upstep . La correspondencia de U+A71D ⟨ ꜝ ⟩ con la letra de clic IPA ⟨ ǃ ⟩ es, por tanto, accidental. Casualmente, U+A71E ⟨ ꜞ ⟩ sirve como variante en superíndice de la consonante de percusión extIPA ⟨ ¡ ⟩ ; las otras letras de percusión, ⟨ ʬ ⟩ y ⟨ ʭ ⟩ , no admiten superíndices en Unicode.
^ No debe confundirse con U+1D4C ⟨ ᵌ ⟩ , que es un superíndice ᴈ (una ɛ invertida en lugar de invertida).
^ No debe confundirse con U+1D46 ⟨ ᵆ ⟩ , que es un superíndice convertido en æ.
^ En teoría, el superíndice ⟨ ᵿ ⟩ podría manejarse utilizando el trazo diacrítico, ⟨ ᶷ̵ ⟩ , si no fuera por la falta de compatibilidad con fuentes.
^ Este es en realidad el diacrítico vietnamita dấu hỏi , no específicamente IPA, pero gráficamente ambos son signos de interrogación castrados.

Referencias

^ abc "UCD: UnicodeData.txt". El estándar Unicode . Consultado el 14 de mayo de 2016 .
^ ab Martin Dürst, Asmus Freytag (16 de mayo de 2007). "Unicode en XML y otros lenguajes de marcado". W3C . Consultado el 13 de septiembre de 2010 .
^ "fracción | Paquete de dardos". Paquetes de dardos . 27 de diciembre de 2021 . Consultado el 21 de septiembre de 2022 .
^ "MathML | Elementos de diseño general | Fracciones". data2type GmbH (en alemán). 30 de marzo de 2021 . Consultado el 13 de enero de 2022 .^{[ enlace muerto ]}
^ Martin Dürst, Asmus Freytag (16 de mayo de 2007). "Talla de fracción". W3C . Consultado el 13 de septiembre de 2010 .
^ "UCD: Scripts.txt". El estándar Unicode . Consultado el 21 de septiembre de 2022 .
^ Everson, Michael; Oeste, Andrew (5 de octubre de 2020). "L2/20-268: Propuesta revisada para agregar diez caracteres para inglés medio a la UCS" (PDF) .
^ Cirílico extendido-D. Rango: 1E030–1E08F
^ Kirk Miller y Michael Ashby, L2/20-253R Solicitud Unicode para letras modificadoras de IPA (b), no pulmonares.
^ Kirk Miller y Michael Ashby, L2/20-252R Solicitud Unicode para letras modificadoras de IPA (a), pulmonar
^ Silva, Eduardo Marín (1 de marzo de 2017). «L2/17-066R: Propuesta de codificación del signo de Marca Registrada» (PDF) .