stringtranslate.com

Wikipedia:Convenciones de nomenclatura (Unicode) (borrador)

Por el momento, esta página solo contiene información sobre caracteres especiales que pueden resultar interesantes o útiles para el inglés. Con suerte, se podrá ampliar para incluir una política sobre su uso.

Unicode proporciona un estándar internacional cuyo objetivo es proporcionar los medios para codificar el texto de todos los documentos que las personas desean almacenar en sus computadoras. Esto incluye todos los alfabetos que se usan actualmente, muchos alfabetos que solo conocen los académicos y símbolos que no representan estrictamente alfabetos, como los símbolos matemáticos, lingüísticos y APL.

ASCII

Estos son nuestro pan de cada día y ya han sido tratados exhaustivamente en otros lugares. Plugwash 28 de junio de 2005 20:37 (UTC)

latín-1

Lo mismo que el anterior, más o menos Plugwash 28 de junio de 2005 20:41 (UTC)

El signo de grado y el indicador ordinal masculino se confunden a menudo y, a veces, se utilizan incorrectamente en lugar de la "o" en relieve en aproximaciones del signo de número . El indicador ordinal femenino también se utiliza incorrectamente ocasionalmente como un "1" superíndice. La viabilidad de tales aproximaciones se basa en que el medio de salida sea visual (pantalla, impresión) y en las características de ciertas fuentes en ciertos tamaños. En otros contextos, la semántica del texto cambia cuando se utilizan los caracteres incorrectos. Por lo tanto, estos caracteres solo deben usarse para los fines previstos: use el signo de grado para indicar grados y los indicadores ordinales según corresponda para los idiomas que los necesitan.

Latín extendido A

En su mayoría, se trata de letras con diacríticos menos comunes. Uno o dos de ellos ya se encuentran en los títulos de los artículos debido a las conversiones desde Windows-1252 (la mayoría de los navegadores interpretan ISO-8859-1 como Windows-1252 y, por lo tanto, esto se incluyó en los nombres de los artículos). Los diacríticos adicionales probablemente sean algo bueno siempre que se implementen redirecciones desde los nombres sin diacríticos y es probable que estos tengan un amplio soporte, por lo que creo que es bastante seguro tenerlos en los títulos de los artículos. Plugwash 28 de junio de 2005 20:47 (UTC)

Ejemplo: Paul Erdős . Cenador 6 de julio de 2005 12:59 (UTC)

Es un error referirse a estos diacríticos como "menos comunes". Muchos de ellos son diacríticos utilizados para idiomas de Europa del Este, incluidos el polaco, el checo, el eslovaco, el croata, el esloveno, el serbio en escritura latina, el húngaro, el turco, el rumano, el letón, el lituano, etc., y desde la introducción de MediaWiki 1.5 ya se utilizan ampliamente en los títulos de los artículos. El hecho de que el latín 1 se limite a los idiomas de Europa Occidental es simplemente un artefacto de la Guerra Fría. -- Curps 15:05, 2 de agosto de 2005 (UTC) [ responder ]

Latín extendido B

Aquí, U+018F es la schwa mayúscula , utilizada en azerbaiyano . Nótese que la schwa minúscula es U+0259 en la sección AFI; el carácter U+01DD es "letra minúscula latina convertida en e", cuya mayúscula es U+018E, que se utiliza en los alfabetos pan-nigerianos.

Además, U+01A0, U+01A1 es "o con cuerno" y U+01AF, U+01B0 es "u con cuerno", usado en vietnamita .

Además, U+01CD a U+01DC son a, i, o, u, u-diéresis con acento circunflejo , que se utilizan en el pinyin chino para el tercer tono. Nótese que Ě/ě (e con acento circunflejo) es U+011A/U+011B y está en la A latina extendida, ya que también es una letra del alfabeto checo.

Además, U+0218 a U+021B son "s con coma debajo" y "t con coma debajo", utilizadas en rumano . A veces no hay fuentes disponibles para estas, por lo que a veces se utilizan "s con cedilla" y "t con cedilla" de la sección A extendida latina en lugar de estas. Ver Caracteres especiales Unicode rumanos -- Curps 21:10, 24 de agosto de 2005 (UTC) [ responder ]

Por curiosidad, ¿sabes si el wp rumano tiene una política sobre el uso de la coma debajo o la cedilla? Plugwash 22:46, 24 de agosto de 2005 (UTC) [ responder ]
Estoy bastante seguro de que utilizan las formas de cedilla, simplemente porque mi navegador no puede mostrar las versiones con coma en los caracteres Unicode rumanos especiales y cuando voy a http://ro.wikipedia.org/ puedo ver las letras. Las versiones con coma sólo se muestran en la tabla anterior porque toda la tabla está configurada para utilizar fuentes Unicode especiales en lugar de las fuentes predeterminadas. Edité la tabla anterior para mostrar la versión de fuente predeterminada junto con la versión de fuente Unicode. -- Curps 03:39, 25 de agosto de 2005 (UTC) [ responder ]

latín extendido adicional

El rango U+01EA0 a U+01EF9 se utiliza para el idioma vietnamita . -- Curps 21:10, 24 de agosto de 2005 (UTC) [ responder ]

Extensiones de IPA

Se utiliza en el cuerpo del texto para el IPA (con una plantilla especial para persuadir a IE de que lo muestre correctamente). Probablemente no sea adecuado para títulos de artículos aquí. Plugwash 28 de junio de 2005 20:48 (UTC)

Sin embargo, cabe señalar que schwa (U+0259) también es una letra del alfabeto azerbaiyano . La schwa minúscula se encuentra en la sección AFI, pero la mayúscula (U+018F) se encuentra en la sección B latina. -- Curps 15:05, 2 de agosto de 2005 (UTC) [ responder ]

Letras modificadoras de espaciado


No estoy formateándolo correctamente, pero hay al menos un elemento interesante en este bloque de código:

Lamentablemente, este carácter no parece estar disponible ni en las fuentes predeterminadas ni en las fuentes Unicode de Windows. -- Curps 21:38, 4 de septiembre de 2005 (UTC) [ responder ]
Funciona bien en el mío, aunque no podría decirte con precisión qué fuente es la que me ha hecho el favor. — Phil | Discusión 14:14, 14 de octubre de 2005 (UTC) [ responder ]

Combinación de signos diacríticos

Observa cómo aparecen las marcas ahora que tienen algo con qué combinar… — Phil | Talk 10:49, 24 de octubre de 2005 (UTC) [ responder ]

Griego

Ya se usa mucho para temas de tipo matemático, pero probablemente no sea muy apropiado para títulos de artículos en inglés. Plugwash 28 de junio de 2005 20:38 (UTC)

Bueno, aquí hay algunos artículos en inglés que podrían usar esas letras en el título. Algunos de estos artículos afirman tener el "título incorrecto debido a limitaciones técnicas": Pi , C omega , constante Omega , distribución Chi-cuadrado , función Gamma , alfa de Cronbach , partícula Beta , distribución Beta y muchos, muchos más. Arbor 6 de julio de 2005 19:07 (UTC)

También algunos nombres de estrellas como α y como redirección a Alpha Andromedae . Pero aquí nos topamos con el problema de que "la letra inicial está en mayúscula", que también se aplica a las letras griegas. -- Curps 04:44, 25 de agosto de 2005 (UTC) [ responder ]

Griego extendido

cirílico

Suplemento cirílico

armenio


hebreo

Tenga en cuenta que el símbolo matemático de Aleph (por ejemplo, Aleph-0 ) se encuentra en la sección de matemáticas en U+2135. -- Curps 21:10, 24 de agosto de 2005 (UTC) [ responder ]

Véase también #Formas de presentación alfabética para las formas utilizadas en yiddish . -- Curps 00:56, 11 de septiembre de 2005 (UTC) [ responder ]

árabe

De hecho, estoy obteniendo una mejor cobertura con la fuente predeterminada aquí. Phil | Discusión 12:30, 24 de octubre de 2005 (UTC) [ responder ]

Suplemento árabe

No consigo nada con ninguna de las dos opciones: ¿hay una mejor alternativa para mostrar el árabe ? — Phil | Discusión 12:45, 24 de octubre de 2005 (UTC) [ responder ]

Siríaco

Taana

Devanagari

bengalí

Gujarati

Tamil

Télugu

Canarés

Malabar

tailandés

georgiano

Puntuación general

Páginas que ya utilizan dichas letras:

Páginas candidatas para su uso:

Superíndices y subíndices

Probablemente no sea relevante para los títulos y en el cuerpo del texto es probablemente más seguro usar subíndices/superíndices HTML.

Además de requerir algunas fuentes de alto rendimiento para que se representen correctamente, los menos conocidos de estos caracteres (todos excepto ² y ³, en realidad) tienden a parecer demasiado pequeños para ser legibles, al menos comparados con <sub>. La política vigente para los planetas menores (cuyas designaciones a menudo incluyen subíndices) es 1) usar <sub> sistemáticamente en el artículo y en la plantilla de título incorrecto, 2) usar caracteres que no sean subíndices en el título y 3) poner en marcha una redirección desde el título con subíndices. Urhixidur 14:51, 2 de agosto de 2005 (UTC)

Símbolos monetarios

El euro (U+20AC) se utiliza mucho en los artículos y debería ser aceptable utilizarlo en el título de un artículo (aunque es difícil pensar en un título plausible que lo utilice... tal vez si el título de algún libro o película incorpora el símbolo). -- Curps 21:08, 24 de agosto de 2005 (UTC) [ responder ]

¿Qué tal unas monedas conmemorativas de 2€ ? ;)Nightst a llion (?) 12:48, 28 de julio de 2006 (UTC) [ responder ]

Símbolos con forma de letras

Símbolos varios

Formas de presentación alfabéticas

Formularios de presentación árabes-A

Formularios de presentación árabes-B

Formularios de ancho medio y ancho completo