ISO/IEC 8859-15:1999 , Tecnología de la información. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits. Parte 15: Alfabeto latino n.º 9 , forma parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero. edición publicada en 1999. Se le conoce informalmente como Latin-9 (y durante un tiempo Latin-0 ). Es similar a la norma ISO 8859-1 y, por lo tanto, también está destinada a los idiomas de “Europa occidental”, pero reemplaza algunos símbolos menos comunes con el signo del euro y algunas letras que se consideraron necesarias. [1]
ISO-8859-15 es el nombre de juego de caracteres preferido de la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 .
Microsoft ha asignado la página de códigos 28605, también conocida como Windows-28605, a ISO-8859-15. IBM ha asignado la página de códigos 923 ( CCSID 923) a ISO 8859-15. [2] [3]
Todos los caracteres imprimibles de ISO/IEC 8859-1 e ISO/IEC 8859-15 también se encuentran en Windows-1252 . Desde octubre de 2016, menos del 0,1% (en realidad, menos del 0,02%) de todos los sitios web utilizan ISO-8859-15. [4] [5]
El identificador ISO 8859-15 se propuso para las lenguas sami en 1996, que finalmente fue rechazado, pero fue aprobado como ISO-IR 197 . [6] [7] [8]
ISO 8859-16 se propuso como una codificación similar a la ISO 8859-15 actual, para reemplazar 11 caracteres ISO 8859-1 no utilizados o raramente utilizados con el francés Œ œ que falta (en el mismo lugar que DEC-MCS y Lotus International Conjunto de caracteres ) y Ÿ (que no estaba en el mismo lugar que estos conjuntos, ya que Ý estaba en ese lugar para el islandés), el holandés IJ ij y el turco Ğ ğ İ ı Ş ş. El signo del euro no existía en aquella época. [9]
El borrador quedó así:
Posteriormente, el nombre se cambió a ISO-8859-0 y se reestructuró en 1997. Los caracteres turcos se eliminaron porque se consideró que potencialmente harían más daño a la práctica turca vigente en ese momento, mientras que la implementación de UCS (Unicode) no estaba tan lejos. , y se eliminó la ligadura holandesa de la IJ ya que se consideró que el dígrafo ij existente era adecuado. También se consideró agregar los galeses Ŵ ŵ y Ŷ ŷ, pero eso se pospuso en espera de una mayor investigación. 4 caracteres ISO 8859-1 no utilizados o poco utilizados ( ¤ , ¨ , ´ y ¸ ) se reemplazaron por € , Ÿ , Œ y œ respectivamente. [10] El euro se hizo necesario cuando se introdujo el euro . Ÿ es necesario para que el texto francés pueda convertirse de minúsculas a mayúsculas y viceversa sin pérdida, y Œ y œ son ligaduras francesas. Irónicamente, los tres últimos ya estaban presentes en el conjunto de caracteres multinacional (MCS) de DEC en 1983, un conjunto de caracteres del que se derivaron ECMA-94 (1985) e ISO-8859-1 (1987). Dado que sus puntos de código originales ahora estaban ocupados por otros personajes, se tuvieron que elegir puntos de código menos lógicos para su reintroducción.
La misma propuesta también recomendó reemplazar 6 caracteres más ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) con "algunos otros caracteres para cubrir un máximo de idiomas". Los motivos de la elección de estos personajes quedaron expuestos en la propuesta. [10] Para el signo del euro, algunos querían reemplazar el signo más-menos en lugar del signo de moneda. El signo de moneda se utiliza en algunas aplicaciones como separador de campos y en otras para indicar el subtotal. Hubo una fuerte oposición a esto. Una persona dijo: "La propuesta «+-» no es un recurso alternativo adecuado, ya que esta secuencia, aunque rara vez se usa, ya tiene un significado matemático fijo, bastante diferente de «±»; e, incluso si un lector dedujera el significado deseado es decir, «±», según el contexto, «+-» en lugar de «±» herirá los sentimientos estéticos de un físico al menos tanto como «oe» en lugar de una ligadura oe de un francófono. [11] Al final, se mantuvo ± y se eliminó ¤ (como se planeó originalmente).
Alrededor de 1997/1998 (cuando se actualizó Windows-1252 ) se seleccionaron cuatro caracteres: Š , š , Ž y ž , que se utilizan en finlandés y estonio para la transliteración de préstamos y nombres rusos . Al mismo tiempo, la propuesta pasó a llamarse ISO 8859-15. Al final se eliminaron los caracteres ¦ , ¼ , ½ y ¾ , mientras que ¢ se mantuvo porque era más común que los otros cuatro.
Hubo intentos de hacer que ISO 8859-15 fuera el conjunto de caracteres predeterminado para la comunicación de 8 bits, pero nunca pudo suplantar al popular ISO 8859-1. Tuvo cierto uso como conjunto de caracteres predeterminado para la consola de texto y los programas de terminal en Linux cuando se necesitaba el signo del euro, pero el uso de Unicode completo no era práctico, pero desde entonces ha sido reemplazado por UTF-8 .
La norma ISO 8859-15 codifica lo que denomina " alfabeto latino n.º 9". Este conjunto de caracteres se utiliza en América , Europa occidental , Oceanía y gran parte de África . También se usa comúnmente en la mayoría de las romanizaciones estándar de las lenguas de Asia oriental.
Cada carácter está codificado como un único valor de código de ocho bits. Estos valores de código se pueden utilizar en casi cualquier sistema de intercambio de datos para comunicarse en los siguientes idiomas:
Para algunos de los idiomas enumerados anteriormente, faltan las comillas tipográficas correctas , ya que solo se incluyen «, », " y '.
Además, esta codificación no proporciona el carácter correcto para el apóstrofe y comillas simples altas orientadas, aunque algunos textos utilizan el acento grave espaciado y el acento agudo espaciado, ambos parte de ISO 8859-1, en lugar del 6 en forma. /9, comillas o apóstrofes (y esto funciona de manera confiable con algunos estilos de fuente, donde todos estos caracteres se muestran como glifos de cuña inclinados).
Las diferencias con ISO-8859-1 tienen el punto de código Unicode que se muestra debajo del carácter.
ISO 8859-15 también tiene los siguientes alias específicos del proveedor: