ISO/CEI 8859-15

ISO/IEC 8859-15:1999 , Tecnología de la información. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits. Parte 15: Alfabeto latino n.º 9 , forma parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero. edición publicada en 1999. Se le conoce informalmente como Latin-9 (y durante un tiempo Latin-0 ). Es similar a la norma ISO 8859-1 y, por lo tanto, también está destinada a los idiomas de “Europa occidental”, pero reemplaza algunos símbolos menos comunes con el signo del euro y algunas letras que se consideraron necesarias. ^[1]

ISO-8859-15 es el nombre de juego de caracteres preferido de la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 .

Microsoft ha asignado la página de códigos 28605, también conocida como Windows-28605, a ISO-8859-15. IBM ha asignado la página de códigos 923 ( CCSID 923) a ISO 8859-15. ^[2]^[3]

Todos los caracteres imprimibles de ISO/IEC 8859-1 e ISO/IEC 8859-15 también se encuentran en Windows-1252 . Desde octubre de 2016, menos del 0,1% (en realidad, menos del 0,02%) de todos los sitios web utilizan ISO-8859-15. ^[4]^[5]

Historia

El identificador ISO 8859-15 se propuso para las lenguas sami en 1996, que finalmente fue rechazado, pero fue aprobado como ISO-IR 197 . ^[6]^[7]^[8]

ISO 8859-16 se propuso como una codificación similar a la ISO 8859-15 actual, para reemplazar 11 caracteres ISO 8859-1 no utilizados o raramente utilizados con el francés Œ œ que falta (en el mismo lugar que DEC-MCS y Lotus International Conjunto de caracteres ) y Ÿ (que no estaba en el mismo lugar que estos conjuntos, ya que Ý estaba en ese lugar para el islandés), el holandés Ĳ ĳ y el turco Ğ ğ İ ı Ş ş. El signo del euro no existía en aquella época. ^[9]

El borrador quedó así:

Posteriormente, el nombre se cambió a ISO-8859-0 y se reestructuró en 1997. Los caracteres turcos se eliminaron porque se consideró que potencialmente harían más daño a la práctica turca vigente en ese momento, mientras que la implementación de UCS (Unicode) no estaba tan lejos. , y se eliminó la ligadura holandesa de la IJ ya que se consideró que el dígrafo ij existente era adecuado. También se consideró agregar los galeses Ŵ ŵ y Ŷ ŷ, pero eso se pospuso en espera de una mayor investigación. 4 caracteres ISO 8859-1 no utilizados o poco utilizados ( ¤ , ¨ , ´ y ¸ ) se reemplazaron por € , Ÿ , Œ y œ respectivamente. ^[10] El euro se hizo necesario cuando se introdujo el euro . Ÿ es necesario para que el texto francés pueda convertirse de minúsculas a mayúsculas y viceversa sin pérdida, y Œ y œ son ligaduras francesas. Irónicamente, los tres últimos ya estaban presentes en el conjunto de caracteres multinacional (MCS) de DEC en 1983, un conjunto de caracteres del que se derivaron ECMA-94 (1985) e ISO-8859-1 (1987). Dado que sus puntos de código originales ahora estaban ocupados por otros personajes, se tuvieron que elegir puntos de código menos lógicos para su reintroducción.

La misma propuesta también recomendó reemplazar 6 caracteres más ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) con "algunos otros caracteres para cubrir un máximo de idiomas". Los motivos de la elección de estos personajes quedaron expuestos en la propuesta. ^[10] Para el signo del euro, algunos querían reemplazar el signo más-menos en lugar del signo de moneda. El signo de moneda se utiliza en algunas aplicaciones como separador de campos y en otras para indicar el subtotal. Hubo una fuerte oposición a esto. Una persona dijo: "La propuesta «+-» no es un recurso alternativo adecuado, ya que esta secuencia, aunque rara vez se usa, ya tiene un significado matemático fijo, bastante diferente de «±»; e, incluso si un lector dedujera el significado deseado es decir, «±», según el contexto, «+-» en lugar de «±» herirá los sentimientos estéticos de un físico al menos tanto como «oe» en lugar de una ligadura oe de un francófono. ^[11] Al final, se mantuvo ± y se eliminó ¤ (como se planeó originalmente).

Alrededor de 1997/1998 (cuando se actualizó Windows-1252 ) se seleccionaron cuatro caracteres: Š , š , Ž y ž , que se utilizan en finlandés y estonio para la transliteración de préstamos y nombres rusos . Al mismo tiempo, la propuesta pasó a llamarse ISO 8859-15. Al final se eliminaron los caracteres ¦ , ¼ , ½ y ¾ , mientras que ¢ se mantuvo porque era más común que los otros cuatro.

Hubo intentos de hacer que ISO 8859-15 fuera el conjunto de caracteres predeterminado para la comunicación de 8 bits, pero nunca pudo suplantar al popular ISO 8859-1. Tuvo cierto uso como conjunto de caracteres predeterminado para la consola de texto y los programas de terminal en Linux cuando se necesitaba el signo del euro, pero el uso de Unicode completo no era práctico, pero desde entonces ha sido reemplazado por UTF-8 .

Cobertura

La norma ISO 8859-15 codifica lo que denomina " alfabeto latino n.º 9". Este conjunto de caracteres se utiliza en América , Europa occidental , Oceanía y gran parte de África . También se usa comúnmente en la mayoría de las romanizaciones estándar de las lenguas de Asia oriental.

Cada carácter está codificado como un único valor de código de ocho bits. Estos valores de código se pueden utilizar en casi cualquier sistema de intercambio de datos para comunicarse en los siguientes idiomas:

Lenguas modernas con cobertura completa de su alfabeto.

Notas

^ Soporte completo excepto Ǿ/ǿ que faltan. Ǿ/ǿ se puede reemplazar con Ø/ø a costa de una mayor ambigüedad.
^ Comúnmente respaldado con una cobertura casi completa del alfabeto holandés, ya que las Ĳ , ĳ que faltan siempre deben representarse como IJ o ij de dos caracteres en formato electrónico.
^ Estados Unidos y los británicos modernos
^ En 2017, el Consejo de Ortografía Alemana adoptó oficialmente una mayúscula, ⟨ẞ⟩ , antes de que se completara el apoyo al alemán.
^ Nueva ortografía
^ ab Ortografía clásica básica
^ Guión Rumi
^ Bokmål y Nynorsk
^ Europeo y brasileño

Cobertura de signos de puntuación y apóstrofes.

Para algunos de los idiomas enumerados anteriormente, faltan las comillas tipográficas correctas , ya que solo se incluyen «, », " y '.

Además, esta codificación no proporciona el carácter correcto para el apóstrofe y comillas simples altas orientadas, aunque algunos textos utilizan el acento grave espaciado y el acento agudo espaciado, ambos parte de ISO 8859-1, en lugar del 6 en forma. /9, comillas o apóstrofes (y esto funciona de manera confiable con algunos estilos de fuente, donde todos estos caracteres se muestran como glifos de cuña inclinados).

Diseño de página de códigos

Las diferencias con ISO-8859-1 tienen el punto de código Unicode que se muestra debajo del carácter.

Alias

ISO 8859-15 también tiene los siguientes alias específicos del proveedor:

WE8ISO8859P15 ( base de datos Oracle ) ^[15]

Ver también

Referencias

^ "ISO-8859-15". IANA . Consultado el 8 de marzo de 2016 .
^ "Documento informativo de la página de códigos 923". Archivado desde el original el 28 de febrero de 2013.
^ "Documento informativo CCSID 923". Archivado desde el original el 1 de diciembre de 2014.
^ "Tendencias históricas en el uso de codificaciones de caracteres, noviembre de 2018". w3techs.com .
^ "Preguntas frecuentes". w3techs.com .
^ TIEKE en representación de la Asociación Finlandesa de Normas SFS (7 de diciembre de 1999). Conjunto latino suplementario sami nº 2 (PDF) . ITSCJ/ IPSJ . ISO-IR -209.
^ Everson, Michael. "Propuesta ISO 8859-15" . Consultado el 26 de febrero de 2017 .
^ Everson, Michael. "Propuesta ISO 8859-14 (posteriormente 15)" . Consultado el 26 de febrero de 2017 .
^ Everson, Michael. "Propuesta ISO 8859-16" . Consultado el 26 de febrero de 2017 .
^ ab Everson, Michael. "Propuesta ISO 8859-0 (posterior 15)" . Consultado el 26 de febrero de 2017 .
^ Stolz, Otto (11 de julio de 1997). "Re: Nuevo borrador ISO 8859-0". Lista de correo Unicode (lista de correo).
^ Página de códigos CPGID 00923 (pdf) (PDF) , IBM
^ Página de códigos CPGID 00923 (txt), IBM
^ Componentes internacionales para Unicode (ICU), ibm-923_P100-1998.ucm, 3 de diciembre de 2002
^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fanático, Jessica; Hola, Claire; Ley, Simón; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Cierto, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simón; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Apéndice A: Datos locales". Guía de soporte para la globalización de la base de datos Oracle9i (PDF) (versión 2 (9.2) ed.). Corporación Oráculo . Oráculo A96529-01. Archivado (PDF) desde el original el 14 de febrero de 2017 . Consultado el 14 de febrero de 2017 .

Enlaces externos

ISO/IEC 8859-15:1999 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits, Parte 15: Alfabeto latino n.° 9 (publicada el 15 de marzo de 1999)
ISO/IEC 8859-15 (borrador final del comité de fecha 1 de agosto de 1997)
ISO Latin 9 en comparación con ISO Latin 1
Conjunto latino suplementario europeo ISO-IR 203 (16 de septiembre de 1998)