stringtranslate.com

ISO 639

ISO 639 es un estándar de la Organización Internacional de Normalización (ISO) que se ocupa de la representación de idiomas y grupos de idiomas . Actualmente consta de cuatro conjuntos (1-3, 5) de códigos, nombrados según cada parte que anteriormente describía el conjunto respectivo (la parte 4 eran pautas sin su propio sistema de codificación); una parte 6 fue publicada pero retirada. Fue aprobada por primera vez en 1967 como una Recomendación ISO de una sola parte , ISO/R 639 , [1] reemplazada en 2002 por la parte 1 de la nueva serie, ISO 639-1 , [2] seguida de partes adicionales. Todas las partes existentes de la serie se consolidaron en una única norma en 2023, [3] basada en gran medida en el texto de la norma ISO 639-4.

Uso de códigos ISO 639

Los códigos de idioma definidos en las distintas secciones de ISO 639 se utilizan con fines bibliográficos y, en entornos informáticos y de Internet, como elemento clave de los datos locales . Los códigos también se utilizan en diversas aplicaciones, como las URL de Wikipedia para sus ediciones en diferentes idiomas.

Historia

La forma inicial del sistema de codificación de idiomas de ISO se manifestó en ISO/R 639:1967, titulado Símbolos para idiomas, países y autoridades , cuyo objetivo principal era regular los vocabularios que significan idiomas, países y agencias de normalización de los organismos miembros de ISO. Sus "símbolos lingüísticos" consistían en identificadores de longitud variable de una o dos letras en alfabetos latinos en mayúscula, por ejemplo, Eo Enpara el inglés; S, Sp, o Espara español; y Inpara indonesio. También se permitió utilizar (la versión anterior a 1993) auxiliares numéricos UDC para indicar idiomas.

Después de desacoplar el código de país en ISO 3166 en 1974, se publicó la primera edición del Código estándar ISO 639:1988 para la representación de nombres de idiomas con un marco de identificadores uniformes de dos letras en alfabetos latinos minúsculos, en su mayoría idénticos en formato y vocabulario similar al de la actual norma ISO 639 Set 1.

Desde entonces, el estándar ha sido adoptado como una tecnología fundamental de la industria informática en rápida expansión (RFC 1766), lo que llevó al desarrollo de un marco de tres letras más expresivo, publicado como ISO 639-2:1998, basado en gran medida en códigos MARC para idiomas. . El sistema original de dos letras fue redefinido como ISO 639-1 en 2001.

En busca de un soporte más amplio de idiomas para aplicaciones en expansión, se establecieron superconjuntos separados del espacio de nombres ISO 639-2 que cubren idiomas y grupos individuales como ISO 639-3 e ISO 639-5, respectivamente. También hubo un intento de codificar variantes de lenguaje más precisas utilizando identificadores de cuatro letras como ISO 639-6, que luego fue retirado y reorganizado bajo otro marco, ISO 21636.

Las actualizaciones relativamente constantes en partes de ISO 639 habían sido manejadas por cada autoridad responsable hasta la publicación de ISO 639:2023, que armonizó y reunificó el texto de las normas anteriores y provocó cambios organizativos con una agencia de mantenimiento conjunta que supervisa todos los conjuntos y emisión de boletines[1].

Conjuntos actuales y partes históricas del estándar.

Cada conjunto de estándares es mantenido por una agencia de mantenimiento, que agrega códigos y cambia el estado de los códigos cuando es necesario. La norma ISO 639-6 fue retirada en 2014, [8] y no incluida en la norma ISO 639:2023.

Características de los códigos individuales.

Alcances:

Tipos (para idiomas individuales): [ necesita actualización ]

Idiomas individuales y macrolenguajes con dos códigos distintos de tres letras en el Conjunto 2:

Relaciones entre los conjuntos.

Los diferentes conjuntos de ISO 639 están diseñados para funcionar juntos, de tal manera que ningún código signifique una cosa en un conjunto y otra cosa en otro. Sin embargo, no todos los idiomas están en todos los conjuntos y existe una variedad de formas diferentes en que los idiomas específicos y otros elementos se tratan en los diferentes conjuntos. Esto depende, por ejemplo, de si un idioma figura en el Conjunto 1 o 2, si tiene códigos B/T separados en el Conjunto 2 o si está clasificado como macrolenguaje en el Conjunto 3, etc.

Estos diversos tratamientos se detallan en el siguiente cuadro. En cada grupo de filas (una para cada alcance del Conjunto 3), las últimas cuatro columnas contienen códigos para un lenguaje representativo que ejemplifica un tipo específico de relación entre los conjuntos de ISO 639, la segunda columna proporciona una explicación de la relación, y la primera columna indica la cantidad de elementos que tienen ese tipo de relación. Por ejemplo, hay cuatro elementos que tienen un código en el Conjunto 1, tienen un código B/T y están clasificados como macrolenguajes en el Conjunto 3. Un representante de estos cuatro elementos es "persa " fa// per.fas

Estas diferencias se deben a los siguientes factores.

En ISO 639 Set 2 , se asignaron dos códigos distintos a 22 idiomas individuales, a saber, un código bibliográfico y uno terminológico (códigos B/T). [15] Los códigos B se incluyeron por razones históricas porque los sistemas bibliográficos anteriores ampliamente utilizados utilizaban códigos de idioma basados ​​en el nombre en inglés del idioma. Por el contrario, los códigos del Conjunto 1 se basaban en el nombre nativo del idioma, y ​​también había un fuerte deseo de tener códigos del Conjunto 2 (códigos T) para estos idiomas que fueran similares al código de 2 caracteres correspondiente en el Conjunto 1.

Los idiomas individuales en el Conjunto 2 siempre tienen un código en el Conjunto 3 (allí solo se reutiliza el código terminológico del Conjunto 2) pero pueden tener o no un código en el Conjunto 1, como se ilustra en los siguientes ejemplos:

Algunos códigos (62) en el Conjunto 3 son macrolenguajes. Estos son grupos que contienen múltiples idiomas individuales que tienen un buen entendimiento mutuo y comúnmente se mezclan o confunden. Algunos macrolenguajes desarrollaron una forma estándar predeterminada en uno de sus idiomas individuales (por ejemplo, el mandarín está implícito de forma predeterminada para el macrolenguaje chino, aún se pueden distinguir otros idiomas individuales si es necesario, pero el código específico cmnpara el mandarín rara vez se usa).

Los códigos colectivos del Conjunto 2 tienen un código en el Conjunto 5: por ejemplo, ausen los Conjuntos 2 y 5, que significa lenguas australianas .

Los conjuntos 2 y 3 también tienen una gama reservada y cuatro códigos especiales:

Espacio de código

Espacio de código de dos letras

En el Conjunto 1 se utilizan identificadores de dos letras (anteriormente "Alpha-2") (para códigos compuestos por 2 letras del alfabeto latino básico ISO ) . Cuando se deseaban códigos para una gama más amplia de idiomas, que pudieran cubrir más de 2 combinaciones de letras (un máximo de 26 2 = 676), el Conjunto 2 se desarrolló utilizando códigos de tres letras. (Sin embargo, este último se publicó formalmente primero. [16] [17] )

Espacio de código de tres letras

Los identificadores de tres letras (anteriormente "Alpha-3") (para códigos compuestos por 3 letras del alfabeto latino básico ISO ) se utilizan en el Conjunto 2 , el Conjunto 3 y el Conjunto 5 . El número de lenguas y grupos lingüísticos que pueden representarse así es 26 3 = 17.576.

El uso común de códigos de tres letras por parte de tres conjuntos de ISO 639 requiere cierta coordinación dentro de un sistema más grande.

El conjunto 2 define cuatro códigos especiales mis, mul, und, zxxun rango reservado qaa-qtz(20 × 26 = 520 códigos) y tiene 20 entradas dobles (los códigos B/T), más 2 entradas con códigos B obsoletos. Esto suma 520 + 22 + 4 = 546 códigos que no se pueden usar en el Conjunto 3 para representar idiomas o en el Conjunto 5 para representar familias o grupos de idiomas. El resto es 17.576 – 546 = 17.030.

Hoy en día existen entre seis y siete mil lenguas en la Tierra. [18] Entonces, esos 17,030 códigos son adecuados para asignar un código único a cada idioma, aunque algunos idiomas pueden terminar con códigos arbitrarios que no se parecen en nada a los nombres tradicionales de ese idioma.

Espacio de código Alpha-4 (retirado)

Se propuso el uso de códigos "Alfa-4" (para códigos compuestos por 4 letras del alfabeto latino básico ISO ) en la norma ISO 639-6 , que ha sido retirada. El límite superior para el número de lenguas y dialectos que se pueden representar es 26 4 = 456.976.

Ver también

notas y referencias

  1. ^ "ISO/R 639:1967". Organización Internacional de Normalización. 1988-03-01 . Consultado el 5 de agosto de 2012 .
  2. ^ "ISO 639:1988". Organización Internacional de Normalización . Consultado el 5 de agosto de 2012 .
  3. ^ "ISO 639: 2023". Organización Internacional de Normalización . Consultado el 15 de noviembre de 2023 .
  4. ^ "Códigos ordenados alfabéticamente por código alfa-3/ISO 639-2". Biblioteca del Congreso. 25 de julio de 2013 . Consultado el 10 de enero de 2019 .
  5. ^ "Códigos ISO-639-2". Biblioteca del Congreso . Consultado el 10 de enero de 2019 .
  6. ^ "Conjunto de códigos ISO 639-3 (UTF-8)". SIL Internacional . Consultado el 12 de julio de 2023 .
  7. ^ "Códigos ISO 639-5 ordenados por Identificador". Oficina de desarrollo de redes y estándares MARC . Biblioteca del Congreso . Consultado el 12 de diciembre de 2018 .
  8. ^ ISO 639-6:2009, ISO .
  9. ^ ab SIL Internacional (14 de junio de 2021). "Cambiar al código de idioma de la Parte 1". ISO 639-3 .
  10. ^ "Tablas de códigos ISO 639: macrolenguajes". Sil.org . Consultado el 5 de agosto de 2012 .
  11. ^ "Tablas de códigos ISO 639: extintas". Sil.org . Consultado el 5 de agosto de 2012 .
  12. ^ "Tablas de códigos ISO 639: antiguas". Sil.org . Consultado el 10 de enero de 2019 .
  13. ^ "Tablas de códigos ISO 639: históricas". Sil.org . Consultado el 5 de agosto de 2012 .
  14. ^ "Tablas de códigos ISO 639: construidas". Sil.org . Consultado el 7 de febrero de 2022 .
  15. ^ "ISO 639-2 - Preguntas frecuentes". Biblioteca del Congreso. 2014-05-05 . Consultado el 12 de diciembre de 2014 .
  16. ^ "Códigos para la representación de nombres de idiomas - Parte 2: Código Alpha-3". Organización Internacional de Normalización . YO ASI . Consultado el 10 de enero de 2019 . Fecha de publicación: 1998-10
  17. ^ "Códigos para la representación de nombres de idiomas - Parte 1: Código Alpha-2". Organización Internacional de Normalización . YO ASI . Consultado el 15 de febrero de 2018 . Fecha de publicación: 2002-07
  18. ^ "Resúmenes estadísticos". Etnólogo . Consultado el 5 de agosto de 2012 .

enlaces externos