La norma ISO 639-3:2007 , Códigos para la representación de nombres de idiomas – Parte 3: Código alfa-3 para una cobertura completa de idiomas , es una norma internacional para códigos de idiomas de la serie ISO 639. Define códigos de tres letras para identificar idiomas. La norma fue publicada por la Organización Internacional de Normalización (ISO) el 1 de febrero de 2007. [1]
La norma ISO 639-3 amplía los códigos alfa-3 de la norma ISO 639-2 con el objetivo de cubrir todos los idiomas naturales conocidos . La cobertura extendida de los idiomas se basó principalmente en los códigos de idiomas utilizados en el Ethnologue (volúmenes 10-14) publicado por SIL International , que ahora es la autoridad de registro de la norma ISO 639-3. [2] Proporciona una enumeración de idiomas lo más completa posible, incluyendo los idiomas vivos y extintos, antiguos y construidos, mayores y menores, escritos y no escritos. [1] Sin embargo, no incluye idiomas reconstruidos como el protoindoeuropeo . [3]
La norma ISO 639-3 está destinada a utilizarse como código de metadatos en una amplia gama de aplicaciones. Se utiliza ampliamente en sistemas informáticos y de información, como Internet, en los que es necesario admitir muchos idiomas. En archivos y otros sistemas de almacenamiento de información, se utiliza en sistemas de catalogación, indicando en qué idioma se encuentra o trata un recurso. Los códigos también se utilizan con frecuencia en la literatura lingüística y en otros ámbitos para compensar el hecho de que los nombres de los idiomas pueden ser confusos o ambiguos.
La norma ISO 639-3 incluye todos los idiomas de la norma ISO 639-1 y todos los idiomas individuales de la norma ISO 639-2 . La norma ISO 639-1 y la norma ISO 639-2 se centran en los idiomas principales, los más representados en el conjunto de la literatura mundial. Dado que la norma ISO 639-2 también incluye colecciones de idiomas y la Parte 3 no, la norma ISO 639-3 no es un superconjunto de la norma ISO 639-2. Cuando existen códigos B y T en la norma ISO 639-2, la norma ISO 639-3 utiliza los códigos T.
Al 23 de enero de 2023 [actualizar], el estándar contiene 7916 entradas. [6] El inventario de idiomas se basa en varias fuentes, incluidas: los idiomas individuales contenidos en 639-2, idiomas modernos del Ethnologue , variedades históricas, idiomas antiguos y idiomas artificiales de la Linguist List , [7] así como los idiomas recomendados dentro del período anual de comentarios públicos.
La autoridad de registro proporciona archivos de datos legibles por máquina . [6] Se pueden realizar asignaciones de ISO 639-1 o ISO 639-2 a ISO 639-3 utilizando estos archivos de datos.
La norma ISO 639-3 pretende suponer distinciones basadas en criterios que no son completamente objetivos. [8] No pretende documentar ni proporcionar identificadores para dialectos u otras variaciones de subidiomas. [9] Sin embargo, los juicios sobre distinciones entre idiomas pueden ser subjetivos, en particular en el caso de variedades lingüísticas sin tradiciones literarias establecidas, uso en la educación o los medios de comunicación u otros factores que contribuyen a la convencionalización lingüística. Por lo tanto, la norma no debe considerarse como una declaración autorizada de qué idiomas distintos existen en el mundo (sobre lo cual puede haber un desacuerdo sustancial en algunos casos), sino simplemente como una forma útil de identificar diferentes variedades lingüísticas con precisión.
Dado que el código es un alfabeto de tres letras, un límite superior para la cantidad de idiomas que se pueden representar es 26 × 26 × 26 = 17 576. Dado que la norma ISO 639-2 define códigos especiales (4), un rango reservado (520) y códigos exclusivos de B (22), no se pueden utilizar códigos 546 en la parte 3. Por lo tanto, un límite superior más estricto es 17 576 − 546 = 17 030.
El límite superior se vuelve aún más estricto si se restan las colecciones de idiomas definidas en 639-2 y las que aún deben definirse en ISO 639-5 .
Hay 58 idiomas en la norma ISO 639-2 que se consideran, para los fines de la norma, como "macroidiomas" en la norma ISO 639-3. [10]
Algunos de estos macrolenguajes no tenían un idioma individual según lo definido por la norma ISO 639-3 en el conjunto de códigos de la norma ISO 639-2, por ejemplo, "ara" (árabe genérico). Otros, como "nor" (noruego), tenían sus dos partes individuales ("nno" ( nynorsk ), "nob" ( bokmål )) ya en la norma ISO 639-2.
Esto significa que algunos idiomas (por ejemplo, 'arb', árabe estándar) que la norma ISO 639-2 consideraba dialectos de un idioma ('ara') ahora la norma ISO 639-3 los considera, en ciertos contextos, idiomas individuales en sí mismos.
Se trata de un intento de abordar variedades que pueden ser lingüísticamente distintas entre sí, pero que son tratadas por sus hablantes como dos formas de la misma lengua, por ejemplo en los casos de diglosia .
Por ejemplo:
Una lista completa está disponible en el sitio web del registrador ISO 639-3. [11]
"Un elemento de código de idioma colectivo es un identificador que representa un grupo de idiomas individuales que no se consideran un solo idioma en ningún contexto de uso". [12] Estos códigos no representan con precisión un idioma o macroidioma en particular.
Si bien la norma ISO 639-2 incluye identificadores de tres letras para idiomas colectivos, estos códigos están excluidos de la norma ISO 639-3. Por lo tanto, la norma ISO 639-3 no es un superconjunto de la norma ISO 639-2.
La norma ISO 639-5 define códigos colectivos de tres letras para familias y grupos de idiomas, incluidos los códigos colectivos de idiomas de la norma ISO 639-2.
En las normas ISO 639-2 e ISO 639-3 se reservan cuatro códigos para los casos en los que ninguno de los códigos específicos es adecuado. Estos están destinados principalmente a aplicaciones como bases de datos en las que se requiere un código ISO independientemente de si existe o no.
mis
(idiomas no codificados, originalmente una abreviatura de 'misceláneos') está destinado a idiomas que (aún) no han sido incluidos en el estándar ISO.mul
(varios idiomas) está pensado para casos donde los datos incluyen más de un idioma y (por ejemplo) la base de datos requiere un único código ISO.und
(indeterminado) está pensado para casos en los que no se ha identificado el idioma de los datos, como cuando está mal etiquetado o nunca se lo ha etiquetado. No está pensado para casos como el de Trojan , en el que se le ha dado un nombre a un idioma no certificado.zxx
(sin contenido lingüístico / no aplicable) está destinado a datos que no son un lenguaje en absoluto, como por ejemplo llamadas de animales. [13]Además, 520 códigos en el rango qaa
– qtz
están 'reservados para uso local'. Por ejemplo, Rebecca Bettencourt asigna un código a las lenguas construidas y se realizan nuevas asignaciones a pedido. [14] Linguist List los usa para las lenguas extintas . Linguist List le ha asignado a uno de ellos un valor genérico: qnp
, protolengua sin nombre. Esto se usa para los nodos intermedios propuestos en un árbol genealógico que no tienen nombre.
La tabla de códigos de la norma ISO 639-3 está abierta a modificaciones. Para proteger la estabilidad del uso actual, los cambios permitidos se limitan a: [15]
El código asignado a un idioma no cambia a menos que haya también un cambio en la denotación. [16]
Los cambios se realizan anualmente. Cada solicitud tiene un período mínimo de tres meses para su revisión pública.
El sitio web de la norma ISO 639-3 tiene páginas que describen los "alcances de denotación" [17] (tipos de lenguajes) y los tipos de lenguajes [18] , que explican qué conceptos están dentro del alcance de la codificación y determinados criterios que deben cumplirse. Por ejemplo, los lenguajes construidos pueden codificarse, pero sólo si están diseñados para la comunicación humana y cuentan con un cuerpo de literatura, lo que evita las solicitudes de invenciones idiosincrásicas.
La autoridad de registro documenta en su sitio web las instrucciones realizadas en el texto de la norma ISO 639-3 respecto de cómo deben mantenerse las tablas de códigos. [19] También documenta los procesos utilizados para recibir y procesar las solicitudes de cambio. [20]
Se proporciona un formulario de solicitud de cambio y hay un segundo formulario para recopilar información sobre las adiciones propuestas. Cualquier parte puede presentar solicitudes de cambio. Una vez presentadas, las solicitudes son revisadas inicialmente por la autoridad de registro para verificar que estén completas.
Cuando se recibe una solicitud completamente documentada, se agrega a un índice de solicitudes de cambio publicado. Además, se envían anuncios a la lista de discusión general de LINGUIST en Linguist List y a otras listas que la autoridad de registro puede considerar relevantes, invitando al público a revisar y aportar comentarios sobre el cambio solicitado. Cualquier propietario de una lista o individuo puede solicitar notificaciones de solicitudes de cambio para regiones o familias lingüísticas específicas. Los comentarios que se reciben se publican para que otras partes los revisen. Según el consenso en los comentarios recibidos, una solicitud de cambio puede retirarse o promoverse a "estado de candidato".
Tres meses antes de que finalice el ciclo de revisión anual (normalmente en septiembre), se envía un anuncio a la lista de discusión de LINGUIST y a otras listas sobre las solicitudes de cambio de estado de los candidatos. Todas las solicitudes permanecen abiertas para su revisión y comentarios hasta el final del ciclo de revisión anual.
Las decisiones se anuncian al final del ciclo de revisión anual (normalmente en enero). En ese momento, las solicitudes pueden ser adoptadas en su totalidad o en parte, modificadas y trasladadas al siguiente ciclo de revisión, o rechazadas. Los rechazos suelen incluir sugerencias sobre cómo modificar las propuestas para volver a presentarlas. Se mantiene un archivo público de cada solicitud de cambio junto con las decisiones adoptadas y la justificación de las mismas. [21]
Los lingüistas Morey, Post y Friedman plantean diversas críticas a la norma ISO 639, y en particular a la ISO 639-3: [16]
jnj
, del peyorativo "Janejero". Por lo tanto, estos códigos pueden ser considerados ofensivos por los hablantes nativos. Sin embargo, los códigos se pueden cambiar mediante una solicitud en el sitio web de SIL.Martin Haspelmath está de acuerdo con cuatro de estos puntos, pero no con el punto sobre el cambio de idioma. [22] No está de acuerdo porque cualquier descripción de un idioma requiere identificarlo, y podemos identificar fácilmente diferentes etapas de un idioma. Sugiere que los lingüistas pueden preferir usar una codificación que se realiza a nivel lingüístico ya que "rara vez les importa a los lingüistas si de lo que están hablando es un idioma, un dialecto o una familia de idiomas muy unida". También cuestiona si una norma ISO para la identificación de idiomas es apropiada ya que la ISO es una organización industrial, mientras que él ve la documentación y nomenclatura de idiomas como un esfuerzo científico. Cita la necesidad original de identificadores de idiomas estandarizados como "la importancia económica de la traducción y la localización de software ", para cuyos fines se establecieron las normas ISO 639-1 y 639-2. Pero plantea dudas sobre la necesidad de la industria de una cobertura tan amplia como la que ofrece la norma ISO 639-3, ya que incluye "lenguas poco conocidas de pequeñas comunidades que nunca o casi nunca se usan por escrito y que a menudo están en peligro de extinción".