stringtranslate.com

ISO 639-3

ISO 639-3:2007 , Códigos para la representación de nombres de idiomas - Parte 3: Código Alpha-3 para una cobertura integral de idiomas , es un estándar internacional para códigos de idiomas de la serie ISO 639 . Define códigos de tres letras para identificar idiomas. La norma fue publicada por la Organización Internacional de Normalización (ISO) el 1 de febrero de 2007. [1]

ISO 639-3 amplía los códigos ISO 639-2 alfa-3 con el objetivo de cubrir todos los lenguajes naturales conocidos . La cobertura de idiomas ampliada se basó principalmente en los códigos de idioma utilizados en Ethnologue (volúmenes 10 a 14) publicado por SIL International , que ahora es la autoridad de registro de ISO 639-3. [2] Proporciona una enumeración de lenguas lo más completa posible, incluidas las vivas y extintas, las antiguas y las construidas, las mayores y las menores, las escritas y las no escritas. [1] Sin embargo, no incluye lenguas reconstruidas como el protoindoeuropeo . [3]

ISO 639-3 está destinado a ser utilizado como códigos de metadatos en una amplia gama de aplicaciones. Se utiliza ampliamente en sistemas informáticos y de información, como Internet, en los que es necesario admitir muchos idiomas. En archivos y otros tipos de almacenamiento de información, se utiliza en sistemas de catalogación, indicando en qué idioma se encuentra un recurso o sobre qué idioma. Los códigos también se utilizan con frecuencia en la literatura lingüística y en otros lugares para compensar el hecho de que los nombres de las lenguas puedan ser oscuros o ambiguos.

Códigos de idioma

ISO 639-3 incluye todos los idiomas en ISO 639-1 y todos los idiomas individuales en ISO 639-2 . ISO 639-1 e ISO 639-2 se centraron en los idiomas principales, representados con mayor frecuencia en el cuerpo total de la literatura mundial. Dado que ISO 639-2 también incluye colecciones de idiomas y la Parte 3 no, ISO 639-3 no es un superconjunto de ISO 639-2. Donde existen códigos B y T en ISO 639-2, ISO 639-3 utiliza los códigos T.

Al 23 de enero de 2023 , la norma contiene 7.916 entradas. [6] El inventario de lenguas se basa en una serie de fuentes que incluyen: las lenguas individuales contenidas en 639-2, lenguas modernas del Ethnologue , variedades históricas, lenguas antiguas y lenguas artificiales de la Lista de Lingüistas , [7] así como idiomas recomendados dentro del período anual de comentarios públicos.

La autoridad de registro proporciona los archivos de datos legibles por máquina . [6] Las asignaciones de ISO 639-1 o ISO 639–2 a ISO 639-3 se pueden realizar utilizando estos archivos de datos.

La norma ISO 639-3 pretende asumir distinciones basadas en criterios que no son del todo objetivos. [8] No pretende documentar ni proporcionar identificadores de dialectos u otras variaciones de subidiomas. [9] Sin embargo, los juicios sobre las distinciones entre lenguas pueden ser subjetivos, particularmente en el caso de variedades lingüísticas sin tradiciones literarias establecidas, uso en educación o medios de comunicación, u otros factores que contribuyen a la convencionalización de la lengua. Por lo tanto, la norma no debe considerarse como una declaración autorizada de qué lenguas distintas existen en el mundo (sobre las cuales puede haber desacuerdos sustanciales en algunos casos), sino simplemente como una forma útil de identificar con precisión las diferentes variedades de lenguas.

Espacio de código

Dado que el código es alfabético de tres letras, un límite superior para el número de idiomas que se pueden representar es 26 × 26 × 26 = 17,576. Dado que ISO 639-2 define códigos especiales (4), un rango reservado (520) y códigos solo B (22), no se pueden usar 546 códigos en la parte 3. Por lo tanto, un límite superior más estricto es 17,576 − 546 = 17,030.

El límite superior se vuelve aún más estricto si se restan las colecciones de idiomas definidas en 639-2 y las que aún no se han definido en ISO 639-5 .

Macrolenguajes

Hay 58 idiomas en ISO 639-2 que se consideran, a los efectos de la norma, "macrolenguajes" en ISO 639-3. [10]

Algunos de estos macrolenguajes no tenían un idioma individual según lo definido por ISO 639–3 en el conjunto de códigos de ISO 639-2, por ejemplo, 'ara' (árabe genérico). Otros como 'nor' (noruego) tenían sus dos partes individuales ('nno' ( Nynorsk ), 'nob' ( Bokmål )) ya en ISO 639-2.

Eso significa que algunos idiomas (por ejemplo, 'arb', árabe estándar) que fueron considerados por ISO 639-2 como dialectos de un idioma ('ara') ahora están en ISO 639-3 en ciertos contextos considerados como idiomas individuales.

Se trata de un intento de abordar variedades que pueden ser lingüísticamente distintas entre sí, pero que sus hablantes tratan como dos formas de la misma lengua, por ejemplo, en los casos de diglosia .

Por ejemplo:

Consulte [11] para obtener la lista completa.

Lenguas colectivas

"Un elemento de código de idioma colectivo es un identificador que representa un grupo de idiomas individuales que no se consideran un solo idioma en ningún contexto de uso". [12] Estos códigos no representan con precisión un lenguaje o macrolenguaje en particular.

Si bien ISO 639-2 incluye identificadores de tres letras para idiomas colectivos, estos códigos están excluidos de ISO 639-3. Por tanto, la ISO 639-3 no es un superconjunto de la ISO 639-2.

ISO 639-5 define códigos colectivos de 3 letras para familias y grupos de idiomas, incluidos los códigos de idiomas colectivos de ISO 639-2.

Códigos especiales

En ISO 639-2 e ISO 639-3 se reservan cuatro códigos para casos en los que ninguno de los códigos específicos es apropiado. Están destinados principalmente a aplicaciones como bases de datos donde se requiere un código ISO independientemente de si existe o no.

Además, 520 códigos de la gama qaaestán qtz"reservados para uso local". Por ejemplo, Rebecca Bettencourt asigna un código a las lenguas construidas y se realizan nuevas asignaciones previa solicitud. [14] The Linguist List los utiliza para lenguas extintas . Linguist List ha asignado a uno de ellos un valor genérico: qnp, protolenguaje sin nombre. Esto se utiliza para nodos intermedios propuestos en un árbol genealógico que no tienen nombre.

Procesos de mantenimiento

La tabla de códigos para ISO 639-3 está abierta a cambios. Para proteger la estabilidad del uso existente, los cambios permitidos se limitan a: [15]

El código asignado a un idioma no cambia a menos que también haya un cambio en la denotación. [dieciséis]

Los cambios se realizan en un ciclo anual. Cada solicitud tiene un período mínimo de tres meses para revisión pública.

El sitio web ISO 639-3 tiene páginas que describen "ámbitos de denotación" [17] (tipos de lenguajes) y tipos de lenguajes, [18] que explican qué conceptos están dentro del alcance de la codificación y ciertos criterios que deben cumplirse. Por ejemplo, los lenguajes construidos pueden codificarse, pero sólo si están diseñados para la comunicación humana y tienen un cuerpo de literatura, evitando solicitudes de invenciones idiosincrásicas.

La autoridad de registro documenta en su sitio web las instrucciones contenidas en el texto de la norma ISO 639-3 sobre cómo se deben mantener las tablas de códigos. [19] También documenta los procesos utilizados para recibir y procesar solicitudes de cambio. [20]

Se proporciona un formulario de solicitud de cambio y hay un segundo formulario para recopilar información sobre las adiciones propuestas. Cualquier parte puede enviar solicitudes de cambio. Cuando se envían, las solicitudes son inicialmente revisadas por la autoridad de registro para verificar que estén completas.

Cuando se recibe una solicitud completamente documentada, se agrega a un índice de solicitudes de cambio publicado. Además, los anuncios se envían a la lista de discusión general de LINGUIST en Linguist List y a otras listas que la autoridad de registro pueda considerar relevantes, invitando al público a revisar y aportar comentarios sobre el cambio solicitado. Cualquier propietario de lista o individuo puede solicitar notificaciones de solicitudes de cambio para regiones o familias de idiomas particulares. Los comentarios que se reciben se publican para que otras partes los revisen. Según el consenso de los comentarios recibidos, una solicitud de cambio puede retirarse o ascenderse al "estado de candidato".

Tres meses antes del final de un ciclo de revisión anual (normalmente en septiembre), se envía un anuncio a la lista de discusión de LINGUISTA y a otras listas sobre las solicitudes de cambio de estado de candidatos. Todas las solicitudes permanecen abiertas para revisión y comentarios hasta el final del ciclo de revisión anual.

Las decisiones se anuncian al final del ciclo de revisión anual (normalmente en enero). En ese momento, las solicitudes podrán adoptarse total o parcialmente, modificarse y trasladarse al siguiente ciclo de revisión, o rechazarse. Los rechazos a menudo incluyen sugerencias sobre cómo modificar las propuestas para volver a presentarlas. Se mantiene un archivo público de cada solicitud de cambio junto con las decisiones tomadas y el fundamento de las decisiones. [21]

Crítica

Los lingüistas Morey, Post y Friedman plantean varias críticas a la norma ISO 639, y en particular a la ISO 639-3: [16]

Martin Haspelmath está de acuerdo con cuatro de estos puntos, pero no con el punto sobre el cambio de idioma. [22] No está de acuerdo porque cualquier descripción de una lengua requiere identificarla, y podemos identificar fácilmente diferentes etapas de una lengua. Sugiere que los lingüistas tal vez prefieran utilizar una codificación realizada en el nivel languoidal, ya que "rara vez les importa si de lo que están hablando es de una lengua, un dialecto o una familia de lenguas muy unida". También cuestiona si una norma ISO para la identificación de idiomas es apropiada ya que ISO es una organización industrial, mientras que considera la documentación y nomenclatura de idiomas como un esfuerzo científico. Cita la necesidad original de identificadores de idioma estandarizados como "la importancia económica de la traducción y la localización de software ", para lo cual se crearon las normas ISO 639-1 y 639-2. Pero plantea dudas sobre la necesidad de la industria de la cobertura integral proporcionada por ISO 639-3, incluyendo "lenguas poco conocidas de pequeñas comunidades que nunca o casi no se utilizan por escrito y que a menudo están en peligro de extinción".

Uso

Referencias

  1. ^ ab "Estado y resumen de ISO 639-3". Organización Internacional de Normalización. 2010-07-20 . Consultado el 14 de junio de 2012 .
  2. ^ "Agencias de mantenimiento y autoridades de registro". YO ASI.
  3. ^ "Tipos de lenguas individuales - Lenguas antiguas". sil.org . Consultado el 11 de junio de 2018 .
  4. ^ Informe de Ethnologue para el código ISO 639: zho Archivado el 12 de septiembre de 2014 en Wayback Machine en ethnologue.com
  5. ^ ISO639-3 en SIL.org
  6. ^ ab "Conjunto de códigos ISO 639-3". Sil.org. 2021-02-18 . Consultado el 7 de abril de 2021 .
  7. ^ "ISO 639-3". sil.org.
  8. ^ "Ámbito de denotación: idiomas individuales". sil.org.
  9. ^ "Ámbito de denotación: dialectos". sil.org.
  10. ^ "Ámbito de denotación: macrolenguajes". sil.org . Consultado el 14 de junio de 2012 .
  11. ^ "Asignaciones de macrolenguaje". sil.org . Consultado el 2 de noviembre de 2021 .
  12. ^ "Ámbito de denotación: lenguas colectivas". sil.org . Consultado el 14 de junio de 2012 .
  13. ^ Grabaciones de campo de llamadas de monos verdes. Entrada en el catálogo del Consorcio de Datos Lingüísticos . Consultado el 15 de enero de 2023.
  14. ^ Bettencourt, Rebeca. "Registro de códigos ConLang". KreativeKorp . Consultado el 12 de marzo de 2021 .
  15. ^ "Envío de solicitudes de cambio ISO 639-3: tipos de cambios". sil.org.
  16. ^ ab Morey, Stephen; Publicar, Mark W.; Friedman, Víctor A. (2013). Los códigos de idioma de ISO 639: una estandarización prematura, en última instancia inalcanzable y posiblemente dañina. Conferencia PARADISEC RRR. Archivado desde el original el 23 de febrero de 2016 . Consultado el 3 de noviembre de 2015 .
  17. ^ "Alcance de la denotación de identificadores de idiomas". sil.org.
  18. ^ "Tipos de idiomas". sil.org.
  19. ^ "Gestión de cambios ISO 639-3". sil.org.
  20. ^ "Envío de solicitudes de cambio ISO 639-3". sil.org.
  21. ^ "Índice de solicitudes de cambio ISO 639-3". sil.org.
  22. ^ Martin Haspelmath, "¿Se puede estandarizar la identidad lingüística? Sobre la crítica de Morey et al. A ISO 639-3", Comentario sobre diversidad lingüística , 04/12/2013
  23. ^ "Extensión del idioma OLAC". language-archives.org . Consultado el 3 de agosto de 2015 .
  24. ^ "Más de 7000 idiomas, solo 1 Windows". Microsoft. 2014-02-05.
  25. ^ "Política de propuesta lingüística". wikimedia.org . Consultado el 3 de agosto de 2015 .
  26. ^ "BCP 47 - Etiquetas para identificar idiomas". ietf.org . Consultado el 3 de agosto de 2015 .
  27. ^ ab "Publicaciones EPUB 3.0". idpf.org . Consultado el 3 de agosto de 2015 .
  28. ^ "Términos de metadatos de DCMI". purl.org . Consultado el 3 de agosto de 2015 .
  29. ^ "Códigos de idioma ISO de dos o tres letras". W3C . Consultado el 3 de agosto de 2015 .
  30. ^ "Registro de idiomas". Autoridad de asignación de números de Internet . Consultado el 12 de agosto de 2015 .
  31. ^ "Semántica, estructura y API de documentos HTML: HTML5". W3C . Consultado el 3 de agosto de 2015 .
  32. ^ "Lenguaje de marcado extensible (XML) 1.0 (quinta edición)". W3C . Consultado el 3 de septiembre de 2022 .
  33. ^ "Gráficos vectoriales escalables (SVG) 2". W3C . Consultado el 3 de septiembre de 2022 .
  34. ^ "Elementos - Directrices para el usuario de MODS: Esquema de descripción de objetos de metadatos: MODS". Biblioteca del Congreso . Consultado el 3 de agosto de 2015 .
  35. ^ "Lenguaje del elemento TEI". Iniciativa de codificación de texto . Consultado el 3 de agosto de 2015 .

Otras lecturas

enlaces externos