El orden alfabético es un sistema mediante el cual las cadenas de caracteres se colocan en orden según la posición de los caracteres en el orden convencional de un alfabeto . Es uno de los métodos de cotejo . En matemáticas, un orden lexicográfico es la generalización del orden alfabético a otros tipos de datos, como secuencias de números u otros objetos matemáticos ordenados .
Cuando se aplica a cadenas o secuencias que pueden contener dígitos, números o tipos de elementos más elaborados, además de caracteres alfabéticos, el orden alfabético generalmente se denomina orden lexicográfico .
Para determinar cuál de dos cadenas de caracteres aparece primero al ordenarlas en orden alfabético, se comparan sus primeras letras . Si difieren, la cadena cuya primera letra aparece antes en el alfabeto aparece antes que la otra cadena. Si las primeras letras son iguales, se comparan las segundas, y así sucesivamente. Si se llega a una posición en la que una cadena no tiene más letras para comparar mientras que la otra sí, se considera que la primera cadena (la más corta) aparece primero en el orden alfabético.
Las letras mayúsculas o en mayúsculas generalmente se consideran idénticas a sus letras minúsculas correspondientes a los efectos del orden alfabético, aunque se pueden adoptar convenciones para manejar situaciones en las que dos cadenas difieren solo en la capitalización. También existen varias convenciones para el manejo de cadenas que contienen espacios , letras modificadas, como las que tienen diacríticos , y caracteres que no son letras, como los signos de puntuación .
El resultado de colocar un conjunto de palabras o cadenas en orden alfabético es que todas las cadenas que comienzan con la misma letra se agrupan; dentro de esa agrupación, se agrupan todas las palabras que comienzan con la misma secuencia de dos letras; y así sucesivamente. El sistema tiende así a maximizar el número de letras iniciales comunes entre palabras adyacentes.
Historia
El orden alfabético fue utilizado por primera vez en el primer milenio a. C. por los escribas semíticos del noroeste que utilizaban el sistema abjad . [1] Sin embargo, durante siglos se prefirieron otros métodos de clasificación y ordenación del material, incluidos el geográfico, el cronológico , el jerárquico y el por categoría , al orden alfabético. [2]
El primer uso efectivo del orden alfabético como mecanismo de catalogación entre los académicos puede haber sido en la antigua Alejandría, [4] en la Gran Biblioteca de Alejandría , que se fundó alrededor del año 300 a. C. Se cree que el poeta y erudito Calímaco , que trabajó allí, creó el primer catálogo de biblioteca del mundo , conocido como Pinakes , con pergaminos colocados en orden alfabético de la primera letra de los nombres de los autores. [2]
En el siglo I a. C., el escritor romano Varrón compiló listas alfabéticas de autores y títulos. [5] En el siglo II d. C., Sexto Pompeyo Festo escribió un epítome enciclopédico de las obras de Verrio Flaco , De verborum significatu , con entradas en orden alfabético. [6] En el siglo III d. C., Harpocración escribió un léxico homérico alfabetizado por todas las letras. [7] En el siglo X, el autor de la Suda utilizó el orden alfabético con variaciones fonéticas.
El orden alfabético como ayuda para la consulta comenzó a entrar en la corriente principal de la vida intelectual de Europa occidental en la segunda mitad del siglo XII, cuando se desarrollaron herramientas alfabéticas para ayudar a los predicadores a analizar el vocabulario bíblico . Esto llevó a la compilación de concordancias alfabéticas de la Biblia por los frailes dominicos en París en el siglo XIII, bajo Hugo de Saint Cher . Las obras de referencia más antiguas, como las Interpretaciones de los nombres hebreos de San Jerónimo , se alfabetizaron para facilitar la consulta. El uso del orden alfabético fue inicialmente resistido por los académicos, que esperaban que sus estudiantes dominaran su área de estudio de acuerdo con sus propias estructuras racionales; su éxito fue impulsado por herramientas como el índice de las obras de San Agustín de Robert Kilwardby , que ayudó a los lectores a acceder al texto original completo en lugar de depender de las compilaciones de extractos que se habían vuelto prominentes en la escolástica del siglo XII . La adopción del orden alfabético fue parte de la transición de la primacía de la memoria a la de las obras escritas. [8] La idea de ordenar la información según el orden alfabético también encontró resistencia por parte de los compiladores de enciclopedias de los siglos XII y XIII, que eran todos devotos eclesiásticos. Preferían organizar su material teológicamente , en el orden de la creación de Dios, comenzando con Deus (que significa Dios). [2]
En 1604 Robert Cawdrey tuvo que explicar en Table Alphabeticall , el primer diccionario monolingüe inglés , "Ahora bien, si la palabra que deseas encontrar comienza con (a), entonces busca al principio de esta tabla, pero si comienza con (v), busca hacia el final". [9] Aunque en 1803 Samuel Taylor Coleridge condenó las enciclopedias con "una disposición determinada por el accidente de las letras iniciales", [10] muchas listas se basan hoy en este principio.
Las palabras anteriores están ordenadas alfabéticamente. As va antes de Aster porque comienzan con las mismas dos letras y As no tiene más letras después de eso, mientras que Aster sí. Las siguientes tres palabras vienen después de Aster porque su cuarta letra (la primera que difiere) es r , que viene después de e (la cuarta letra de Aster ) en el alfabeto. Esas palabras en sí mismas están ordenadas según sus sextas letras ( l , n y p respectivamente). Luego viene At , que se diferencia de las palabras anteriores en la segunda letra ( t viene después de s ). Ataman viene después de At por la misma razón que Aster vino después de As . Attack sigue a Ataman según la comparación de sus terceras letras, y Baa viene después de todas las demás porque tiene una primera letra diferente.
Tratamiento de cadenas de múltiples palabras
Cuando algunas de las cadenas que se ordenan constan de más de una palabra, es decir, contienen espacios u otros separadores como guiones , se pueden adoptar dos enfoques básicos. En el primer enfoque, todas las cadenas se ordenan inicialmente según su primera palabra, como en la secuencia:
Roble; Oak Hill; Oak Ridge; Parque Oakley; Río Oakley
donde todas las cadenas que comienzan con la palabra separada Oak preceden a todas aquellas que comienzan con Oakley , porque Oak precede a Oakley en orden alfabético.
En el segundo enfoque, las cadenas se ordenan alfabéticamente como si no tuvieran espacios, dando como resultado la secuencia:
Roble; Oak Hill; Parque Oakley; Río Oakley; Oak Ridge
donde Oak Ridge ahora viene después de las cuerdas Oakley , como sería si se escribiera "Oakridge".
El segundo enfoque es el que se suele adoptar en los diccionarios [ cita requerida ] y, por ello, los editores lo denominan a menudo orden de diccionario . El primer enfoque se ha utilizado a menudo en los índices de libros , aunque cada editor tradicionalmente establece sus propios estándares sobre qué enfoque utilizar en ellos; no existía ninguna norma ISO para los índices de libros ( ISO 999 ) antes de 1975.
Casos especiales
Letras modificadas
En francés, las letras modificadas (como las que tienen diacríticos ) se tratan de la misma manera que la letra base para fines de ordenación alfabética. Por ejemplo, rôle se encuentra entre rock y rose , como si se escribiera role . Sin embargo, los idiomas que usan dichas letras sistemáticamente generalmente tienen sus propias reglas de ordenación. Consulte § Convenciones específicas de cada idioma a continuación.
Ordenar por apellido
En la mayoría de las culturas en las que los apellidos se escriben después de los nombres de pila , se sigue deseando ordenar las listas de nombres (como en las guías telefónicas) primero por el apellido. En este caso, los nombres deben reordenarse para ordenarse correctamente. Por ejemplo, Juan Hernandes y Brian O'Leary deberían ordenarse como "Hernandes, Juan" y "O'Leary, Brian" incluso si no se escriben de esta manera. Capturar esta regla en un algoritmo de cotejo informático es complejo y los intentos simples fallarán. Por ejemplo, a menos que el algoritmo tenga a su disposición una lista extensa de apellidos, no hay forma de decidir si "Gillian Lucille van der Waal" es "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der", o incluso "Lucille van der Waal, Gillian".
En el ámbito académico, es frecuente encontrar una ordenación por apellido. En un mismo artículo de varios autores, ordenar a los autores alfabéticamente por apellido, en lugar de por otros métodos como la antigüedad inversa o el grado subjetivo de contribución al artículo, se considera una forma de "reconocer contribuciones similares" o "evitar la discordia en los grupos de colaboración". [11] Se ha descubierto que la práctica en ciertos campos de ordenar las citas en las bibliografías por los apellidos de sus autores crea un sesgo a favor de los autores cuyos apellidos aparecen antes en el alfabeto, mientras que este efecto no aparece en los campos en los que las bibliografías se ordenan cronológicamente. [12]
Ely otras palabras comunes
Si una frase comienza con una palabra muy común (como "el", "un" o "una", llamadas artículos en gramática), esa palabra a veces se ignora o se mueve al final de la frase, pero este no es siempre el caso. Por ejemplo, el libro " El resplandor " podría tratarse como "El resplandor", o "El resplandor, el" y, por lo tanto, antes del título del libro " El verano de Sam ". Sin embargo, también puede tratarse simplemente como "El resplandor" y después de "El verano de Sam". De manera similar, " Una arruga en el tiempo " podría tratarse como "Arruga en el tiempo", "Arruga en el tiempo, A" o "Una arruga en el tiempo". Los tres métodos de alfabetización son bastante fáciles de crear mediante algoritmos, pero muchos programas se basan en un orden lexicográfico simple .
Impermeableprefijos
Los prefijos M y Mc en los apellidos irlandeses y escoceses son abreviaturas de Mac y a veces se ordenan alfabéticamente como si la ortografía fuera Mac completa. Por lo tanto, McKinley podría aparecer antes que Mackintosh (como sucedería si se hubiera escrito "MacKinley"). Desde la aparición de las listas ordenadas por ordenador, este tipo de ordenación alfabética se encuentra con menos frecuencia, aunque todavía se utiliza en las guías telefónicas británicas.
Calleprefijo
El prefijo St o St. es una abreviatura de "Saint" (San) y tradicionalmente se alfabetiza como si la ortografía fuera Saint completa. Por lo tanto, en un diccionario geográfico, St John's podría aparecer antes de Salem (como si se hubiera escrito "Saint John's"). Desde la aparición de las listas ordenadas por ordenador, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se utiliza a veces.
Ligaduras
Las ligaduras (dos o más letras fusionadas en un símbolo) que no se consideran letras distintas, como Æ y Œ en inglés, se suelen ordenar como si fueran letras separadas: "æther" y "aether" se ordenarían del mismo modo en relación con todas las demás palabras. Esto es así incluso cuando la ligadura no es puramente estilística, como en el caso de los préstamos lingüísticos y las marcas comerciales.
Tal vez sea necesario adoptar reglas especiales para ordenar cadenas que varían únicamente según si dos letras están unidas por una ligadura.
Tratamiento de numerales
Cuando algunas de las cadenas contienen números (u otros caracteres que no sean letras), existen varios enfoques posibles. A veces, estos caracteres se tratan como si vinieran antes o después de todas las letras del alfabeto. Otro método consiste en ordenar los números alfabéticamente como se escribirían: por ejemplo, 1776 se ordenaría como si se escribiera "diecisiete setenta y seis", y 24 heures du Mans como si se escribiera "vingt-quatre..." (en francés, "veinticuatro"). Cuando se utilizan números u otros símbolos como formas gráficas especiales de letras, como 1337 para leet o la película Seven (que se estilizó como Se7en ), se pueden ordenar como si fueran esas letras. El orden de clasificación natural ordena las cadenas alfabéticamente, excepto que los números de varios dígitos se tratan como un solo carácter y se ordenan por el valor del número codificado por los dígitos.
En el caso de los monarcas y papas , aunque sus números están en números romanos y se parecen a letras, normalmente están dispuestos en orden numérico: así, por ejemplo, aunque V viene después de I, el rey danés Christian IX viene después de su predecesor Christian VIII .
Convenciones específicas del lenguaje
Los idiomas que utilizan un alfabeto latino extendido generalmente tienen sus propias convenciones para el tratamiento de las letras adicionales. También en algunos idiomas ciertos dígrafos son tratados como letras individuales para fines de cotejo. Por ejemplo, el alfabeto español trata a ñ como una letra básica después de n , y anteriormente trataba a los dígrafos ch y ll como letras básicas después de c y l , respectivamente. Ahora ch y ll están alfabetizadas como combinaciones de dos letras. La nueva regla de alfabetización fue emitida por la Real Academia Española en 1994. Estos dígrafos todavía se designaban formalmente como letras, pero ya no lo son desde 2010. Por otro lado, el dígrafo rr sigue a rqu como se esperaba (y lo hizo incluso antes de la regla de alfabetización de 1994), mientras que las vocales con acentos agudos ( á, é, í, ó, ú ) siempre se han ordenado en paralelo con sus letras base, al igual que la letra ü .
En algunos casos, como el árabe y el kiowa , el alfabeto ha sido reordenado por completo.
A continuación se enumeran las reglas de alfabetización aplicadas en varios idiomas.
En árabe , hay dos órdenes principales del alfabeto de 28 letras que se usa hoy en día. El estándar y más comúnmente usado es el orden hijāʾī , que fue creado por el lingüista árabe Nasr ibn 'Asim al-Laythi y presenta un método de ordenación visual donde las letras se ordenan según sus formas. Por ejemplo, bāʾ (ب), tāʾ (ت), thāʾ (ث) se agrupan ya que tienen la misma forma base o rasm (ٮ) y se diferencian solo por la señalización consonántica conocida como iʻjām . El orden ʾabjadī original , que fonéticamente se parece al de otras lenguas semíticas así como al latín, todavía se usa hoy en día, generalmente limitado para ordenar listas en un documento, análogo a los números romanos . Cuando se usa el orden ʾabjadī en numeración, las letras se escriben en una forma modificada para distinguirlas de las letras utilizadas en palabras y de los números. Por ejemplo, ʾalif (ا), que parece idéntico al numeral árabe oriental uno (١), un pequeño bucle ovalado se extiende en el sentido de las agujas del reloj desde la parte inferior de la letra, seguido de una cola corta (𞺀). [ cita requerida ] Aunque estos caracteres rara vez se utilizan digitalmente, están codificados en Unicode bajo Símbolos alfabéticos matemáticos árabes . [13] Un orden menos común, el orden ṣawtī [ar] , se coteja fonéticamente y fue creado por al-Khalil ibn Ahmad al-Farahidi .
En azerí , hay ocho letras adicionales al alfabeto latino estándar. Cinco de ellas son vocales: i, ı, ö, ü, ə y tres son consonantes: ç, ş, ğ. El alfabeto es el mismo que el turco , con los mismos sonidos escritos con las mismas letras, a excepción de tres letras adicionales: q, x y ə para sonidos que no existen en turco. Aunque todas las "letras turcas" se ordenan en su orden alfabético "normal" como en turco, las tres letras adicionales se ordenan arbitrariamente después de letras cuyos sonidos se aproximan a los suyos. Entonces, q se ordena justo después de k, x (pronunciada como una ch alemana ) se ordena justo después de h y ə (pronunciada aproximadamente como una a corta inglesa ) se ordena justo después de e.
En bretón no hay "c", "q", "x", pero sí los dígrafos "ch" y "c'h", que se intercalan entre "b" y "d". Por ejemplo: "buzhugenn, chug, c'hoar, daeraouenn" (lombriz, jugo, hermana, lágrima).
En checo y eslovaco , las vocales acentuadas tienen un peso de clasificación secundario: en comparación con otras letras, se tratan como sus formas no acentuadas (en checo, A-Á, E-É-Ě, I-Í, O-Ó, U-Ú-Ů, Y-Ý, y en eslovaco, A-Á-Ä, E-É, I-Í, O-Ó-Ô, U-Ú, Y-Ý), pero luego se ordenan después de las letras no acentuadas (por ejemplo, el orden lexicográfico correcto es baa, baá, báa, báá, bab, báb, bac, bác, bač, báč [en checo] y baa, baá, baä, báa, báá, báä, bäa, bäá, bää, bab, báb, bäb, bac, bác, bäc, bač, báč, bäč [en eslovaco]). Las consonantes acentuadas tienen un peso de cotejo primario y se cotejan inmediatamente después de sus contrapartes no acentuadas, con excepción de Ď, Ň y Ť (en checo) y Ď, Ĺ, Ľ, Ň, Ŕ y Ť (en eslovaco), que nuevamente tienen un peso secundario. CH se considera una letra separada y va entre H e I. En eslovaco, DZ y DŽ también se consideran letras separadas y se ubican entre Ď y E.
En los alfabetos danés y noruego también están presentes las mismas vocales adicionales que en sueco (ver más abajo), pero en un orden diferente y con glifos diferentes (..., X, Y, Z, Æ , Ø , Å ). Además, "Aa" se considera equivalente a "Å". El alfabeto danés ha considerado tradicionalmente a la "W" como una variante de la "V", pero hoy en día la "W" se considera una letra independiente.
En holandés, la combinación IJ (que representa IJ ) se debía escribir antiguamente como Y (o, a veces, como una letra separada: Y < IJ < Z), pero actualmente se escribe principalmente como 2 letras (II < IJ < IK). Las excepciones son las guías telefónicas; IJ siempre se escribe aquí como Y porque en muchos apellidos holandeses se usa Y donde la ortografía moderna requeriría IJ. Tenga en cuenta que una palabra que comienza con ij y se escribe con I mayúscula también se escribe con J mayúscula, por ejemplo, la ciudad IJmuiden , el río IJssel y el país IJsland ( Islandia ).
En esperanto , las consonantes con acento circunflejo ( ĉ , ĝ , ĥ , ĵ , ŝ ), así como ŭ (u con breve ), se cuentan como letras separadas y se ordenan por separado (c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z).
En estonio, õ , ä , ö y ü se consideran letras independientes y se ordenan después de w . Las letras š , z y ž aparecen únicamente en préstamos y nombres propios extranjeros y siguen a la letra s en el alfabeto estonio , que por lo demás no difiere del alfabeto latino básico.
El alfabeto feroés también tiene algunas de las letras adicionales danesas, noruegas y suecas, a saber, Æ y Ø . Además, el alfabeto feroés utiliza la eth islandesa, que sigue a la D. Cinco de las seis vocales A , I , O , U e Y pueden llevar acento y, a partir de entonces, se consideran letras independientes. Las consonantes C , Q , X , W y Z no se encuentran. Por lo tanto, las primeras cinco letras son A , Á , B , D y Ð , y las últimas cinco son V , Y , Ý , Æ , Ø.
En filipino (tagalo) y otros idiomas filipinos, la letra Ng se trata como una letra separada. Se pronuncia como en sing , ping-pong , etc. Por sí sola, se pronuncia nang , pero en la ortografía filipina general , se escribe como si fueran dos letras separadas (n y g). Además, los derivados de letras (como Ñ ) siguen inmediatamente a la letra base. El filipino también se escribe con diacríticos, pero su uso es muy raro (excepto la tilde ).
El alfabeto finlandés y las reglas de clasificación son los mismos que los del sueco.
En francés , el último acento de una palabra determina el orden. [14] Por ejemplo, en francés, las siguientes cuatro palabras se ordenarían de esta manera: cote < côte < coté < côté. La letra e se ordena como e é è ê ë (œ se considera como oe), lo mismo para o que ô ö.
En alemán, las letras con diéresis ( Ä , Ö , Ü ) se tratan, por lo general, igual que sus versiones sin diéresis; la ß siempre se ordena como ss. Esto hace que el orden alfabético sea Arbeit, Arg, Ärgerlich, Argument, Arm, Assistant, Aßlar, Assoziation. Para los directorios telefónicos y listas de nombres similares, las diéresis se deben ordenar como las combinaciones de letras "ae", "oe", "ue" porque varios apellidos alemanes aparecen tanto con diéresis como en la forma sin diéresis con "e" (Müller/Mueller). Esto hace que el orden alfabético sea Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
Las vocales húngaras tienen acentos, diéresis y dobles acentos, mientras que las consonantes se escriben con caracteres simples, dobles (dígrafos) o triples (trígrafos). En la comparación, las vocales acentuadas son equivalentes a sus contrapartes no acentuadas y los caracteres dobles y triples siguen a sus originales simples. El orden alfabético húngaro es: A=Á, B, C, Cs, D, Dz, Dzs, E=É, F, G, Gy, H, I=Í, J, K, L, Ly, M, N, Ny, O=Ó, Ö=Ő, P, Q, R, S, Sz, T, Ty, U=Ú, Ü=Ű, V, W, X, Y, Z, Zs. (Antes de 1984, dz y dzs no se consideraban letras individuales para la intercalación, sino dos letras cada una, d+z y d+zs en su lugar). Esto significa que, por ejemplo, nádcukor debe preceder a nádcsomó (aunque s normalmente precede a u ), ya que c precede a cs en la intercalación. La diferencia en la longitud de las vocales solo debe tenerse en cuenta si las dos palabras son idénticas (por ejemplo, egér, éger ). Los espacios y guiones dentro de frases se ignoran en la intercalación. Ch también aparece como dígrafo en ciertas palabras, pero no se considera un grafema por derecho propio en términos de intercalación.
Una característica particular de la ordenación húngara es que las formas contraídas de los di- y trígrafos dobles (como ggy de gy + gy o ddzs de dzs + dzs ) deben ordenarse como si estuvieran escritas en su totalidad (independientemente del hecho de la contracción y de los elementos de los di- o trígrafos). Por ejemplo, kaszinó debe preceder a kassza (aunque el cuarto carácter z normalmente vendría después de s en el alfabeto), porque el cuarto "carácter" ( grafema ) de la palabra kassza se considera un segundo sz (descomponiendo ssz en sz + sz ), que sigue a i (en kaszinó ).
En islandés , se añade Þ y a la D le sigue Ð . Cada vocal (A, E, I, O, U, Y) va seguida de su correspondiente con una acentuación : Á, É, Í, Ó, Ú, Ý. No hay Z, por lo que el alfabeto termina: ... X, Y, Ý, Þ , Æ , Ö.
Ambas letras también fueron utilizadas por los escribas anglosajones que también utilizaban la letra rúnica Wynn para representar /w/.
Þ (llamada espina; þ minúscula) es también una letra rúnica.
Ð (llamada eth; ð minúscula) es la letra D con un trazo añadido.
El kiowa se ordena según principios fonéticos, como las escrituras brahmicas , en lugar de según el orden histórico del latín. Las vocales van primero, luego las consonantes oclusivas ordenadas de adelante hacia atrás en la boca, y de negativas a positivas , luego las africadas , fricativas, líquidas y nasales:
A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
En lituano , las letras lituanas se escriben después de las originales en latín. Otro cambio es que la Y va justo antes de la J : ... G, H, I, Į, Y, J, K...
En polaco , específicamente las letras polacas derivadas del alfabeto latino se ordenan después de sus originales: A, Ą, B, C, Ć, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó, P, ..., S, Ś, T, ..., Z, Ź, Ż. Los dígrafos a efectos de ordenación se tratan como si fueran dos letras separadas.
En el orden alfabético pinyin , donde las palabras tienen las mismas letras básicas en pinyin y difieren solo en los diacríticos modificadores, la letra no modificada va antes de la letra modificada. Por ejemplo, ⟨e⟩ va antes de ⟨ê⟩ (額 ( è ) antes de 欸 ( ê̄ )), y ⟨u⟩ va antes y ⟨ü⟩ (路 ( lù ) antes de 驢 ( lǘ ) y 努 ( nǔ ) antes de 女 ( nǚ )). Los caracteres con las mismas letras pinyin (incluidas las letras modificadas ⟨ê⟩ y ⟨ü⟩ ) se organizan según sus tonos en el orden de "primer tono (es decir, "tono plano"), segundo tono (tono ascendente), tercer tono (tono descendente-ascendente), cuarto tono (tono descendente), quinto tono (tono neutro)", por ejemplo "媽 ( mā ), 麻 ( má ), 馬 ( mǎ ), 罵 ( mà ), 嗎 ( ma )". [a]
En portugués , el orden de clasificación es igual que en español: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Los dígrafos y las letras con diacríticos no están incluidos en el alfabeto.
En rumano , los caracteres especiales derivados del alfabeto latino se ordenan después de sus originales: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
En serbocroata y otras lenguas eslavas meridionales relacionadas, los cinco caracteres acentuados y los tres caracteres unidos se ordenan después de los originales: ..., C, Č, Ć, D, DŽ, Đ, E, ..., L, LJ, M, N, NJ, O, ..., S, Š, T, ..., Z, Ž.
Hasta 1994, el español trataba "CH" y "LL" como letras individuales, dando un orden de cinco , credo , chispa y lomo , luz , llama . Esto ya no es así desde que en 1994 la RAE adoptó el uso más convencional, y ahora LL se intercala entre LK y LM, y CH entre CG y CI. Los seis caracteres con diacríticos Á, É, Í, Ó, Ú, Ü se tratan como las letras originales A, E, I, O, U, por ejemplo: radio , ráfaga , rana , rápido , rastrillo . La única cuestión de intercalación específica del español es Ñ ( eñe ) como una letra diferente intercalada después de N.
En el alfabeto sueco , hay tres vocales adicionales colocadas al final (..., X, Y, Z, Å , Ä , Ö ), similares a los alfabetos danés y noruego, pero con diferentes glifos y un orden de clasificación diferente. La letra "W" ha sido tratada como una variante de "V", pero en la 13.ª edición de Svenska Akademiens ordlista (2006) la "W" se consideró una letra separada.
En el alfabeto turco hay seis letras adicionales: ç, ğ, ı, ö, ş y ü (pero no q, w ni x). Se intercalan con ç después de c, ğ después de g, ı antes de i, ö después de o, ş después de s y ü después de u. Originalmente, cuando se introdujo el alfabeto en 1928, ı se intercalaba después de i, pero el orden se cambió más tarde para que las letras que tuvieran formas que contuvieran puntos, cedillas u otros signos ornamentales siempre siguieran a las letras con formas desnudas correspondientes. Nótese que en la ortografía turca la letra I es la mayúscula de ı sin punto, mientras que İ es la mayúscula de i con punto.
En vietnamita , hay siete letras adicionales: ă , â , đ , ê , ô , ơ , ư, mientras que f , j , w y z están ausentes, aunque todavía se usan de alguna manera (como direcciones de Internet o préstamos de lenguas extranjeras). La "f" se reemplaza por la combinación "ph". Lo mismo que para la "w", es "qu".
En volapük , ä , ö y ü se cuentan como letras separadas y se ordenan por separado (a, ä, b... o, ö, p... u, ü, v) mientras que q y w están ausentes. [15]
En galés, los dígrafos CH, DD, FF, NG, LL, PH, RH y TH se consideran letras individuales y cada uno de ellos se enumera después del primer carácter del par (excepto NG, que se enumera después de G), lo que produce el orden A, B, C, CH, D, DD, E, F, FF, G, NG, H, etc. Sin embargo, a veces puede ocurrir que la composición de palabras dé como resultado la yuxtaposición de dos letras que no forman un dígrafo. Un ejemplo es la palabra LLONGYFARCH (compuesta por LLON + GYFARCH). Esto da como resultado un orden como, por ejemplo, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG es un dígrafo en LLONG, pero no en LLONGYFARCH). La combinación de letras R+H (a diferencia del dígrafo RH) puede surgir de manera similar por yuxtaposición en compuestos, aunque esto tiende a no producir pares en los que una identificación errónea pueda afectar el orden. Para las otras combinaciones de letras potencialmente confusas que pueden ocurrir (es decir, D+D y L+L), se utiliza un guion en la ortografía (por ejemplo, AD-DAL, CHWIL-LYS).
Automatización
Los algoritmos de intercalación (en combinación con los algoritmos de ordenación ) se utilizan en la programación informática para colocar cadenas en orden alfabético. Un ejemplo estándar es el algoritmo de intercalación Unicode , que se puede utilizar para colocar cadenas que contengan símbolos Unicode en (una extensión de) orden alfabético. [14] Se puede hacer que se ajuste a la mayoría de las convenciones específicas del lenguaje descritas anteriormente adaptando su tabla de intercalación predeterminada. Varias de estas adaptaciones se recopilan en Common Locale Data Repository .
Órdenes similares
El principio detrás del ordenamiento alfabético todavía se puede aplicar en idiomas que, estrictamente hablando, no utilizan un alfabeto (por ejemplo, pueden escribirse utilizando un silabario o abugida ), siempre que los símbolos utilizados tengan un orden establecido.
En los sistemas de escritura logográfica , como el hanzi chino o el kanji japonés , el método de clasificación por radicales y trazos se utiliza con frecuencia como forma de definir un orden de los símbolos. El japonés a veces utiliza el orden de pronunciación, más comúnmente con el orden Gojūon , pero a veces con el orden más antiguo Iroha .
En matemáticas, el orden lexicográfico es un medio de ordenar secuencias de manera análoga a la utilizada para producir el orden alfabético. [16]
Algunas aplicaciones informáticas utilizan una versión del orden alfabético que se puede lograr mediante un algoritmo muy simple , basado exclusivamente en los códigos ASCII o Unicode para caracteres. Esto puede tener efectos no estándar, como colocar todas las letras mayúsculas antes que las minúsculas. Véase Orden alfabético ASCII .
Un diccionario de rimas se basa en la clasificación de palabras en orden alfabético comenzando desde la última hasta la primera letra de la palabra.
^ Hay una excepción: en el Diccionario ABC chino-inglés el orden de los tonos es "tono cero (tono neutro), primer tono (tono plano), segundo tono (tono ascendente), tercer tono (tono descendente-ascendente) y cuarto tono (tono descendente)".
Referencias
^ Reinhard G. Lehmann: "27-30-22-26. ¿Cuántas letras necesita un alfabeto? El caso del semítico", en: La idea de la escritura: escribir a través de las fronteras , editado por Alex de Voogt y Joachim Friedrich Quack, Leiden: Brill 2012, pp. 11–52.
^ abc Street, Julie (10 de junio de 2020). «De la A a la Z: la sorprendente historia del orden alfabético» (texto y audio) . ABC News (ABC Radio National) . Australian Broadcasting Corporation. Archivado desde el original el 2 de julio de 2020. Consultado el 6 de julio de 2020 .
^ por ejemplo Salmos 25, 34, 37, 111, 112, 119 y 145 de la Biblia hebrea
^ Daly, Lloyd. Contribuciones a la historia de la alfabetización en la Antigüedad y la Edad Media . Bruselas, 1967. pág. 25.
^ O'Hara, James (1989). "Messapus, Cycnus y el orden alfabético del catálogo de héroes italianos de Virgilio". Fénix . 43 (1): 35–38. doi :10.2307/1088539. JSTOR 1088539.
^ LIVRE XI – texte latin – traduction + comments. Archivado desde el original el 9 de junio de 2012 . Consultado el 8 de mayo de 2012 .
^ Gibson, Craig (2002). Interpretando un clásico: Demóstenes y sus comentaristas antiguos .
^ Rouse, Mary A.; Rouse, Richard M. (1991), " Statim invenire : escuelas, predicadores y nuevas actitudes hacia la página", Testigos auténticos: enfoques de los textos y manuscritos medievales , University of Notre Dame Press, págs. 201-219, ISBN0-268-00622-9
^ Cawdrey, Robert (1604). Una tabla alfabética . Londres. pág. [A4]v.
^ Cartas de Coleridge, n.º 507.
^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (enero de 2007). "Secuencia de autores y crédito por contribuciones en publicaciones con varios autores". PLOS Biol . 5 (1): e18. doi : 10.1371/journal.pbio.0050018 . PMC 1769438. PMID 17227141 .
^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "El orden importa: la ordenación alfabética de las citas en el texto genera sesgos en las tasas de citación" (PDF) . Psychonomic Bulletin & Review . 26 (3): 1020–1026. doi : 10.3758/s13423-018-1532-8 . PMID 30288671. S2CID 52922399. Archivado (PDF) desde el original el 10 de noviembre de 2018 . Consultado el 10 de noviembre de 2018 .
Resumen para legos en: Colleen Flaherty (22 de octubre de 2018). "El caso contra la denominación alfabética de los autores". Inside Higher Ed .
^ "Símbolos alfabéticos matemáticos árabes" (PDF) . El estándar Unicode. Archivado (PDF) del original el 30 de octubre de 2022 . Consultado el 26 de noviembre de 2022 .
^ ab "Unicode Technical Standard #10: Unicode collation algorithm". Unicode, Inc. (unicode.org). 20 de marzo de 2008. Archivado desde el original el 27 de agosto de 2008 . Consultado el 27 de agosto de 2008 .
^ Midgley, Ralph. «Volapük to English dictionary» (PDF) . Archivado desde el original (PDF) el 1 de septiembre de 2012. Consultado el 24 de septiembre de 2019 .
^ Franz Baader; Tobias Nipkow (1999). Reescritura de términos y todo eso . Cambridge University Press. págs. 18-19. ISBN978-0-521-77920-3.
Lectura adicional
Chauvin, Yvonne. Práctica de clasificación alfabética . 4ª edición. París: Bordas, 1977. ISBN 2-04-010155-1