Orden alfabetico

El orden alfabético es un sistema mediante el cual las cadenas de caracteres se colocan en orden según la posición de los caracteres en el orden convencional de un alfabeto . Es uno de los métodos de colación . En matemáticas, un orden lexicográfico es la generalización del orden alfabético a otros tipos de datos, como secuencias de números u otros objetos matemáticos ordenados .

Cuando se aplica a cadenas o secuencias que pueden contener dígitos, números o tipos de elementos más elaborados, además de caracteres alfabéticos, el orden alfabético generalmente se denomina orden lexicográfico .

Para determinar cuál de dos cadenas de caracteres aparece primero al ordenarlos alfabéticamente, se comparan sus primeras letras . Si difieren, entonces la cadena cuya primera letra aparece antes en el alfabeto aparece antes que la otra cadena. Si las primeras letras son iguales, se comparan las segundas letras, y así sucesivamente. Si se alcanza una posición en la que una cadena no tiene más letras para comparar mientras que la otra sí, se considera que la primera cadena (más corta) ocupa el primer lugar en orden alfabético.

Las letras mayúsculas o mayúsculas generalmente se consideran idénticas a sus correspondientes letras minúsculas a los efectos del orden alfabético, aunque se pueden adoptar convenciones para manejar situaciones en las que dos cadenas difieren sólo en el uso de mayúsculas. También existen varias convenciones para el manejo de cadenas que contienen espacios , letras modificadas, como aquellas con signos diacríticos , y caracteres que no son letras, como signos de puntuación .

El resultado de colocar un conjunto de palabras o cadenas en orden alfabético es que todas las cadenas que comienzan con la misma letra se agrupan; dentro de esa agrupación se agrupan todas las palabras que comienzan con la misma secuencia de dos letras; etcétera. Por tanto, el sistema tiende a maximizar el número de letras iniciales comunes entre palabras adyacentes.

Historia

El orden alfabético fue utilizado por primera vez en el primer milenio a. C. por los escribas semíticos del noroeste que utilizaban el sistema abjad . ^[1] Sin embargo, durante siglos se prefirió una variedad de otros métodos de clasificación y ordenamiento de material, incluidos geográfico, cronológico , jerárquico y por categoría , al orden alfabético. ^[2]

Partes de la Biblia datan de los siglos VII y VI a. C. En el Libro de Jeremías , el profeta utiliza el cifrado de sustitución Atbash , basado en el orden alfabético. De manera similar, los autores bíblicos utilizaron acrósticos basados en el alfabeto hebreo (ordenado) . ^[3]

El primer uso efectivo del orden alfabético como mecanismo de catalogación entre los eruditos puede haber sido en la antigua Alejandría, ^[4] en la Gran Biblioteca de Alejandría , fundada alrededor del año 300 a.C. Se cree que el poeta y erudito Calímaco , que trabajó allí, creó el primer catálogo de biblioteca del mundo , conocido como Pinakes , con pergaminos archivados en orden alfabético de la primera letra de los nombres de los autores. ^[2]

En el siglo I a. C., el escritor romano Varrón compiló listas alfabéticas de autores y títulos. ^[5] En el siglo II d.C., Sexto Pompeyo Festo escribió un epítome enciclopédico de las obras de Verrius Flaccus , De verborum significatu , con entradas en orden alfabético. ^[6] En el siglo III d.C., Harpocration escribió un léxico homérico ordenado alfabéticamente por todas las letras. ^[7] En el siglo X, el autor de la Suda utilizó el orden alfabético con variaciones fonéticas.

El orden alfabético como ayuda para la consulta comenzó a incorporarse a la corriente principal de la vida intelectual de Europa occidental en la segunda mitad del siglo XII, cuando se desarrollaron herramientas alfabéticas para ayudar a los predicadores a analizar el vocabulario bíblico . Esto llevó a la compilación de concordancias alfabéticas de la Biblia por los frailes dominicos en París en el siglo XIII, bajo Hugo de Saint Cher . Las obras de referencia más antiguas, como las Interpretaciones de los nombres hebreos de San Jerónimo, se ordenaron alfabéticamente para facilitar su consulta. Inicialmente, los académicos se resistieron al uso del orden alfabético, que esperaban que sus estudiantes dominaran su área de estudio de acuerdo con sus propias estructuras racionales; su éxito fue impulsado por herramientas como el índice de Robert Kilwardby de las obras de San Agustín , que ayudó a los lectores a acceder al texto original completo en lugar de depender de las compilaciones de extractos que se habían vuelto prominentes en la escolástica del siglo XII . La adopción del orden alfabético fue parte de la transición de la primacía de la memoria a la de las obras escritas. ^[8] La idea de ordenar la información según el orden del alfabeto también encontró resistencia por parte de los compiladores de enciclopedias de los siglos XII y XIII, todos ellos devotos eclesiásticos. Preferían organizar su material teológicamente – en el orden de la creación de Dios, comenzando con Deus (que significa Dios). ^[2]

En 1604, Robert Cawdrey tuvo que explicar en Table Alphabeticall , el primer diccionario monolingüe de inglés : "Ahora bien, si la palabra que deseas encontrar comienza con (a), entonces mira al principio de esta tabla, pero si con (v) Mira hacia el final". ^[9] Aunque todavía en 1803 Samuel Taylor Coleridge condenó las enciclopedias con "una disposición determinada por el accidente de las letras iniciales", ^[10] muchas listas se basan hoy en este principio.

Ordenar en escritura latina

Orden básico y ejemplos.

El orden estándar del alfabeto latino básico ISO moderno es:

ABCDEFGHIJKLMNOPQRSTU VWXYZ

A continuación se muestra un ejemplo de orden alfabético sencillo:

Como; Aster; Astrolabio; Astronomía; Astrofísica; En; atamán; Ataque; Balido

Otro ejemplo:

Percebe; Ser; Estado; Beneficio; Doblado

Las palabras anteriores están ordenadas alfabéticamente. As viene antes de Aster porque comienzan con las mismas dos letras y As no tiene más letras después de eso, mientras que Aster sí. Las siguientes tres palabras vienen después de Aster porque su cuarta letra (la primera que difiere) es r , que viene después de e (la cuarta letra de Aster ) en el alfabeto. Esas palabras en sí están ordenadas según su sexta letra ( l , n y p respectivamente). Luego viene At , que se diferencia de las palabras anteriores en la segunda letra ( t viene después de s ). Ataman viene después de At por la misma razón que Aster vino después de As . Attack sigue a Ataman basándose en la comparación de sus terceras letras, y Baa viene después de todas las demás porque tiene una primera letra diferente.

Tratamiento de cadenas de varias palabras.

Cuando algunas de las cadenas que se ordenan constan de más de una palabra, es decir, contienen espacios u otros separadores como guiones , se pueden adoptar dos enfoques básicos. En el primer enfoque, todas las cadenas se ordenan inicialmente según su primera palabra, como en la secuencia:

Roble; colina del roble; Cresta de roble; Parque Oakley; Río Oakley
donde todas las cadenas que comienzan con la palabra separada Oak preceden a todas las que comienzan con Oakley , porque Oak precede a Oakley en orden alfabético.

En el segundo método, las cadenas se ordenan alfabéticamente como si no tuvieran espacios, dando la secuencia:

Roble; colina del roble; Parque Oakley; Río Oakley; cresta de roble
donde ahora Oak Ridge viene después de las cuerdas Oakley , como si se escribiera "Oakridge".

El segundo enfoque es el que se suele adoptar en los diccionarios ^{[ cita requerida ]} y, por lo tanto, los editores suelen denominarlo orden de diccionario . El primer enfoque se ha utilizado a menudo en los índices de libros , aunque cada editor tradicionalmente establece sus propios estándares sobre qué enfoque utilizar en los mismos; No existía ninguna norma ISO para índices de libros ( ISO 999 ) antes de 1975.

Casos especiales

Letras modificadas

En francés, las letras modificadas (como las que tienen signos diacríticos ) se tratan de la misma manera que la letra base a efectos de orden alfabético. Por ejemplo, rol se sitúa entre el rock y la rosa , como si estuviera escrito rol . Sin embargo, los idiomas que utilizan este tipo de letras sistemáticamente generalmente tienen sus propias reglas de ordenamiento. Consulte § Convenciones específicas del idioma a continuación.

Ordenar por apellido

En la mayoría de las culturas donde los apellidos se escriben después de los nombres de pila , todavía se desea ordenar las listas de nombres (como en las guías telefónicas) primero por apellido. En este caso, es necesario reordenar los nombres para que se ordenen correctamente. Por ejemplo, Juan Hernandes y Brian O'Leary deben ordenarse como "Hernandes, Juan" y "O'Leary, Brian" incluso si no están escritos de esta manera. Captar esta regla en un algoritmo de clasificación por computadora es complejo y los intentos simples fracasarán. Por ejemplo, a menos que el algoritmo tenga a su disposición una lista extensa de apellidos, no hay manera de decidir si "Gillian Lucille van der Waal" es "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der", o incluso "Lucille van der Waal, Gillian".

La ordenación por apellido se encuentra con frecuencia en contextos académicos. Dentro de un único artículo de varios autores, ordenar a los autores alfabéticamente por apellido, en lugar de utilizar otros métodos como la antigüedad inversa o el grado subjetivo de contribución al artículo, se considera una forma de "reconocer contribuciones similares" o "evitar [ing] falta de armonía en los grupos colaboradores". ^[11] Se ha descubierto que la práctica en ciertos campos de ordenar las citas en las bibliografías por los apellidos de sus autores crea un sesgo a favor de los autores con apellidos que aparecen antes en el alfabeto, mientras que este efecto no aparece en campos en los que las bibliografías son ordenados cronológicamente. ^[12]

Ely otras palabras comunes

Si una frase comienza con una palabra muy común (como "el", "un" o "una", llamados artículos en gramática), esa palabra a veces se ignora o se mueve al final de la frase, pero no siempre es así. caso. Por ejemplo, el libro " El Resplandor " podría tratarse como "El Resplandor" o "El Resplandor" y, por tanto, antes del título del libro " El verano de Sam ". Sin embargo, también puede tratarse simplemente como "El resplandor" y después de "El verano de Sam". De manera similar, " Una arruga en el tiempo " podría tratarse como "Una arruga en el tiempo", "Una arruga en el tiempo, A" o "Una arruga en el tiempo". Los tres métodos de alfabetización son bastante fáciles de crear mediante algoritmos, pero muchos programas se basan en un orden lexicográfico simple .

Macprefijos

Los prefijos M y Mc en los apellidos irlandeses y escoceses son abreviaturas de Mac y, a veces, están ordenados alfabéticamente como si la ortografía fuera Mac completa. Por lo tanto, McKinley podría figurar antes que Mackintosh (como lo sería si se hubiera escrito como "MacKinley"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se utiliza en los directorios telefónicos británicos.

Calleprefijo

El prefijo St o St. es una abreviatura de "Saint" y tradicionalmente se ordena alfabéticamente como si la ortografía fuera Saint en su totalidad. Por lo tanto, en un diccionario geográfico, San Juan podría figurar antes que Salem (como si así fuera si se hubiera escrito como "San Juan"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se usa a veces.

Ligaduras

Las ligaduras (dos o más letras fusionadas en un símbolo) que no se consideran letras distintas, como Æ y Œ en inglés, generalmente se clasifican como si las letras estuvieran separadas: "æther" y "aether" se ordenarían del mismo modo en relación con todas las demás palabras. Esto es cierto incluso cuando la ligadura no es puramente estilística, como en préstamos y nombres de marcas.

Es posible que sea necesario adoptar reglas especiales para clasificar cadenas que varían sólo según si dos letras están unidas por una ligadura.

Tratamiento de numerales

Cuando algunas de las cadenas contienen números (u otros caracteres que no son letras), son posibles varios enfoques. A veces, estos caracteres se tratan como si estuvieran antes o después de todas las letras del alfabeto. Otro método consiste en ordenar los números alfabéticamente tal como se escribirían: por ejemplo, 1776 se ordenaría como si se escribiera "diecisiete setenta y seis", y 24 heures du Mans como si se escribiera "vingt-quatre..." (francés "veinticuatro"). Cuando se utilizan números u otros símbolos como formas gráficas especiales de letras, como 1337 para leet o la película Seven (que fue estilizada como Se7en ), se pueden ordenar como si fueran esas letras. El orden de clasificación natural ordena las cadenas alfabéticamente, excepto que los números de varios dígitos se tratan como un solo carácter y se ordenan por el valor del número codificado por los dígitos.

En el caso de los monarcas y papas , aunque sus números están en números romanos y se parecen a letras, normalmente están ordenados en orden numérico: así, por ejemplo, aunque V viene después de I, el rey danés Cristián IX viene después de su predecesor Cristián VIII. .

Convenciones específicas del idioma

Los idiomas que utilizan un alfabeto latino extendido generalmente tienen sus propias convenciones para el tratamiento de las letras adicionales. Además, en algunos idiomas, ciertos dígrafos se tratan como letras individuales a efectos de cotejo. Por ejemplo, el alfabeto español trata a la ñ como una letra básica que sigue a la n , y anteriormente trataba los dígrafos ch y ll como letras básicas que siguen a la cy l , respectivamente. Ahora сh y ll están ordenados alfabéticamente como combinaciones de dos letras. La nueva regla de alfabetización fue emitida por la Real Academia Española en 1994. Estos dígrafos todavía se designaban formalmente como letras pero ya no lo son desde 2010. Por otro lado, el dígrafo rr sigue a rqu como se esperaba (y lo hizo incluso antes de la Regla de alfabetización de 1994), mientras que las vocales con acento agudo ( á, é, í, ó, ú ) siempre se han ordenado en paralelo a sus letras base, al igual que la letra ü .

En algunos casos, como el árabe y el kiowa , el alfabeto ha sido completamente reordenado.

Las reglas de alfabetización aplicadas en varios idiomas se enumeran a continuación.

En árabe , hay dos órdenes principales del alfabeto de 28 letras que se utilizan en la actualidad. El estándar y más comúnmente utilizado es el orden hijāʾī , que fue creado por el primer lingüista árabe Nasr ibn 'Asim al-Laythi y presenta un método de ordenación visual en el que las letras se ordenan según sus formas. Por ejemplo, bāʾ (ب), tāʾ (ت), thāʾ (ث) se agrupan porque tienen la misma forma base o rasm (ٮ) y se diferencian únicamente por la indicación de consonantes conocida como iʻjām . El orden ʾabjadī original , que fonéticamente se parece al de otras lenguas semíticas además del latín, todavía se utiliza hoy en día, generalmente limitado a ordenar listas en un documento, de forma análoga a los números romanos . Cuando se utiliza el orden ʾabjadī en la numeración, las letras se escriben en una forma modificada para distinguirlas de las letras utilizadas en palabras y de los números. Por ejemplo, ʾalif (ا), que parece idéntico al número árabe oriental uno (١), un pequeño bucle ovalado se extiende en el sentido de las agujas del reloj desde la parte inferior de la letra, seguido de una cola corta (�). Aunque estos caracteres rara vez se utilizan digitalmente, están codificados en Unicode bajo símbolos alfabéticos matemáticos árabes . ^[13] Un orden menos común, el orden ṣawtī ^[ar] , está cotejado fonéticamente y fue creado por al-Khalil ibn Ahmad al-Farahidi .
En azerbaiyano , hay ocho letras adicionales al alfabeto latino estándar. Cinco de ellas son vocales: i, ı, ö, ü, ə y tres son consonantes: ç, ş, ğ. El alfabeto es igual que el turco , con los mismos sonidos escritos con las mismas letras, salvo tres letras adicionales: q, x y ə para sonidos que no existen en turco. Aunque todas las "letras turcas" están clasificadas en su orden alfabético "normal" como en turco, las tres letras adicionales se clasifican arbitrariamente después de las letras cuyos sonidos se acercan a los suyos. Entonces, q se coteja justo después de k, x (pronunciado como una ch alemana ) se coteja justo después de h y ə (pronunciado aproximadamente como una a corta en inglés ) se coteja justo después de e.
En bretón , no existe la "c", la "q", la "x", pero sí los dígrafos "ch" y "c'h", que se intercalan entre la "b" y la "d". Por ejemplo: « buzhugenn, chug, c'hoar, daeraouenn » (lombriz, jugo, hermana, lágrima).
En checo y eslovaco , las vocales acentuadas tienen un peso de clasificación secundario; en comparación con otras letras, se tratan como sus formas no acentuadas (en checo, A-Á, E-É-Ě, I-Í, O-Ó, U-Ú- Ů, Y-Ý, y en eslovaco, A-Á-Ä, E-É, I-Í, O-Ó-Ô, U-Ú, Y-Ý), pero luego se ordenan según las letras sin acento (por Por ejemplo, el orden lexicográfico correcto es baa, baá, báa, báá, bab, báb, bac, bác, bač, báč [en checo] y baa, baá, baä, báa, báá, báä, bäa, bäá, bää, bab. , báb, bäb, bac, bác, bäc, bač, báč, bäč [en eslovaco]). Las consonantes acentuadas tienen un peso de clasificación primario y se clasifican inmediatamente después de sus contrapartes no acentuadas, con excepción de Ď, Ň y Ť (en checo) y Ď, Ĺ, Ľ, Ň, Ŕ y Ť (en eslovaco), que nuevamente tienen un peso secundario. CH se considera una letra separada y va entre H e I. En eslovaco, DZ y DŽ también se consideran letras separadas y se ubican entre Ď y E.
En los alfabetos danés y noruego , las mismas vocales adicionales que en sueco (ver más abajo) también están presentes pero en un orden diferente y con diferentes glifos (..., X, Y, Z, Æ , Ø , Å ). Además, "Aa" se clasifica como equivalente a "Å". El alfabeto danés ha visto tradicionalmente la "W" como una variante de la "V", pero hoy en día la "W" se considera una letra separada.
En holandés, la combinación IJ (que representa Ĳ ) anteriormente se clasificaba como Y (o, a veces, como una letra separada: Y < IJ < Z), pero actualmente se clasifica principalmente como 2 letras (II < IJ < IK). Las excepciones son los directorios telefónicos; IJ siempre se clasifica como Y aquí porque en muchos apellidos holandeses Y se usa donde la ortografía moderna requeriría IJ. Tenga en cuenta que una palabra que comienza con ij y se escribe con I mayúscula también se escribe con J mayúscula, por ejemplo, la ciudad IJmuiden , el río IJssel y el país IJsland ( Islandia ).
En esperanto , las consonantes con acento circunflejo ( ĉ , ĝ , ĥ , ĵ , ŝ ), así como ŭ (u con breve ), se cuentan como letras separadas y se clasifican por separado (c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ... s, ŝ, t, u, ŭ, v, z).
En estonio õ , ä , ö y ü se consideran letras separadas y se clasifican después de w . Las letras š , z y ž aparecen únicamente en préstamos y nombres propios extranjeros y siguen a la letra s en el alfabeto estonio , que por lo demás no difiere del alfabeto latino básico.
El alfabeto feroés también tiene algunas letras adicionales danesas, noruegas y suecas, a saber, Æ y Ø . Además, el alfabeto feroés utiliza el eth islandés, que sigue a la D. Cinco de las seis vocales A , I , O , U e Y pueden recibir acentos y luego se consideran letras separadas. Las consonantes C , Q , X , W y Z no se encuentran. Por tanto, las cinco primeras letras son A , Á , B , D y Ð , y las cinco últimas son V , Y , Ý , Æ , Ø.
En filipino (tagalo) y otros idiomas filipinos, la letra Ng se trata como una letra separada. Se pronuncia como en sing , ping-pong , etc. Por sí solo, se pronuncia nang , pero en la ortografía filipina general , se escribe como si fueran dos letras separadas (n y g). Además, las letras derivadas (como Ñ ) siguen inmediatamente a la letra base. El filipino también se escribe con signos diacríticos, pero su uso es muy raro (excepto la tilde ).
El alfabeto finlandés y las reglas de clasificación son las mismas que las del sueco.
En francés , el último acento de una palabra determinada determina el orden. ^[14] Por ejemplo, en francés, las siguientes cuatro palabras se ordenarían de esta manera: cote < côte < coté < côté. La letra e se ordena como e é è ê ë (œ considerada como oe), lo mismo para o que ô ö.
En alemán, las letras con diéresis ( Ä , Ö , Ü ) se tratan generalmente como sus versiones sin diéresis; ß siempre se ordena como ss. Esto crea el orden alfabético Arbeit, Arg, Ärgerlich, Argument, Arm, Assistant, Aßlar, Assoziation. En directorios telefónicos y listas de nombres similares, las diéresis se deben clasificar como las combinaciones de letras "ae", "oe", "ue", ya que varios apellidos alemanes aparecen tanto con diéresis como sin diéresis con "e". " (Müller/Mueller). Esto hace que el orden alfabético sea Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
Las vocales húngaras tienen acentos, diéresis y acentos dobles, mientras que las consonantes se escriben con caracteres simples, dobles (dígrafos) o triples (trígrafos). Al cotejar, las vocales acentuadas son equivalentes a sus contrapartes no acentuadas y los caracteres dobles y triples siguen a sus originales simples. El orden alfabético húngaro es: A=Á, B, C, Cs, D, Dz, Dzs, E=É, F, G, Gy, H, I=Í, J, K, L, Ly, M, N, Ny , O=Ó, Ö=Ő, P, Q, R, S, Sz, T, Ty, U=Ú, Ü=Ű, V, W, X, Y, Z, Zs. (Antes de 1984, dz y dzs no se consideraban letras individuales para la clasificación, sino dos letras cada una, d+z y d+zs). Esto significa que, por ejemplo, nádcukor debería preceder a nádcsomó (aunque s normalmente precede a u ), ya que c precede a cs en la intercalación. La diferencia en la longitud de las vocales sólo debe tenerse en cuenta si las dos palabras son idénticas (por ejemplo, egér, éger ). Los espacios y guiones dentro de las frases se ignoran en la clasificación. Ch también aparece como dígrafo en ciertas palabras, pero no se considera un grafema por derecho propio en términos de intercalación.
Una característica particular de la intercalación húngara es que las formas contraídas de di- y trígrafos dobles (como ggy de gy + gy o ddzs de dzs + dzs ) deben ser intercaladas como si estuvieran escritas en su totalidad (independientemente del hecho de la contracción y los elementos de los di- o trígrafos). Por ejemplo, kaszinó debe preceder a kassza (aunque el cuarto carácter z normalmente vendría después de s en el alfabeto), porque el cuarto "carácter" ( grafema ) de la palabra kassza se considera un segundo sz (descomponiendo ssz en sz + sz ) , que sí sigue a i (en kaszinó ).
En islandés , se añade Þ y a D le sigue Ð . Cada vocal (A, E, I, O, U, Y) va seguida de su correspondiente en agudo : Á, É, Í, Ó, Ú, Ý. No hay Z, por lo que el alfabeto termina: ... X, Y, Ý, Þ , Æ , Ö.
- Ambas letras también fueron utilizadas por escribas anglosajones que también utilizaron la letra rúnica Wynn para representar /w/.
- Þ (llamada espina; minúscula þ) también es una letra rúnica.
- Ð (llamada eth; minúscula ð) es la letra D con un trazo añadido.
Kiowa está ordenado según principios fonéticos, como las escrituras brahmicas , más que según el orden latino histórico. Primero vienen las vocales, luego las consonantes paradas ordenadas de adelante hacia atrás de la boca, y de negativo a positivo , luego las africadas, fricativas, líquidas y nasales:

A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N

En lituano , las letras específicamente lituanas van después de sus originales latinos. Otro cambio es que Y viene justo antes de J : ... G, H, I, Į, Y, J, K...
En polaco , las letras específicamente polacas derivadas del alfabeto latino se clasifican según sus originales: A, Ą, B, C, Ć, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó. , P, ..., S, Ś, T, ..., Z, Ź, Ż. Los dígrafos a efectos de cotejo se tratan como si fueran dos letras separadas.
En el orden alfabético pinyin , donde las palabras tienen las mismas letras básicas en pinyin y solo difieren en los signos diacríticos modificadores, la letra no modificada aparece antes de la letra modificada. Por ejemplo, ⟨e⟩ viene antes de ⟨ê⟩ (額 ( è ) antes de 欸 ( ê̄ )), y ⟨u⟩ viene antes y ⟨ü⟩ (路 ( lù ) antes de 驢 ( lǘ ) y 努 ( nǔ ) antes de 女. ( nǚ )). Los caracteres con las mismas letras pinyin (incluidas las letras modificadas ⟨ê⟩ y ⟨ü⟩ ) están organizados según sus tonos en el orden de "primer tono (es decir, "tono plano"), segundo tono (tono ascendente), tercer tono ( tono descendente-ascendente), cuarto tono (tono descendente), quinto tono (tono neutro)", por ejemplo "媽 ( mā ), 麻 ( má ), 馬 ( mǎ ), 罵 ( mà ), 嗎 ( ma )". ^[a]
En portugués , el orden de clasificación es igual que en inglés: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Los dígrafos y las letras con signos diacríticos no están incluidos en el alfabeto.
En rumano , los caracteres especiales derivados del alfabeto latino se clasifican después de sus originales: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
En serbocroata y otras lenguas eslavas del sur relacionadas, los cinco caracteres acentuados y los tres caracteres unidos se ordenan según los originales: ..., C, Č, Ć, D, DŽ, Đ, E, ..., L, LJ , M, N, NJ, O, ..., S, Š, T, ..., Z, Ž.
El español trató (hasta 1994) "CH" y "LL" como letras simples, dando un orden de cinco , credo , chispa y lomo , luz , llama . Esto ya no es cierto desde que en 1994 la RAE adoptó el uso más convencional, y ahora LL se intercala entre LK y LM, y CH entre CG y CI. Los seis caracteres con signos diacríticos Á, É, Í, Ó, Ú, Ü se tratan como las letras originales A, E, I, O, U, por ejemplo: radio , ráfaga , rana , rápido , rastrillo . La única pregunta de cotejo específica en español es Ñ ( eñe ) como una letra diferente cotejada después de N.
En el alfabeto sueco , hay tres vocales adicionales colocadas al final (..., X, Y, Z, Å , Ä , Ö ), similar al alfabeto danés y noruego, pero con diferentes glifos y un orden de clasificación diferente. La letra "W" ha sido tratada como una variante de la "V", pero en la decimotercera edición de Svenska Akademiens ordlista (2006) la "W" se consideraba una letra separada.
En el alfabeto turco hay seis letras adicionales: ç, ğ, ı, ö, ş y ü (pero no q, w y x). Están intercalados con ç después de c, ğ después de g, ı antes de i, ö después de o, ş después de s y ü después de u. Originalmente, cuando se introdujo el alfabeto en 1928, la ı se ordenaba después de la i, pero el orden se cambió más tarde para que las letras con formas que contienen puntos, cedillas u otras marcas decorativas siempre sigan a las letras con las formas desnudas correspondientes. Tenga en cuenta que en la ortografía turca la letra I es la mayúscula de la ı sin punto, mientras que İ es la mayúscula de la i con punto.
En muchas lenguas turcas (como el azerí o la ortografía Jaꞑalif para el tártaro ), solía estar la letra Gha (Ƣƣ), que se encontraba entre G y H. Ahora está en desuso.
En vietnamita , hay siete letras adicionales: ă , â , đ , ê , ô , ơ , ư mientras que f , j , w , z están ausentes, aunque todavía tienen algún uso (como dirección de Internet, idioma de préstamo extranjero) . "f" se sustituye por la combinación "ph". Lo mismo que para "w" es "qu".
En Volapük ä , ö y ü se cuentan como letras separadas y se clasifican por separado (a, ä, b... o, ö, p... u, ü, v) mientras que q y w están ausentes. ^[15]
En galés, los dígrafos CH, DD, FF, NG, LL, PH, RH y TH se tratan como letras individuales y cada uno aparece después del primer carácter del par (excepto NG, que aparece después de G), lo que produce el ordene A, B, C, CH, D, DD, E, F, FF, G, NG, H, etc. Sin embargo, a veces puede suceder que al combinar palabras se produzca la yuxtaposición de dos letras que no forman un dígrafo. Un ejemplo es la palabra LLONGYFARCH (compuesta de LLON + GYFARCH). Esto da como resultado un orden como, por ejemplo, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG es un dígrafo en LLONG, pero no en LLONGYFARCH). La combinación de letras R+H (a diferencia del dígrafo RH) puede surgir de manera similar por yuxtaposición en compuestos, aunque esto tiende a no producir pares en los que una identificación errónea pueda afectar el orden. Para las otras combinaciones de letras potencialmente confusas que pueden ocurrir, es decir, D+D y L+L, se utiliza un guión en la ortografía (por ejemplo, AD-DAL, CHWIL-LYS).

Automatización

Los algoritmos de intercalación (en combinación con algoritmos de clasificación ) se utilizan en programación informática para colocar cadenas en orden alfabético. Un ejemplo estándar es el algoritmo de clasificación Unicode , que se puede utilizar para colocar cadenas que contengan cualquier símbolo Unicode en (una extensión de) orden alfabético. ^[14] Se puede hacer que cumpla con la mayoría de las convenciones específicas del idioma descritas anteriormente adaptando su tabla de clasificación predeterminada. Varias de estas adaptaciones se recopilan en Common Locale Data Repository .

Pedidos similares

El principio detrás del orden alfabético todavía se puede aplicar en idiomas que no usan estrictamente un alfabeto (por ejemplo, pueden escribirse usando un silabario o abugida ) siempre que los símbolos utilizados tengan un orden establecido.

Para los sistemas de escritura logográfica , como el hanzi chino o el kanji japonés , el método de clasificación por radicales y trazos se utiliza con frecuencia como una forma de definir un orden en los símbolos. El japonés a veces usa el orden de pronunciación, más comúnmente con el orden Gojūon pero a veces con el orden más antiguo Iroha .

En matemáticas, el orden lexicográfico es un medio para ordenar secuencias de una manera análoga a la utilizada para producir el orden alfabético. ^[dieciséis]

Algunas aplicaciones informáticas utilizan una versión del orden alfabético que se puede lograr mediante un algoritmo muy simple , basado exclusivamente en códigos ASCII o Unicode para caracteres. Esto puede tener efectos no estándar, como colocar todas las letras mayúsculas antes que las minúsculas. Ver orden ASCIIbético .

Un diccionario de rimas se basa en ordenar las palabras en orden alfabético comenzando desde la última hasta la primera letra de la palabra.

Ver también

Notas

^ Hay una excepción: en el Diccionario ABC Chino-Inglés el orden de los tonos es "tono cero (tono neutro), primer tono (tono plano), segundo tono (tono ascendente), tercer tono (tono descendente-ascendente) y cuarto tono ( tono descendente)".

Referencias

^ Reinhard G. Lehmann: "27-30-22-26. ¿Cuántas letras necesita un alfabeto? El caso del semítico", en: La idea de escribir: escribir entre fronteras , editado por Alex de Voogt y Joachim Friedrich Quack, Leiden : Brill 2012, págs. 11–52.
^ abc Street, Julie (10 de junio de 2020). «De la A a la Z - la sorprendente historia del orden alfabético» (texto y audio) . ABC Noticias (ABC Radio Nacional) . Corporación Australiana de Radiodifusión. Archivado desde el original el 2 de julio de 2020 . Consultado el 6 de julio de 2020 .
^ por ejemplo, Salmos 25, 34, 37, 111, 112, 119 y 145 de la Biblia hebrea
^ Daly, Lloyd. Contribuciones a la Historia de la Alfabetización en la Antigüedad y la Edad Media . Bruselas, 1967. p. 25.
^ O'Hara, James (1989). "Messapus, Cycnus y el orden alfabético del catálogo de héroes italianos de Virgilio". Fénix . 43 (1): 35–38. doi :10.2307/1088539. JSTOR 1088539.
^ LIVRE XI - texte latin - traducción + comentarios. Archivado desde el original el 9 de junio de 2012 . Consultado el 8 de mayo de 2012 .
^ Gibson, Craig (2002). Interpretando un clásico: Demóstenes y sus antiguos comentaristas .
^ Despertar, María A.; Rouse , Richard M. (1991), " Statim invenire : escuelas, predicadores y nuevas actitudes hacia la página", Testigos auténticos: enfoques de textos y manuscritos medievales , University of Notre Dame Press, págs. 0-268-00622-9
^ Cawdrey, Robert (1604). Una tabla alfabéticamente . Londres. pag. [A4]v.
^ Cartas de Coleridge, núm. 507.
^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatiana A; Resh, Vicente H; Krauss, Jochen (enero de 2007). "Secuencia del autor y crédito por contribuciones en publicaciones de varios autores". PLOS Biol . 5 (1): e18. doi : 10.1371/journal.pbio.0050018 . PMC 1769438 . PMID 17227141.
^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "El orden importa: la alfabetización de las citas en el texto sesga las tasas de citas" (PDF) . Boletín y revisión psiconómica . 26 (3): 1020–1026. doi : 10.3758/s13423-018-1532-8 . PMID 30288671. S2CID 52922399. Archivado (PDF) desde el original el 10 de noviembre de 2018 . Consultado el 10 de noviembre de 2018 .
- Resumen de Lay en: Colleen Flaherty (22 de octubre de 2018). "El caso contra la denominación alfabética de los autores". Dentro de la educación superior .
^ "Símbolos alfabéticos matemáticos árabes" (PDF) . EL estándar Unicode. Archivado (PDF) desde el original el 30 de octubre de 2022 . Consultado el 26 de noviembre de 2022 .
^ ab "Estándar técnico Unicode n.º 10: algoritmo de intercalación Unicode". Unicode, Inc. (unicode.org). 20 de marzo de 2008. Archivado desde el original el 27 de agosto de 2008 . Consultado el 27 de agosto de 2008 .
^ Midgley, Ralph. "Diccionario de Volapük a inglés" (PDF) . Archivado desde el original (PDF) el 1 de septiembre de 2012 . Consultado el 24 de septiembre de 2019 .
^ Franz Baader; Tobías Nipkow (1999). Reescritura de términos y todo eso . Prensa de la Universidad de Cambridge. págs. 18-19. ISBN 978-0-521-77920-3.

Otras lecturas

Chauvin, Yvonne. Práctica de clasificación alfabética . 4ª edición. París: Bordas, 1977. ISBN 2-04-010155-1
Flandes, Judith . Un lugar para todo: la curiosa historia del orden alfabético . Nueva York: Libros básicos/Libros Hatchette, 2020. ISBN 978-1-5416-7507-0