stringtranslate.com

Orden alfabetico

El orden alfabético es un sistema mediante el cual las cadenas de caracteres se colocan en orden según la posición de los caracteres en el orden convencional de un alfabeto . Es uno de los métodos de colación . En matemáticas, un orden lexicográfico es la generalización del orden alfabético a otros tipos de datos, como secuencias de números u otros objetos matemáticos ordenados .

Cuando se aplica a cadenas o secuencias que pueden contener dígitos, números o tipos de elementos más elaborados, además de caracteres alfabéticos, el orden alfabético generalmente se denomina orden lexicográfico .

Para determinar cuál de dos cadenas de caracteres aparece primero al ordenarlos alfabéticamente, se comparan sus primeras letras . Si difieren, entonces la cadena cuya primera letra aparece antes en el alfabeto aparece antes que la otra cadena. Si las primeras letras son iguales, se comparan las segundas letras, y así sucesivamente. Si se alcanza una posición en la que una cadena no tiene más letras para comparar mientras que la otra sí, se considera que la primera cadena (más corta) ocupa el primer lugar en orden alfabético.

Las letras mayúsculas o mayúsculas generalmente se consideran idénticas a sus correspondientes letras minúsculas a los efectos del orden alfabético, aunque se pueden adoptar convenciones para manejar situaciones en las que dos cadenas difieren sólo en el uso de mayúsculas. También existen varias convenciones para el manejo de cadenas que contienen espacios , letras modificadas, como aquellas con signos diacríticos , y caracteres que no son letras, como signos de puntuación .

El resultado de colocar un conjunto de palabras o cadenas en orden alfabético es que todas las cadenas que comienzan con la misma letra se agrupan; dentro de esa agrupación se agrupan todas las palabras que comienzan con la misma secuencia de dos letras; etcétera. Por tanto, el sistema tiende a maximizar el número de letras iniciales comunes entre palabras adyacentes.

Historia

El orden alfabético fue utilizado por primera vez en el primer milenio a. C. por los escribas semíticos del noroeste que utilizaban el sistema abjad . [1] Sin embargo, durante siglos se prefirió una variedad de otros métodos de clasificación y ordenamiento de material, incluidos geográfico, cronológico , jerárquico y por categoría , al orden alfabético. [2]

Partes de la Biblia datan de los siglos VII y VI a. C. En el Libro de Jeremías , el profeta utiliza el cifrado de sustitución Atbash , basado en el orden alfabético. De manera similar, los autores bíblicos utilizaron acrósticos basados ​​en el alfabeto hebreo (ordenado) . [3]

El primer uso efectivo del orden alfabético como mecanismo de catalogación entre los eruditos puede haber sido en la antigua Alejandría, [4] en la Gran Biblioteca de Alejandría , que fue fundada alrededor del año 300 a.C. Se cree que el poeta y erudito Calímaco , que trabajó allí, creó el primer catálogo de biblioteca del mundo , conocido como Pinakes , con pergaminos archivados en orden alfabético de la primera letra de los nombres de los autores. [2]

En el siglo I a. C., el escritor romano Varrón compiló listas alfabéticas de autores y títulos. [5] En el siglo II d.C., Sexto Pompeyo Festo escribió un epítome enciclopédico de las obras de Verrius Flaccus , De verborum significatu , con entradas en orden alfabético. [6] En el siglo III d.C., Harpocration escribió un léxico homérico ordenado alfabéticamente por todas las letras. [7] En el siglo X, el autor de la Suda utilizó el orden alfabético con variaciones fonéticas.

El orden alfabético como ayuda para la consulta comenzó a incorporarse a la corriente principal de la vida intelectual de Europa occidental en la segunda mitad del siglo XII, cuando se desarrollaron herramientas alfabéticas para ayudar a los predicadores a analizar el vocabulario bíblico . Esto llevó a la compilación de concordancias alfabéticas de la Biblia por los frailes dominicos en París en el siglo XIII, bajo Hugo de Saint Cher . Las obras de referencia más antiguas, como las Interpretaciones de los nombres hebreos de San Jerónimo , se ordenaron alfabéticamente para facilitar su consulta. Inicialmente, los académicos se resistieron al uso del orden alfabético, que esperaban que sus estudiantes dominaran su área de estudio de acuerdo con sus propias estructuras racionales; su éxito fue impulsado por herramientas como el índice de Robert Kilwardby de las obras de San Agustín , que ayudó a los lectores a acceder al texto original completo en lugar de depender de las compilaciones de extractos que se habían vuelto prominentes en la escolástica del siglo XII . La adopción del orden alfabético fue parte de la transición de la primacía de la memoria a la de las obras escritas. [8] La idea de ordenar la información según el orden del alfabeto también encontró resistencia por parte de los compiladores de enciclopedias de los siglos XII y XIII, todos ellos devotos eclesiásticos. Preferían organizar su material teológicamente – en el orden de la creación de Dios, comenzando con Deus (que significa Dios). [2]

En 1604, Robert Cawdrey tuvo que explicar en Table Alphabeticall , el primer diccionario monolingüe de inglés : "Ahora bien, si la palabra que deseas encontrar comienza con (a), entonces mira al principio de esta tabla, pero si con (v) Mira hacia el final". [9] Aunque todavía en 1803 Samuel Taylor Coleridge condenó las enciclopedias con "una disposición determinada por el accidente de las letras iniciales", [10] muchas listas se basan hoy en este principio.

La disposición en orden alfabético puede verse como una fuerza para democratizar el acceso a la información, ya que no requiere conocimientos previos extensos para encontrar lo que se necesita. [2]

Ordenar en escritura latina

Orden básico y ejemplos.

El orden estándar del alfabeto latino básico ISO moderno es:

ABCDEFGHIJKLMNOPQRSTU VWXYZ

A continuación se muestra un ejemplo de orden alfabético sencillo:

Otro ejemplo:

Las palabras anteriores están ordenadas alfabéticamente. As viene antes de Aster porque comienzan con las mismas dos letras y As no tiene más letras después de eso, mientras que Aster sí. Las siguientes tres palabras vienen después de Aster porque su cuarta letra (la primera que difiere) es r , que viene después de e (la cuarta letra de Aster ) en el alfabeto. Esas palabras en sí están ordenadas según su sexta letra ( l , n y p respectivamente). Luego viene At , que se diferencia de las palabras anteriores en la segunda letra ( t viene después de s ). Ataman viene después de At por la misma razón que Aster vino después de As . Attack sigue a Ataman basándose en la comparación de su tercera letra, y Baa viene después de todas las demás porque tiene una primera letra diferente.

Tratamiento de cadenas de varias palabras.

Cuando algunas de las cadenas que se ordenan constan de más de una palabra, es decir, contienen espacios u otros separadores como guiones , se pueden adoptar dos enfoques básicos. En el primer enfoque, todas las cadenas se ordenan inicialmente según su primera palabra, como en la secuencia:

En el segundo enfoque, las cadenas se ordenan alfabéticamente como si no tuvieran espacios, dando la secuencia:

El segundo enfoque es el que se suele adoptar en los diccionarios [ cita requerida ] y, por lo tanto, los editores suelen denominarlo orden de diccionario . El primer enfoque se ha utilizado a menudo en los índices de libros , aunque cada editor tradicionalmente establece sus propios estándares sobre qué enfoque utilizar en los mismos; No existía ninguna norma ISO para índices de libros ( ISO 999 ) antes de 1975.

Casos especiales

Letras modificadas

En francés, las letras modificadas (como las que tienen signos diacríticos ) se tratan de la misma manera que la letra base a efectos de orden alfabético. Por ejemplo, rol se sitúa entre el rock y la rosa , como si fuera rol escrito . Sin embargo, los idiomas que utilizan este tipo de letras sistemáticamente generalmente tienen sus propias reglas de ordenación. Consulte § Convenciones específicas del idioma a continuación.

Ordenar por apellido

En la mayoría de las culturas donde los apellidos se escriben después de los nombres de pila , todavía se desea ordenar las listas de nombres (como en las guías telefónicas) primero por apellido. En este caso, es necesario reordenar los nombres para ordenarlos correctamente. Por ejemplo, Juan Hernandes y Brian O'Leary deben ordenarse como "Hernandes, Juan" y "O'Leary, Brian" incluso si no están escritos de esta manera. Captar esta regla en un algoritmo de clasificación por computadora es complejo y los intentos simples fracasarán. Por ejemplo, a menos que el algoritmo tenga a su disposición una lista extensa de apellidos, no hay manera de decidir si "Gillian Lucille van der Waal" es "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der", o incluso "Lucille van der Waal, Gillian".

La ordenación por apellido se encuentra con frecuencia en contextos académicos. Dentro de un único artículo de varios autores, ordenar a los autores alfabéticamente por apellido, en lugar de utilizar otros métodos como la antigüedad inversa o el grado subjetivo de contribución al artículo, se considera una forma de "reconocer contribuciones similares" o "evitar [ing] falta de armonía en los grupos colaboradores". [11] Se ha descubierto que la práctica en ciertos campos de ordenar las citas en las bibliografías por los apellidos de sus autores crea un sesgo a favor de los autores con apellidos que aparecen antes en el alfabeto, mientras que este efecto no aparece en campos en los que las bibliografías son ordenados cronológicamente. [12]

El y otras palabras comunes

Si una frase comienza con una palabra muy común (como "el", "un" o "una", llamados artículos en gramática), esa palabra a veces se ignora o se mueve al final de la frase, pero no siempre es así. caso. Por ejemplo, el libro " El Resplandor " podría tratarse como "El Resplandor" o "El Resplandor" y, por tanto, antes del título del libro " El verano de Sam ". Sin embargo, también puede tratarse simplemente como "El Resplandor" y después de "El Verano de Sam". De manera similar, " Una arruga en el tiempo " podría tratarse como "Una arruga en el tiempo", "Una arruga en el tiempo, A" o "Una arruga en el tiempo". Los tres métodos de alfabetización son bastante fáciles de crear mediante algoritmos, pero muchos programas se basan en un orden lexicográfico simple .

Prefijos de Mac

Los prefijos M y Mc en los apellidos irlandeses y escoceses son abreviaturas de Mac y, a veces, están ordenados alfabéticamente como si la ortografía fuera Mac completa. Por lo tanto , McKinley podría figurar antes que Mackintosh (como lo sería si se hubiera escrito como "MacKinley"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se utiliza en los directorios telefónicos británicos.

prefijo st

El prefijo St o St. es una abreviatura de "Saint" y tradicionalmente se ordena alfabéticamente como si la ortografía fuera Saint en su totalidad. Por lo tanto, en un diccionario geográfico, San Juan podría figurar antes que Salem (como si así fuera si se hubiera escrito como "San Juan"). Desde la llegada de las listas ordenadas por computadora, este tipo de alfabetización se encuentra con menos frecuencia, aunque todavía se usa a veces.

Ligaduras

Las ligaduras (dos o más letras fusionadas en un símbolo) que no se consideran letras distintas, como Æ y Œ en inglés, generalmente se clasifican como si las letras estuvieran separadas: "æther" y "aether" se ordenarían del mismo modo en relación con todas las demás palabras. Esto es cierto incluso cuando la ligadura no es puramente estilística, como en préstamos y nombres de marcas.

Es posible que sea necesario adoptar reglas especiales para clasificar cadenas que varían sólo según si dos letras están unidas por una ligadura.

Tratamiento de numerales

Cuando algunas de las cadenas contienen números (u otros caracteres que no son letras), son posibles varios enfoques. A veces, estos caracteres se tratan como si estuvieran antes o después de todas las letras del alfabeto. Otro método consiste en ordenar los números alfabéticamente tal como se escribirían: por ejemplo, 1776 se ordenaría como si se escribiera "diecisiete setenta y seis", y 24 heures du Mans como si se escribiera "vingt-quatre..." (francés "veinticuatro"). Cuando se utilizan números u otros símbolos como formas gráficas especiales de letras, como 1337 para leet o la película Seven (que fue estilizada como Se7en ), se pueden ordenar como si fueran esas letras. El orden de clasificación natural ordena las cadenas alfabéticamente, excepto que los números de varios dígitos se tratan como un solo carácter y se ordenan por el valor del número codificado por los dígitos.

En el caso de los monarcas y papas , aunque sus números están en números romanos y se parecen a letras, normalmente están ordenados en orden numérico: así, por ejemplo, aunque V viene después de I, el rey danés Cristián IX viene después de su predecesor Cristián VIII. .

Convenciones específicas del idioma

Los idiomas que utilizan un alfabeto latino extendido generalmente tienen sus propias convenciones para el tratamiento de las letras adicionales. Además, en algunos idiomas, ciertos dígrafos se tratan como letras individuales a efectos de cotejo. Por ejemplo, el alfabeto español trata a la ñ como una letra básica que sigue a la n , y anteriormente trataba a los dígrafos ch y ll como letras básicas que siguen a la cy l , respectivamente. Ahora сh y ll están ordenados alfabéticamente como combinaciones de dos letras. La nueva regla de alfabetización fue emitida por la Real Academia Española en 1994. Estos dígrafos todavía se designaban formalmente como letras pero ya no lo son desde 2010. Por otro lado, el dígrafo rr sigue a rqu como se esperaba (y lo hizo incluso antes de la Regla de alfabetización de 1994), mientras que las vocales con acento agudo ( á, é, í, ó, ú ) siempre se han ordenado en paralelo a sus letras base, al igual que la letra ü .

En algunos casos, como el árabe y el kiowa , el alfabeto ha sido completamente reordenado.

Las reglas de alfabetización aplicadas en varios idiomas se enumeran a continuación.

A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N

Automatización

Los algoritmos de intercalación (en combinación con algoritmos de clasificación ) se utilizan en programación informática para colocar cadenas en orden alfabético. Un ejemplo estándar es el algoritmo de clasificación Unicode , que se puede utilizar para colocar cadenas que contengan cualquier símbolo Unicode en (una extensión de) orden alfabético. [14] Se puede hacer que cumpla con la mayoría de las convenciones específicas del idioma descritas anteriormente adaptando su tabla de clasificación predeterminada. Varias de estas adaptaciones se recopilan en Common Locale Data Repository .

Pedidos similares

El principio detrás del orden alfabético todavía se puede aplicar en idiomas que no usan estrictamente un alfabeto (por ejemplo, pueden escribirse usando un silabario o abugida ) siempre que los símbolos utilizados tengan un orden establecido.

Para los sistemas de escritura logográfica , como el hanzi chino o el kanji japonés , el método de clasificación por radicales y trazos se utiliza con frecuencia como una forma de definir un orden en los símbolos. El japonés a veces usa el orden de pronunciación, más comúnmente con el orden Gojūon pero a veces con el orden más antiguo Iroha .

En matemáticas, el orden lexicográfico es un medio para ordenar secuencias de una manera análoga a la utilizada para producir el orden alfabético. [dieciséis]

Algunas aplicaciones informáticas utilizan una versión del orden alfabético que se puede lograr mediante un algoritmo muy simple , basado exclusivamente en códigos ASCII o Unicode para caracteres. Esto puede tener efectos no estándar, como colocar todas las letras mayúsculas antes que las minúsculas. Ver orden ASCIIbético .

Un diccionario de rimas se basa en ordenar las palabras en orden alfabético comenzando desde la última hasta la primera letra de la palabra.

Ver también

Notas

  1. ^ Hay una excepción: en el Diccionario ABC Chino-Inglés el orden de los tonos es "tono cero (tono neutro), primer tono (tono plano), segundo tono (tono ascendente), tercer tono (tono descendente-ascendente) y cuarto tono ( tono descendente)".

Referencias

  1. ^ Reinhard G. Lehmann: "27-30-22-26. ¿Cuántas letras necesita un alfabeto? El caso del semítico", en: La idea de escribir: escribir entre fronteras , editado por Alex de Voogt y Joachim Friedrich Quack, Leiden : Brill 2012, págs. 11–52.
  2. ^ abcd Street, Julie (10 de junio de 2020). «De la A a la Z - la sorprendente historia del orden alfabético» (texto y audio) . ABC Noticias (ABC Radio Nacional) . Corporación Australiana de Radiodifusión. Archivado desde el original el 2 de julio de 2020 . Consultado el 6 de julio de 2020 .
  3. ^ por ejemplo, Salmos 25, 34, 37, 111, 112, 119 y 145 de la Biblia hebrea
  4. ^ Daly, Lloyd. Contribuciones a la Historia de la Alfabetización en la Antigüedad y la Edad Media . Bruselas, 1967. p. 25.
  5. ^ O'Hara, James (1989). "Messapus, Cycnus y el orden alfabético del catálogo de héroes italianos de Virgilio". Fénix . 43 (1): 35–38. doi :10.2307/1088539. JSTOR  1088539.
  6. ^ LIVRE XI - texte latin - traducción + comentarios. Archivado desde el original el 9 de junio de 2012 . Consultado el 8 de mayo de 2012 .
  7. ^ Gibson, Craig (2002). Interpretando un clásico: Demóstenes y sus antiguos comentaristas .
  8. ^ Despertar, María A.; Rouse, Richard M. (1991), " Statim invenire : escuelas, predicadores y nuevas actitudes hacia la página", Testigos auténticos: enfoques de textos y manuscritos medievales , University of Notre Dame Press, págs . 0-268-00622-9
  9. ^ Cawdrey, Robert (1604). Una tabla alfabéticamente . Londres. pag. [A4]v.
  10. ^ Cartas de Coleridge, núm. 507.
  11. ^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatiana A; Resh, Vicente H; Krauss, Jochen (enero de 2007). "Secuencia del autor y crédito por contribuciones en publicaciones de varios autores". PLOS Biol . 5 (1): e18. doi : 10.1371/journal.pbio.0050018 . PMC 1769438 . PMID  17227141. 
  12. ^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "El orden importa: la alfabetización de las citas en el texto sesga las tasas de citas" (PDF) . Boletín y revisión psiconómica . 26 (3): 1020–1026. doi : 10.3758/s13423-018-1532-8 . PMID  30288671. S2CID  52922399. Archivado (PDF) desde el original el 10 de noviembre de 2018 . Consultado el 10 de noviembre de 2018 .
  13. ^ "Símbolos alfabéticos matemáticos árabes" (PDF) . EL estándar Unicode. Archivado (PDF) desde el original el 30 de octubre de 2022 . Consultado el 26 de noviembre de 2022 .
  14. ^ ab "Estándar técnico Unicode n.º 10: algoritmo de intercalación Unicode". Unicode, Inc. (unicode.org). 20 de marzo de 2008. Archivado desde el original el 27 de agosto de 2008 . Consultado el 27 de agosto de 2008 .
  15. ^ Midgley, Ralph. "Diccionario de Volapük a inglés" (PDF) . Archivado desde el original (PDF) el 1 de septiembre de 2012 . Consultado el 24 de septiembre de 2019 .
  16. ^ Franz Baader; Tobías Nipkow (1999). Reescritura de términos y todo eso . Prensa de la Universidad de Cambridge. págs. 18-19. ISBN 978-0-521-77920-3.

Otras lecturas