Recopilación de conceptos con fines principalmente lexicoestadísticos
Una lista Swadesh ( es una compilación de conceptos tentativamente universales para fines de lexicoestadística . Es cuales todos los idiomas, sin excepción, tienen términos, como estrella, mano, agua, matar, dormir, etc. El número de tales términos es pequeño: unos pocos cientos como máximo, o posiblemente menos de cien; la inclusión o exclusión de muchos términos está sujeta a debate entre los lingüistas, por lo que hay varias listas diferentes, y algunos autores pueden referirse a "listas Swadesh". La lista Swadesh lleva el nombre del lingüista Morris Swadesh .
Las traducciones de una lista Swadesh a un conjunto de idiomas permiten a los investigadores cuantificar la interrelación entre esos idiomas. Las listas Swadesh se utilizan en lexicoestadística (la evaluación cuantitativa de la relación genealógica de los idiomas) y en glotocronología (la datación de la divergencia lingüística). Por ejemplo, los términos de una lista Swadesh se pueden comparar entre dos idiomas (ya que ambos los tienen) para ver si están relacionados y en qué medida, lo que proporciona información útil que se puede aplicar posteriormente a la comparación de los idiomas. (La lexicoestadística real es bastante complicada y, por lo general, se comparan conjuntos de idiomas).
Versiones y autores
Morris Swadesh creó varias versiones de su lista. Comenzó [1] con una lista de 215 significados (introducida falsamente como una lista de 225 significados en el artículo debido a un error ortográfico [2] ), que redujo a 165 palabras para el idioma salish-spokane-kalispel . En 1952, publicó una lista de 215 significados, [3] de los cuales sugirió la eliminación de 16 por ser poco claros o no universales , y agregó uno para llegar a 200 palabras. En 1955, [4] escribió: "La única solución parece ser una eliminación drástica de la lista, en la comprensión de que la calidad es al menos tan importante como la cantidad. Incluso la nueva lista tiene defectos, pero son relativamente leves y pocos en número". Después de correcciones menores, la lista final de 100 palabras se publicó póstumamente en 1971 [5] y 1972.
Otras versiones de listas de pruebas lexicoestadísticas fueron publicadas por ejemplo por Robert Lees (1953), John A. Rea (1958:145f), Dell Hymes (1960:6), E. Cross (1964 con 241 conceptos), WJ Samarin (1967:220f), D. Wilson (1969 con 57 significados), Lionel Bender (1969), RL Oswald (1971), Winfred P. Lehmann (1984:35f), D. Ringe (1992, passim, diferentes versiones), Sergei Starostin (1984, passim, diferentes versiones), William SY. Wang (1994), M. Lohr (2000, 128 significados en 18 idiomas), B. Kessler (2002) y muchos otros. Concepticon , [6] un proyecto alojado en el proyecto Cross-Linguistic Linked Data (CLLD), recopila varias listas de conceptos (incluidas las listas clásicas de Swadesh) en diferentes áreas y épocas lingüísticas, y actualmente incluye 240 listas de conceptos diferentes. [7]
La versión de Isidore Dyen (1992, 200 significados de 95 variantes lingüísticas) se utiliza con frecuencia y está ampliamente disponible en Internet . Desde 2010, un equipo dirigido por Michael Dunn ha intentado actualizar y mejorar esa lista. [8]
Principio
En origen, las palabras de las listas Swadesh fueron elegidas por su disponibilidad universal y culturalmente independiente en tantos idiomas como fuera posible, independientemente de su estabilidad (la propensión de la palabra a cambiar, como lo hacen todas las palabras con el tiempo en mayor o menor medida, lo que puede incluir préstamos de otro idioma).
Sin embargo, la estabilidad puede ser importante. Numerosos autores, entre ellos Marisa Lohr 1999, 2000, han analizado la estabilidad de los términos de una lista Swadesh en caso de cambio de idioma y el posible uso de este hecho para fines de glotocronología (estudio de cómo se desarrollan y se ramifican las lenguas con el tiempo). [9]
La lista Swadesh fue elaborada por Morris Swadesh basándose en su intuición. Listas similares más recientes, como la lista Dolgopolsky (1964) o la lista Leipzig-Yakarta (2009), se basan en datos sistemáticos de muchos idiomas diferentes, pero aún no son tan conocidas ni tan utilizadas como la lista Swadesh.
Uso en lexicoestadística y glotocronología
Las listas de pruebas lexicoestadísticas se utilizan en lexicoestadística para definir subgrupos de idiomas, y en glotocronología para "proporcionar fechas para los puntos de ramificación en el árbol". [10] La tarea de definir (y contar el número) de palabras cognadas en la lista está lejos de ser trivial, y a menudo está sujeta a disputa, porque los cognados no necesariamente parecen similares, y el reconocimiento de cognados presupone el conocimiento de las leyes de sonido de los respectivos idiomas.
Lista final original de Swadesh 100
La lista final de Swadesh, publicada en 1971, [5] contiene 100 términos. Las explicaciones de los términos se pueden encontrar en Swadesh 1952 [3] o, donde se indique con una cruz ( † ), en Swadesh 1955. Nótese que solo esta secuencia original aclara el significado correcto que se pierde en un orden alfabético, por ejemplo, en el caso "27. corteza" (originalmente sin la especificación aquí agregada).
- Yo (pronombre de primera persona del singular)
- tú (pronombre singular de segunda persona; 1952 thou & ye)
- Nosotros (1955: inclusive )
- este
- eso
- ¿ Quién ? (“?” no 1971)
- ¿Qué ? (“?” no 1971)
- no
- todos (de un numero)
- muchos
- uno
- dos
- grande
- largo (no ancho)
- pequeño
- mujer
- hombre (humano adulto de sexo masculino)
- persona (humano individual)
- pez (sustantivo)
- pájaro
- perro
- piojo
- árbol (no tronco)
- semilla (sustantivo)
- hoja (botánica)
- raíz (botánica)
- corteza (de árbol)
- piel (1952: de persona)
- carne (1952 carne, carne)
- sangre
- hueso
- grasa (1952: grasa, sustancia orgánica)
- huevo
- cuerno (de toro, etc., no de 1952) †
- cola
- pluma (grande, no hacia abajo)
- cabello (en la cabeza de los humanos)
- cabeza (anatómica)
- oreja
- ojo
- nariz
- boca
- diente (frontal, en lugar de molar)
- lengua (anatómica)
- garra (no en 1952) † 1
- pie (no pierna)
- rodilla (no 1952) †
- mano
- vientre (parte inferior del cuerpo, abdomen)
- cuello (no nuca)
- pechos (femeninos; pecho de 1955) †
- corazón
- hígado
- beber (verbo)
- comer (verbo)
- morder (verbo)
- ver (verbo)
- escuchar (verbo)
- saber (hechos)
- dormir (verbo)
- morir (verbo)
- matar (verbo)
- nadar (verbo)
- volar (verbo)
- caminar (verbo)
- venir (verbo)
- acostarse (de lado, reclinado)
- sentarse (verbo)
- estar de pie (verbo)
- dar (verbo)
- decir (verbo) †
- sol
- Luna (no 1952) †
- estrella
- agua (sustantivo)
- lluvia (sustantivo, verbo de 1952)
- piedra
- arena
- tierra (suelo)
- nube (no niebla)
- humo (sustantivo, de fuego)
- fuego
- cenizas )
- quemar (verbo intransitivo)
- camino (camino de 1952, sendero; no calle)
- montaña (no colina)
- rojo (color)
- verde (color)
- amarillo (color)
- blanco (color)
- negro (color)
- noche
- caliente (adjetivo; 1952 cálido, de clima)
- frío (del tiempo)
- lleno †
- nuevo
- bien
- redondo (no 1952) †
- seco (sustancia)
- nombre
^ "Garra" se añadió recién en 1955, pero muchos especialistas conocidos lo reemplazaron por (uña) , porque las expresiones para "garra" no están disponibles en muchos idiomas antiguos, extintos o menos conocidos.
La lista de 110 elementos de la Base de Datos Lexicoestadística Global utiliza la lista Swadesh original de 100 elementos, además de otras 10 palabras de la lista Swadesh–Yakhontov. [11]
Lista de Swadesh 207
La lista más utilizada hoy en día es la lista Swadesh de 207 palabras, adaptada de Swadesh 1952. [3]
En Wikcionario ("Listas de Swadesh por idioma"), Panlex [12] [13] y en la "Lista de palabras de Swadesh de idiomas indoeuropeos" de Palisto, [14] se pueden encontrar cientos de listas de Swadesh en este formato.
Listas más cortas
La lista Swadesh-Yakhontov es un subconjunto de 35 palabras de la lista Swadesh que el lingüista ruso Sergei Yakhontov consideró especialmente estable alrededor de los años 1960, aunque la lista recién se publicó oficialmente en 1991. [15] Lingüistas como Sergei Starostin la han utilizado en lexicoestadística . Con sus números Swadesh, son: [16]
- I
- tú (singular)
- este
- OMS
- qué
- uno
- dos
- pez
- perro
- piojo
- sangre
- hueso
- huevo
- bocina
- cola
- oreja
- ojo
- nariz
- diente
- lengua
- mano
- saber
- morir
- dar
- sol
- luna
- agua
- sal
- piedra
- viento
- fuego
- año
- lleno
- nuevo
- nombre
Holman et al. (2008) descubrieron que, a la hora de identificar las relaciones entre los dialectos chinos, la lista Swadesh-Yakhontov era menos precisa que la lista Swadesh-100 original. Además, descubrieron que una lista diferente (de 40 palabras) (también conocida como lista ASJP ) era igual de precisa que la lista Swadesh-100. Sin embargo, calcularon la estabilidad relativa de las palabras comparando las retenciones entre idiomas de familias lingüísticas establecidas. No encontraron diferencias estadísticamente significativas en las correlaciones entre las familias del Viejo Mundo y las del Nuevo Mundo.
La lista clasificada Swadesh-100, con los números Swadesh y la estabilidad relativa, es la siguiente (Holman et al., Apéndice. Las palabras marcadas con asterisco aparecen en la lista de 40 palabras):
- 22 *piojo (42,8)
- 12 *dos (39,8)
- 75 *agua (37,4)
- 39 *oreja (37.2)
- 61 *morir (36,3)
- 1*yo (35,9)
- 53 *hígado (35,7)
- 40 *ojo (35,4)
- 48*mano (34,9)
- 58 *escuchar (33.8)
- 23 *árbol (33,6)
- 19 *pescado (33,4)
- 100 *nombre (32,4)
- 77 *piedra (32,1)
- 43 *diente (30,7)
- 51 *pechos (30,7)
- 2*tú (30,6)
- 85 *ruta (30.2)
- 31 *hueso (30.1)
- 44 *lengua (30.1)
- 28 *piel (29,6)
- 92*noche (29,6)
- 25 *hojas (29,4)
- 76 lluvia (29.3)
- 62 muertes (29,2)
- 30 *sangre (29.0)
- 34 *cuerno (28,8)
- 18*persona (28,7)
- 47 *rodilla (28.0)
- 11 *uno (27,4)
- 41 *nariz (27.3)
- 95 *completo (26,9)
- 66 *ven (26.8)
- 74 *estrella (26,6)
- 86 *montaña (26.2)
- 82 *fuego (25.7)
- 3 *nosotros (25.4)
- 54 *bebida (25.0)
- 57 *ver (24.7)
- 27 corteza (24,5)
- 96 *nuevo (24.3)
- 21 *perro (24.2)
- 72 *sol (24.2)
- 64 moscas (24,1)
- 32 grasa (23,4)
- 73 luna (23.4)
- 70 dar (23.3)
- 52 corazones (23,2)
- 36 plumas (23,1)
- 90 blanco (22,7)
- 89 amarillo (22,5)
- 20 aves (21,8)
- 38 cabezas (21,7)
- 79 tierra (21.7)
- 46 pies (21,6)
- 91 negro (21,6)
- 42 bocas (21,5)
- 88 verde (21,1)
- 60 dormir (21.0)
- 7 ¿qué? (20.7)
- 26 raíz (20,5)
- 45 garras (20,5)
- 56 mordidas (20,5)
- 83 cenizas (20,3)
- 87 rojo (20,2)
- 55 comer (20.0)
- 33 huevos (19,8)
- 6 quienes (19.0)
- 99 seco (18,9)
- 37 cabellos (18,6)
- 81 humo (18,5)
- 8 no (18.3)
- 4 esto (18.2)
- 24 semillas (18,2)
- 16 mujer (17,9)
- 98 rondas (17,9)
- 14 de largo (17,4)
- 69 puestos (17,1)
- 97 bueno (16,9)
- 17 hombres (16,7)
- 94 frío (16,6)
- 29 carne (16,4)
- 50 cuello (16.0)
- 71 dicen (16.0)
- 84 quemadura (15,5)
- 35 cola (14,9)
- 78 arena (14,9)
- 5 que (14.7)
- 65 caminar (14,4)
- 68 sentarse (14.3)
- 10 muchos (14,2)
- 9 en total (14,1)
- 59 saber (14.1)
- 80 nubes (13,9)
- 63 nadar (13,6)
- 49 barriga (13,5)
- 13 grandes (13,4)
- 93 caliente (11.6)
- 67 mentira (11.2)
- 15 pequeños (6,3)
Lenguas de signos
Al estudiar las lenguas de signos de Vietnam y Tailandia , el lingüista James Woodward observó que la lista Swadesh tradicional aplicada a las lenguas habladas no era adecuada para las lenguas de signos . La lista Swadesh da como resultado una sobrestimación de las relaciones entre las lenguas de signos, debido a los signos indiciales como los pronombres y las partes del cuerpo. La lista modificada es la siguiente, en orden mayoritariamente alfabético: [17]
- todo
- animal
- malo
- porque
- pájaro
- negro
- sangre
- niño
- contar
- día
- morir
- sucio
- perro
- seco
- aburrido
- polvo
- tierra
- huevo
- grasa
- padre
- pluma
- fuego
- pez
- flor
- bien
- césped
- verde
- pesado
- cómo
- caza
- marido
- hielo
- si
- matar
- reír
- hoja
- mentir
- vivir
- largo
- piojo
- hombre
- carne
- madre
- montaña
- nombre
- angosto
- nuevo
- noche
- no
- viejo
- otro
- persona
- jugar
- lluvia
- rojo
- correcto
- río
- soga
- sal
- mar
- afilado
- corto
- cantar
- sentarse
- liso
- serpiente
- nieve
- pararse
- estrella
- piedra
- sol
- cola
- delgado
- árbol
- vomitar
- cálido
- agua
- húmedo
- qué
- cuando
- dónde
- blanco
- OMS
- ancho
- esposa
- viento
- con
- mujer
- madera
- gusano
- año
- amarillo
- lleno
- luna
- hermano
- gato
- bailar
- cerdo
- hermana
- trabajar
Véase también
- Otras listas
- Proyectos y bases de datos
- Conceptos y campos lingüísticos
- Cognado : una palabra derivada de la misma palabra que otra.
- Lingüística histórica : el estudio de los cambios lingüísticos a lo largo del tiempo.
- Estudios indoeuropeos : el estudio de las lenguas indoeuropeas y su hipotético ancestro común, el protoindoeuropeo.
- Protolengua : lengua ancestral postulada a partir de la cual se presume que evolucionó una familia de lenguas.
- Métodos de reconstrucción del lenguaje
- Método comparativo : comparación característica por característica de lenguas relacionadas para reconstruir su desarrollo y ancestro común.
- Comparación léxica masiva : un método controvertido, considerado rival del método comparativo, para determinar el parentesco entre idiomas.
- Reconstrucción interna : reconstrucción de un estado anterior de una lengua sin compararla con otras lenguas.
- Otro
- Inglés básico : una forma simplificada de inglés para comunicarse y aprender.
- Listas Swadesh de varios idiomas en Wikcionario
Notas
- ^ Swadesh 1950: 161
- ^ List, J.-M. (2018): Hacia una historia de la compilación de listas de conceptos en lingüística histórica. Historia y filosofía de las ciencias del lenguaje 5.10. URL
- ^ abc Swadesh 1952: 456–7 PDF
- ^ Swadesh 1955: 125
- ^ Desde Swadesh 1971: 283
- ^ Concepción. doi :10.5281/zenodo.19782
- ^ List, J.-M., M. Cysouw y R. Forkel (2016): Concepticon. Un recurso para la vinculación de listas de conceptos. En: Actas de la Décima Conferencia Internacional sobre Recursos y Evaluación de Lenguas . 2393-2400. PDF
- ^ "IELex:: IELex". GitHub . Marzo de 2022.
- ^ Marisa Lohr (2000), "Nuevos enfoques de la lexicoestadística y la glotocronología" en C. Renfrew, A. McMahon y L. Trask, ed. Time Depth in Historical Linguistics , vol. 1, págs. 209-223
- ^ Sheila Embleton (1992), en W. Bright, ed., Enciclopedia Internacional de Lingüística , Oxford University Press, pág. 131
- ^ Starostin, George (ed.) 2011-2019. The Global Lexicostatistical Database . Moscú: Higher School of Economics y Santa Fe: Santa Fe Institute . Consultado el 26 de diciembre de 2020.
- ^ Jonathan Pool (2016), Listas Swadesh de Panlex en formato PDF
- ^ David Kamholz, Jonathan Pool, Susan Colowick (2014), PanLex: creación de un recurso para la traducción léxica panlingüe PDF
- ^ Palisto (2013), Lista de palabras Swadesh de lenguas indoeuropeas .
- ^ Lista de conceptos Yakhontov 1991 100. Concepticon . Consultado el 30 de diciembre de 2020.
- ^ Starostin 1991
- ^ Karen Emmorey ; Harlan L. Lane (2000). Los signos del lenguaje revisados: una antología en honor a Ursula Bellugi y Edward Klima. Prensa de Psicología. págs. 20-21. ISBN 978-0-8058-3246-4. Consultado el 26 de septiembre de 2011 .
Referencias
- Campbell, Lyle. (1998). Lingüística histórica: una introducción . Edimburgo: Edinburgh University Press. ISBN 0-262-53267-0 .
- Embleton, Sheila (1995). Reseña de An Indo-European Classification: A Lexicostatistical Experiment de Isidore Dyen, JB Kruskal y P. Black. TAPS Monograph 82–5, Filadelfia. en Diachronica Vol. 12, no. 2, 263–68.
- Gudschinsky, Sarah. (1956). "El ABC de la lexicoestadística (glotocronología)". Word , vol. 12, 175-210.
- Hoijer, Harry. (1956). "Lexicoestadística: una crítica". Language , Vol. 32, 49–60.
- Holm, Hans J. (2007). "El nuevo arboreto de los 'árboles' indoeuropeos: ¿pueden los nuevos algoritmos revelar la filogenia e incluso la prehistoria del indoeuropeo?" Journal of Quantitative Linguistics , vol. 14, 167–214.
- Holman, Eric W., Søren Wichmann, Cecil H. Brown, Viveka Velupillai, André Müller, Dik Bakker (2008). "Exploraciones en clasificación automatizada de idiomas". Folia Lingüística , vol. 42, núm. 2, 331–354
- Sankoff, David (1970). "Sobre la tasa de reemplazo de las relaciones entre palabras y significados". Language , Vol. 46, 564–569.
- Starostin, Sergei (1991). Altajskaja Problema i Proisxozhdenie Japonskogo Jazyka [El problema altaico y el origen de la lengua japonesa]. Moscú: Nauka
- Swadesh, Morris. (1950). "Relaciones internas de los Salish". Revista Internacional de Lingüística Americana , vol. 16, 157–167.
- Swadesh, Morris. (1952). "Datación lexicoestadística de contactos étnicos prehistóricos". Actas de la American Philosophical Society , vol. 96, 452–463.
- Swadesh, Morris. (1955). "Hacia una mayor precisión en la datación lexicoestadística". Revista Internacional de Lingüística Americana , vol. 21, 121–137.
- Swadesh, Morris. (1971). El origen y la diversificación del lenguaje . Ed. post mortem por Joel Sherzer. Chicago: Aldine. ISBN 0-202-01001-5 . Contiene la lista final de 100 palabras en la pág. 283.
- Swadesh, Morris, et al. (1972). "¿Qué es la glotocronología?", en Morris Swadesh y Joel Sherzer, ed., El origen y la diversificación del lenguaje, págs. 271-284. Londres: Routledge & Kegan Paul. ISBN 0-202-30841-3 .
- Wittmann, Henri (1973). "La clasificación lexicoestadística de las lenguas criollas de base francesa". Lexicostatistics in Genetic Linguistics: Proceedings of the Yale Conference, April 3–4, 1971 , dir. Isidore Dyen, 89–99. La Haye: Mouton.[1]
Enlaces externos
Busque Apéndice:Listas de Swadesh en Wikcionario, el diccionario libre.
- Universales léxico-semánticos: una visión crítica
- Proyecto Rosetta
- Listas Swadesh de lenguas nativas brasileñas
- Blog ilustrado sobre lingüística y etimología de Stephan Steinbach