Modelo de árbol

En lingüística histórica , el modelo de árbol (también Stammbaum , genético o cladístico ) es un modelo de la evolución de las lenguas análogo al concepto de árbol genealógico , en particular un árbol filogenético en la evolución biológica de las especies . Al igual que con las especies, se supone que cada lengua ha evolucionado a partir de un único progenitor o lengua "madre", y que las lenguas que comparten un ancestro común pertenecen a la misma familia lingüística .

Popularizado por el lingüista alemán August Schleicher en 1853, ^[1]^[2] el modelo de árbol siempre ha sido un método común para describir las relaciones genéticas entre lenguas desde los primeros intentos de hacerlo. Es fundamental en el campo de la lingüística comparada , que implica el uso de evidencia de lenguas conocidas y reglas observadas de evolución de características lingüísticas para identificar y describir las protolenguas hipotéticas ancestrales de cada familia lingüística, como el protoindoeuropeo y las lenguas indoeuropeas . Sin embargo, se trata en gran medida de una búsqueda teórica y cualitativa, y los lingüistas siempre han enfatizado las limitaciones inherentes del modelo de árbol debido al gran papel que desempeña la transmisión horizontal en la evolución de las lenguas, que van desde los préstamos hasta las lenguas criollas que tienen múltiples lenguas madre. ^[1] El modelo de onda fue desarrollado en 1872 por el alumno de Schleicher, Johannes Schmidt, como una alternativa al modelo de árbol que incorpora la transmisión horizontal. ^[3]

El modelo de árbol también tiene las mismas limitaciones que la taxonomía biológica con respecto al problema de las especies de cuantificar un fenómeno continuo que incluye excepciones como las especies en anillo en biología y los continuos dialectales en el lenguaje. El concepto de vínculo se desarrolló en respuesta a ello y se refiere a un grupo de idiomas que evolucionaron a partir de un continuo dialectal en lugar de a partir de idiomas secundarios lingüísticamente aislados de un solo idioma. ^[2]

Historia

El Antiguo Testamento y San Agustín

Agustín de Hipona supuso que cada uno de los descendientes de Noé fundó una nación y que a cada nación se le dio su propia lengua: asirio para Assur , hebreo para Heber , y así sucesivamente. ^[4] En total identificó 72 naciones, fundadores tribales y lenguas. La confusión y dispersión se produjo en la época de Peleg , hijo de Heber, hijo de Sem , hijo de Noé. ^[5]^[6] Agustín formuló una hipótesis no muy distinta de las de los lingüistas históricos posteriores, de que la familia de Heber "conservó esa lengua que no sin razón se cree que fue la lengua común de la raza ... a partir de entonces llamada hebreo". Sin embargo, la mayoría de las 72 lenguas datan de muchas generaciones posteriores a Heber. San Agustín resuelve este primer problema suponiendo que Heber, que vivió 430 años, todavía estaba vivo cuando Dios le asignó los 72. ^[7]^{: 123}

Ursprache, la lengua del paraíso

La hipótesis de San Agustín se mantuvo sin mayores dudas durante más de mil años. Luego, en una serie de tratados publicados en 1684, en los que expresaba su escepticismo respecto de diversas creencias, especialmente las bíblicas, Sir Thomas Browne escribió: ^[8]

"Aunque la tierra estaba ampliamente poblada antes del diluvio... sin embargo, es muy posible dudar de si, después de una gran dispersión y por un espacio de mil seiscientos años, los hombres mantuvieron un idioma tan uniforme en todas partes...".

Para entonces, el descubrimiento del Nuevo Mundo y la exploración del Lejano Oriente habían permitido conocer un número de lenguas nuevas muy superior a las 72 calculadas por San Agustín. Citando las lenguas nativas americanas, Browne sugiere que "la confusión de lenguas al principio sólo se produjo entre los que estaban presentes en Sinaar en la obra de Babel...". Para aquellos "al pie de las colinas, donde descansaba el arca... su lengua primitiva podría con el tiempo extenderse a varias partes de Europa y Asia..." ^[9] Esto es un indicio de un árbol. En opinión de Browne, la simplificación a partir de una lengua aborigen más grande que el hebreo podría explicar las diferencias en el lenguaje. Sugiere el chino antiguo, del que los otros descendieron por "confusión, mezcla y corrupción". ^[10] Más tarde invoca la "mezcla y alteración". ^[11]

Browne informa sobre una serie de actividades reconstructivas llevadas a cabo por los eruditos de la época: ^[12]

"El erudito Casaubon concibe que un diálogo podría ser compuesto en sajón, sólo de aquellas palabras que son derivables del griego... Verstegan no dudó de que podría idear una carta que pudiera ser entendida por los ingleses, holandeses y frislandeses orientales... Y si, como sostiene el erudito Buxhornius , la lengua escita como lengua materna se extiende por todas las naciones de Europa, e incluso hasta Persia, la comunidad de muchas palabras, entre tantas naciones, tiene una traducción más razonable y sería más derivable de la lengua común difundida a través de todas ellas, que de cualquier nación en particular, que también ha tomado prestada y retiene solo de segunda mano".

De este modo, la confusión que se generó en la Torre de Babel fue eliminada como obstáculo al dejarla de lado. Los intentos de encontrar similitudes entre todos los idiomas dieron como resultado el descubrimiento gradual de una antigua lengua maestra de la que se derivan todos los demás idiomas. Sin duda, Browne escribió y pensó mucho antes de 1684. En ese mismo siglo revolucionario en Gran Bretaña, James Howell publicó el Volumen II de Epistolae Ho-Elianae , cartas casi ficticias a varias personas importantes del reino que contenían información histórica válida. En la Carta LVIII, la metáfora de un árbol de idiomas aparece completamente desarrollada, a falta de ser la opinión de un lingüista profesional: ^[13]

"Ahora izaré velas hacia los Países Bajos, cuyo idioma es el mismo dialecto que el inglés, y lo fue desde el principio, siendo ambos derivados del alto holandés [Howell se equivoca aquí]: el danés también es solo una rama del mismo árbol ... Ahora bien, el alto holandés o lengua teutónica, es una de las principales y más amplias lenguas maternas de Europa ... fue la lengua de los godos y los vándalos , y continúa siendo la de la mayor parte de Polonia y Hungría , que tienen un dialecto de ella como lengua vulgar ... Algunos de sus escritores harían creer a este mundo que ella era la lengua hablada en el paraíso".

La búsqueda de la "lengua del paraíso" estaba en marcha entre todos los lingüistas de Europa. Quienes escribían en latín la llamaban lingua prima , lingua primaeva o lingua primigenia. En inglés era la lengua adánica; en alemán, Ursprache o hebräische Ursprache si se creía que era el hebreo. Esta misteriosa lengua tenía un aura de pureza e incorrupción, y esas cualidades eran las que se utilizaban para seleccionar a los candidatos. Este concepto de Ursprache empezó a utilizarse mucho antes de que los neogramáticos lo adoptaran para sus protolenguas. La brecha entre las familias de lenguas, tan divergentes entre sí, seguía abierta. ^{[ cita requerida ]}

Modelo indoeuropeo

El 2 de febrero de 1786, Sir William Jones pronunció su discurso del tercer aniversario ante la Sociedad Asiática como presidente de la misma sobre el tema de los hindúes . En él aplicó la lógica del modelo del árbol a tres lenguas, griego, latín y sánscrito, pero por primera vez en la historia sobre bases puramente lingüísticas, señalando «una afinidad más fuerte, tanto en las raíces de los verbos como en las formas gramaticales, de la que podría haberse producido por accidente;...». Continuó postulando que surgieron de «alguna fuente común, que, tal vez, ya no existe». A ellos añadió el gótico, el celta y el persa como «de la misma familia». ^[14]

Jones no mencionó su "fuente común" ni desarrolló más la idea, pero los lingüistas de la época la retomaron. En la Quarterly Review (de Londres) de finales de 1813-1814, Thomas Young publicó una reseña de Mithridates , oder allgemeine Sprachenkunde ("Mithridates, o una historia general de las lenguas") de Johann Christoph Adelung , cuyo volumen I había salido en 1806, y los volúmenes II y III, 1809-1812 , continuados por Johann Severin Vater. El trabajo de Adelung describía unas 500 "lenguas y dialectos" y planteaba la hipótesis de una descendencia universal de la lengua del paraíso, ubicada en Cachemira , en el centro del área total de las 500. Young comienza señalando la deuda de Adelung con Mithridates , de Differentiis Linguarum de Conrad Gesner de 1555 y otros catálogos posteriores de lenguas y alfabetos. ^[15]

Cachemira (rojo), la ubicación del Edén de Adelung

Young se propone presentar la clasificación de Adelung. El tipo monosilábico es el más antiguo y primitivo, hablado en Asia, al este del Edén, en la dirección de la salida de Adán del Edén. A continuación sigue el grupo de Jones, todavía sin nombre, pero atribuido a Jones: "Otra clase antigua y extensa de lenguas unidas por un mayor número de semejanzas de las que pueden ser totalmente accidentales". Para esta clase ofrece un nombre, ^[16] "indoeuropeo", el primer uso lingüístico conocido de la palabra, pero no su primer uso conocido. La Compañía Británica de las Indias Orientales utilizaba "comercio indoeuropeo" para referirse al comercio de mercancías entre la India y Europa. ^[17] Todas las pruebas que Young cita para el grupo ancestral son las palabras más similares: madre, padre, etc.

Las clases adicionales de Adelung eran la tártara (que más tarde se conocería como la disputada familia altaica ), la africana y la americana, que dependen de la geografía y de una presunta descendencia del Edén. Young no comparte el entusiasmo de Adelung por el lenguaje del paraíso y lo califica de principalmente especulativo. ^{[ cita requerida ]}

La designación de Young, exitosa en inglés, fue sólo una de varias candidatas propuestas entre 1810 y 1867: indo-germanique ( Conrad Malte-Brun , 1810), japetisk ( Rasmus Christian Rask , 1815), Indo-germanisch ( Julius Klaproth , 1823), indisch-teutsch (F. Schmitthenner, 1826), sanskritisch ( Wilhelm von Humboldt , 1827), indokeltisch (AF Pott, 1840), arioeuropeo ( Graziadio Isaia Ascoli , 1854), ario ( Max Müller , 1861) y aryaque (H. Chavée , 1867). Todos estos hombres eran políglotas y prodigios de las lenguas. (Klaproth, por ejemplo, el autor del exitoso candidato en lengua alemana, Indo-Germanisch, que criticó a Jones por su método acrítico, sabía chino, japonés, tibetano y varios otros idiomas con sus escrituras). El concepto de una Biblia La lengua original apeló a su imaginación. A medida que la esperanza de encontrarla se fue apagando gradualmente, recurrieron al concepto cada vez más extendido de un indoeuropeo común hablado por tribus nómadas en las llanuras de Eurasia, y aunque argumentaron que esta lengua se puede deducir por la En realidad, no fue así como lo consiguieron, sino que fue el único caso en el que sus esfuerzos por encontrar la Ursprache tuvieron éxito. ^{[ cita requerida ]}

Modelo neogramático

El modelo se debe en su formulación más estricta a los neogramáticos . El modelo se apoya en concepciones anteriores de William Jones , Franz Bopp y August Schleicher, a las que añade la falta de excepciones de las leyes del sonido y la regularidad del proceso. El lingüista que quizá fue el más responsable de establecer el vínculo con el darwinismo fue August Schleicher.

El hecho de que comparara su Stammbaum , o árbol genealógico de las lenguas, con la presentación de la evolución que Darwin hizo poco después de esa presentación lo demuestra la carta abierta que escribió en 1863 a Ernst Haeckel , publicada póstumamente. En 1869, Haeckel le había sugerido que leyera El origen de las especies . ^{[ cita requerida ]}

Después de leerlo, Schleicher escribió Die Darwinische Theorie und die Sprachwissenschaft , "El darwinismo puesto a prueba por la ciencia del lenguaje". ^[18] En un escenario que recuerda al que se produjo entre Darwin y Wallace sobre el descubrimiento de la evolución (ambos la descubrieron de forma independiente), Schleicher respaldó la presentación de Darwin, pero la criticó por no insertar ninguna especie. Luego presentó un Stammbaum de idiomas, que, sin embargo, no era el primero que publicaba. ^{[ cita requerida ]}

La evolución de las lenguas no fue la fuente de la teoría de la evolución de Darwin. La había basado en la variación de las especies, como la que había observado en los pinzones de las Islas Galápagos , que parecían ser modificaciones de un ancestro común. La selección de especies domésticas para producir una nueva variedad también jugó un papel en sus conclusiones. La primera edición de El origen de las especies en 1859 analiza el árbol del lenguaje como si fuera de novo bajo el tema de la clasificación. Darwin critica el método sincrónico ideado por Linneo , sugiriendo que se lo reemplace por un "ordenamiento natural" basado en la evolución. ^{[ cita requerida ]} Dice: ^[19]

"Quizá valga la pena ilustrar esta concepción de la clasificación tomando el caso de las lenguas. Si tuviéramos un pedigrí perfecto de la humanidad, una clasificación genealógica de las razas humanas proporcionaría la mejor clasificación de las diversas lenguas que se hablan actualmente en todo el mundo; y si hubiera que incluir todas las lenguas extintas y todos los dialectos intermedios y de lenta evolución, creo que esa clasificación sería la única posible. Sin embargo, podría ser que alguna lengua muy antigua se hubiera modificado poco y hubiera dado lugar a pocas lenguas nuevas, mientras que otras (debido a la difusión y el posterior aislamiento y estados de civilización de las diversas razas, descendientes de una raza común) se hubieran modificado mucho y hubieran dado lugar a muchas lenguas y dialectos nuevos. Los diversos grados de diferencia en las lenguas de un mismo tronco tendrían que expresarse mediante grupos subordinados a grupos; pero la clasificación adecuada o incluso la única posible seguiría siendo la genealógica; y ésta sería estrictamente natural, ya que conectaría entre sí todas las lenguas, extintas y modernas, por las afinidades más estrechas, y daría la filiación y el origen de cada lengua."

Schleicher nunca había oído hablar de Darwin antes de que Haeckel se lo hiciera notar. Había publicado su propio trabajo sobre el Stammbaum en un artículo de 1853, seis años antes de la primera edición de El origen de las especies en 1859. El concepto de descendencia de las lenguas no era nuevo en absoluto. Thomas Jefferson , un lingüista devoto, había propuesto que la necesidad continua de neologismos implica que las lenguas deben "progresar" o "avanzar". ^[20] Estas ideas presagian la evolución de las especies biológicas o de las lenguas, pero después del contacto de Schleicher con las ideas de Darwin, y tal vez del contacto de Darwin con los lingüistas históricos, la evolución y el cambio lingüístico quedaron inextricablemente vinculados y se convertirían en la base de la clasificación. Ahora, como entonces, los principales problemas serían demostrar líneas de descendencia específicas e identificar los puntos de ramificación. ^{[ cita requerida ]}

Árbol filogenético

La antigua metáfora recibió un significado completamente nuevo bajo el antiguo nombre por Joseph Harold Greenberg en una serie de ensayos que comenzaron alrededor de 1950. Desde la adopción de la metáfora del árbol genealógico por parte de los lingüistas, el concepto de evolución había sido propuesto por Charles Darwin y era generalmente aceptado en biología. La taxonomía , la clasificación de los seres vivos, ya había sido inventada por Carl Linnaeus . Utilizaba una nomenclatura binomial para asignar un nombre de especie y un nombre de género a cada organismo vivo conocido. Estos se organizaban en una jerarquía biológica bajo varios filos , o grupos más generales, ramificándose finalmente en las diversas especies. La base para esta clasificación biológica eran las características físicas compartidas observadas de las especies. ^{[ cita requerida ]}

Darwin, sin embargo, reviviendo otra antigua metáfora, el árbol de la vida , planteó la hipótesis de que los grupos de la clasificación de Linneo ( los taxones actuales ) descendían en una estructura de árbol a lo largo del tiempo desde el más simple al más complejo. El árbol jerárquico de Linneo era sincrónico; Darwin imaginó un proceso diacrónico de descendencia común . Donde Linneo había concebido rangos , que eran consistentes con la gran cadena de ser adoptada por los racionalistas , Darwin concibió linajes . Durante las décadas posteriores a Darwin, se hizo evidente que los rangos de la jerarquía de Linneo no se correspondían exactamente con los linajes. Se convirtió en el objetivo principal de la taxonomía descubrir los linajes y alterar la clasificación para reflejarlos, lo que hizo bajo la guía general de los Códigos de Nomenclatura , libros de reglas mantenidos por organizaciones internacionales para autorizar y publicar propuestas para reclasificar especies y otros taxones. El nuevo enfoque se denominó filogenia , la "generación de filos", que ideó una nueva metáfora arbórea, el árbol filogenético . Una unidad del árbol y todas sus unidades descendientes eran un clado y el descubrimiento de los clados era la cladística . ^{[ cita requerida ]}

Greenberg comenzó a escribir en una época en la que la sistemática filogenética carecía de las herramientas que más tarde estuvieron a su disposición: la computadora (sistemática computacional) y la secuenciación del ADN ( sistemática molecular ). Para descubrir una relación cladística, los investigadores se basaron en el mayor número posible de similitudes morfológicas entre especies que se pudieran definir y tabular. Estadísticamente, cuanto mayor era el número de similitudes, más probable era que las especies estuvieran en el mismo clado. Este enfoque atrajo a Greenberg, que estaba interesado en descubrir universales lingüísticos . Al alterar el modelo de árbol para convertir el árbol genealógico en un árbol filogenético, dijo: ^[21]

"Cualquier lengua consta de miles de formas que tienen sonido y significado... cualquier sonido puede expresar cualquier significado. Por lo tanto, si dos lenguas coinciden en un número considerable de tales elementos... necesariamente llegamos a la conclusión de que existe un origen histórico común. Tales clasificaciones genéticas no son arbitrarias... la analogía aquí con la clasificación biológica es extremadamente estrecha... así como en biología clasificamos las especies en el mismo género o unidad superior porque las semejanzas son tales que sugieren una hipótesis de descendencia común, lo mismo sucede con las hipótesis genéticas en el lenguaje."

En esta analogía, una familia lingüística es como un clado , las lenguas son como especies , la protolengua es como un taxón ancestral , el árbol lingüístico es como un árbol filogenético y las lenguas y dialectos son como especies y variedades. Greenberg formuló grandes tablas de características de lenguas hasta entonces desatendidas de África, las Américas, Indonesia y el norte de Eurasia y las clasificó según sus similitudes. Llamó a este enfoque " clasificación tipológica ", al que se llegó mediante lingüística descriptiva en lugar de lingüística comparativa . ^[22]

Fechas y glotocronología

Los lingüistas históricos han utilizado el método comparativo para reconstruir modelos arbóreos utilizando datos léxicos, morfológicos y fonológicos discretos. Se puede encontrar la cronología, pero no existen estimaciones de fechas absolutas utilizando este sistema.

La glotocronología permite estimar fechas absolutas. Los cognados compartidos (que significan que tienen un origen histórico común) calculan los tiempos de divergencia. Sin embargo, el método fue desacreditado más tarde debido a que los datos no eran confiables. Debido a esto, los lingüistas históricos tienen problemas con la estimación exacta de la edad a la hora de determinar la edad de la familia de lenguas indoeuropeas. Podría oscilar entre 4000 y 40 000 años antes del presente, o cualquier fecha intermedia según Dixon, que se basó en el ascenso y la caída del lenguaje (Cambridge University Press). ^[23] Como se ve en el artículo aquí. ^[24]

Las posibles soluciones para la glotocronología están por llegar gracias a los métodos filogenéticos computacionales . Las técnicas como el uso de modelos de evolución mejoran la precisión de la longitud y la topología de las ramas de los árboles. Por lo tanto, el uso de métodos filogenéticos computacionales permite a los investigadores analizar datos lingüísticos de la biología evolutiva. Esto ayuda además a contrastar teorías entre sí, como la teoría de Kurgan y la teoría de Anatolia, que afirman los orígenes de las lenguas infoeuropeas. ^[24]

Filogenética computacional en lingüística histórica

El método comparativo compara las características de varios idiomas para evaluar la similitud de un idioma con otro. Los resultados de esta evaluación están orientados a los datos, es decir, dependen de la cantidad de características y de la cantidad de idiomas comparados. Hasta la llegada de la computadora al panorama de la lingüística histórica, las cifras en ambos casos eran necesariamente pequeñas. El efecto era el de intentar representar una fotografía utilizando una pequeña cantidad de píxeles grandes, o unidades de imagen. Las limitaciones del modelo de árbol eran demasiado evidentes, lo que dio lugar a quejas de los principales lingüistas históricos. ^{[ cita requerida ]}

A finales del siglo XX, los lingüistas comenzaron a utilizar software destinado a la clasificación biológica para clasificar las lenguas. Los programas y métodos se volvieron cada vez más sofisticados. A principios del siglo XXI, el proyecto Computational Phylogenetics in Historical Linguistics (CPHL), un consorcio de lingüistas históricos, recibió financiación de la National Science Foundation para estudiar las filogenias. ^[25] La familia indoeuropea es un tema de estudio importante. En enero de 2012, habían recopilado y codificado una base de datos "filtrada" de "22 caracteres fonológicos, 13 caracteres morfológicos y 259 caracteres léxicos", y una base de datos no filtrada de más. Se incluyen listas de palabras de 24 lenguas indoeuropeas. Un mayor número de características e idiomas aumenta la precisión, siempre que cumplan ciertos criterios. Utilizando un software informático especializado, prueban varias hipótesis filogenéticas para determinar su capacidad de explicar los caracteres por descendencia genética. ^{[ cita requerida ]}

Limitaciones del modelo

Una limitación endémica del modelo de árbol es la propia presunción fundacional en la que se basa: requiere una clasificación basada en idiomas o, más generalmente, en variedades de idiomas . Dado que una variedad representa una abstracción de la totalidad de las características lingüísticas , existe la posibilidad de pérdida de información durante la traducción de datos (de un mapa de isoglosas ) a un árbol. Por ejemplo, está el problema de los continuos dialectales . Proporcionan variedades que no son inequívocamente de un idioma u otro, sino que contienen características propias de más de uno. La cuestión de cómo deben clasificarse es similar a la cuestión que presentan las especies en anillo para el concepto de clasificación de especies en biología. ^{[ cita requerida ]}

Las limitaciones del modelo de árbol, en particular su incapacidad para manejar la distribución no discreta de innovaciones compartidas en los continuos dialectales , se han abordado mediante el desarrollo de metodologías no cladísticas (no basadas en árboles). Estas incluyen el modelo Wave y, más recientemente, el concepto de enlace . ^[3]

Una limitación adicional del modelo de árbol involucra a las lenguas mixtas e híbridas, así como a la mezcla de lenguas en general, ya que el modelo de árbol solo permite divergencias. Por ejemplo, según Zuckermann (2009:63), ^[26] "israelí", su término para el hebreo moderno , al que considera un híbrido semitoeuropeo, "demuestra que la realidad de la génesis lingüística es mucho más compleja de lo que permite un sistema de árbol genealógico simple. Es poco probable que las lenguas 'revividas' tengan un solo progenitor".

Filogenias perfectas

El propósito del software filogenético es generar cladogramas , un tipo especial de árbol en el que los enlaces sólo se bifurcan; es decir, en cualquier nodo en la misma dirección sólo se ofrecen dos ramas. Los datos de entrada son un conjunto de caracteres a los que se les pueden asignar estados en diferentes idiomas, como presente (1) o ausente (0). Por lo tanto, un idioma puede describirse mediante un conjunto único de coordenadas que consiste en los valores de estado de todos los caracteres considerados. Estas coordenadas pueden ser similares entre sí o menos. Los idiomas que comparten más estados son los más similares entre sí. ^{[ cita requerida ]}

El software examina todos los estados de todos los caracteres de todos los idiomas mediante uno de varios métodos matemáticos para lograr una comparación por pares de cada idioma con el resto. Luego construye un cladograma basado en grados de similitud; por ejemplo, se supone que los idiomas hipotéticos a y b, que son los más cercanos entre sí, tienen un ancestro común, ab. Se supone que el idioma siguiente más cercano, c, tiene un ancestro común con ab, y así sucesivamente. El resultado es una serie proyectada de caminos históricos que conducen desde el ancestro común general (la raíz) a los idiomas (las hojas). Cada camino es único. No hay vínculos entre los caminos. Cada hoja y nodo tiene un solo ancestro. Todos los estados se explican por la descendencia de otros estados. Un cladograma que se ajusta a estos requisitos es una filogenia perfecta. ^[27]

Al principio, parecía que los resultados de los ensayos en los que se variaban los factores que se suponía que eran relevantes no eran uniformes. De cualquier cambio se obtenía un nuevo cladograma, lo que sugería que el método no captaba la evolución subyacente de las lenguas, sino que solo reflejaba los juicios improvisados de los investigadores. Para encontrar los factores que sí influían en la filogenia, los investigadores necesitaban tener alguna medida de la precisión de sus resultados; es decir, los resultados debían calibrarse con filogenias conocidas. Realizaron el experimento utilizando diferentes supuestos en busca de los que producirían las coincidencias más cercanas a las filogenias indoeuropeas más seguras. Esos supuestos podrían utilizarse en áreas problemáticas de la filogenia indoeuropea con mayor confianza. ^{[ cita requerida ]}

Para obtener una filogenia razonablemente válida, los investigadores descubrieron que necesitaban introducir como entrada los tres tipos de caracteres: fonológicos, léxicos y morfológicos, todos ellos necesarios para presentar una imagen suficientemente detallada para el cálculo de la filogenia. Sólo los caracteres cualitativos produjeron resultados significativos. Los estados repetidos eran demasiado ambiguos para que el software los interpretara correctamente; por lo tanto, los caracteres que estaban sujetos a formación inversa y desarrollo paralelo, que revertían un carácter a un estado anterior o adoptaban un estado que evolucionaba en otro carácter, respectivamente, se filtraron del conjunto de datos de entrada. ^[28]

Redes filogenéticas perfectas

A pesar de su cuidado por codificar los mejores caracteres cualitativos en cantidades suficientes, los investigadores no pudieron obtener filogenias perfectas para algunos grupos, como el germánico y el albanés dentro del indoeuropeo. Razonaron que un número significativo de caracteres, que no podían explicarse por la descendencia genética del ancestro calculado del grupo, fueron prestados. Presumiblemente, si el modelo de onda , que explicaba el préstamo, fuera una explicación completa de los caracteres del grupo, no podría encontrarse ninguna filogenia para él. Si ambos modelos fueran parcialmente efectivos, entonces existiría un árbol, pero necesitaría ser complementado por explicaciones no genéticas. Por lo tanto, los investigadores modificaron el software y el método para incluir la posibilidad de préstamos. ^[29]

Los investigadores introdujeron en el experimento el concepto de interfaz, o límite permitido a través del cual fluirían los estados de los caracteres. Existía una interfaz unidireccional, o borde, entre un padre y un hijo. Si sólo los bordes unidireccionales fueran suficientes para explicar la presencia de todos los estados en una lengua, entonces no habría necesidad de mirar más allá de la filogenia perfecta. Si no, entonces se podrían añadir uno o más bordes de contacto, o interfaces bidireccionales, a la filogenia. Por lo tanto, una lengua podría tener más de una fuente de estados: la lengua madre o una lengua de contacto. ^{[ cita requerida ]}

Un árbol modificado de esta manera ya no era un árbol como tal: podía haber más de un camino desde la raíz hasta la hoja. Los investigadores llamaron a esta disposición una red. Los estados de un carácter seguían evolucionando a lo largo de un único camino desde la raíz hasta la hoja, pero su origen podía ser la raíz en cuestión o una lengua de contacto. Si todos los estados del experimento podían explicarse mediante la red, se la denominaba red filogenética perfecta. ^[30]

Compatibilidad y viabilidad

La generación de redes requirió dos fases. En la primera fase, los investigadores idearon una serie de filogenias, llamadas árboles candidatos, para probar su compatibilidad. Un carácter es compatible cuando su origen se explica por la filogenia generada. ^[31] En una filogenia perfecta, todos los caracteres son compatibles y la compatibilidad del árbol es del 100%. Por el principio de parsimonia, o navaja de Occam , no se garantiza la existencia de redes. Los árboles candidatos se obtuvieron ejecutando primero el software de generación de filogenias utilizando el conjunto de datos indoeuropeos (las cadenas de estados de caracteres) como entrada, y luego modificando el árbol resultante en otras hipótesis para probar. ^{[ cita requerida ]}

Ninguno de los árboles candidatos originales eran filogenias perfectas, aunque algunos de los subárboles dentro de ellos sí lo eran. La siguiente fase fue generar redes a partir de los árboles con puntuaciones de compatibilidad más altas añadiendo interfaces una a la vez, seleccionando la interfaz de mayor compatibilidad, hasta que se obtuvo la suficiencia; es decir, la compatibilidad de la red fue la más alta. Resultó que el número de redes compatibles generadas podía variar desde ninguna hasta más de una docena. Sin embargo, no todas las interfaces posibles eran históricamente factibles. Las interfaces entre algunos idiomas eran geográfica y cronológicamente poco probables. Al inspeccionar los resultados, los investigadores excluyeron las interfaces no factibles hasta que quedó una lista de solo redes factibles, que se pudieron organizar en orden de puntuación de compatibilidad. ^{[ cita requerida ]}

La red más viable para el indoeuropeo

Los investigadores comenzaron con cinco árboles candidatos para el indoeuropeo, con letras AE, uno generado a partir del software filogenético, dos modificaciones del mismo y dos sugeridos por Craig Melchert , un lingüista histórico e indoeuropeo. Los árboles diferían principalmente en la colocación del grupo más ambiguo, las lenguas germánicas, y el albanés, que no tenía suficientes caracteres distintivos para ubicarlo exactamente. El árbol A contenía 14 caracteres incompatibles; B, 19; C, 17; D, 21; E, 18. Los árboles A y C tuvieron los mejores puntajes de compatibilidad. Las incompatibilidades eran todas léxicas, y las A eran un subconjunto de las C. ^[32]

La generación posterior de redes descubrió que todas las incompatibilidades podían resolverse con un mínimo de tres aristas de contacto, excepto el árbol E. Como no tenía una alta compatibilidad, se lo excluyó. El árbol A tenía 16 redes posibles, que una inspección de viabilidad redujo a tres. El árbol C tenía una red, pero como requería una interfaz con el Báltico y no con el Eslavo, no era viable. ^[33]

El árbol A, el más compatible y factible, plantea la hipótesis de siete grupos que se separaron del protoindoeuropeo entre aproximadamente el 4000 a. C. y el 2250 a. C., de la siguiente manera. ^[34]

Los primeros en separarse fueron los anatolianos, hacia el año 4000 a. C.
El tocario le siguió alrededor del 3500 a. C.
Poco después, alrededor de 3250, el protoítalo-celta (indoeuropeo occidental) se separó, convirtiéndose en protoítalo y protocelta alrededor de 2500 a. C.
Hacia el año 3000, el protoalbano-germánico se separó, pasando a ser albanés y protogermánico alrededor del año 2000.
Hacia el año 3000 el protogrecoarmenio (indoeuropeo meridional) se dividió, pasando a ser protogriego y protoarmenio alrededor de 1800.
El baltoeslavo apareció alrededor del año 2500, dividiéndose en protobáltico y protoeslavo alrededor del año 1000.
Finalmente, el protoindoeuropeo se convirtió en protoindoiraní (indoeuropeo oriental) alrededor de 2250.

Los árboles B y E ofrecen la alternativa del proto-germano-balto-eslavo (indoeuropeo septentrional), lo que convierte al albanés en una rama independiente. La única fecha que los autores avalan es la última, basada en la continuidad de la cultura Yamna , la cultura Andronovo y las culturas de habla indoaria conocidas. Todas las demás se describen como "estimación de la situación". ^[35]

Dada la filogenia de mejor compatibilidad, A, se requieren tres aristas de contacto para completar la compatibilidad. Este es el grupo de aristas con la menor cantidad de eventos de préstamo: ^[35]

En primer lugar, una frontera entre el protoitálico y el protogermánico, que debe haber comenzado después del año 2000, según el esquema de datación presentado.
Un segundo borde de contacto fue entre el protoitálico y el protogrecoarmenio, que debe haber comenzado después del año 2500.
El tercer borde de contacto es entre el protogermánico y el protobáltico, que debe haber comenzado después del año 1000.

Los autores describen el árbol A con los bordes descritos anteriormente como "nuestra mejor PPN". ^[36] En todas las PPN, está claro que, aunque las lenguas hijas iniciales se volvieron distintas en un aislamiento relativo, la evolución posterior de los grupos solo se puede explicar por la evolución en proximidad a otras lenguas con las que se produce un intercambio según el modelo de onda.

Véase también

Notas

^ ab List, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martin, William (2014). "Redes de préstamos léxicos y transferencia lateral de genes en la evolución del lenguaje y el genoma". BioEssays . 36 (2): 141–150. doi :10.1002/bies.201300096. ISSN 0265-9247. PMC 3910147 . PMID 24375688.
^ por François (2014).
^ ab Véase Bloomfield 1933, pág. 311; Heggarty y otros (2010); François (2014).
↑ San Agustín (1948). «XVI: 9–11». Ciudad de Dios .
^ Génesis 10:25
^ 1 Crónicas 1:19.
^ San Agustín (obispo de Hipona) (1871). Las obras de Aurelio Agustín: una nueva traducción. T. & T. Clark – vía Google Books .
^ Browne 1684, págs. 223–241
^ Browne 1684, pág. 224.
^ Browne 1684, pág. 225.
^ Browne 1684, pág. 228.
^ Browne 1684, págs. 226–228.
^ Howell, James (1688) [1645]. "Carta LVIII al Muy Honorable Conde R." Epistolae Ho-Elianae, Cartas familiares, domésticas y foráneas, divididas en cuatro libros, en parte históricas, políticas y filosóficas, sobre ocasiones emergentes . Vol. II (6.ª ed.). Londres: Thomas Guy. pág. 356.
^ Jones, William (1807) [1786], "Discurso del tercer aniversario sobre los hindúes", en Lord Teignmouth (ed.), The Works of Sir William Jones with the life of the Author, in Thirteen Volumes , vol. III, Londres: John Stockdale y John Walker, pág. 34
^ Young 1813, pág. 251
^ Young 1813, pág. 255
^ Grant, Robert (1813). Un bosquejo de la historia de la Compañía de las Indias Orientales, desde su primera formación hasta la aprobación de la Ley de Regulación de 1773; con una visión resumida de los cambios que han tenido lugar desde ese período en la administración interna de la India británica . Londres: Black, Parry, and Co. [etc.] pp. xxxiv–xxxv.
^ Williams, DM; Ebach, Malte C.; Nelson, Gareth J. (2008). Fundamentos de sistemática y biogeografía . Nueva York, NY: Springer. p. 45. ISBN. 9780387727288.
^ Darwin, Charles (1860). Sobre el origen de las especies por medio de la selección natural, o, La preservación de las razas favorecidas en la lucha por la vida. Londres: J. Murray. p. 422. Puede que valga la pena ilustrar esta visión de la clasificación tomando el caso de las lenguas Darwin.
^ Post, David G. (2009). En busca del alce de Jefferson: notas sobre el estado del ciberespacio . Oxford; Nueva York: Oxford University Press . pág. 125. ISBN. 978-0-19-534289-5.
^ Greenberg, Joseph H. (1990) [1954], "Un enfoque cuantitativo de la morfología tipológica del lenguaje", en Denning, Keith M.; Kemmer, Suzanne (eds.), Sobre el lenguaje: escritos seleccionados de Joseph H. Greenberg , Stanford: Stanford University Press , págs. 3-4
^ Greenberg, Joseph Harold (1971). Lenguaje, cultura y comunicación . Stanford: Stanford University Press . pág. 113. ISBN. 9780804707817.
^ Dixon, RMW (1997). El ascenso y la caída de las lenguas, de RMW Dixon. Cambridge Core. doi :10.1017/CBO9780511612060. ISBN 9780511612060. Recuperado el 26 de septiembre de 2017 .
^ ab Gray, Russell D.; Atkinson, Quentin D. (27 de noviembre de 2003). "Los tiempos de divergencia de los árboles lingüísticos respaldan la teoría anatolia del origen indoeuropeo". Nature . 426 (6965). Nature Publishing Group: 435–9. Bibcode :2003Natur.426..435G. doi :10.1038/nature02029. PMID 14647380. S2CID 42340 – vía Google Books .
^ "CPHL: Filogenética computacional en lingüística histórica". 2004–2012.
^ Zuckermann, Ghil'ad. 2009. "Hibridación versus revivibilidad: Causalidad múltiple, formas y patrones". Journal of Language Contact , Varia 2:40–67.
^ Nakhleh 2005, pág. 383.
^ Nakhleh 2005, págs. 384–385.
^ Los detalles técnicos de los algoritmos utilizados se detallan en Nakhleh 2005, Apéndice A. Los detalles del conjunto de datos se detallan en el Apéndice B.
^ Nakhleh 2005, págs. 388–391.
^ Nakhleh 2005, pág. 387.
^ Nakhleh 2005, pág. 396.
^ Nakhleh 2005, pág. 400.
^ Nakhleh 2005, pág. 398.
^Ab Nakhleh 2005, pág. 401.
^ Nakhleh 2005, pág. 407.

Bibliografía

Bloomfield, Leonard (1984) [1933]. Idioma . Chicago y Londres: University of Chicago Press .
Browne, Thomas (1852) [1684], "Tratados misceláneos; Misceláneas; Tratado 8, De idiomas, y particularmente de la lengua sajona", en Tenison, Thomas (ed.), The Works of Sir Thomas Browne , Bohn's Antiquarian Library, vol. III, Lincoln's Inn Fields: Cox (Brothers) y Wyman, págs. 223–241.
François, Alexandre (2014), "Árboles, ondas y vínculos: modelos de diversificación lingüística" (PDF) , en Bowern, Claire; Evans, Bethwyn (eds.), The Routledge Handbook of Historical Linguistics , Londres: Routledge , págs. 161–189, ISBN 978-0-41552-789-7.
Heggarty, Paul; Maguire, Warren; McMahon, abril (2010). "¿Divisiones u ondas? ¿Árboles o redes? Cómo las medidas de divergencia y el análisis de redes pueden desentrañar las historias de las lenguas". Philosophical Transactions of the Royal Society B . 365 (1559): 3829–3843. doi :10.1098/rstb.2010.0099. PMC 2981917 . PMID 21041208.
Nakhleh, Luay; Ringe, Don; Warnow, Tandy (2005). "Redes filogenéticas perfectas: una nueva metodología para reconstruir la historia evolutiva de las lenguas naturales" (PDF) . Lengua . 81 (2): 382–420. CiteSeerX 10.1.1.65.1791 . doi :10.1353/lan.2005.0078. S2CID 162958.
Young, Thomas (octubre de 1813). «Historia general de las lenguas de Adlung». The Quarterly Review . X (XIX Artículo XII). Londres: John Murray: 250–292.

Enlaces externos

Wikimedia Commons tiene medios relacionados con Gráficos y árboles de lenguaje .

Labov, William (2010). "15. La difusión de la lengua de un lugar a otro". Principios del cambio lingüístico . Vol. 3: Cognición y factores culturales. Reino Unido: Wiley-Blackwell – vía Scribd.^{[ enlace muerto permanente ]}
Santorini, Beatrice; Kroch, Anthony (2007). "Relaciones entre nodos". La sintaxis del lenguaje natural: una introducción en línea utilizando el programa Trees . Universidad de Pensilvania .