modelo de arbol

En lingüística histórica , el modelo de árbol (también Stammbaum , modelo genético o cladístico ) es un modelo de evolución de lenguas análogo al concepto de árbol genealógico , particularmente un árbol filogenético en la evolución biológica de las especies . Al igual que con las especies, se supone que cada lengua evolucionó a partir de una única lengua parental o "madre", con lenguas que comparten un ancestro común perteneciente a la misma familia lingüística .

Popularizado por el lingüista alemán August Schleicher en 1853, ^[1]^[2] el modelo de árbol siempre ha sido un método común para describir las relaciones genéticas entre lenguas desde los primeros intentos de hacerlo. Es fundamental para el campo de la lingüística comparada , que implica el uso de evidencia de lenguas conocidas y reglas observadas de la evolución de las características del lenguaje para identificar y describir las protolenguas hipotéticas ancestrales de cada familia de lenguas, como el protoindoeuropeo y el indoeuropeo. Lenguas europeas . Sin embargo, esto es en gran medida una búsqueda teórica y cualitativa, y los lingüistas siempre han enfatizado las limitaciones inherentes del modelo de árbol debido al gran papel que desempeña la transmisión horizontal en la evolución de la lengua, desde préstamos hasta lenguas criollas que tienen múltiples lenguas maternas. ^[1] El modelo ondulatorio fue desarrollado en 1872 por el alumno de Schleicher, Johannes Schmidt, como una alternativa al modelo de árbol que incorpora la transmisión horizontal. ^[3]

El modelo de árbol también tiene las mismas limitaciones que la taxonomía biológica con respecto al problema de las especies de cuantificar un fenómeno continuo que incluye excepciones como especies de anillos en biología y dialectos continuos en el lenguaje. El concepto de vínculo se desarrolló en respuesta y se refiere a un grupo de lenguas que evolucionaron a partir de un continuo dialectal en lugar de lenguas hijas lingüísticamente aisladas de una sola lengua. ^[2]

Historia

Antiguo Testamento y San Agustín

Agustín de Hipona supuso que cada uno de los descendientes de Noé fundó una nación y que a cada nación se le dio su propio idioma: asirio para Assur , hebreo para Heber , etc. ^[4] En total identificó 72 naciones, fundadores tribales y lenguas. La confusión y dispersión se produjo en tiempos de Peleg , hijo de Heber, hijo de Sem , hijo de Noé. ^[5]^[6] Agustín formuló una hipótesis no muy diferente a la de los lingüistas históricos posteriores, de que la familia de Heber "conservó esa lengua que no sin razón se creía que había sido la lengua común de la raza... en adelante llamada hebrea". Sin embargo, la mayoría de los 72 idiomas datan de muchas generaciones después de Heber. San Agustín resuelve este primer problema suponiendo que Heber, que vivió 430 años, todavía estaba vivo cuando Dios le asignó los 72. ^[7]^{: 123}

Ursprache, la lengua del paraíso

La hipótesis de San Agustín permaneció sin mayores dudas durante más de mil años. Luego, en una serie de tratados, publicados en 1684, expresando escepticismo respecto de diversas creencias, especialmente las bíblicas, Sir Thomas Browne escribió: ^[8]

"Aunque la tierra estaba ampliamente poblada antes del diluvio... sin embargo, si, después de una gran dispersión y durante el espacio de mil seiscientos años, los hombres mantuvieron un lenguaje tan uniforme en todas partes... bien puede dudarse".

Para entonces, el descubrimiento del Nuevo Mundo y la exploración del Lejano Oriente habían permitido conocer un número de nuevas lenguas muy superior a las 72 calculadas por San Agustín. Citando las lenguas nativas americanas, Browne sugiere que "al principio la confusión de lenguas recayó sólo sobre los presentes en Sinaar en la obra de Babel..." Para aquellos "al pie de las colinas, donde descansaba el arca... sus la lengua primitiva podría con el tiempo expandirse a varias partes de Europa y Asia..." ^[9] Esto es un indicio de un árbol. En opinión de Browne, la simplificación de un idioma aborigen más amplio que el hebreo podría explicar las diferencias en el idioma. Sugiere a los antiguos chinos, de los que los demás descendieron por "confusión, mezcla y corrupción". ^[10] Posteriormente invoca "commezcla y alteración". ^[11]

Browne informa sobre una serie de actividades reconstructivas realizadas por los estudiosos de la época: ^[12]

"El erudito Casaubon concibe que un diálogo podría componerse en sajón, sólo con palabras que sean derivables del griego... Verstegan no tuvo dudas de que podría idear una carta que pudiera ser entendida por los ingleses, holandeses y Frislandes Orientales. ... Y si, como sostiene el erudito Buxhornius , la lengua escita como lengua materna se extiende por todas las naciones de Europa, e incluso hasta Persia, la comunidad de muchas palabras, entre tantas naciones, tiene una traducción más razonable y más bien derivable de la lengua común difundida a través de todos ellos, que de cualquier nación en particular, que también ha tomado prestado y tiene pero de segunda mano."

De este modo se eliminó la confusión en la Torre de Babel como obstáculo al dejarla de lado. Los intentos de encontrar similitudes en todas las lenguas dieron como resultado el descubrimiento gradual de una antigua lengua maestra de la que derivan todas las demás lenguas. Sin duda, Browne escribió y pensó mucho antes de 1684. En ese mismo siglo revolucionario en Gran Bretaña, James Howell publicó el Volumen II de Epistolae Ho-Elianae , cartas casi ficticias a varias personas importantes del reino que contienen información histórica válida. En la Carta LVIII la metáfora de un árbol de lenguas aparece completamente desarrollada, sin llegar a ser la opinión de un lingüista profesional: ^[13]

"Ahora izaré velas hacia los Países Bajos, cuyo idioma es el mismo dialecto que el inglés, y lo fue desde el principio, ya que ambos derivan del alto holandés [Howell se equivoca aquí]: el danés también no es más que una rama. del mismo árbol... Ahora bien, el alto holandés o lengua teutónica, es una de las principales y más espaciosas lenguas maternas de Europa... era la lengua de los godos y vándalos , y continúa aún en la mayor parte de Polonia y Hungría , que tiene un dialecto suyo como lengua vulgar... Algunos de sus escritores harían creer a este mundo que ella era la lengua que se hablaba en el paraíso."

La búsqueda de "la lengua del paraíso" estaba en marcha entre todos los lingüistas de Europa. Quienes escribieron en latín la llamaron lingua prima , lingua primaeva o lingua primigenia. En inglés era la lengua adámica; en alemán, la Ursprache o la hebräische Ursprache si se creía que era hebreo. Este lenguaje misterioso tenía un aura de pureza e incorrupción, y esas cualidades eran los estándares utilizados para seleccionar candidatos. Este concepto de Ursprache se empezó a utilizar mucho antes de que los neogramáticos lo adoptaran para sus protolenguas. La brecha entre familias de lenguas tan divergentes seguía sin cerrarse. ^{[ cita necesaria ]}

Modelo indoeuropeo

El 2 de febrero de 1786, Sir William Jones pronunció su discurso del tercer aniversario ante la Sociedad Asiática como presidente sobre el tema de los hindúes . En él aplicó la lógica del modelo de árbol a tres lenguas, el griego, el latín y el sánscrito, pero por primera vez en la historia sobre bases puramente lingüísticas, observando "una afinidad más fuerte, tanto en las raíces de los verbos como en las formas de los verbos". gramática, que posiblemente podría haber sido producida por accidente..." Continuó postulando que surgieron de "alguna fuente común, que, tal vez, ya no existe". A ellos añadió el gótico, el celta y el persa como "de la misma familia". ^[14]

Jones no nombró su "fuente común" ni desarrolló más la idea, pero fue retomada por los lingüistas de la época. En la Quarterly Review (de Londres) de finales de 1813-1814, Thomas Young publicó una reseña de Mithridates, oder allgemeine Sprachenkunde ("Mithridates, o una historia general de las lenguas") de Johann Christoph Adelung , cuyo volumen I había aparecido en 1806, y volúmenes II y III, 1809-1812 , continuados por Johann Severin Vater. El trabajo de Adelung describió unos 500 "idiomas y dialectos" y planteó la hipótesis de un descenso universal desde el idioma del paraíso, ubicado en Cachemira central, hasta el rango total de los 500. Young comienza señalando la deuda de Adelung con Mitrídates , de Differentiis Linguarum de Conrad Gesner. de 1555 y otros catálogos posteriores de lenguas y alfabetos. ^[15]

Cachemira (rojo), la ubicación del Edén en Adelung

Young se compromete a presentar la clasificación de Adelung. El tipo monosilábico es el más antiguo y primitivo, se habla en Asia, al este del Edén, en la dirección de la salida de Adán del Edén. Luego sigue el grupo de Jones, aún sin nombre, pero atribuido a Jones: "Otra clase antigua y extensa de lenguas unidas por un mayor número de semejanzas que bien pueden ser completamente accidentales". Para esta clase ofrece un nombre, ^[16] "indoeuropeo", el primer uso lingüístico conocido de la palabra, pero no el primer uso conocido. La Compañía Británica de las Indias Orientales utilizaba "comercio indoeuropeo" para referirse al comercio de mercancías entre la India y Europa. ^[17] Toda la evidencia que cita Young para el grupo ancestral son las palabras más similares: madre, padre, etc.

Las clases adicionales de Adelung fueron los tártaros, los africanos y los americanos, que dependen de la geografía y de una supuesta ascendencia del Edén. Young no comparte el entusiasmo de Adelung por el lenguaje del paraíso y lo califica de principalmente especulativo. ^{[ cita necesaria ]}

La designación de Young, exitosa en inglés, fue sólo una de varias candidatas propuestas entre 1810 y 1867: indo-germanique ( Conrad Malte-Brun , 1810), japetisk ( Rasmus Christian Rask , 1815), Indo-germanisch ( Julius Klaproth , 1823), indisch-teutsch (F. Schmitthenner, 1826), sanskritisch ( Wilhelm von Humboldt , 1827), indokeltisch (AF Pott, 1840), arioeuropeo ( Graziadio Isaia Ascoli , 1854), ario ( Max Müller , 1861) y aryaque (H. Chavée , 1867). Todos estos hombres eran políglotas y prodigios de las lenguas. (Klaproth, por ejemplo, el autor del exitoso candidato en lengua alemana, Indo-germanisch, que criticó a Jones por su método acrítico, conocía chino, japonés, tibetano y varios otros idiomas con sus escrituras). Ursprache apeló a su imaginación. A medida que la esperanza de encontrarlo se desvanecía gradualmente, recurrieron al creciente concepto de indoeuropeo común hablado por tribus nómadas en las llanuras de Eurasia, y aunque argumentaron que este idioma se puede deducir mediante los métodos de la lingüística comparada, en De hecho, no fue así como lo obtuvieron. Fue el único caso en el que sus esfuerzos por encontrar a la Ursprache tuvieron éxito. ^{[ cita necesaria ]}

Modelo neogramático

El modelo se debe en su formulación más estricta a los neogramáticos . El modelo se basa en concepciones anteriores de William Jones , Franz Bopp y August Schleicher añadiendo la ausencia de excepciones de las leyes sólidas y la regularidad del proceso. El lingüista quizás más responsable de establecer el vínculo con el darwinismo fue August Schleicher.

Que estaba comparando su Stammbaum , o árbol genealógico de las lenguas, con la presentación de la evolución de Darwin poco después de esa presentación, lo prueba la carta abierta que escribió en 1863 a Ernst Haeckel , aunque publicada póstumamente. En 1869, Haeckel le había sugerido leer El origen de las especies . ^{[ cita necesaria ]}

Después de leerlo, Schleicher escribió Die Darwinische Theorie und die Sprachwissenschaft , "El darwinismo puesto a prueba por la ciencia del lenguaje". ^[18] En un escenario que recuerda al entre Darwin y Wallace sobre el descubrimiento de la evolución (ambos la descubrieron de forma independiente), Schleicher respaldó la presentación de Darwin, pero la criticó por no insertar ninguna especie. Luego presentó un Stammbaum de las lenguas, que, sin embargo, no fue el primero que publicó. ^{[ cita necesaria ]}

La evolución de las lenguas no fue la fuente de la teoría de la evolución de Darwin. Se basó en la variación de especies, como la que había observado en los pinzones de las Islas Galápagos , que parecían ser modificaciones de un ancestro común. La selección de especies domésticas para producir una nueva variedad también influyó en sus conclusiones. La primera edición de El origen de las especies de 1859 analiza el árbol de lenguas como si fuera de novo bajo el tema de la clasificación. Darwin critica el método sincrónico ideado por Linneo , sugiriendo que sea sustituido por una "disposición natural" basada en la evolución. ^{[ cita necesaria ]} Él dice: ^[19]

"Quizás valga la pena ilustrar este punto de vista de la clasificación tomando el caso de las lenguas. Si poseyéramos un pedigrí perfecto de la humanidad, una disposición genealógica de las razas humanas permitiría la mejor clasificación de las diversas lenguas que ahora se hablan en todo el mundo. y si tuvieran que incluirse todas las lenguas extintas y todos los dialectos intermedios y que cambian lentamente, creo que tal disposición sería la única posible. Sin embargo, podría ser que alguna lengua muy antigua hubiera cambiado poco y hubiera cambiado. dio lugar a pocas lenguas nuevas, mientras que otras (debido a la difusión y posterior aislamiento y estados de civilización de las diversas razas, descendientes de una raza común) habían alterado mucho y habían dado lugar a muchas lenguas y dialectos nuevos. de diferencia en las lenguas de la misma cepa, tendría que expresarse por grupos subordinados a grupos; pero la disposición adecuada o incluso la única posible seguiría siendo genealógica y esto sería estrictamente natural, ya que conectaría todas las lenguas extintas; y moderno, por las más estrechas afinidades, y daría la filiación y origen de cada lengua."

Schleicher nunca había oído hablar de Darwin antes de que Haeckel le llamara la atención. Había publicado su propio trabajo sobre el Stammbaum en un artículo de 1853, seis años antes de la primera edición de El origen de las especies en 1859. El concepto de descendencia de lenguas no era en modo alguno nuevo. Thomas Jefferson , un lingüista devoto, había propuesto que la continua necesidad de neologismos implica que las lenguas deben "progresar" o "avanzar". ^[20] Estas ideas presagian la evolución de especies biológicas o lenguas, pero después del contacto de Schleicher con las ideas de Darwin, y quizás el contacto de Darwin con los lingüistas históricos, la evolución y el cambio de lengua estuvieron inextricablemente vinculados y se convertirían en la base de la clasificación. Ahora, como entonces, los principales problemas serían demostrar líneas de descendencia específicas e identificar los puntos de ramificación. ^{[ cita necesaria ]}

árbol filogenético

Joseph Harold Greenberg le dio a la antigua metáfora un significado completamente nuevo bajo el antiguo nombre en una serie de ensayos que comenzaron alrededor de 1950. Desde la adopción de la metáfora del árbol genealógico por los lingüistas, el concepto de evolución había sido propuesto por Charles Darwin y fue generalmente aceptado en biología. La taxonomía , la clasificación de los seres vivos, ya había sido inventada por Carl Linneo . Utilizó una nomenclatura binomial para asignar un nombre de especie y un nombre de género a cada organismo vivo conocido. Estos estaban organizados en una jerarquía biológica bajo varios filos , o grupos más generales, ramificándose en última instancia en diversas especies. La base de esta clasificación biológica fueron las características físicas compartidas observadas de la especie. ^{[ cita necesaria ]}

Darwin, sin embargo, reviviendo otra metáfora antigua, el árbol de la vida , planteó la hipótesis de que los grupos de la clasificación de Linneo ( los taxones actuales ) descendieron en una estructura de árbol a lo largo del tiempo, desde los más simples a los más complejos. El árbol jerárquico de Linneo era sincrónico; Darwin imaginó un proceso diacrónico de descendencia común . Donde Linneo había concebido rangos , que eran consistentes con la gran cadena de ser adoptada por los racionalistas , Darwin concibió linajes . Durante las décadas posteriores a Darwin quedó claro que los rangos de la jerarquía de Linneo no correspondían exactamente a los linajes. El objetivo principal de la taxonomía se convirtió en descubrir los linajes y alterar la clasificación para reflejarlos, lo que hizo bajo la guía general de los Códigos de Nomenclatura , libros de reglas mantenidos por organizaciones internacionales para autorizar y publicar propuestas para reclasificar especies y otros taxones. El nuevo enfoque se denominó filogenia , la "generación de filos", y ideó una nueva metáfora del árbol, el árbol filogenético . Una unidad en el árbol y todas sus unidades descendientes eran un clado y el descubrimiento de los clados fue cladística . ^{[ cita necesaria ]}

Greenberg comenzó a escribir durante una época en la que la sistemática filogenética carecía de las herramientas disponibles más tarde: la computadora (sistemática computacional) y la secuenciación del ADN ( sistemática molecular ). Para descubrir una relación cladística, los investigadores se basaron en un número tan grande de similitudes morfológicas entre especies como fue posible definir y tabular. Estadísticamente, cuanto mayor era el número de similitudes, más probable era que las especies pertenecieran al mismo clado. Este enfoque atrajo a Greenberg, que estaba interesado en descubrir universales lingüísticos . Alterando el modelo de árbol para convertir el árbol genealógico en un árbol filogenético, dijo: ^[21]

"Cualquier lengua consta de miles de formas con sonido y significado... cualquier sonido puede expresar cualquier significado. Por lo tanto, si dos lenguas coinciden en un número considerable de tales elementos... necesariamente sacamos una conclusión de origen histórico común Tales clasificaciones genéticas no son arbitrarias... la analogía aquí con la clasificación biológica es extremadamente cercana... así como en biología clasificamos especies en el mismo género o unidad superior porque las semejanzas son tales que sugieren una hipótesis de descendencia común. lo mismo ocurre con las hipótesis genéticas en el lenguaje".

En esta analogía, una familia de lenguas es como un clado , las lenguas son como especies , la protolengua es como un taxón ancestro , el árbol de lenguas es como un árbol filogenético y las lenguas y dialectos son como especies y variedades. Greenberg formuló grandes tablas de características de lenguas hasta entonces olvidadas de África, América, Indonesia y el norte de Eurasia y las clasificó según sus similitudes. Llamó a este enfoque " clasificación tipológica ", a la que llegó mediante la lingüística descriptiva más que mediante la lingüística comparada . ^[22]

Fechas y glotocronología

Los lingüistas históricos han utilizado el método comparativo para reconstruir modelos de árboles utilizando datos léxicos, morfológicos y fonológicos discretos. Se puede encontrar la cronología, pero no hay estimaciones de fechas absolutas utilizando este sistema.

La glotocronología permite estimar fechas absolutas. Los cognados compartidos (cognados que significan tener un origen histórico común) se calculan tiempos de divergencia. Sin embargo, se descubrió que el método quedó desacreditado posteriormente debido a que los datos no eran fiables. Debido a esto, los lingüistas históricos tienen problemas con la estimación exacta de la edad al determinar la edad de la familia de lenguas indoeuropeas. Podría oscilar entre 4000 BP y 40 000 BP, o en cualquier punto intermedio entre esas fechas, según Dixon, basándose en el ascenso y la caída del lenguaje (Cambridge University Press). ^[23] Como se ve en el artículo aquí. ^[24]

Se avecinan posibles soluciones para la glotocronología gracias a métodos filogenéticos computacionales . Técnicas como el uso de modelos de evolución mejoran la precisión de la longitud y la topología de las ramas de los árboles. Por lo tanto, el uso de métodos filogenéticos computacionales permite a los investigadores analizar datos lingüísticos de la biología evolutiva. Esto ayuda aún más a contrastar teorías entre sí, como la teoría de Kurgan y la teoría de Anatolia, ambas afirmando orígenes de lenguas infoeuropeas. ^[24]

Filogenética computacional en lingüística histórica.

El método comparativo compara características de varios idiomas para evaluar qué tan similar es un idioma a otro. Los resultados de dicha evaluación se basan en datos; es decir, los resultados dependen de la cantidad de características y la cantidad de idiomas comparados. Hasta la llegada de la computadora al panorama de la lingüística histórica, las cifras en ambos casos eran necesariamente pequeñas. El efecto fue intentar representar una fotografía utilizando una pequeña cantidad de píxeles grandes o unidades de imagen. Las limitaciones del modelo de árbol eran demasiado evidentes, lo que dio lugar a quejas de los principales lingüistas históricos. ^{[ cita necesaria ]}

A finales del siglo XX, los lingüistas comenzaron a utilizar software destinado a la clasificación biológica para clasificar lenguas. Los programas y métodos se volvieron cada vez más sofisticados. A principios del siglo XXI, el proyecto Filogenética Computacional en Lingüística Histórica (CPHL), un consorcio de lingüistas históricos, recibió financiación de la Fundación Nacional de Ciencias para estudiar filogenias. ^[25] La familia indoeuropea es un importante tema de estudio. En enero de 2012, habían recopilado y codificado una base de datos "seleccionada" de "22 caracteres fonológicos, 13 caracteres morfológicos y 259 caracteres léxicos" y una base de datos no seleccionada de más. Se incluyen listas de palabras de 24 idiomas indoeuropeos. Un mayor número de funciones y lenguajes aumenta la precisión, siempre que cumplan ciertos criterios. Utilizando software informático especializado, prueban varias hipótesis filogenéticas sobre su capacidad para explicar los caracteres por descendencia genética. ^{[ cita necesaria ]}

Limitaciones del modelo

Una limitación endémica del modelo de árbol es la presunción fundamental en la que se basa: requiere una clasificación basada en lenguas o, más generalmente, en variedades de lenguas . Dado que una variedad representa una abstracción de la totalidad de características lingüísticas , existe la posibilidad de pérdida de información durante la traducción de datos (de un mapa de isoglosas ) a un árbol. Por ejemplo, está la cuestión de los continuos dialectales . Proporcionan variedades que no son inequívocamente una lengua u otra sino que contienen rasgos característicos de más de una. La cuestión de cómo deben clasificarse es similar a la cuestión que presentan las especies en anillo al concepto de clasificación de especies en biología. ^{[ cita necesaria ]}

Las limitaciones del modelo de árbol, en particular su incapacidad para manejar la distribución no discreta de innovaciones compartidas en dialectos continuos , se han abordado mediante el desarrollo de metodologías no cladísticas (no basadas en árboles). Incluyen el modelo Wave ; y más recientemente, el concepto de vinculación . ^[3]

Una limitación adicional del modelo de árbol involucra lenguajes mixtos e híbridos, así como la mezcla de lenguajes en general, ya que el modelo de árbol solo permite divergencias. Por ejemplo, según Zuckermann (2009:63), ^[26] "israelí", su término para designar al hebreo moderno , al que considera un híbrido semitoeuropeo, "demuestra que la realidad de la génesis lingüística es mucho más compleja que una simple El sistema de árbol genealógico lo permite. Es poco probable que las lenguas 'revividas' tengan un solo padre".

Filogenias perfectas

El propósito del software filogenético es generar cladogramas , un tipo especial de árbol en el que los enlaces sólo se bifurcan; es decir, en cualquier nodo en la misma dirección sólo se ofrecen dos ramas. Los datos de entrada son un conjunto de caracteres a los que se les pueden asignar estados en diferentes idiomas, como presente (1) o ausente (0). Por lo tanto, un idioma puede describirse mediante un conjunto de coordenadas único que consta de los valores de estado de todos los caracteres considerados. Estas coordenadas pueden ser iguales o menos parecidas. Los idiomas que comparten la mayoría de los estados son los más parecidos entre sí. ^{[ cita necesaria ]}

El software analiza todos los estados de todos los caracteres de todos los idiomas mediante uno de varios métodos matemáticos para lograr una comparación por pares de cada idioma con el resto. Luego construye un cladograma basado en grados de similitud; por ejemplo, se supone que las lenguas hipotéticas, a y b, que son las más cercanas entre sí, tienen un ancestro común, ab. Se supone que la siguiente lengua más cercana, c, tiene un ancestro común con ab, y así sucesivamente. El resultado es una serie proyectada de caminos históricos que van desde el ancestro común general (la raíz) hasta las lenguas (las hojas). Cada camino es único. No hay vínculos entre caminos. Cada hoja y nodo tiene un solo ancestro. Todos los estados son descendientes de otros estados. Un cladograma que cumple con estos requisitos es una filogenia perfecta. ^[27]

Al principio parecía haber poca coherencia en los resultados de los ensayos que variaban los factores supuestamente relevantes. De cualquier cambio resultó un nuevo cladograma, lo que sugería que el método no capturaba la evolución subyacente de las lenguas, sino que sólo reflejaba los juicios extemporáneos de los investigadores. Para encontrar los factores que influyeban en la filogenia, los investigadores necesitaban tener alguna medida de la precisión de sus resultados; es decir, los resultados debían calibrarse con respecto a filogenias conocidas. Realizaron el experimento utilizando diferentes suposiciones buscando las que producirían las coincidencias más cercanas con las filogenias indoeuropeas más seguras. Esos supuestos podrían utilizarse con mayor confianza en áreas problemáticas de la filogenia indoeuropea. ^{[ cita necesaria ]}

Para obtener una filogenia razonablemente válida, los investigadores descubrieron que necesitaban ingresar como entrada los tres tipos de caracteres: fonológicos, léxicos y morfológicos, todos los cuales debían presentar una imagen suficientemente detallada para el cálculo de la filogenia. Sólo los caracteres cualitativos produjeron resultados significativos. Los estados repetidos eran demasiado ambiguos para que el software los interpretara correctamente; por lo tanto, los personajes que estaban sujetos a una formación posterior y un desarrollo paralelo, que revertían un personaje a un estado anterior o adoptaban un estado que evolucionó en otro personaje, respectivamente, fueron seleccionados del conjunto de datos de entrada. ^[28]

Redes filogenéticas perfectas

A pesar de su cuidado de codificar los mejores caracteres cualitativos en cantidades suficientes, los investigadores no pudieron obtener filogenias perfectas para algunos grupos, como los germánicos y albaneses dentro del indoeuropeo. Razonaron que se habían tomado prestados un número significativo de caracteres, que no podían explicarse por la descendencia genética del ancestro calculado del grupo. Presumiblemente, si el modelo ondulatorio , que explicaba el préstamo, fuera una explicación completa de los caracteres del grupo, no se podría encontrar filogenia alguna para él. Si ambos modelos fueran parcialmente efectivos, entonces existiría un árbol, pero necesitaría complementarse con explicaciones no genéticas. Por lo tanto, los investigadores modificaron el software y el método para incluir la posibilidad de pedir prestado. ^[29]

Los investigadores introdujeron en el experimento el concepto de interfaz, o límite permitido sobre el cual fluirían los estados de los caracteres. Existía una interfaz unidireccional, o borde, entre un padre y un hijo. Si sólo los límites unidireccionales fueran suficientes para explicar la presencia de todos los estados en una lengua, entonces no habría necesidad de mirar más allá de la filogenia perfecta. De lo contrario, se podrían agregar a la filogenia uno o más bordes de contacto, o interfaces bidireccionales. Por lo tanto, una lengua puede tener más de una fuente de estados: la lengua madre o una lengua de contacto. ^{[ cita necesaria ]}

Un árbol así modificado ya no era un árbol como tal: podía haber más de un camino desde la raíz hasta la hoja. Los investigadores llamaron a esta disposición red. Los estados de un carácter todavía evolucionaban a lo largo de un camino único desde la raíz hasta la hoja, pero su origen podría ser la raíz bajo consideración o un lenguaje de contacto. Si la red podía explicar todos los estados del experimento, se la denominó red filogenética perfecta. ^[30]

Compatibilidad y viabilidad

La generación de redes requirió dos fases. En la primera fase, los investigadores idearon una serie de filogenias, llamadas árboles candidatos, para probar su compatibilidad. Un carácter es compatible cuando su origen se explica por la filogenia generada. ^[31] En una filogenia perfecta, todos los caracteres son compatibles y la compatibilidad del árbol es del 100%. Según el principio de parsimonia, o la navaja de Occam , no se garantiza ninguna red. Los árboles candidatos se obtuvieron ejecutando primero el software de generación de filogenia utilizando el conjunto de datos indoeuropeos (las cadenas de estados de caracteres) como entrada, y luego modificando el árbol resultante para incluir otras hipótesis que se probarían. ^{[ cita necesaria ]}

Ninguno de los árboles candidatos originales eran filogenias perfectas, aunque algunos de los subárboles dentro de ellos sí lo eran. La siguiente fase fue generar redes a partir de los árboles con puntuaciones de compatibilidad más altas agregando interfaces una a la vez, seleccionando la interfaz de mayor compatibilidad, hasta obtener la suficiencia; es decir, la compatibilidad de la red era máxima. Al final resultó que, la cantidad de redes compatibles generadas podía variar desde ninguna hasta más de una docena. Sin embargo, no todas las interfaces posibles fueron históricamente factibles. Las interfaces entre algunas lenguas no eran muy probables desde el punto de vista geográfico y cronológico. Al inspeccionar los resultados, los investigadores excluyeron las interfaces no factibles hasta que quedó una lista de las únicas redes factibles, que pudieron ordenarse en orden de puntuación de compatibilidad. ^{[ cita necesaria ]}

La red más factible para los indoeuropeos

Los investigadores comenzaron con cinco árboles candidatos para indoeuropeo, denominados AE, uno generado a partir del software filogenético, dos modificaciones del mismo y dos sugeridos por Craig Melchert , un lingüista histórico e indoeuropeista. Los árboles se diferenciaban principalmente en la ubicación del grupo más ambiguo, las lenguas germánicas y el albanés, que no tenían suficientes caracteres distintivos para ubicarlo exactamente. El árbol A contenía 14 caracteres incompatibles; B, 19; C, 17; D, 21; E,18. Los árboles A y C tuvieron las mejores puntuaciones de compatibilidad. Todas las incompatibilidades eran léxicas y las A eran un subconjunto de las C. ^[32]

La generación posterior de redes descubrió que todas las incompatibilidades se podían resolver con un mínimo de tres bordes de contacto, excepto el árbol E. Como no tenía una alta compatibilidad, se excluyó. El árbol A tenía 16 redes posibles, que una inspección de viabilidad redujo a tres. El árbol C tenía una red, pero como requería una interfaz con el Báltico y no con el Eslavo, no era factible. ^[33]

El árbol A, el árbol más compatible y factible, plantea la hipótesis de siete grupos que se separaron del protoindoeuropeo entre aproximadamente 4000 a. C. y 2250 a. C., de la siguiente manera. ^[34]

La primera en separarse fue Anatolia, alrededor del 4000 a.C.
Tocharian siguió alrededor del 3500 a.C.
Poco después, alrededor del año 3250, el protoítalo-celta (indoeuropeo occidental) se separó, convirtiéndose en protoitálico y protocelta alrededor del 2500 a.C.
Aproximadamente en el año 3000, el protoalbano-germánico se separó, convirtiéndose en albanés y protogermánico aproximadamente en el año 2000.
Aproximadamente en el año 3000, los protogrecoarmenios (indoeuropeos del sur) se dividieron, convirtiéndose en protogriegos y protoarmenios aproximadamente en 1800.
El baltoeslavo apareció alrededor del año 2500, dividiéndose en protobáltico y protoeslavo alrededor del año 1000.
Finalmente, el protoindoeuropeo se convirtió en protoindoiraní (indoeuropeo oriental) alrededor del año 2250.

Los árboles B y E ofrecen la alternativa del protogermano-baltoeslavo (indoeuropeo del norte), lo que convierte al albanés en una rama independiente. La única fecha de la que los autores dan fe es la última, basándose en la continuidad de la cultura Yamna , la cultura Andronovo y las culturas de habla indo-aria conocidas. Todos los demás se describen como "estimación". ^[35]

Dada la filogenia de mejor compatibilidad, A, se requieren tres bordes de contacto para completar la compatibilidad. Este es el grupo de aristas con el menor número de eventos de endeudamiento: ^[35]

En primer lugar, una brecha entre el protoitálico y el protogermánico, que debió comenzar después del año 2000, según el esquema de datación proporcionado.
Un segundo contacto se produjo entre el protoitálico y el protogreco-armenio, que debió comenzar después del 2500.
El tercer borde de contacto es entre el protogermánico y el protobáltico, que debe haber comenzado después del año 1000.

Los autores describen el árbol A con los bordes descritos anteriormente como "nuestro mejor PPN". ^[36] En todas las PPN, está claro que aunque las lenguas hijas iniciales se volvieron distintas en relativo aislamiento, la evolución posterior de los grupos sólo puede explicarse por la evolución en la proximidad de otras lenguas con las que se produce un intercambio mediante el modelo ondulatorio.

Ver también

Notas

^ Lista ab, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martín, William (2014). "Redes de préstamo léxico y transferencia lateral de genes en el lenguaje y la evolución del genoma". Bioensayos . 36 (2): 141-150. doi :10.1002/bies.201300096. ISSN 0265-9247. PMC 3910147 . PMID 24375688.
^ ab François (2014).
^ ab Véase Bloomfield 1933, p. 311; Heggarty et al. (2010); François (2014).
↑ San Agustín (1948). "XVI: 9-11". Ciudad de dios .
^ Génesis 10:25
^ 1 Crónicas 1:19.
^ San Agustín (obispo de Hipona) (1871). Las obras de Aurelio Agustín: una nueva traducción. T. y T. Clark - a través de Google Books .
^ Browne 1684, págs. 223-241
^ Browne 1684, pag. 224.
^ Browne 1684, pag. 225.
^ Browne 1684, pag. 228.
^ Browne 1684, págs. 226-228.
^ Howell, James (1688) [1645]. "Carta LVIII al Muy Honorable Conde R.". Epistolae Ho-Elianae, cartas familiares, domésticas y antiguas, divididas en cuatro libros, en parte históricas, políticas, filosóficas, sobre ocasiones emergentes . vol. II (6ª ed.). Londres: Thomas Guy. pag. 356.
^ Jones, William (1807) [1786], "Discurso del tercer aniversario, sobre los hindúes", en Lord Teignmouth (ed.), Las obras de Sir William Jones con la vida del autor, en trece volúmenes , vol. III, Londres: John Stockdale y John Walker, pág. 34
^ Joven 1813, pag. 251
^ Joven 1813, pag. 255
^ Conceder, Robert (1813). Un bosquejo de la historia de la Compañía de las Indias Orientales, desde su primera formación hasta la aprobación de la ley reguladora de 1773; con una visión resumida de los cambios que han tenido lugar desde ese período en la administración interna de la India británica . Londres: Black, Parry y Co. [etc.] págs. xxxiv–xxxv.
^ Williams, DM; Ebach, Malta C.; Nelson, Gareth J. (2008). Fundamentos de sistemática y biogeografía . Nueva York, Nueva York: Springer. pag. 45.ISBN 9780387727288.
^ Darwin, Charles (1860). Sobre el origen de las especies por medio de la selección natural, o, La preservación de las razas favorecidas en la lucha por la vida. Londres: J. Murray. pag. 422. Puede que valga la pena ilustrar esta visión de la clasificación tomando el caso de las lenguas de Darwin.
^ Publicación, David G. (2009). En busca del alce de Jefferson: notas sobre el estado del ciberespacio . Oxford; Nueva York: Oxford University Press . pag. 125.ISBN 978-0-19-534289-5.
^ Greenberg, Joseph H. (1990) [1954], "Un enfoque cuantitativo de la morfología tipológica del lenguaje", en Denning, Keith M.; Kemmer, Suzanne (eds.), Sobre el lenguaje: escritos seleccionados de Joseph H. Greenberg , Stanford: Stanford University Press , págs.
^ Greenberg, Joseph Harold (1971). Lengua, cultura y comunicación . Stanford: Prensa de la Universidad de Stanford . pag. 113.ISBN 9780804707817.
^ Dixon, RMW (1997). El ascenso y la caída de las lenguas por RMW Dixon. Núcleo de Cambridge. doi :10.1017/CBO9780511612060. ISBN 9780511612060. Consultado el 26 de septiembre de 2017 .
^ ab Gray, Russell D.; Atkinson, Quentin D. (27 de noviembre de 2003). "Los tiempos de divergencia del árbol del lenguaje respaldan la teoría de Anatolia del origen indoeuropeo". Naturaleza . 426 (6965). Grupo editorial de la naturaleza: 435–9. Código Bib :2003Natur.426..435G. doi : 10.1038/naturaleza02029. PMID 14647380. S2CID 42340 - a través de Google Books .
^ "CPHL: filogenética computacional en lingüística histórica". 2004-2012.
^ Zuckermann, Ghil'ad. 2009. "Hybridity versus revivability: causalidad múltiple, formas y patrones". Revista de contacto lingüístico , Varia 2:40–67.
^ Nakhleh 2005, pág. 383.
^ Nakhleh 2005, págs. 384–385.
^ Los detalles técnicos de los algoritmos utilizados se indican en Nakhleh 2005, Apéndice A. Los detalles del conjunto de datos se indican en el Apéndice B.
^ Nakhleh 2005, págs. 388–391.
^ Nakhleh 2005, pág. 387.
^ Nakhleh 2005, pág. 396.
^ Nakhleh 2005, pág. 400.
^ Nakhleh 2005, pág. 398.
^ ab Nakhleh 2005, pág. 401.
^ Nakhleh 2005, pág. 407.

Bibliografía

Bloomfield, Leonard (1984) [1933]. Idioma . Chicago y Londres: University of Chicago Press .
Browne, Thomas (1852) [1684], "Miscellany Tracts; Miscellanies; Tract 8, Of Languages, and Particularly of the Saxon Tongue", en Tenison, Thomas (ed.), The Works of Sir Thomas Browne , Biblioteca de anticuarios de Bohn, vol. III, Lincoln's Inn Fields: Cox (hermanos) y Wyman, págs. 223-241.
François, Alexandre (2014), "Árboles, ondas y vínculos: modelos de diversificación del lenguaje" (PDF) , en Bowern, Claire; Evans, Bethwyn (eds.), The Routledge Handbook of Historical Linguistics , Londres: Routledge , págs. 161–189, ISBN 978-0-41552-789-7.
Heggarty, Paul; Maguire, Warren; McMahon, abril (2010). "¿Divisiones u ondas? ¿Árboles o redes? Cómo las medidas de divergencia y el análisis de redes pueden desentrañar las historias de las lenguas". Transacciones filosóficas de la Royal Society B. 365 (1559): 3829–3843. doi :10.1098/rstb.2010.0099. PMC 2981917 . PMID 21041208.
Nakhleh, Luay; Ringe, Don; Warnow, Tandy (2005). "Redes filogenéticas perfectas: una nueva metodología para reconstruir la historia evolutiva de las lenguas naturales" (PDF) . Idioma . 81 (2): 382–420. CiteSeerX 10.1.1.65.1791 . doi :10.1353/lan.2005.0078. S2CID 162958.
Young, Thomas (octubre de 1813). "Historia general de las lenguas de Adlung". La revisión trimestral . X (XIX Artículo XII). Londres: John Murray: 250–292.

enlaces externos

Wikimedia Commons tiene medios relacionados con tablas y árboles de idiomas .

Labov, William (2010). "15. La difusión del lenguaje de un lugar a otro". Principios del cambio lingüístico . vol. 3: Cognición y Factores Culturales. Reino Unido: Wiley-Blackwell - vía Scribd.^{[ enlace muerto permanente ]}
Santorini, Beatriz; Kroch, Antonio (2007). "Relaciones de nodo". La sintaxis del lenguaje natural: una introducción en línea utilizando el programa Trees . Universidad de Pennsylvania .