Una familia lingüística es un grupo de lenguas relacionadas a través de la descendencia de un ancestro común, llamado protolengua de esa familia. El término familia es una metáfora tomada de la biología, con el modelo de árbol utilizado en lingüística histórica análogo a un árbol genealógico , o a los árboles filogenéticos de taxones utilizados en taxonomía evolutiva . Los lingüistas describen así las lenguas hijas dentro de una familia lingüística como relacionadas genéticamente . [1] La divergencia de una protolengua en lenguas hijas ocurre típicamente a través de la separación geográfica, con diferentes dialectos regionales de la protolengua experimentando diferentes cambios lingüísticos y, por lo tanto, convirtiéndose en lenguas distintas con el tiempo. [2]
Un ejemplo bien conocido de una familia de lenguas son las lenguas romances , que incluyen el español , el francés , el italiano , el portugués , el rumano , el catalán y muchas otras, todas las cuales descienden del latín vulgar . [nota 1] [3] La familia romance en sí es parte de la familia indoeuropea más grande, que incluye muchas otras lenguas nativas de Europa y el sur de Asia , todas ellas se cree que descienden de un ancestro común conocido como protoindoeuropeo .
Se suele decir que una familia lingüística contiene al menos dos lenguas, aunque a veces se hace referencia a las lenguas aisladas (lenguas que no están relacionadas con ninguna otra lengua) como familias que contienen una lengua. A la inversa, no existe un límite superior para el número de lenguas que puede contener una familia. Algunas familias, como las lenguas austronesias , contienen más de 1000. [4]
Las familias lingüísticas pueden identificarse a partir de características compartidas entre lenguas. Los cambios de sonido son una de las pruebas más sólidas que se pueden utilizar para identificar una relación genética debido a su naturaleza predecible y consistente, y a través del método comparativo se pueden utilizar para reconstruir protolenguas. Sin embargo, las lenguas también pueden cambiar a través del contacto lingüístico , lo que puede sugerir falsamente relaciones genéticas. Por ejemplo, las lenguas mongólica , tungusica y turca comparten una gran cantidad de similitudes que llevan a varios investigadores a creer que estaban relacionadas . Estas supuestas relaciones se descubrieron más tarde como derivadas del contacto lingüístico y, por lo tanto, no están realmente relacionadas. [5] Sin embargo, con el tiempo, las altas cantidades de contacto lingüístico y los cambios inconsistentes harán que sea esencialmente imposible derivar más relaciones; incluso la familia lingüística más antigua, la afroasiática , es mucho más joven que la propia lengua. [6]
Las estimaciones sobre el número de familias lingüísticas en el mundo pueden variar ampliamente. Según Ethnologue, existen 7151 lenguas humanas vivas distribuidas en 142 familias lingüísticas diferentes. [7] [8] Lyle Campbell (2019) identifica un total de 406 familias lingüísticas independientes, incluidas las aisladas. [9]
Ethnologue 27 (2024) enumera las siguientes familias que contienen al menos el 1% de las 7.164 lenguas conocidas en el mundo: [10]
Glottolog 5.0 (2024) enumera las siguientes como las familias más grandes, de 7.788 idiomas (además de los lenguajes de señas , pidgins y lenguas no clasificables ): [11]
Los recuentos de idiomas pueden variar significativamente dependiendo de lo que se considere un dialecto; por ejemplo, Lyle Campbell cuenta solo 27 idiomas otomangues, aunque él, Ethnologue y Glottolog también están en desacuerdo en cuanto a qué idiomas pertenecen a la familia.
Dos lenguas tienen una relación genética y pertenecen a la misma familia lingüística si ambas descienden de un ancestro común a través del proceso de cambio lingüístico o si una desciende de la otra. El término y el proceso de evolución de la lengua son independientes y no dependen de la terminología, la comprensión y las teorías relacionadas con la genética en el sentido biológico, por lo que, para evitar confusiones, algunos lingüistas prefieren el término relación genealógica . [12] [13] : 184
Existe un patrón notablemente similar entre el árbol lingüístico y el árbol genético de la ascendencia humana [14] que fue verificado estadísticamente. [15] Las lenguas interpretadas en términos del supuesto árbol filogenético de las lenguas humanas se transmiten en gran medida verticalmente (por ascendencia) en oposición a horizontalmente (por difusión espacial). [16]
En algunos casos, la derivación compartida de un grupo de lenguas relacionadas a partir de un ancestro común está directamente atestiguada en el registro histórico. Por ejemplo, este es el caso de la familia de las lenguas romances , en la que el español , el italiano , el portugués , el rumano y el francés descienden del latín, así como de la familia de las lenguas germánicas del norte , que incluye el danés , el sueco , el noruego y el islandés , que tienen una descendencia compartida del nórdico antiguo . Tanto el latín como el nórdico antiguo están atestiguados en registros escritos, al igual que muchas etapas intermedias entre esas lenguas ancestrales y sus descendientes modernos.
En otros casos, las relaciones genéticas entre lenguas no están directamente atestiguadas. Por ejemplo, las lenguas romances y las lenguas germánicas del norte también están relacionadas entre sí, siendo subfamilias de la familia de las lenguas indoeuropeas , ya que se cree que tanto el latín como el nórdico antiguo descienden de una lengua aún más antigua, el protoindoeuropeo ; sin embargo, no sobrevive ninguna evidencia directa del protoindoeuropeo o de su divergencia en las lenguas que lo derivan. En casos como estos, las relaciones genéticas se establecen mediante el uso del método comparativo del análisis lingüístico.
Para probar la hipótesis de que dos idiomas están relacionados, el método comparativo comienza con la colección de pares de palabras que se supone que son cognados : es decir, palabras en idiomas relacionados que se derivan de la misma palabra en el idioma ancestral compartido. Los pares de palabras que tienen pronunciaciones y significados similares en los dos idiomas suelen ser buenos candidatos para cognados hipotéticos. El investigador debe descartar la posibilidad de que las dos palabras sean similares simplemente por casualidad, o debido a que una haya tomado prestadas las palabras de la otra (o de un idioma relacionado con el otro). La semejanza casual se descarta por la existencia de grandes colecciones de pares de palabras entre los dos idiomas que muestran patrones similares de similitud fonética. Una vez que se han eliminado la similitud coincidente y el préstamo como posibles explicaciones para las similitudes en el sonido y el significado de las palabras, la explicación restante es el origen común: se infiere que las similitudes se produjeron debido a la descendencia de un ancestro común, y las palabras son en realidad cognados, lo que implica que los idiomas deben estar relacionados. [17]
Cuando las lenguas están en contacto entre sí , cualquiera de ellas puede influir en la otra a través de interferencias lingüísticas , como préstamos. Por ejemplo, el francés ha influido en el inglés , el árabe ha influido en el persa , el sánscrito ha influido en el tamil y el chino ha influido en el japonés de esta manera. Sin embargo, dicha influencia no constituye (y no es una medida de) una relación genética entre las lenguas en cuestión. La interferencia lingüística puede ocurrir entre lenguas que están genéticamente estrechamente relacionadas, entre lenguas que están distantemente relacionadas (como el inglés y el francés, que son lenguas indoeuropeas distantemente relacionadas ) y entre lenguas que no tienen relación genética.
Algunas excepciones al modelo simple de relación genética de las lenguas incluyen las lenguas aisladas y las lenguas mixtas , pidgin y criollas .
Las lenguas mixtas, los pidgins y las lenguas criollas constituyen tipos genéticos especiales de lenguas. No descienden lineal ni directamente de una única lengua y no tienen un único antepasado.
Los aislados son lenguas que no se puede demostrar que estén relacionadas genealógicamente con ninguna otra lengua moderna. Como corolario, cada lengua aislada también forma su propia familia lingüística, una familia genética que consiste en una sola lengua. Un ejemplo que se cita a menudo es el vasco , que forma una familia lingüística por sí sola; pero hay muchos otros ejemplos fuera de Europa. A escala global, el sitio Glottolog cuenta un total de 423 familias lingüísticas en el mundo, incluidas 184 aisladas. [18]
Una teoría controvertida sobre las relaciones genéticas entre las lenguas es la monogénesis , la idea de que todas las lenguas conocidas, con excepción de los criollos , los pidgins y las lenguas de signos , descienden de una única lengua ancestral. [19] Si eso es cierto, significaría que todas las lenguas (excepto los pidgins, los criollos y las lenguas de signos) están relacionadas genéticamente, pero en muchos casos, las relaciones pueden ser demasiado remotas para ser detectables. Las explicaciones alternativas para algunas similitudes básicas observadas entre las lenguas incluyen las teorías del desarrollo, relacionadas con el desarrollo biológico de la capacidad para el lenguaje a medida que el niño crece desde recién nacido. [ cita requerida ]
Una familia lingüística es una unidad monofilética ; todos sus miembros derivan de un ancestro común, y todos los descendientes de ese ancestro están incluidos en la familia. Por lo tanto, el término familia es análogo al término biológico clado . Las familias lingüísticas se pueden dividir en unidades filogenéticas más pequeñas, a veces denominadas "ramas" o "subfamilias" de la familia; por ejemplo, las lenguas germánicas son una subfamilia de la familia indoeuropea . Las subfamilias comparten un ancestro común más reciente que el ancestro común de la familia más grande; el protogermánico , el ancestro común de la subfamilia germánica, era en sí mismo un descendiente del protoindoeuropeo , el ancestro común de la familia indoeuropea. Dentro de una familia grande, las subfamilias se pueden identificar a través de "innovaciones compartidas": los miembros de una subfamilia compartirán características que representan retenciones de su ancestro común más reciente, pero que no estaban presentes en la protolengua general de la familia más grande.
Algunos taxónomos restringen el término familia a un cierto nivel, pero hay poco consenso sobre cómo hacerlo. Quienes colocan tales etiquetas también subdividen las ramas en grupos y los grupos en complejos . Una familia de nivel superior (es decir, la más grande) a menudo se llama filo o stock . Cuanto más cercanas estén las ramas entre sí, más estrechamente relacionadas estarán las lenguas. Esto significa que si una rama de una protolengua está cuatro ramas más abajo y también hay una lengua hermana de esa cuarta rama, entonces las dos lenguas hermanas están más estrechamente relacionadas entre sí que con esa protolengua ancestral común.
El término macrofamilia o superfamilia se aplica a veces a agrupaciones propuestas de familias lingüísticas cuyo estatus como unidades filogenéticas generalmente se considera no corroborado por los métodos lingüísticos históricos aceptados .
Algunas familias lingüísticas muy unidas, y muchas de sus ramas dentro de familias más grandes, adoptan la forma de continuos dialectales en los que no existen fronteras claras que permitan identificar, definir o contar de manera inequívoca las lenguas individuales dentro de la familia. Sin embargo, cuando las diferencias entre las lenguas de las distintas regiones en los extremos del continuo son tan grandes que no existe una inteligibilidad mutua entre ellas, como ocurre en el árabe , el continuo no puede considerarse de manera significativa como una sola lengua.
Una variedad de habla también puede considerarse una lengua o un dialecto dependiendo de consideraciones sociales o políticas. Por lo tanto, diferentes fuentes, especialmente a lo largo del tiempo, pueden dar números muy diferentes de lenguas dentro de una cierta familia. Las clasificaciones de la familia japonesa , por ejemplo, varían desde una lengua (una lengua aislada con dialectos) hasta casi veinte; hasta la clasificación de las ryukyuanas como lenguas separadas dentro de una familia de lenguas japonesas en lugar de dialectos del japonés, la propia lengua japonesa se consideraba una lengua aislada y, por lo tanto, la única lengua de su familia.
Se sabe que la mayoría de las lenguas del mundo están relacionadas con otras. Las que no tienen parientes conocidos (o para las que solo se han propuesto relaciones de parentesco de manera tentativa) se denominan lenguas aisladas , que son básicamente familias de lenguas que constan de una sola lengua. Se estima que se conocen 129 lenguas aisladas en la actualidad. [20] Un ejemplo es el vasco . En general, se supone que las lenguas aisladas tienen parientes o tuvieron parientes en algún momento de su historia, pero en una profundidad temporal demasiado grande para que la comparación lingüística pueda recuperarlos.
Un idioma aislado se clasifica en función del hecho de que se sabe lo suficiente sobre él como para compararlo genéticamente con otros idiomas, pero no se encuentra ningún ancestro o relación común con ningún otro idioma conocido. [20]
Una lengua aislada en su propia rama dentro de una familia, como el albanés y el armenio dentro del indoeuropeo, a menudo también se denomina aislada, pero el significado de la palabra "aislada" en tales casos suele aclararse con un modificador . Por ejemplo, el albanés y el armenio pueden denominarse "aisladas indoeuropeas". Por el contrario, hasta donde se sabe, la lengua vasca es una lengua absolutamente aislada: no se ha demostrado que esté relacionada con ninguna otra lengua moderna a pesar de los numerosos intentos. Se puede decir que una lengua es una lengua aislada actualmente, pero no históricamente, si se atestiguan parientes relacionados pero ahora extintos. La lengua aquitana , hablada en la época romana, puede haber sido un antepasado del vasco, pero también podría haber sido una lengua hermana del antepasado del vasco. En este último caso, el vasco y el aquitano formarían una pequeña familia juntos. Los antepasados no se consideran miembros distintos de una familia. [ cita requerida ]
Una protolengua puede considerarse como una lengua madre (que no debe confundirse con una lengua materna [21] ) que es la raíz de la que provienen todas las lenguas de la familia. El ancestro común de una familia lingüística rara vez se conoce directamente, ya que la mayoría de las lenguas tienen una historia registrada relativamente corta. Sin embargo, es posible recuperar muchas características de una protolengua aplicando el método comparativo , un procedimiento reconstructivo elaborado por el lingüista del siglo XIX August Schleicher . Esto puede demostrar la validez de muchas de las familias propuestas en la lista de familias lingüísticas . Por ejemplo, el ancestro común reconstruible de la familia lingüística indoeuropea se llama protoindoeuropeo . El protoindoeuropeo no está atestiguado por registros escritos y, por lo tanto, se conjetura que se habló antes de la invención de la escritura.
Una representación visual común de una familia de lenguas se da mediante un árbol genético de la lengua. El modelo de árbol a veces se denomina dendrograma o filogenia . El árbol genealógico muestra la relación de las lenguas dentro de una familia, de forma muy similar a como un árbol genealógico de un individuo muestra su relación con sus parientes. Existen críticas al modelo del árbol genealógico. Los críticos se centran principalmente en la afirmación de que la estructura interna de los árboles está sujeta a variación en función de los criterios de clasificación. [22] Incluso entre quienes apoyan el modelo del árbol genealógico, existen debates sobre qué lenguas deberían incluirse en una familia de lenguas. Por ejemplo, dentro de la dudosa familia de lenguas altaicas , existen debates sobre si las lenguas japonesas y coreanas deberían incluirse o no. [23]
El modelo de onda se ha propuesto como una alternativa al modelo de árbol. [13] El modelo de onda utiliza isoglosas para agrupar variedades lingüísticas; a diferencia del modelo de árbol, estos grupos pueden superponerse. Mientras que el modelo de árbol implica una falta de contacto entre lenguas después de la derivación de una forma ancestral, el modelo de onda enfatiza la relación entre lenguas que permanecen en contacto, lo que es más realista. [13] La glotometría histórica es una aplicación del modelo de onda, destinada a identificar y evaluar las relaciones genéticas en los vínculos lingüísticos . [13] [24]
Un sprachbund es un área geográfica que tiene varias lenguas que presentan estructuras lingüísticas comunes. Las similitudes entre esas lenguas se deben al contacto lingüístico, no al azar ni a un origen común, y no se reconocen como criterios que definan una familia lingüística. Un ejemplo de sprachbund sería el subcontinente indio . [25]
Las innovaciones compartidas, adquiridas por préstamos u otros medios, no se consideran genéticas y no tienen relación con el concepto de familia lingüística. Se ha afirmado, por ejemplo, que muchas de las características más llamativas compartidas por las lenguas itálicas ( latín , osco , umbro , etc.) bien podrían ser " características areales ". Sin embargo, alteraciones de aspecto muy similar en los sistemas de vocales largas en las lenguas germánicas occidentales son muy posteriores a cualquier noción posible de una innovación protolingüística (y tampoco pueden considerarse fácilmente como "areales", ya que el inglés y el germánico occidental continental no eran un área lingüística). En una línea similar, hay muchas innovaciones únicas similares en germánico , báltico y eslavo que es mucho más probable que sean características areales que atribuibles a una protolengua común. Pero la incertidumbre legítima sobre si las innovaciones compartidas son características areales, coincidencia o herencia de un ancestro común, conduce al desacuerdo sobre las subdivisiones adecuadas de cualquier gran familia lingüística.
El concepto de familias lingüísticas se basa en la observación histórica de que las lenguas desarrollan dialectos , que con el tiempo pueden divergir en lenguas distintas. Sin embargo, la ascendencia lingüística es menos clara que la ascendencia biológica familiar, en la que las especies no se cruzan. [26] Es más como la evolución de los microbios, con una extensa transferencia lateral de genes . Las lenguas bastante distantemente relacionadas pueden afectarse entre sí a través del contacto lingüístico , lo que en casos extremos puede dar lugar a lenguas sin un único ancestro, ya sean criollos o lenguas mixtas . Además, varias lenguas de signos se han desarrollado de forma aislada y parecen no tener parientes en absoluto. No obstante, estos casos son relativamente raros y la mayoría de las lenguas bien atestiguadas pueden clasificarse inequívocamente como pertenecientes a una u otra familia lingüística, incluso si se desconoce la relación de esta familia con otras familias.
El contacto lingüístico puede dar lugar al desarrollo de nuevas lenguas a partir de la mezcla de dos o más lenguas con el fin de que dos grupos que hablan lenguas diferentes interactúen entre sí. Las lenguas que surgen para que dos grupos se comuniquen entre sí para participar en intercambios comerciales o que aparecen como resultado del colonialismo se denominan pidgins . Los pidgins son un ejemplo de expansión lingüística y cultural causada por el contacto lingüístico. Sin embargo, el contacto lingüístico también puede dar lugar a divisiones culturales. En algunos casos, dos grupos que hablan lenguas diferentes pueden tener sentimientos territoriales hacia su lengua y no querer que se realicen cambios en ella. Esto provoca fronteras lingüísticas y los grupos en contacto no están dispuestos a hacer ningún compromiso para dar cabida a la otra lengua. [27]