Una familia lingüística es un grupo de lenguas relacionadas por descendencia de una lengua ancestral común o lengua parental , denominada protolengua de esa familia. El término familia es una metáfora tomada de la biología, siendo el modelo de árbol utilizado en lingüística histórica análogo a un árbol genealógico , o a los árboles filogenéticos de especies utilizados en la taxonomía evolutiva . Así, los lingüistas describen las lenguas hijas dentro de una familia lingüística como genéticamente relacionadas . [1] La divergencia de una protolengua en lenguas hijas suele ocurrir a través de la separación geográfica, con diferentes dialectos regionales de la protolengua hablados por diferentes comunidades lingüísticas que experimentan diferentes cambios lingüísticos y, por lo tanto, se convierten en lenguas distintas entre sí. [2]
Un ejemplo bien conocido de familia de lenguas son las lenguas romances , incluidas el español , el francés , el italiano , el portugués , el rumano y muchas otras, todas las cuales descienden del latín vulgar hablado en el Imperio Romano . [nota 1] [3] La familia romance en sí es parte de la familia indoeuropea más grande , que incluye muchas otras lenguas nativas de Europa y el sur de Asia, como el inglés y el hindi , todas las cuales se cree que descienden de una lengua ancestral común hablada. Hace miles de años se le conoció como protoindoeuropeo .
Las familias lingüísticas con más hablantes son la indoeuropea y la sino-tibetana ; esta última se debe en gran parte a la gran cantidad de hablantes de chino mandarín en China. [4] Una familia de lenguas puede contener cualquier cantidad de lenguas: algunas familias, como las familias austronesia y Níger-Congo , contienen cientos de lenguas diferentes, [4] mientras que algunas lenguas, denominadas aisladas , no se sabe que estén relacionadas con ninguna. otras lenguas y por tanto constituyen una familia formada por una sola lengua.
La pertenencia de lenguas a una familia lingüística se establece mediante investigaciones en lingüística comparada . Las lenguas relacionadas genealógicamente pueden identificarse por sus retenciones compartidas; es decir, comparten similitudes sistemáticas que no pueden explicarse como debidas al azar o a efectos del contacto lingüístico (como el préstamo o la convergencia ) y, por lo tanto, deben ser características heredadas de su ancestro común compartido. Sin embargo, algunos conjuntos de lenguas pueden de hecho derivar de un ancestro común pero han divergido lo suficiente entre sí como para que su relación ya no sea detectable; y algunas lenguas no han sido estudiadas con suficiente detalle para ser clasificadas y, por lo tanto, se desconoce su pertenencia familiar.
Las estimaciones sobre el número de familias lingüísticas en el mundo pueden variar ampliamente. Según Ethnologue hay 7.151 lenguas humanas vivas distribuidas en 142 familias lingüísticas diferentes. [5] [6] Lyle Campbell (2019) identifica un total de 406 familias lingüísticas independientes, incluidas las aisladas. [7]
Ethnologue 27 (2024) enumera las siguientes familias que contienen al menos el 1% de las 7.164 lenguas conocidas en el mundo: [8]
Glottolog 4.7 (2022) enumera las siguientes como las familias más grandes, de 8565 lenguas (además de las lenguas de signos, pidgins y lenguas inclasificables): [9]
Los recuentos de idiomas pueden variar significativamente según lo que se considere un dialecto; por ejemplo, Lyle Campbell cuenta sólo 27 lenguas otomangues, aunque él, Ethnologue y Glottolog tampoco están de acuerdo sobre qué lenguas pertenecen a la familia.
Dos lenguas tienen una relación genética y pertenecen a la misma familia lingüística, si ambas descienden de un ancestro común a través del proceso de cambio de lengua , o si una desciende de la otra. El término y el proceso de evolución del lenguaje son independientes y no dependen de la terminología, la comprensión y las teorías relacionadas con la genética en el sentido biológico, por lo que, para evitar confusiones, algunos lingüistas prefieren el término relación genealógica . [10] [11] : 184
Existe un patrón notablemente similar mostrado por el árbol lingüístico y el árbol genético de la ascendencia humana [12] que fue verificado estadísticamente. [13] Las lenguas interpretadas en términos del supuesto árbol filogenético de las lenguas humanas se transmiten en gran medida verticalmente (por ascendencia) en lugar de horizontalmente (por difusión espacial). [14]
En algunos casos, la derivación compartida de un grupo de lenguas emparentadas a partir de un ancestro común está directamente atestiguada en el registro histórico. Por ejemplo, este es el caso de la familia de lenguas romances , en la que el español , el italiano , el portugués , el rumano y el francés descienden del latín, así como de la familia de lenguas germánicas del norte , que incluye el danés , el sueco , el noruego y el islandés , que han compartido descendencia del nórdico antiguo . Tanto el latín como el nórdico antiguo están atestiguados en registros escritos, al igual que muchas etapas intermedias entre esas lenguas ancestrales y sus descendientes modernos.
En otros casos, las relaciones genéticas entre lenguas no están atestiguadas directamente. Por ejemplo, las lenguas romances y las lenguas germánicas del norte también están relacionadas entre sí, siendo subfamilias de la familia de lenguas indoeuropeas , ya que se cree que tanto el latín como el nórdico antiguo descienden de una lengua aún más antigua, el protoindoeuropeo. europeo ; sin embargo, no sobrevive ninguna evidencia directa del protoindoeuropeo o su divergencia en sus lenguas descendientes. En casos como estos, las relaciones genéticas se establecen mediante el uso del método comparativo de análisis lingüístico.
Para probar la hipótesis de que dos lenguas están relacionadas, el método comparativo comienza con la colección de pares de palabras que se supone son cognados : es decir, palabras en lenguas relacionadas que se derivan de la misma palabra en la lengua ancestral compartida. Los pares de palabras que tienen pronunciaciones y significados similares en los dos idiomas suelen ser buenos candidatos para cognados hipotéticos. El investigador debe descartar la posibilidad de que las dos palabras sean similares simplemente por casualidad, o porque una las haya tomado prestadas de la otra (o de un idioma relacionado con la otra). El parecido casual se descarta por la existencia de grandes colecciones de pares de palabras entre los dos idiomas que muestran patrones similares de similitud fonética. Una vez que se han eliminado la similitud coincidente y los préstamos como posibles explicaciones de las similitudes en el sonido y el significado de las palabras, la explicación restante es el origen común: se infiere que las similitudes ocurrieron debido a la descendencia de un ancestro común, y las palabras son en realidad cognados, lo que implica los idiomas deben estar relacionados. [15]
Cuando las lenguas están en contacto entre sí , cualquiera de ellas puede influir en la otra mediante interferencias lingüísticas , como el préstamo. Por ejemplo, el francés ha influido en el inglés , el árabe ha influido en el persa , el sánscrito ha influido en el tamil y el chino ha influido en el japonés de esta manera. Sin embargo, dicha influencia no constituye (ni es una medida de) una relación genética entre las lenguas en cuestión. La interferencia lingüística puede ocurrir entre lenguas que están genéticamente estrechamente relacionadas, entre lenguas que están lejanamente relacionadas (como el inglés y el francés, que son lenguas indoeuropeas lejanamente relacionadas ) y entre lenguas que no tienen relación genética.
Algunas excepciones al modelo de relación genética simple de las lenguas incluyen lenguas aisladas y lenguas mixtas , pidgin y criollas .
Las lenguas mixtas, los pidgins y las lenguas criollas constituyen tipos genéticos especiales de lenguas. No descienden lineal o directamente de una única lengua y no tienen un único ancestro.
Las lenguas aisladas son lenguas de las que no se puede demostrar que estén relacionadas genealógicamente con ninguna otra lengua moderna. Como corolario, cada lengua aislada también forma su propia familia lingüística, una familia genética que consta de una sola lengua. Un ejemplo citado a menudo es el vasco , que forma una familia lingüística por sí solo; pero hay muchos otros ejemplos fuera de Europa. A escala global, el sitio Glottolog cuenta un total de 427 familias lingüísticas en el mundo, entre ellas 182 aisladas. [dieciséis]
Una teoría controvertida sobre las relaciones genéticas entre lenguas es la monogénesis , la idea de que todas las lenguas conocidas, con excepción de los criollos , los pidgins y las lenguas de signos , descienden de una única lengua ancestral. [17] Si eso es cierto, significaría que todas las lenguas (excepto el pidgins, los criollos y las lenguas de signos) están relacionadas genéticamente, pero en muchos casos, las relaciones pueden ser demasiado remotas para ser detectables. Las explicaciones alternativas para algunos puntos comunes básicos observados entre las lenguas incluyen teorías del desarrollo, relacionadas con el desarrollo biológico de la capacidad de lenguaje a medida que el niño crece desde que es recién nacido. [ cita necesaria ]
Una familia de lenguas es una unidad monofilética ; todos sus miembros derivan de un antepasado común, y todos los descendientes de ese antepasado están incluidos en la familia. Por tanto, el término familia es análogo al término biológico clado . Las familias de lenguas se pueden dividir en unidades filogenéticas más pequeñas, a veces denominadas "ramas" o "subfamilias" de la familia; por ejemplo, las lenguas germánicas son una subfamilia de la familia indoeuropea . Las subfamilias comparten un ancestro común más reciente que el ancestro común de la familia más grande; El protogermánico , ancestro común de la subfamilia germánica, era a su vez descendiente del protoindoeuropeo , ancestro común de la familia indoeuropea. Dentro de una familia numerosa, las subfamilias se pueden identificar a través de "innovaciones compartidas": los miembros de una subfamilia compartirán características que representan retenciones de su ancestro común más reciente, pero que no estaban presentes en el protolenguaje general de la familia más grande.
Algunos taxónomos restringen el término familia a cierto nivel, pero hay poco consenso sobre cómo hacerlo. Quienes colocan tales etiquetas también subdividen las ramas en grupos y los grupos en complejos . Una familia de nivel superior (es decir, la más grande) a menudo se denomina filo o stock . Cuanto más cerca estén las ramas entre sí, más estrechamente relacionadas estarán las lenguas. Esto significa que si una rama de una protolengua está cuatro ramas más abajo y también hay una lengua hermana en esa cuarta rama, entonces las dos lenguas hermanas están más estrechamente relacionadas entre sí que con esa protolengua ancestral común.
El término macrofamilia o superfamilia se aplica a veces a agrupaciones propuestas de familias lingüísticas cuyo estatus como unidades filogenéticas generalmente se considera no fundamentado por métodos lingüísticos históricos aceptados .
Algunas familias lingüísticas muy unidas, y muchas ramas dentro de familias más grandes, toman la forma de dialectos continuos en los que no hay fronteras claras que permitan identificar, definir o contar de manera inequívoca las lenguas individuales dentro de la familia. Sin embargo, cuando las diferencias entre el habla de diferentes regiones en los extremos del continuo son tan grandes que no hay inteligibilidad mutua entre ellas, como ocurre en árabe , el continuo no puede verse significativamente como una sola lengua.
Una variedad de habla también puede considerarse una lengua o un dialecto dependiendo de consideraciones sociales o políticas. Por lo tanto, diferentes fuentes, especialmente a lo largo del tiempo, pueden proporcionar números tremendamente diferentes de lenguas dentro de una determinada familia. Las clasificaciones de la familia japonesa , por ejemplo, varían desde una lengua (una lengua aislada con dialectos) hasta casi veinte; hasta la clasificación de Ryukyuan como lenguas separadas dentro de una familia de lenguas japonesas en lugar de dialectos del japonés, la lengua japonesa en sí se consideraba una Lengua aislada y por tanto la única lengua de su familia.
Se sabe que la mayoría de los idiomas del mundo están relacionados con otros. Aquellos que no tienen parientes conocidos (o para los cuales las relaciones familiares sólo se proponen tentativamente) se denominan lenguas aisladas , esencialmente familias lingüísticas que constan de una sola lengua. Se estima que en la actualidad se conocen 129 lenguas aisladas. [18] Un ejemplo es el vasco . En general, se supone que las lenguas aisladas tienen parientes o tuvieron parientes en algún momento de su historia, pero en un momento demasiado grande para que la comparación lingüística los recupere.
Una lengua aislada se clasifica basándose en el hecho de que se sabe lo suficiente sobre la lengua aislada para compararla genéticamente con otras lenguas, pero no se encuentra ninguna ascendencia o relación común con ninguna otra lengua conocida. [18]
Una lengua aislada en su propia rama dentro de una familia, como el albanés y el armenio dentro del indoeuropeo, a menudo también se denomina aislada, pero el significado de la palabra "aislar" en tales casos suele aclararse con un modificador . Por ejemplo, se puede hacer referencia al albanés y al armenio como un "aislado indoeuropeo". Por el contrario, hasta donde sabemos, la lengua vasca es un idioma absolutamente aislado: no se ha demostrado que esté relacionado con ninguna otra lengua moderna a pesar de numerosos intentos. Se puede decir que una lengua es actualmente aislada, pero no históricamente, si se atestiguan parientes relacionados pero ahora extintos. La lengua aquitana , hablada en la época romana, puede haber sido un antepasado del vasco, pero también pudo haber sido una lengua hermana del antepasado del vasco. En este último caso, vascos y aquitanos formarían juntos una pequeña familia. Los antepasados no se consideran miembros distintos de una familia. [ cita necesaria ]
Una protolengua puede considerarse como una lengua materna (que no debe confundirse con una lengua materna [19] ), siendo la raíz de la que provienen todas las lenguas de la familia. El ancestro común de una familia lingüística rara vez se conoce directamente, ya que la mayoría de las lenguas tienen una historia registrada relativamente corta. Sin embargo, es posible recuperar muchas características de una protolengua aplicando el método comparativo , un procedimiento reconstructivo elaborado por el lingüista del siglo XIX August Schleicher . Esto puede demostrar la validez de muchas de las familias propuestas en la lista de familias lingüísticas . Por ejemplo, el ancestro común reconstruible de la familia de lenguas indoeuropeas se llama protoindoeuropeo . El protoindoeuropeo no está atestiguado por registros escritos, por lo que se conjetura que se habló antes de la invención de la escritura.
Una representación visual común de una familia de lenguas viene dada por un árbol genético de lenguas. El modelo de árbol a veces se denomina dendrograma o filogenia . El árbol genealógico muestra la relación de las lenguas dentro de una familia, de la misma manera que el árbol genealógico de un individuo muestra su relación con sus parientes. Hay críticas al modelo de árbol genealógico. Las críticas se centran principalmente en la afirmación de que la estructura interna de los árboles está sujeta a variaciones según los criterios de clasificación. [20] Incluso entre quienes apoyan el modelo de árbol genealógico, existen debates sobre qué lenguas deberían incluirse en una familia de lenguas. Por ejemplo, dentro de la dudosa familia de lenguas altaicas , existen debates sobre si las lenguas japónica y coreana deben incluirse o no. [21]
El modelo ondulatorio se ha propuesto como alternativa al modelo de árbol. [11] El modelo ondulatorio utiliza isoglosas para agrupar variedades lingüísticas; A diferencia del modelo de árbol, estos grupos pueden superponerse. Mientras que el modelo de árbol implica una falta de contacto entre lenguas después de la derivación de una forma ancestral, el modelo de onda enfatiza la relación entre lenguas que permanecen en contacto, lo cual es más realista. [11] La glotometría histórica es una aplicación del modelo de ondas, destinada a identificar y evaluar relaciones genéticas en vínculos lingüísticos . [11] [22]
Un sprachbund es un área geográfica que tiene varios idiomas que presentan estructuras lingüísticas comunes. Las similitudes entre esas lenguas se deben al contacto lingüístico, no al azar ni al origen común, y no se reconocen como criterios que definan una familia lingüística. Un ejemplo de sprachbund sería el subcontinente indio . [23]
Las innovaciones compartidas, adquiridas mediante préstamos u otros medios, no se consideran genéticas y no tienen relación con el concepto de familia lingüística. Se ha afirmado, por ejemplo, que muchas de las características más llamativas compartidas por las lenguas itálicas ( latín , osco , umbría , etc.) bien podrían ser " rasgos reales ". Sin embargo, alteraciones de aspecto muy similar en los sistemas de vocales largas de las lenguas germánicas occidentales son muy posteriores a cualquier posible noción de innovación en una protolengua (y tampoco pueden considerarse fácilmente "arealistas", ya que el inglés y el germánico occidental continental no eran un área lingüística). De manera similar, hay muchas innovaciones únicas similares en germánico , báltico y eslavo que es mucho más probable que sean características reales que atribuibles a una protolengua común. Pero la incertidumbre legítima sobre si las innovaciones compartidas son características reales, coincidencias o herencia de un ancestro común conduce a desacuerdos sobre las subdivisiones adecuadas de cualquier gran familia lingüística.
El concepto de familias de lenguas se basa en la observación histórica de que las lenguas desarrollan dialectos , que con el tiempo pueden divergir en lenguas distintas. Sin embargo, la ascendencia lingüística es menos clara que la ascendencia biológica familiar, en la que las especies no se cruzan. [24] Se parece más a la evolución de los microbios, con una extensa transferencia lateral de genes . Las lenguas emparentadas muy lejanamente pueden afectarse entre sí a través del contacto lingüístico , lo que en casos extremos puede conducir a lenguas sin un solo ancestro, ya sean criollas o lenguas mixtas . Además, varias lenguas de signos se han desarrollado de forma aislada y no parecen tener ningún pariente. No obstante, estos casos son relativamente raros y la mayoría de las lenguas mejor documentadas pueden clasificarse sin ambigüedades como pertenecientes a una familia lingüística u otra, incluso si se desconoce la relación de esta familia con otras familias.
El contacto lingüístico puede conducir al desarrollo de nuevas lenguas a partir de la mezcla de dos o más lenguas con el fin de interacciones entre dos grupos que hablan lenguas diferentes. Se denominan pidgin a las lenguas que surgen con el fin de que dos grupos se comuniquen entre sí para realizar intercambios comerciales o que aparecieron como resultado del colonialismo . Los pidgins son un ejemplo de expansión lingüística y cultural provocada por el contacto lingüístico. Sin embargo, el contacto lingüístico también puede provocar divisiones culturales. En algunos casos, dos grupos de hablantes de idiomas diferentes pueden sentirse territoriales con respecto a su idioma y no querer que se realice ningún cambio en él. Esto provoca que las fronteras lingüísticas y los grupos en contacto no estén dispuestos a hacer concesiones para adaptarse a la otra lengua. [25]