La comparación de masas es un método desarrollado por Joseph Greenberg para determinar el nivel de parentesco genético entre lenguas. En la actualidad, se suele denominar comparación multilateral . La comparación de masas se ha calificado de "engaño metodológico" y la mayoría de los lingüistas la rechazan, y su uso continuado se limita principalmente a la lingüística marginal . [1] [2]
Algunas de las relaciones de alto nivel que Greenberg mencionó son ahora generalmente aceptadas gracias al análisis con otras técnicas lingüísticas más ampliamente aceptadas, aunque ya habían sido postuladas por otros (por ejemplo, afroasiático y Níger-Congo ). Otras son aceptadas por muchos aunque cuestionadas por algunos especialistas prominentes (por ejemplo, nilo-sahariano ), mientras que otras son rechazadas casi universalmente (por ejemplo , euroasiático , khoisan y amerindio ).
La idea del método de comparación masiva es que un grupo de idiomas está relacionado cuando muestran numerosas semejanzas en vocabulario, incluidos pronombres y morfemas , formando un patrón entrelazado común al grupo. A diferencia del método comparativo , la comparación masiva no requiere ninguna correspondencia regular o sistemática entre los idiomas comparados; todo lo que se requiere es un sentimiento impresionista de similitud. Greenberg no establece un estándar claro para determinar la relación; no establece un estándar para lo que considera una "semejanza" o cuántas semejanzas se necesitan para demostrar la relación. [3]
La comparación masiva se realiza mediante la creación de una tabla de elementos de vocabulario básico y sus formas en los idiomas que se van a comparar para determinar las semejanzas. La tabla también puede incluir morfemas comunes. La siguiente tabla fue utilizada por [4] para ilustrar la técnica. Muestra las formas de seis elementos de vocabulario básico en nueve idiomas diferentes, identificados por letras.
Según Greenberg, las relaciones básicas pueden determinarse sin ninguna experiencia en el caso de lenguas que están bastante estrechamente relacionadas, aunque el conocimiento de las probables trayectorias de cambio de sonido adquiridas a través de la tipología permite ir más lejos más rápido. Por ejemplo, la trayectoria p > f es extremadamente frecuente, pero la trayectoria f > p lo es mucho menos, lo que permite plantear la hipótesis de que fi : pi y fik : pix están efectivamente relacionadas y se remontan a la protoforma * pi y * pik/x . De manera similar, aunque el conocimiento de que k > x es extremadamente frecuente, x > k lo es mucho menos, permite elegir * pik en lugar de * pix . Por lo tanto, según Greenberg (2005:318), las consideraciones fonológicas entran en juego desde el principio, aunque la comparación de masas no intenta producir reconstrucciones de protolenguas , ya que estas pertenecen a una fase posterior del estudio. Las tablas utilizadas en la comparación de masas real involucran un número mucho mayor de elementos y lenguas. Los elementos incluidos pueden ser léxicos, como 'mano', 'cielo' e 'ir', o morfológicos, como PLURAL y MASCULINO . [5] Para Greenberg, los resultados obtenidos mediante la comparación masiva se acercaban a la certeza: [6] "La presencia de semejanzas fundamentales de vocabulario y semejanzas en elementos con función gramatical, particularmente si son recurrentes en varios idiomas, es una indicación segura de relación genética".
Como herramienta para identificar relaciones genéticas entre lenguas, la comparación de masas es una alternativa al método comparativo . Los defensores de la comparación de masas, como Greenberg, afirman que el método comparativo es innecesario para identificar relaciones genéticas; además, afirman que solo se puede utilizar una vez que se identifican las relaciones mediante la comparación de masas, lo que hace que la comparación de masas sea el "primer paso" para determinar las relaciones (1957:44). Esto contrasta con la lingüística comparativa convencional , que se basa en el método comparativo para ayudar a identificar relaciones genéticas; específicamente, implica comparar datos de dos o más lenguas. Si se encuentran conjuntos de correspondencias de sonido recurrentes, lo más probable es que las lenguas estén relacionadas; si una investigación más profunda confirma la relación potencial, se pueden establecer formas ancestrales reconstruidas utilizando las correspondencias de sonido cotejadas. [3]
Sin embargo, Greenberg no desautorizó por completo el método comparativo; afirmó que "una vez que tenemos un repertorio bien establecido, me dedico a comparar y reconstruir como cualquier otra persona, como se puede ver en mis diversas contribuciones a la lingüística histórica" (1990, citado en Ruhlen 1994:285) y acusó a los lingüistas convencionales de difundir "la idea extraña y ampliamente difundida de que busco reemplazar el método comparativo con una nueva y extraña invención propia" (2002:2). Anteriormente en su carrera, antes de desarrollar plenamente la comparación masiva, llegó a afirmar que su metodología no "entraba en conflicto de ninguna manera con el método comparativo tradicional" (1957:44). Sin embargo, Greenberg considera que el método comparativo no desempeña ningún papel en la determinación de relaciones, lo que reduce significativamente su importancia en comparación con los métodos tradicionales de comparación lingüística. En efecto, su enfoque de la comparación masiva marginó al método comparativo con una "nueva y extraña invención propia". [3]
Reflejando el empirismo metodológico también presente en su trabajo tipológico , consideró que los hechos tenían mayor peso que sus interpretaciones, afirmando (1957:45):
La presencia de errores frecuentes en los datos de Greenberg ha sido señalada por lingüistas como Lyle Campbell y Alexander Vovin , quienes lo consideran como un debilitamiento fatal del intento de Greenberg de demostrar la fiabilidad de la comparación masiva. Campbell señala en su discusión de la propuesta amerindia de Greenberg que "casi todos los especialistas encuentran distorsiones e inexactitudes extensas en los datos de Greenberg"; por ejemplo, Willem Adelaar , un especialista en lenguas andinas, ha afirmado que "el número de formas erróneas [en los datos de Greenberg] probablemente excede el de las formas correctas". Algunas formas en los datos de Greenberg incluso parecen atribuirse al idioma equivocado. Greenberg también ignora los cambios de sonido conocidos que han experimentado los idiomas; una vez que se tienen en cuenta, muchas de las semejanzas que señala desaparecen. Los datos de Greenberg también contienen errores de tipo más sistemático: por ejemplo, agrupa idiomas no relacionados basándose en clasificaciones obsoletas o porque tienen nombres similares. [3] [7] [8]
Greenberg también considera arbitrariamente que ciertas partes de una palabra son afijos cuando no se conocen afijos de la forma fonológica requerida para que las palabras sean más coherentes con sus datos. Por el contrario, Greenberg emplea con frecuencia formas afijadas en sus datos, sin reconocer los límites morfémicos reales; cuando se eliminan los afijos, las palabras a menudo ya no guardan ningún parecido con sus reconstrucciones "amerindas". [7] [9] Greenberg ha respondido a esta crítica afirmando que "el método de comparación multilateral es tan poderoso que dará resultados confiables incluso con los datos más pobres. El material incorrecto debería tener simplemente un efecto aleatorio". Esto no ha tranquilizado a los críticos del método, que están lejos de convencerse del "poder" del método. [9]
Una crítica destacada a la comparación de masas es que no puede distinguir las formas prestadas de las heredadas, a diferencia de la reconstrucción comparativa, que puede hacerlo a través de correspondencias de sonidos regulares. Los préstamos no detectados dentro de los datos de Greenberg respaldan esta afirmación; por ejemplo, enumera " cognados " de Uwa baxita "machete", aunque es un préstamo del español machete . [7] [10] admite que "en casos particulares e infrecuentes la cuestión del préstamo puede ser dudosa" cuando se utiliza la comparación de masas, pero afirma que es poco probable que se tome prestado el vocabulario básico en comparación con el vocabulario cultural, afirmando que "cuando una masa de semejanzas se debe a un préstamo, tenderán a aparecer en el vocabulario cultural y a agruparse en ciertas áreas semánticas que reflejan la naturaleza cultural del contacto". Los lingüistas convencionales aceptan esta premisa, pero afirman que no es suficiente para distinguir los préstamos del vocabulario heredado . [7]
Según él, cualquier tipo de elemento lingüístico puede ser tomado prestado "en ocasiones", pero "el vocabulario fundamental es a prueba de préstamos masivos". Sin embargo, las lenguas pueden tomar prestado, y lo hacen, vocabulario básico. Por ejemplo, en palabras de Campbell, el finés ha tomado prestado "de sus vecinos bálticos y germánicos varios términos para parentesco básico y partes del cuerpo, incluyendo 'madre', 'hija', 'hermana', 'diente', 'ombligo', 'cuello', 'muslo' y 'piel'". Greenberg continúa afirmando que "[l]os morfemas derivativos, flexivos y pronominales y las alternancias morfológicas son los menos sujetos de todos a préstamos"; incorpora correlaciones morfológicas y pronominales cuando realiza comparaciones masivas, pero son periféricas y pocas en número en comparación con sus comparaciones léxicas . El propio Greenberg reconoce el papel periférico que desempeñan en sus datos al decir que "no son realmente necesarias". Además, las correlaciones que enumera no son exclusivas ni se encuentran universalmente dentro de las lenguas que compara. Greenberg tiene razón al señalar que el préstamo de pronombres o morfología es poco común, pero no se puede descartar sin recurrir a un método más sofisticado que la comparación de masas. [3] [7] [11]
Greenberg continúa afirmando que "las correspondencias sonoras recurrentes" no son suficientes para detectar préstamos, ya que "cuando los préstamos son numerosos, a menudo muestran tales correspondencias". [12] Sin embargo, Greenberg tergiversa las prácticas de la lingüística comparada dominante en este caso; pocos lingüistas abogan por utilizar correspondencias sonoras con exclusión de todo otro tipo de evidencia. Esta evidencia adicional a menudo ayuda a separar los préstamos del vocabulario heredado; por ejemplo, Campbell menciona cómo "[c]iertos tipos de evidencia gramatical pautada (aquella que resiste la explicación a partir de préstamos, accidentes o tipología y universales ) pueden ser un testimonio importante, independientemente de la cuestión de las correspondencias sonoras". [11] Puede que no siempre sea posible separar el material prestado del heredado, pero cualquier método tiene sus límites; en la gran mayoría de los casos, la diferencia puede discernirse. [3]
En el ámbito interlingüístico, las semejanzas casuales entre elementos léxicos no relacionados son comunes, debido a la gran cantidad de lexemas presentes en los idiomas del mundo; por ejemplo, el inglés much y el español mucho no están relacionados de manera demostrable, a pesar de su forma fonológica similar. Esto significa que muchas de las semejanzas encontradas mediante la comparación masiva probablemente sean coincidencias. Greenberg empeora este problema al reconstruir un ancestro común cuando solo una pequeña proporción de los idiomas que compara realmente muestran una coincidencia para cualquier elemento léxico dado, lo que le permite seleccionar elementos léxicos de apariencia similar de una amplia gama de idiomas. [9] Aunque son menos susceptibles al préstamo, los pronombres y la morfología también suelen mostrar un subconjunto restringido del inventario fonémico de un idioma , lo que hace que las semejanzas casuales interlingüísticas sean más probables. [3]
Greenberg también permite una amplia latitud semántica al comparar elementos; si bien las comparaciones lingüísticas ampliamente aceptadas permiten un grado de latitud semántica, lo que él permite es inconmensurablemente mayor; por ejemplo, una de sus comparaciones involucra palabras para "noche", "excremento" y "hierba". [9]
Los defensores de la comparación masiva a menudo descuidan la exclusión de clases de palabras que generalmente se consideran poco fiables para probar relaciones lingüísticas. Por ejemplo, Greenberg no intentó excluir palabras onomatopéyicas de sus datos. Las palabras onomatopéyicas a menudo se excluyen de la comparación lingüística, ya que las palabras onomatopéyicas de sonido similar pueden evolucionar fácilmente en paralelo. Aunque es imposible hacer un juicio definitivo sobre si una palabra es onomatopéyica, ciertos campos semánticos , como "soplar" y "chupar", muestran una tendencia translingüística a ser onomatopéyicos; hacer tal juicio puede requerir un análisis profundo de un tipo que la comparación masiva hace difícil. De manera similar, Greenberg olvidó excluir de sus datos los elementos afectados por el simbolismo sonoro , que a menudo distorsiona la forma original de los elementos léxicos. Finalmente, las "palabras infantiles", como "mamá" y "papá" carecen de valor evidencial en la comparación lingüística, ya que generalmente se piensa que derivan de los sonidos que hacen los bebés cuando comienzan a adquirir idiomas . Los defensores de la comparación masiva a menudo evitan tener el cuidado suficiente para excluir palabras infantiles; uno de ellos, Merritt Ruhlen, incluso ha intentado restar importancia a los problemas inherentes a su uso en la comparación lingüística. [3] [7] El hecho de que muchas de las lenguas indígenas de las Américas tengan pronombres que comienzan con oclusivas nasales , lo que Greenberg ve como evidencia de ascendencia común, en última instancia también puede estar vinculado al desarrollo temprano del habla; el especialista algonquino Ives Goddard señala que "Un gesto equivalente al utilizado para articular el sonido n es la actividad muscular voluntaria más importante de un bebé lactante". [13]
Desde el desarrollo de la lingüística comparada en el siglo XIX, se espera que un lingüista que afirme que dos lenguas están relacionadas, independientemente de que existan o no pruebas históricas, respalde esa afirmación presentando reglas generales que describan las diferencias entre sus léxicos, morfologías y gramáticas. El procedimiento se describe en detalle en el artículo sobre el método comparativo .
Por ejemplo, se podría demostrar que el español está relacionado con el italiano mostrando que muchas palabras del primero pueden asignarse a palabras correspondientes del segundo mediante un conjunto relativamente pequeño de reglas de reemplazo, como la correspondencia entre es- y s- iniciales, -os e -i finales , etc. Existen muchas correspondencias similares entre las gramáticas de los dos idiomas. Dado que es extremadamente improbable que esas correspondencias sistemáticas sean coincidencias aleatorias, la explicación más probable, con diferencia, es que los dos idiomas han evolucionado a partir de una única lengua ancestral ( el latín , en este caso).
Todas las agrupaciones lingüísticas prehistóricas que gozan de amplia aceptación hoy en día (como las familias indoeuropea , urálica , algonquina y bantú ) se han establecido de esta manera.
El desarrollo real del método comparativo fue un proceso más gradual de lo que suponen los detractores de Greenberg. Tiene tres momentos decisivos. El primero fue la observación de Rasmus Rask en 1818 de un posible cambio regular de sonido en las consonantes germánicas. El segundo fue la extensión de esta observación por parte de Jacob Grimm a un principio general ( la ley de Grimm ) en 1822. El tercero fue la resolución de Karl Verner de una irregularidad en este cambio de sonido ( la ley de Verner ) en 1875. Recién en 1861 August Schleicher presentó, por primera vez, reconstrucciones sistemáticas de protoformas indoeuropeas (Lehmann 1993:26). Schleicher, sin embargo, consideró estas reconstrucciones como extremadamente provisionales (1874:8). Nunca afirmó que probaran la existencia de la familia indoeuropea, que aceptó como un hecho a partir de investigaciones anteriores, principalmente la de Franz Bopp , su gran predecesor en los estudios indoeuropeos.
Karl Brugmann , que sucedió a Schleicher como autoridad principal en indoeuropeo, y los otros neogramáticos de finales del siglo XIX, destilaron el trabajo de estos eruditos en el famoso (aunque a menudo discutido) principio de que "todo cambio de sonido, en la medida en que ocurre automáticamente, se lleva a cabo de acuerdo con leyes que no admiten excepción" (Brugmann 1878). [14]
Sin embargo, los neogramáticos no consideraban que las correspondencias de sonidos regulares o las reconstrucciones comparativas fueran relevantes para la prueba de la relación genética entre las lenguas. De hecho, casi no hicieron declaraciones sobre cómo deben clasificarse las lenguas (Greenberg 2005:158). El único neogramático que se ocupó de esta cuestión fue Berthold Delbrück , colaborador de Brugmann en los Grundriß der vergleichenden Grammatik der indogermanischen Sprachen (Greenberg 2005:158-159, 288). Según Delbrück (1904:121-122, citado en Greenberg 2005:159), Bopp había afirmado demostrar la existencia del indoeuropeo de la siguiente manera:
Además, Delbrück adoptó la posición enunciada posteriormente por Greenberg sobre la prioridad de las etimologías sobre las leyes sólidas (1884:47, citado en Greenberg 2005:288): "las etimologías obvias son el material del que se extraen las leyes sólidas".
La opinión de que las correspondencias sonoras o, en otra versión de la opinión, la reconstrucción de una protolengua son necesarias para demostrar la relación entre las lenguas, data del siglo XX, no del XIX, y nunca fue una postura de los neogramáticos. El indoeuropeo fue reconocido por eruditos como William Jones (1786) y Franz Bopp (1816) mucho antes del desarrollo del método comparativo.
Además, el indoeuropeo no fue la primera familia lingüística que reconocieron los estudiosos de la lengua. El semítico había sido reconocido por los eruditos europeos en el siglo XVII, el finougrio en el XVIII. El dravidiano fue reconocido a mediados del siglo XIX por Robert Caldwell (1856), mucho antes de la publicación de las reconstrucciones comparativas de Schleicher.
Por último, la suposición de que todas las familias lingüísticas generalmente aceptadas por los lingüistas actuales han sido establecidas por el método comparativo es falsa. Algunas familias fueron aceptadas durante décadas antes de que se propusieran reconstrucciones comparativas de ellas, por ejemplo, la afroasiática y la sinotibetana . Muchas lenguas son generalmente aceptadas como pertenecientes a una familia lingüística aunque no exista una reconstrucción comparativa, a menudo porque las lenguas solo están atestiguadas en forma fragmentaria, como la lengua anatolia lidia (Greenberg 2005:161). Por el contrario, existen reconstrucciones comparativas detalladas para algunas familias lingüísticas que, no obstante, siguen siendo controvertidas, como el altaico . Los detractores del altaico señalan que los datos recopilados para demostrar mediante el comparativismo la existencia de la familia son escasos, erróneos e insuficientes. Hay que tener en cuenta que las correspondencias fonológicas regulares necesitan que se preparen y comparen miles de listas de léxicos antes de establecerse, y estas listas faltan para muchas de las familias propuestas identificadas mediante comparación masiva. Además, otros problemas específicos afectan a las listas "comparativas" de ambas propuestas, como la atestación tardía para las lenguas altaicas, o la comparación de protoformas no seguras. [15] [16]
Greenberg afirmó que, en el fondo, no hacía más que continuar con el método simple pero eficaz de clasificación de las lenguas que había dado lugar al descubrimiento de numerosas familias lingüísticas antes de la elaboración del método comparativo (1955:1-2, 2005:75) y que había seguido haciéndolo después, como en la clasificación del hitita como indoeuropeo en 1917 (Greenberg 2005:160-161). Este método consiste esencialmente en dos cosas: semejanzas en el vocabulario básico y semejanzas en los morfemas flexivos. Si la comparación masiva difiere de ella en algún aspecto obvio, parecería ser en la teorización de un enfoque que se había aplicado previamente de manera relativamente ad hoc y en las siguientes adiciones:
Las posiciones de Greenberg y sus críticos parecen, por tanto, ofrecer una alternativa marcadamente contrastante:
Además de los cambios sistemáticos, las lenguas también están sujetas a mutaciones aleatorias (como préstamos de otras lenguas, flexiones irregulares, composición y abreviaturas) que afectan a una palabra a la vez, o a pequeños subconjuntos de palabras. Por ejemplo, la palabra española perro , que no proviene del latín, no se puede traducir en términos de su equivalente italiano cane (la palabra española can es el equivalente derivado del latín, pero se usa mucho menos en las conversaciones cotidianas, ya que se reserva para fines más formales). A medida que esos cambios esporádicos se acumulen, oscurecerán cada vez más los sistemáticos, de la misma manera que la suciedad y los arañazos en una fotografía pueden acabar haciendo que el rostro sea irreconocible. [9]
A pesar de la naturaleza aparentemente insoluble del conflicto entre Greenberg y sus críticos, algunos lingüistas han comenzado a abogar por su resolución. Edward Vajda , conocido por su reciente propuesta de dené-yeniseiano , intenta establecer una posición que simpatice tanto con el enfoque de Greenberg como con el de sus críticos, como Lyle Campbell y Johanna Nichols . [17]
Anti-Greenbergiano
Greenbergiano