An unclassified language is a language whose genetic affiliation to other languages has not been established. Languages can be unclassified for a variety of reasons, mostly due to a lack of reliable data[1] but sometimes due to the confounding influence of language contact, if different layers of its vocabulary or morphology point in different directions and it is not clear which represents the ancestral form of the language.[2] Some poorly known extinct languages, such as Gutian and Cacán, are simply unclassifiable, and it is unlikely the situation will ever change.
A supposedly unclassified language may turn out not to be a language at all, or even a distinct dialect, but merely a family, tribal or village name, or an alternative name for a people or language that is classified.
If a language's genetic relationship has not been established after significant documentation of the language and comparison with other languages and families, as in the case of Basque in Europe, it is considered a language isolate – that is, it is classified as a language family of its own. An 'unclassified' language therefore is one which may still turn out to belong to an established family once better data is available or more thorough comparative research is done. Extinct unclassified languages for which little evidence has been preserved are likely to remain in limbo indefinitely, unless lost documents or a surviving speaking population are discovered.
Un ejemplo de lengua que ha causado múltiples problemas de clasificación es Mimi de Decorse en Chad . Este idioma sólo está atestiguado en una lista de palabras única recopilada ca. 1900. Al principio se pensó que era una lengua maban , debido a las similitudes con Maba , la primera lengua maban descrita. Sin embargo, a medida que se describieron otras lenguas de la familia Maban, quedó claro que las similitudes eran únicamente con el propio Maba, y la relación era demasiado distante para que Mimi se relacionara específicamente con Maba y no por igual con las otras lenguas Maban. Por lo tanto, ahora se cree que las similitudes obvias se deben a préstamos del maba, que es el idioma socialmente dominante en la zona. Cuando se descuentan dichos préstamos, hay muchos menos datos para clasificar a Mimi, y lo que queda no es particularmente similar a ninguna otra lengua o familia de lenguas. Por lo tanto, Mimi podría ser una lengua aislada, o quizás un miembro de alguna otra familia relacionada con Maban en el filo nilo-sahariano propuesto pero aún no demostrado . Sería más fácil abordar el problema con mejores datos, pero nadie ha podido volver a encontrar hablantes de la lengua.
También sucede que una lengua puede no estar clasificada dentro de una familia establecida. Es decir, puede ser obvio que es, digamos, una lengua malayo-polinesia , pero no está claro a qué rama del malayo-polinesio pertenece. Cuando una familia consta de muchas lenguas similares con un alto grado de contacto confuso, una gran cantidad de lenguas pueden quedar efectivamente desclasificadas de esta manera. Las familias donde esto constituye un problema importante incluyen a las malayo-polinesias, bantúes , pama-nyungan y arahuacas .
Hay cientos de lenguas sin clasificar, la mayoría extintas, aunque hay algunas, aunque relativamente pocas, que todavía se hablan; En la siguiente lista, las lenguas extintas están etiquetadas con una daga (†).
Estas lenguas son inclasificables, no sólo no están clasificadas, porque si bien puede haber registros de la existencia de una lengua, es posible que no haya suficientes materiales para analizarla y clasificarla, especialmente en el caso de lenguas ahora extintas. (Ver, por ejemplo, una lista de lenguas no clasificadas de América del Sur ).
Muchas de estas lenguas también se consideran inclasificables, ya que la cantidad de datos puede no ser suficiente para revelar parientes cercanos, si los hubiera. Para otros, puede haber datos suficientes para mostrar que la lengua pertenece a una familia particular, pero no dentro de ella, o para mostrar que la lengua no tiene parientes cercanos, pero no suficientes para concluir que es una lengua aislada.
Algunas 'lenguas' resultan ser inventadas, como la lengua kukurá de Brasil.