Este cuadro de reconocimiento de idiomas presenta una variedad de pistas que se pueden utilizar para ayudar a determinar el idioma en que está escrito un texto.
Personajes
El idioma de un texto extranjero a menudo se puede identificar buscando caracteres específicos de ese idioma.
- ABCDEFGHIJKLMNOPQRSTUVWXYZ ( alfabeto latino )
- y ningún otro – inglés , indonesio , latín , malayo , suajili , zulú
- àäèéëïijöü – holandés (a excepción de la ligadura ij, estas letras son muy raras en holandés. Incluso los textos holandeses bastante largos a menudo no tienen signos diacríticos ).
- áêéèëïíîôóúû Afrikáans
- êôúû – frisón occidental
- ÆØÅæøå – danés , noruego
- Diacríticos simples , en su mayoría diéresis
- ÄÖäö – finlandés (BCDFGQWXZÅbcfgqwxzå se encuentran solo en nombres y préstamos, ocasionalmente también ŠšŽž)
- ÅÄÖåäö – sueco (ocasionalmente é)
- ÄÖÕÜäöõü – Estonio (BCDFGQWXYZcfqwxyz se encuentran solo en nombres y préstamos, ocasionalmente también ŠšŽž)
- ÄÖÜẞäöüß – Alemán
- Circunflejos
- ÇÊÎŞÛçêîşû – kurdo
- ĂÂÎȘȚăâîșț – rumano
- ÂÊÎÔÛŴŶÁÉÍÏâêîôûŵŷáéíï – galés ; (ÓÚẂÝÀÈÌÒÙẀỲÄËÖÜẄŸóúẃýàèìòùẁỳäëöüẅÿ también se usa, pero con mucha menos frecuencia)
- ĈĜĤĴŜŬĉĝĥĵŝŭ – esperanto
- Tres o más tipos de diacríticos
- ÇĞİÖŞÜçğıöşü – turco
- ÁÐÉÍÓÚÝÞÆÖáðéíóúýþæö – islandés
- ÁÐÍÓÚÝÆØáðíóúýæø – feroés
- ÁÉÍÓÖŐÚÜŰáéíóöőúüű – húngaro
- ÀÇÉÈÍÓÒÚÜÏàçéèíóòúüï· – catalán
- ÀÂÆÇÉÈÊËÎÏÔŒÙÛÜŸàâæçéèêëîïôœùûüÿ – Francés ; (Ÿ y ÿ se encuentran solo en ciertos nombres propios)
- ÁÀÇÉÈÍÓÒÚËÜÏáàçéèíóòúëüï (· sólo en dialecto gascón) – occitano
- ÁÉÍÓÚÂÊÔÀãõçáéíóúâêôà (ü brasileña y k, w e y no en palabras nativas) – Portugués
- ÁÉÍÑÓÚÜáéíñóúü ¡¿ – Español
- ÀÉÈÌÒÙàéèìòù – italiano
- ÁÉÍÓÚÝÃẼĨÕŨỸÑG̃áéíóúýãẽĩõũỹñg̃ - Guaraní (el único idioma que usa g̃)
- ÁĄĄ́ÉĘĘ́ÍĮĮ́ŁŃ áąą́éęę́íįį́łń (FQRVfqrv no está en palabras nativas) – Lenguas atabascanas del sur
- ąłńóż Lenguas lequíticas
- A, Ą, Ã, B, C, D, E, É, Ë, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ò, Ó, Ô, P, R, S, T, U, Ù, W, Y, Z, Ż – Casubio
- ČŠŽ
- ĐÀẢÃÁẠĂẰẲẴẮẶÂẦẨẪẤẬÈẺẼÉẸÊỀỂỄẾỆÌỈĨÍỊÒỎÕÓỌÔỒỔỖỐỘƠỜỞ ỠỚỢÙỦŨÚỤƯỪỬỮỨỰỲỶỸÝỴ đàảãáạăằẳẵắặâầẩẫấậèẻẽéẹêềểễếệìỉĩíịòỏõóọồổỗốơờởỡớợ ùủũúụưừửữứựỳỷỹýỵ – vietnamita
- ā ē ī ō ū: puede verse en algunos textos japoneses en rōmaji o transcripciones (ver más abajo) o en textos hawaianos y maoríes .
- é – Sundanés
- ñ - Vasco
- أ ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه ؤ و ئ ى ي ء Escritura árabe
- Familia de escrituras brahmicas
- Escritura bengalí
- অ আ কা কি কী উ কু ঊ কূ ঋ কৃ এ কে ঐ কৈ ও কো ঔ কৌ ক্ কত্ কং কঃ কঁ ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ৰ ল ৱ শ ষ স হ য় ড় ঢ় ০ ১ ২ ৩ ৪ ৫ ৬ ৭ ৮ ৯
- utilizado para escribir bengalí y asamés .
- Devanagari
- अ आ इ ई उ ऊ ऋ ॠ ऌ ॡ ऍ ऎ ए ऐ ऑ ऒ ओ ओ क ख ग घ ङ च छ ज झ ञ ट ठ ड ढ ण त थ द ध न प फ ब भ म य र ल ळ व श ष स ह ० १ २ ३ ४ ५ ६ ७ ८ ९ प् पँ पं पः प़ पऽ
- Se utiliza para escribir, ya sea junto con otras escrituras o exclusivamente, varios idiomas indios , incluidos el sánscrito , el hindi , el maithili , el magahi marathi , el cachemiro , el sindhi , el bhili , el konkani , el bhojpuri y el nepalí de Nepal .
- Gurmukhi
- Escritura gujarati
- અ આ ઇ ઈ ઉ ઊ ઋ ઌ ઍ એ ઐ ઑ ઓ ઔ ક ખ ગ ઘ ઙ ચ છ જ ઝ ઞ ટ ઠ ડ ઢ ણ ત થ દ ધ ન પ ફ બ ભ મ ય ર લ ળ વ શ ષ સ હ ૠ ૡૢૣ
- Solía escribirse en gujarati y kachchi.
- Escritura tibetana
- АБВГДЕЖЗИКЛМНОПРСТУФХЦЧШ ( alfabeto cirílico )
- ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ αβγδεζηθικλμνξοπρσςτυφχψω (Alfabeto griego ) – Griego
- אבגדהוזחטיכלמנסעפצקרשת ( alfabeto hebreo )
- y tal vez algunos puntos y líneas extraños encima, debajo o dentro de los caracteres – Hebreo
- פֿ; puntos/líneas debajo de las letras que aparecen solo con א,י y ו – Yiddish
- No hay puntos ni líneas alrededor de las letras, y más de unas pocas palabras terminan con א (es decir, la tienen en la posición más a la izquierda) – Arameo
- Ladino
- 漢字文化圈 – Algunas lenguas de Asia oriental
- 위키백과에 (nótese las elipses y círculos comunes) Coreano
- ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏ etc. -- ㄓㄨˋㄧㄣㄈㄨˊㄏㄠˋ ( Bopomofo )
- កខគឃងចឆជឈញដឋឌឍណតថទធនបផពភមសហយរលឡអវអ្កអ្ខអ ្គអ្ឃអ្ងអ្ចអ្ឆអ្ឈអ្ញអ្ឌអ ្ឋអ្ឌអ្ឃអ្ណអ្តអ្ថអ្ទអ្ធអ្នអ្បអ្ផអ្ពអ្ភអ្ មអ្សអ្ហអ្យអ្រអ្យអ្លអ្អអ្វ អក្សរខ្មែរ (alfabeto jemer ) - jemer
- Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ ( Armenian alphabet ) – Armenian
- ა ბ გდ ევ ზ ჱ თ ი კ ლ მ ნ ჲ ო პ ჟ რ ს ტ ჳ უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ ( alfabeto georgiano ) – georgiano
- Compras ษสหฬอฮฯะา฿เแโใไๅๆ๏ ๐๑๒๓๔๕๖๗๘๙๚๛ ( escritura tailandesa ) - tailandés
- AEIOUHKLMNPW' Alfabeto hawaiano - Hawaiano
- ⴰⴱⴲⴳⴴⴵⴶⴷⴸⴹⴺⴻⴼⴽⴾⴿⵀⵁⵂⵃⵄⵅⵆⵇⵈⵉⵊⵋⵌⵍⵎⵐⵑⵒⵓⵔⵕⵖⵗⵘ ⵙⵚⵛⵜⵝⵞⵠⵡⵢⵣⵤⵥⵦⵧ Tifinagh , una escritura utilizada para tamazight (bereber)
Alfabeto latino (posiblemente ampliado)
lenguas romances
Muchas raíces latinas .
- Letras acentuadas: â ç è é ê î ô û , raramente ë ï ; ù solo en la palabra où , à solo al final de algunas palabras (incluida à ). Nunca á í ì ó ò ú .
- Comillas angulares: « » (aunque también se utilizan comillas tipo «Q»); el diálogo se indica tradicionalmente mediante guiones.
- Palabras cortas comunes: la , le , les , un , une , des , de , du , à , au , et , ou , où , sur , il , elle , ils , se , je , vous , que , qui , y , en , si , ne , est , sont , a , ont .
- Muchas contracciones apostrofadas para pronombres y partículas comunes, es decir, palabras l ' o d ' , con menos frecuencia c ' , j ' , m ' , n ' , s ' , t ' o raramente z ' , sólo antes de una palabra que comienza con una vocal o, en algunos casos, una h .
- Dígrafos y trígrafos comunes:
- Dígrafos de vocales: au , ai , ei , ou . Final de palabra -ez .
- Dígrafos vocálicos (nasales): an , en , in , on , raramente un . En todos estos casos, la n se convierte en m antes de b , p o m (por ejemplo, embouchure , nunca * enbouchure ).
- Trígrafos vocales: eau , ein , ain , oin .
- Dígrafos consonánticos: ch , gu- . Raramente sh . Semiconsonante -ill- .
- Las letras w y k son raras y se utilizan sólo en préstamos, generalmente de lenguas germánicas (por ejemplo, whisky ).
- Las ligaduras œ y æ son convencionales, pero rara vez se usan (algunas palabras son bien conocidas, por ejemplo , œil , œuf(s) , bœuf(s) ; la mayoría de las demás son científicas/técnicas y tomadas del latín).
- Palabras que terminan en -aux , -eux o -oux .
- Caracteres: ¿ ¡ (signos de interrogación y exclamación invertidos), ñ
- Todas las vocales (á, é, í, ó, ú) pueden llevar acento agudo.
- La letra u puede llevar diéresis (ü), pero sólo después de la letra g
- Algunas palabras de uso frecuente: de, el, del, los, la(s), uno(s), una(s), y
- Sin contracciones apostrofadas
- No se utiliza acento grave
- Las letras k y w son raras y solo se utilizan en préstamos (por ejemplo, walkman ).
- Principios de palabras: ll- (compruebe que no sea galés ni catalán) doble L (ll)
- Terminaciones de palabras: -o, -a, -ción, -miento, -dad
- Comillas angulares: « » (aunque también se utilizan comillas con forma de "Q"); el diálogo suele indicarse mediante guiones
- Casi todas las palabras nativas terminan en vocal. Algunas excepciones son non , il , per , con y del .
- Palabra común de una letra: è .
- Palabra común: perché .
- Secuencias de letras: gli , gn , sci .
- Las letras j , k , w , x e y son raras y se utilizan sólo en préstamos (por ejemplo, whisky ).
- Terminaciones de palabras: -o , -a , -zione , -mento , -tà , -aggio .
- El acento grave (por ejemplo, en à) casi siempre aparece en la última letra de las palabras.
- Las consonantes dobles ( tt , zz , cc , ss , bb , pp , ll , etc.) son frecuentes.
- Caracteres: à, è, é, í, ï, ò, ó, ú, ü, ç, ·
- Combinación de caracteres tz (también común en euskera, sin embargo) y l·l
- Sílabas y palabras terminadas en -aig , -eig , -oig , -uig , -aix , -eix , -oix , -uix
- Secuencias de letras: tx (también común en euskera, sin embargo) y tg
- La letra y sólo se utiliza en la combinación ny y préstamos.
- Las letras k y w son raras y solo se utilizan en préstamos (por ejemplo, walkman ).
- Terminaciones de palabras: -o , -a , -es , -ció , -tat , -ment
- Palabra que comienza con ll- (también común en español y galés, sin embargo)
- Palabras comunes: això , amb , mateix , tots , que
- Personajes: ă â î ș ț
- Palabras comunes: și, de, la, a, ai, ale, alor, cu
- Terminaciones de palabras: -a, -ă, -u, -ul, -ului, -ție (o -țiune), -ment, -tate; nombres terminados en -escu
- Doble y triple i: copii, copiii
- Tenga en cuenta que el rumano a veces se escribe en línea sin diacríticos, lo que dificulta su identificación. A veces se usa una cedilla en la S (ş) y en la T (ţ) en lugar del diacrítico correcto, la coma (arriba).
- Caracteres: ã, õ, â, ê, ô, á, é, í, ó, ú, à, ç
- Palabras comunes de una letra: a, à, e, é, o
- Palabras comunes de dos letras: ao, as, às, da, de, do, em, os, ou, um
- Palabras comunes de tres letras: aos, com, das, dos, ele, ela, mas, não, por, que, são, uma
- Terminaciones comunes: -ção, -dade, -ismo, -mente
- Dígrafos comunes: ch, nh, lh; ejemplos: chave, galinha, baralho.
- Las letras k, w e y son poco frecuentes. Se encuentran sobre todo en préstamos lingüísticos, por ejemplo: keynesianismo , walkie-talkie , nylon .
- La mayoría de las palabras singulares terminan en vocal, l, m, r o z.
- Las palabras en plural terminan en -s.
- Caracteres: å, é, è, ê, î, ô, û
- Dígrafos y trígrafos comunes: ai, ae, én, -jh-, tch, oe, -nn-, -nnm-, xh, ou
- Palabras comunes de una letra: a, å, e, i, t', l', s', k'
- Palabras comunes de dos letras: al, ås, li, el, vs, ki, si, pô, pa, po, ni, èn, dj'
- Palabras comunes de tres letras: dji, nén, rén, bén, pol, mel
- Terminaciones comunes: -aedje, -mint, -xhmint, -ès, -ou, -owe, -yî, -åcion
- Los apóstrofos van seguidos de un espacio (preferiblemente uno que no se rompa), por ejemplo: l' ome en lugar de l'ome .
- Similar al portugués; el artículo indefinido "unha" (fem. plural), el sufijo -ción y un uso más intenso de la letra "x" suelen firmar el gallego.
- Artículos definidos o (masc. sing.), os (masc. plural), a (fem. sing.), as (fem. plural)
- Diagramas comunes: nh (ningunha)
- Las letras j, k, w e y no están en el alfabeto y aparecen solo en préstamos.
Lenguas germánicas
- Palabras: un , una , y , en , de , sobre , el , que , a , es , qué , yo ( yo siempre es mayúscula cuando se habla de uno mismo)
- secuencias de letras: th , ch , sh , ough , augh , qu
- terminaciones de palabras: -ing , -tion , -ed , -age , -s , -'s , -'ve , -n't , -'d
- La gran mayoría de las palabras terminan en consonante o, a veces, en e. Algunas excepciones comunes son: who, to, so, no, do, a y algunos nombres como Julia.
- diacríticos o acentos solo en préstamos (piñata)
- secuencias de letras ij (en mayúscula como IJ , y también encontrada como ligadura, IJ o ij ), ei , ou , au , oe , vocales duplicadas (pero no ii ), kw , ch , sch , oei , ooi , aai y uw ( especialmente eeuw , ieuw , auw y ouw ).
- Todas las consonantes, excepto h , j , q , v , w , x y z, se pueden duplicar.
- Las letras c (excepto en la secuencia (s)ch ), q , x e y casi sólo se encuentran en préstamos lingüísticos.
- palabras: het, op, en, een, voor (y compuestos de voor ).
- Terminaciones de palabras: -tje , -sje , -ing , -en , -lijk ,
- al comienzo de las palabras: z-, v-, ge-
- t/m ocurre ocasionalmente entre dos puntos en el tiempo o entre números (por ejemplo, números de casa).
- secuencias de letras: ij , ei , oa
- palabras: yn
- Palabras: 'n , as , vir , nie .
- Similar al holandés, pero:
- Las letras holandesas comunes c y z son raras y se usan solo en préstamos lingüísticos (por ejemplo, chalet );
- La vocal holandesa común ij no se utiliza; en su lugar, se utilizan i e y (por ejemplo, -lik , sy );
- La terminación -en en las palabras holandesas más comunes es rara y se reemplaza por -e .
- diéresis (ä, ö, ü), ess-zett (ß)
- secuencias de letras: ch , sch , tsch , tz , ss ,
- palabras comunes: der , die , das , den , dem , des , er , sie , es , ist , ich , du , aber
- Terminaciones comunes: -en , -er , -ern , -st , -ung , -chen , -tät
- Letras raras: x , y (excepto en préstamos)
- La letra c rara vez se usa, excepto en las secuencias enumeradas anteriormente y en préstamos.
- palabras compuestas largas
- un punto (.) después de los números ordinales, p. ej. 3. Oktober
- Muchas palabras en mayúscula en medio de las oraciones, ya que el alemán escribe con mayúscula todos los sustantivos.
- letras å, ä, ö, raramente é
- palabras comunes: och , i , att , det , en , som , är , av , den , på , om , inte , men
- Terminaciones comunes: -ning , -lig , -isk , -ande , -ade , -era , -rna
- terminaciones de apellidos comunes: -sson , -berg , -borg , -gren , -lund , -lind , -ström , -kvist/qvist/quist
- palabras compuestas largas
- secuencias de letras: stj , sj , skj , tj , ck , än
- No se utilizan los caracteres w y z , excepto para nombres propios extranjeros y algunos préstamos, pero se utiliza x , a diferencia del danés y el noruego, que la reemplazan por ks.
- La duplicación de consonantes es común, pero la duplicación de vocales es muy rara.
- letras æ, ø, å
- palabras comunes: af, og, til, er, på, med, det, den ;
- terminaciones comunes: -tion , -ing , -else , -hed ;
- palabras compuestas largas;
- no se utilizan los caracteres q , w , x y z , excepto para nombres propios extranjeros y algunos préstamos lingüísticos;
- para distinguirlo del noruego: utiliza la combinación de letras øj ; uso frecuente de æ ; se conservan las ortografías de palabras extranjeras prestadas (en particular el uso de c ), como centralstation .
- La duplicación de consonantes es común, pero la duplicación de vocales es muy rara.
- letras æ, ø, å
- palabras comunes: av, ble, er, og, en, et, men, i, å, for, eller ;
- terminaciones comunes: -sjon , -ing , -else , -het ;
- palabras compuestas largas;
- no se utilizan los caracteres c , w , z y x excepto para nombres propios extranjeros y algunos préstamos lingüísticos;
- dos versiones del idioma: bokmål (mucho más cercano al danés) y nynorsk ; por ejemplo , ikke, lørdag, norge (bokmål) frente a ikkje, laurdag, noreg (nynorsk); Nynorsk usa la palabra òg ; los materiales impresos casi siempre se publican únicamente en bokmål;
- para distinguirse del danés: se utiliza la combinación de letras øy ; uso menos frecuente de æ ; la ortografía de palabras extranjeras prestadas se 'norsifica' (en particular eliminando el uso de c ), como sentralstasjon .
- La duplicación de consonantes es común, pero la duplicación de vocales es muy rara.
- letras á, ð, é, í, ó, ú, ý, þ, æ, ö
- comienzos comunes: fj- , gj- , hj- , hl- , hr- , hv- , kj- y sj- ,
- terminaciones comunes: -ar (especialmente -nar ), -ir (especialmente -nir ), -ur , -nn (especialmente -inn )
- no se utiliza el carácter c , q , w o z, excepto para nombres propios extranjeros, algunos préstamos y, en el caso de z , textos más antiguos.
- La duplicación de consonantes es común, pero la duplicación de vocales es muy rara.
- letras á, ð, í, ó, ú, ý, æ, ø
- Combinaciones de letras: ggj , oy , skt
- para distinguirlo del islandés: no utiliza é ni þ, utiliza ø en lugar de ö (a veces se escribe ö en las señales de tráfico, o incluso ő).
- La duplicación de consonantes es común, pero la duplicación de vocales es muy rara.
Lenguas bálticas
- utiliza signos diacríticos : ā, č, ē, ģ, ī, ķ, ļ, ņ, ō, ŗ, š, ū, ž
- no tiene letras: q, w, x, y
- Ya no se usa ō ni ŗ en el lenguaje moderno
- duplicación extremadamente rara de vocales
- duplicación rara de consonantes
- un punto (.) después de los números ordinales, p. ej. 2005. gads
- palabras comunes: ir , bija , tika , es , viņš
- abundancia visual de letras ą, č, ę, ė, į, š, ų, ū, ų
- no tiene letras q, w, x
- duplicación extremadamente rara de vocales y consonantes
- muchas formas variadas (generalmente terminaciones) de la misma palabra, por ejemplo, namas, namo, namus, namams, etc.
- palabras generalmente largas (ausencia de artículos y menos preposiciones en comparación con las lenguas germánicas)
- palabras comunes: ir , yra , kad , apuesta .
Lenguas eslavas
- grupos de consonantes rz, sz, cz, prz, trz
- incluye: ą, ę, ć, ś, ł, ń, ó, ż, ź
- palabras w, z, we, i, na (varias palabras de una letra)
- palabras broma, sí
- palabras que comienzan con był, będzie, jest (formas de cópula być , "ser").
- abundancia visual de letras ž š ů ě ř
- palabras je, v
- Para distinguirlo del eslovaco: no utiliza ä, ľ, ĺ, ŕ o ô; ú sólo aparece al principio de las palabras.
- abundancia visual de letras ž š č ;
- usos: ä, ľ, y ô y (muy raramente) ĺ y ŕ;
- sufijos típicos: -cia , -ť ;
- para distinguir del checo: no usa ě, ř o ů.
- similar al serbio
- letras-dígrafos dž, lj, nj
- no tiene q, w, x, y
- Sufijos típicos: -ti , -ći
- letras especiales: č, ć, š, ž, đ
- Palabras comunes: a, i, u, je
- Para distinguir del serbio: las secuencias -ije- y -je- son comunes; verbos que terminan en -irati , -iran
- similar al croata
- letras-dígrafos dž, lj, nj (lj y nj son algo más comunes que dž, aunque no por mucho)
- sin q, w, x, y
- Sufijos verbales típicos -ti , -ći (el infinitivo se usa mucho menos que en croata)
- las palabras extranjeras pueden terminar en -tija , -ovan , -ovati , -uje
- Letras especiales: đ (raro), č, š (común), ć, ž (menos común)
- palabras comunes: a, i, u, je, jeste
- Sufijo de tiempo futuro -iće , -ićeš , -ićemo , -ićete (no se encuentra en croata)
- Las secuencias vocálicas -ije- y -je- son muy frecuentes en el serbio que se habla en Bosnia y Herzegovina, Montenegro y Croacia (ijekavica), pero no aparecen en Serbia porque cada una de esas secuencias se sustituye por -e- (ekavica).
- utiliza Џ, Ј, Љ, Њ, Ђ, Ћ
- no utiliza Щ, Ъ, Ы, Ь, Э, Ю, Я, Ё, Є, Ґ, Ї, І, Ў
- Para distinguir del macedonio: no utiliza Ѕ, Ѓ, Ќ
Lenguas celtas
- Las letras Ŵ y ŵ se utilizan en galés
- palabras y, yr, yn, a, ac, i, o
- secuencias de letras wy, ch, dd, ff, ll, mh, ngh, nh, ph, rh, th, si
- Letras no utilizadas: k, q, v, x, z
- Letra usada sólo en raras ocasiones, en préstamos: j
- Letras comúnmente acentuadas: â, ê, î, ô, û, ŵ, ŷ , aunque los acentos agudos ( ´ ), graves ( ` ) y diéresis ( ¨ ) pueden aparecer hipotéticamente en todas las vocales
- terminaciones de palabras: -ion, -au, -wr, -wyr
- y es la letra más común en el idioma
- w entre consonantes ( w de hecho representa una vocal en el idioma galés)
- El acento circunflejo ( ^ ) es, con diferencia, el signo diacrítico más común, aunque a menudo se omiten por completo los signos diacríticos.
- vocales con acento agudo: á é í ó ú
- Palabras que comienzan con secuencias de letras bp dt gc bhf
- secuencias de letras sc cht
- no se utiliza las letras J, K, Q, V, W.
- frecuente bh, ch, dh, fh, gh, mh, th, sh
- para distinguir del gaélico (escocés): puede haber palabras o nombres con la segunda (o incluso la tercera) letra en mayúscula en lugar de la primera: hÉireann .
- vocales con acentos graves: à è ì ò ù ( é y ó todavía se ven ocasionalmente, pero ahora se desaconseja su uso)
- secuencias de letras sg chd
- frecuente bh, ch, dh, fh, gh, mh, th, sh
- para distinguir del irlandés: los prefijos se separan con guion, por lo que generalmente no aparecen mayúsculas en el medio de las palabras: an t-Oban .
albanés(Shqip)
- letras únicas: ë , ç .
- ë es la letra más común en el idioma.
- La letra w no se utiliza excepto en préstamos.
- dh , gj , ll , nj , rr , sh , th , xh y zh se consideran una letra en lugar de dos.
- palabras comunes: po, jo, dhe, i, të, me
maltés(Maltés)
- letras únicas: ċ, ġ, ħ, għ, ħ, ż
- Origen semítico, bastante inteligible con el árabe.
- utiliza il-xxx para el artículo definido
Lenguas iraníes
- utiliza circunflejo ( ^ ): ê, î, û y cedilla ( ¸ ): ç, ş
- La palabra xwe (oneself, myself, yourself, etc.) aparece con frecuencia y es muy específica ( combinación xw )
- ( I, i ) es la letra más común en el idioma
- utiliza ocho vocales (a, e, ê, i, î, o, u, û)
- Imposible encontrar una palabra sin ninguna vocal
- tiene muchas palabras compuestas
Lenguas finougrias
- letras distintas å , ä y ö ; pero nunca õ o ü ( y ocupa el lugar de ü )
- b , f , z , š y ž aparecen sólo en préstamos y nombres propios ; los dos últimos se sustituyen por sh o zh en algunos textos
- c , q , w , x , å aparecen sólo en nombres propios (normalmente extranjeros)
- Fuera de los préstamos, la d aparece solo entre vocales o en hd.
- Fuera de los préstamos, g sólo aparece en ng
- Aparte de los préstamos, las palabras no comienzan con dos consonantes; esto se refleja en la estructura general de las sílabas, donde los grupos de consonantes solo aparecen a través de los límites de las sílabas, excepto en algunos préstamos.
- Palabras comunes: sinä , en
- Terminaciones comunes: -nen , -ka / -kä , -in , -t (sufijo plural)
- combinaciones de vocales comunes: ai , uo , ei , ie , oi , yö , äi
- Grado inusualmente alto de duplicación de letras; tanto las vocales como las consonantes estarán geminadas, por ejemplo, aa , ee , ii , kk , ll , ss , yy , ää.
- palabras largas y frecuentes
- letras distintas: õ , ä , ö y ü ; pero nunca ß o å
- Similar al finlandés, excepto:
- La letra y no se utiliza, excepto en préstamos ( la ü es la vocal correspondiente)
- Las letras b y g (sin n precedente ) se encuentran fuera de los préstamos lingüísticos.
- Uso ocasional de š y ž , principalmente en préstamos (más la combinación tš )
- Los préstamos son más comunes en general que en finlandés, principalmente tomados del alemán.
- Las palabras terminan en consonantes con más frecuencia que en finlandés, siendo particularmente típicas las b , d y v finales de palabra.
- La letra d es mucho más común en estonio que en finlandés, y en estonio suele ser la última letra de la palabra (sufijo plural), lo que nunca ocurre en finlandés.
- La doble öö es más común que en finlandés; otras dobles pueden incluir õõ , üü , raramente hh (para la ch alemana ) e incluso šš
- palabras comunes: ja , on , ei , ta , ver , või .
- Las letras ő y ű ( doble acento agudo ) son exclusivas del húngaro.
- Las letras acentuadas á y é son frecuentes
- Combinaciones de letras: cs, dz, dzs, gy, ly, ny, sz, ty, zs (todas clasificadas como letras separadas), leg‐, ‐obb (nota: sz también es común en polaco)
- palabras comunes: a, az, ez, egy, és, van, hogy
- letra k muy frecuente (sufijo plural)
Lenguas esquimales y aleutianas
- Palabras polisintéticas largas (una sola palabra puede tener más de 30 letras)
- relativamente abundante n , q (no necesariamente seguida de u ), u
- omnipresentes consonantes dobles y vocales ( aa , ii , qq , uu , más raramente ee , oo )
- Las vocales a , i , u son notablemente más frecuentes que e , o (que sólo se encuentran antes de q y r )
- Sin diptongos excepto ai ocasional al final de palabra , solo combinaciones de consonantes además de consonantes dobles y (n)ng consisten en r + consonante
- Las ortografías antiguas (ahora abolidas en la reforma ortográfica) a veces incluían acento agudo, circunflejo y/o tilde: Qânâq vs. Qaanaaq .
Lenguas del Atabascano meridional
- vocales con acento agudo, ogonek (gancho nasal), o ambos: á, ą, ą́
- vocales duplicadas: aa, áá, ąą, ą́ą́
- l cortada : ł (¡compruebe que no sea polaco!)
- n con acento agudo: ń
- comillas: ' o '
- secuencias: dl, tł, tł', dz, ts', ií, áa, aá
- Puede tener palabras bastante largas
Además de lo anterior,
Además de lo anterior,
- usos: u, ú, ų
- no utiliza o , ó o ǫ
Guaraní
- Muchas tildes sobre vocales (incluidas y) y n
- tilde sobre g: g̃—es el único idioma del mundo que la usa. Ejemplos: hagũa y g̃uahẽ .
- b, d y g generalmente no aparecen sin m o n antes (mb, nd, ng) a menos que sean palabras prestadas del español.
- f, l, q, w, x, z son préstamos externos extremadamente raros
- no usa c sin h: ch
japonésenRomaji(Nihongo/japonés)
- palabras: desu, aru, suru , esp. al final de las oraciones;
- terminaciones de palabras: -masu, -masen, -shita ;
- Letras: El japonés casi siempre alterna entre una consonante y una vocal. Las excepciones son los dígrafos shi y chi , la africada tsu , la geminación (dos consonantes iguales seguidas) y la palatalización (una consonante seguida de la letra y ).
- Se puede utilizar un macrón o un acento circunflejo para indicar vocales dobles, p. ej.: Tōkyō
- palabras comunes: no, o, wa, de, ni
(Nota: Romaji no se utiliza con frecuencia en la escritura japonesa. Se utiliza con mayor frecuencia entre extranjeros que están aprendiendo la pronunciación del idioma japonés).
Hmong(Hmoob) escrito enAlfabeto popular romanizado
- Casi todas las palabras escritas son bastante cortas (una sílaba).
- Las sílabas (a menos que se pronuncien con tono medio) terminan en una letra de tono: una de bsjvmgd , lo que da lugar a "grupos consonánticos" aparentes como -wj
- w puede ser la vocal principal de una sílaba (por ejemplo, tswv )
- Las sílabas pueden comenzar con secuencias como hm-, ntxh-, nq- .
- Sílabas que terminan en vocales dobles (especialmente -oo, -ee ) posiblemente seguidas de letras tonales (como en Hmoob "Hmong").
vietnamita(vietnamitas)
- Caracteres romanos con más de un signo diacrítico en la misma vocal. Véase más arriba.
- Casi todas las palabras escritas son bastante cortas (de una sílaba y, en su mayoría, de menos de seis caracteres).
- Palabras que comienzan con ng o ngh
- Palabras que terminan en nh
- palabras comunes: cái, không, có, ở, của, và, tại, với, để, đã, sẽ, đang, tôi, bạn, chúng, là
Citado en vietnamita legible (VIQR)
- Los siguientes caracteres (a menudo en combinación) después de las vocales: ^ ( + ' ` ? ~ .
- DD, Dd o dd
- El siguiente carácter antes de la puntuación: \
vietnamitaVNIcodificación
- Los dígitos 1-8 después de las vocales
- El dígito 9 después de una D o d
- El siguiente carácter antes de números: \
- Los siguientes caracteres después de las vocales: sfrxj
- Las siguientes vocales, duplicadas: aeo
- La letra w después de los siguientes caracteres: aou
- DD, Dd o dd
Chino, romanizado
- En general, las sílabas del mandarín terminan solo en vocales o n, ng, r; nunca en p, t, k, m.
- Palabras que empiezan con x, q, zh
- Marcas tonales en vocales, como ā, á, ǎ, à
- Para mayor comodidad al utilizar una computadora, a veces se sustituyen por números, por ejemplo, a1, a2, a3, a4.
- Las palabras no comienzan con b, d, g, z, q, x, r
- Palabras que empiezan con hs
- Muchas palabras con guion
- Apóstrofos después de letras iniciales o dígrafos, p. ej. t'a, ch'i
- Muchas combinaciones de vocales inusuales como ae, eei, ii, iee, oou, yy, etc.
- Inserción de r, por ejemplo arn, erng, etc.
- Palabras que terminan en nn, nq
- Muchas palabras con guion.
- Las palabras pueden terminar en p, t, k, m, n, ng, h; nunca r
- Caracteres romanos con muchos signos diacríticos en las vocales. A diferencia del vietnamita, cada carácter tiene como máximo un signo de este tipo.
- Caracteres de combinación inusuales, a saber, · (punto central, siempre después de o ) y | (barra vertical). ¯ ( macrón ) también es común.
Lenguas austronesias
Puede contener lo siguiente:
Prefijos: me-, mem-, memper-, pe-, per-, di-, ke-
Sufijos: -kan, -an, -i
Otros (estos casi siempre se escriben en minúsculas): yang, dan , di, ke, oleh, itu
El malayo y el indonesio son mutuamente inteligibles para hablantes competentes, aunque los traductores e intérpretes generalmente serán especialistas en uno u otro idioma. Véase Comparación entre el malayo estándar y el indonesio .
Uso frecuente de la letra 'a' (comparable a la frecuencia de la 'e' inglesa).
La mayoría de las lenguas polinesias utilizan AEFGHIKLMNOPRSTUV y ʻ (a veces escrito ' o Q)
- Consonantes siempre separadas por una o más vocales ( fenua , haʻapai , ʻolelo )
- Vocales cortas y largas, escritas con macrón (āēīōū) o por réplica (aa, ee, ii, oo, uu)
- Diptongos frecuentes ( oiaue , maorí )
- Las palabras siempre terminan con vocal
- Los préstamos se transcriben (como en japonés): Sesu Kilisito = Jesucristo, polokalama = programa)
- Préstamos frecuentes del inglés o del francés (dependiendo de la historia colonial)
- AEFHIKLMN DE OPSTUV `
- ng ( Tonga ), h, terminaciones en -onua ( fonua )
- artículo te
- palabras frecuentes: 'o, te, ki, mei, i, faka-
- Préstamos del inglés
- AEFGILMNOPSTUV `
- sin letra K, usa okina (ʻ) o nada en su lugar ( faka en tongano es faʻa en samoano)
- uso frecuente de L ( le )
- palabras frecuentes: o , e , le , se , a , i , ma
- AEFGHIKLMNOPSTUV `
- Distinguir del tongano: g en lugar de ng ( tokaga )
- artículo te
- h es más frecuente que s ( tahi )
- palabras frecuentes: ko, te, ki, mai, i, o, ne'e, e, mo, faka-
- Préstamos del francés
- AEFGHIKLMNOPSTUV `
- artículo le
- palabras frecuentes: ko, le, ki, mei, i, o, mo, faka-
- Distingue de Wallis: S es más frecuente que H ( tasi )
- Distinguir del samoano: letra K
- Préstamos del francés
Lenguas turcas
Tenga en cuenta que algunas lenguas turcas como el azerí y el turcomano utilizan un alfabeto latino similar (a menudo Jaŋalif ) y palabras similares, y podrían confundirse con el turco. El azerí tiene las letras Əə, Xx y Qq que no están presentes en el alfabeto turco, y el turcomano tiene Ää, Žž, Ňň, Ýý y Ww. Caracteres latinos utilizados exclusivamente (o casi exclusivamente) para las lenguas turcas: Əə, Ŋŋ, Ɵɵ, Ьь, Ƣƣ, Ğğ, İ e ı. Todas las lenguas turcas pueden formar palabras largas añadiendo varios sufijos.
turco(Türkçe/Türkiye_Türkçesi)
Alfabeto turco
Minúsculas: abc ç defg ğ h ı ijklmno ö prs ş tu ü vyz
Mayúsculas: ABC Ç DEFG Ğ HI İ JKLMNO Ö PRS Ş TU Ü VYZ
Palabras comunes
- bir — uno, un
- pero — esto
- ancak — pero
- oldu — fue (sucedió)
- şu — eso
Misceláneo.
- La letra "j" sólo se utiliza en préstamos lingüísticos.
- Las palabras nunca comienzan con "ğ"
- Busque terminaciones de palabras comunes. Los cambios de tiempo en los verbos turcos se crean agregando sufijos al final del verbo. Las pluralizaciones se producen agregando -lar y -ler .
- Cambios de tiempo comunes: -yor -mış -muş -sun
- Posesividad/persona: -im -un -ın -in -iz -dur -tır
- Ejemplo: Yap tı , "[Él] lo hizo"; Yap es la raíz del verbo que significa "hacer", -mış indica el tiempo perfecto, -tır indica la tercera persona (él/ella/eso).
- Ejemplo: Ada lar , "Islas"; Ada es un sustantivo que significa "isla", -lar lo hace plural.)
- Ejemplo: Ev imiz , "Nuestra casa"; Ev es un sustantivo que significa "casa", -im indica el poseedor en primera persona, que -iz hace plural.)
El azerí se reconoce fácilmente por el uso frecuente de la ə . Esta letra no se utiliza en ningún otro alfabeto latino moderno reconocido oficialmente. Además, utiliza las letras x y q , que no se utilizan en turco.
- Palabras comunes: və , ki , ilə , bu , o , isə , görə , da , də
- Uso frecuente de signos diacríticos: ç , ğ , ı , İ , ö , ş , ü
- Palabras que terminan en -lar , -lər , -ın , -in , -da , -də , -dan , -dən
- Palabras que nunca comienzan con ğ o ı
- Palabras que rara vez comienzan con dos o más consonantes
- Transliteración de palabras y nombres extranjeros, p. ej. Audrey Hepburn = Odri Hepbern
Chino(chino)
- Sin espacios, excepto entre signos de puntuación y (a veces) palabras extranjeras.
- A veces se utilizan números arábigos (0-9)
- Puntuación:
- Periodo 。(no .)
- Coma serial 、(se distingue de la coma regular ,)
- Elipse …… (seis puntos)
- Sin hiragana , katakana o hangul
- Puede escribirse verticalmente
Chino simplificado(简体) vsChino tradicional(Español:Frases)
Nota: Muchos caracteres no se simplificaron. Como resultado, es común que una palabra o frase corta sea idéntica en el idioma simplificado y en el tradicional, pero es poco común que una oración completa también sea idéntica.
Radicales comunes diferentes entre tradicional y simplificado:
- Simplificado:讠钅饣纟门(por ejemplo,语 银 饭 纪 问)
- Tradicional:訁釒飠糹門(por ejemplo,語 銀 飯 紀 問)
Caracteres comunes diferentes entre el tradicional y el simplificado:
- Simplificado:国 会 这 来 对 开 关 门 时 个 书 长 万 边 东 车 爱 儿
- Tradicional:國 會 這 來 對 開 關 門 時 個 書 長 萬 邊 東 車 愛 兒
Chino escrito estándar (basado en el mandarín) vs. cantonés vernáculo escrito
Nota: Además de Hong Kong, también hay hablantes de cantonés en el sur de China continental, Malasia y Singapur [1] , por lo que el cantonés escrito puede escribirse en caracteres simplificados o tradicionales.
Caracteres comunes del cantonés vernáculo que no aparecen o aparecen raramente en el mandarín:
Algunos de los caracteres anteriores no son compatibles con todas las codificaciones de caracteres, por lo que a veces el radical 口 de la izquierda se sustituye por un 0 o un o , por ejemplo
A veces, se utilizan diferentes caracteres chinos para expresar el mismo significado en cantonés y mandarín. Si utilizas el que se usa comúnmente en cantonés para expresar el mismo significado cuando hablas o escribes en mandarín, un hablante nativo puede confundirse o incluso tener dificultades para entenderlo, y viceversa. Algunos ejemplos son: (cantonés vs mandarín)
- 食vs吃(comer) 飲vs喝(beber) 企vs站(ponerse de pie) 凍vs冷(frío) 落vs下(abajo) 著vs穿(vestirse) 讀vs唸(leer) 鬧vs罵(reñir) 計vs算(calcular) 咪vs別(no) 行vs走(caminar/ir) 先vs才(entonces)
Hay palabras chinas que se utilizan para construir vocabularios que se utilizan en cantonés y que no se utilizan o rara vez se utilizan en el mandarín moderno. Algunos ejemplos son: (cantonés vs mandarín)
- 成日vs整天(siempre) 傾計vs聊天(hablar) 返工vs上班(ir a trabajar) 溫書vs溫習(estudiar) 影片vs視頻(video) 隔離vs旁邊(cerca) vs蓋樓(construir un casa) 聽日vs明天(mañana) 巴閉vs囂張(arrogante) 搞掂vs完成(terminado) 定係vs還是(o) 靚仔vs帥哥(hombre guapo) 鍾意vs喜歡(como) 犀利vs厲害(poderoso) 同埋vs和/及(y) 黐綫vs瘋的(loco) 雪櫃vs冰箱(refrigerador)
El vocabulario cantonés formado a partir de palabras cantonesas se utiliza en la vida cotidiana en el sur de China y no se utiliza en el mandarín moderno. Algunos ejemplos son:
- 咪咁(no seas así) 好冇(¿vale?) 玩嘢(jugar una mala pasada) 做嘢(trabajar) 睇戲(ver una película/película) 唔知(no sé) 埋嚟( venir) 嗰個(eso) 咁嘅嘢(tal cosa) 佢哋(ellos) 咩事/乜事(¿qué?) 冇嘢(nada) 嗰陣(en ese momento) 越嚟越多(más y más) 我嘅(mío) 梗係(por supuesto) 𥄫(echar un vistazo) 冧佢(ámelo) 拎畀我(llévalo a yo) 嘥曬(todo se desperdicia) 你啱(tienes razón) 𢫏住(cubrir algo) 冚唪唥(todo) 撳實(presionar algo con fuerza) 瞓覺(dormir) 掟石仔(tirar un piedra pequeña) 唓[una palabra modal para expresar desprecio] 噃[una palabra modal para recordar o advertir a alguien] 詏交(discutir) 好嬲(muy enojado) 心悒(sentirse deprimido en el corazón) 𧨾女仔(complacer a chica) 得咁多咋(sólo esto) 做好咗(hecho algo bien)
Por último, cuando se introducen términos de otros países (especialmente de Estados Unidos y el Reino Unido) en China, el cantonés y el mandarín suelen recibir traducciones diferentes, donde el cantonés suele traducirse según la pronunciación de los términos en inglés y el mandarín suele traducirse según el significado de los términos. Algunos ejemplos son: (cantonés vs mandarín)
- 的士(dik1 si2, no tiene un significado directo, traducido según la pronunciación inglesa) vs 出租車(chū zū chē, que significa coches para alquilar), traducido de Taxi.
- 巴士(baa1 si2, no tiene un significado directo, traducido según la pronunciación inglesa) vs 公車(gōng chē, que significa coches públicos), traducido de Autobús.
- 多士(do1 si2, no tiene un significado directo, traducido según la pronunciación en inglés) vs 土司(tǔ sī, no tiene un significado directo, traducido según la pronunciación en inglés), traducido de Toast.
- 騷(sou1, no tiene un significado directo, traducido según la pronunciación en inglés) vs 秀(xìu, no tiene un significado directo, traducido según la pronunciación en inglés), traducido de Show.
- 士多(si2 do1, no tiene un significado directo, traducido según la pronunciación inglesa) vs 小店(xiǎo diàn, que significa pequeña tienda), traducido de Tienda.
- 𨋢(lip1, no tiene un significado directo, traducido según la pronunciación inglesa) vs 升降機(shēng jiàng jī, que significa máquina que se eleva y se baja), traducido de Ascensor/Elevador.
- 掰拜(baai1 baai3, no tiene un significado directo, traducido según la pronunciación inglesa) vs 再見(zài jiàn, que significa hasta luego), traducido de Byebye/Adiós.
japonés(Japonés)
- Caracteres katakana (カタカナ) e hiragana (ひらがな) mezclados con kanji (漢字)
- Sin espacios
- Sistema numérico = Números árabes (1,2,3 etc.)
- Puntuación:
- Período .
- Coma 、(, también se utiliza en bytes dobles)
- Comillas 「」
- Caracteres pequeños ocasionales junto a los grandes, por ejemplo. しゃ りゅ しょ って シャ リュ ショ ッテ
- Marcas dobles (conocidas como daku-on) que aparecen en la parte superior derecha de los caracteres, por ejemplo. で が ず デ ガ ズ
- Círculos vacíos (conocidos como handaku-on) que aparecen en la parte superior derecha de los caracteres, por ejemplo. ぱ ぴ パ ぴ
- Personajes frecuentes: の を は が
- Originalmente escrito en formato vertical (libros, escuela, etc.) pero en línea aparece mayormente en formato horizontal.
coreano(Amor/Amor)
- Signos de puntuación de estilo occidental
- Espaciado al estilo occidental
- Letras hangul (fonéticas) ej: ㅂ (b en book) ㅈ (j en jump) ㅅ (s en sock) ㅊ (ch en champion) ㅍ (p en pox)
- Letras Hangul utilizadas para formar bloques de sílabas; por ejemplo, ㅅ s + ㅓ o + ㅇ ng = 성 canción
- Los círculos y las elipses son comunes en hangul; son extremadamente raros en chino.
- La apariencia general tiene una complejidad relativamente uniforme, en contraste con la china o la japonesa.
Idioma jemerភាសារខ្មែរ
El idioma jemer se escribe utilizando el alfabeto distintivo del jemer .
- rara vez usa espacios
- Las letras tienen una forma distintivamente "más alta" que otras escrituras brahmicas.
- Utiliza números jemeres al escribir ១ ២ ៣ ៤ ៥ ៦ ៧ ៨ ៩.
- Tiene una versión más pequeña de consonantes colocadas debajo de las consonantes principales que pueden aparecer agrupadas.
- Tiene 24 signos diacríticos que denotan rimas de sílabas: ា ិ ី ឹ ឺ ុ ូ ួ ើ ឿ ៀ េ ែ ៃ េា ៅ ុំ ំ ាំ ះ ុះ េះ ោះ
- Usa esto como punto final: ។
Griego(Elogios)
El griego moderno se escribe con el alfabeto griego en forma monótona , politónica o átona , ya sea según la gramática demótica ( Sr. Triantafilidis ) o la gramática katharevousa . Algunas personas escriben en greeklish (griego con escritura latina), que es visual, ortográfica o fonética o simplemente desordenada (mixta). Las únicas formas ortográficas oficiales del idioma griego son la monótona y la politónica.
Griego moderno normal (griego monótono)
- palabras y, είναι ;
- Cada palabra de varias sílabas tiene un acento/marca de tono ( oxia ): ά έ ή ί ό ύ ώ
- El único otro diacrítico utilizado es el tréma: ϊ/ΐ, ϋ/ΰ, etc.
Griego anterior a 1980 (griego politónico)
Katharevousa , Dimotiki (gramática de Triantafylidis )
- Diacríticos: ά, ᾶ, ἀ, ἁ, y combinaciones, también con otras vocales.
- Algunos textos, especialmente en Katharevousa, también tienen ὰ, ᾳ, en combinación con otros signos diacríticos.
Griego antiguo
- Diacríticos: ά, ὰ, ᾶ, ἀ, ἁ, ᾳ, y combinaciones, también con otras vocales; ῥ; La tilde (ᾶ) a menudo se parece más a un circunflejo redondeado.
- Algunos textos presentan sigma semilunar (parece c) en lugar de σ/ς
Griego ático
- Era común en algunos medios de comunicación griegos (televisión);
- Verá caracteres griegos sin acentos/tonos;
- palabras: και, ειναι, αυτο .
griego enGriego
- Existe un software de conversión automática de griego-lish a griego. Si encuentra un texto griego-lish, puede resultarle útil para la Wikipedia en griego (después de la conversión).
- Tenga en cuenta: en greco-léxico se puede utilizar más de un carácter para cada letra. (ejemplo: th para Θ ( theta )).
Griego ortográfico
Griego fonético
- palabras ke, ine ;
- omega aparece como o;
- ei, oi aparecen como i;
- ai aparece como e.
Greeklish basado en imágenes
- omega (Ω o ω) puede aparecer como W o w;
- épsilon (E) puede aparecer como 3 ;
- alfa (A) puede aparecer como 4 ;
- theta (Θ) puede aparecer como 8 ;
- upsilon (Y) puede aparecer como \|/ ;
- gamma (γ) puede aparecer como y
- Se puede utilizar más de un carácter para una letra.
Griego-lish desordenado (mixto)
- palabras kai, una ;
- combina principios del Greeklish fonético, visual y ortográfico según la idiosincrasia del escritor ;
- La forma más comúnmente utilizada de Greeklish.
armenio(español:Francés)
El armenio se puede reconocer por su alfabeto único de 39 letras:
Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք ԵՎ(և) Օ Ֆ
georgiano(Frases)
El georgiano se reconoce por su alfabeto único (hay que tener en cuenta que algunos caracteres han caído en desuso).
ა ბ გ დ ე ვ ზ ჱ თ ი კ ლ მ ნ ჲ ო პ ჟ რ ს ტ ჳ უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ
Alfabeto cirílico
La negrita denota letras exclusivas del idioma.
Lenguas eslavas
- usos: ё, і, й, ў, ы, э, '
- Características: se utiliza шч en lugar de щ
- el único idioma cirílico que no presenta и.
- usos: ъ, щ, я, ю, й
- palabras: със, в
- características: muchas palabras terminan en artículo definido –ът, –ят, –та, –то, –те
- usos: ј, љ, њ, џ, ѓ , ќ , ѕ
- Palabras: во, Ёо
- Características: р se encuentra generalmente entre consonantes, por ejemplo првин
ruso(ruso)
- usos: ё, й, ъ (raramente), ы, э, щ
- usos: ј, љ, њ, џ, ђ , ћ
- no utiliza: ъ, щ, я, ю, й
- Palabras: је, yu
- características: grupos de consonantes grandes, por ejemplo српски
- usos: є, и, і, ї, й, ґ, є щ, '
- no utiliza: ъ, ё, ы, э
mongol
- usos: ү, ҩ
- no utiliza: ё, й, к, щ, ъ, ы, ь, ю, я
- Se utiliza solo en nombres o palabras prestadas: в, е, з, ф, ц
montenegrino
Osetio
Alfabeto árabe
- Todos los idiomas que utilizan el alfabeto árabe se escriben de derecha a izquierda.
- En el pasado, varios otros idiomas se escribieron con el alfabeto árabe, pero ahora se escriben más comúnmente con caracteres latinos; algunos ejemplos son el turco , el somalí y el suajili .
árabe(español)
- signo de interrogación invertido: ؟
- Las vocales cortas no se escriben, por lo que muchas palabras se escriben sin vocal alguna.
- prefijo común: -الـ
- sufijo común: ة -ـة-
- Palabras: إلىائية, منائية
persa(español)
Salvo en casos muy raros, los verbos están al final de una frase.
- verbos comunes: کرد، بود، شد، است، میشود
- usos: پ، چ، ژ، گ
- Palabras: که، به
Urdú(Amor)
- usos: ٹ، ڈ، ڑ، ں، ے
- muchas palabras que terminan en ے
- Palabras: اور، ہے
- para distinguirlo del árabe: en muchos textos, el urdu se escribe estilísticamente con palabras "inclinadas" hacia abajo, de arriba a la derecha hacia abajo a la izquierda (a diferencia del estilo "lineal" del árabe, persa, etc.).
Alfabeto siríaco
Siríaco(a)
- Las vocales cortas no suelen escribirse, por lo que muchas palabras se escriben sin vocal alguna.
- Tres estilos de escritura (estrangela, serto, mahdnaya) y dos formas diferentes de representar las vocales.
- El alfabeto básico en estilo Estrangela es: �����������������������������������������������������������������������������������������������������������������������������������������������������������������������
- basic alphabet in Serto style is: ܬ , ܫ , ܪ , ܩ , ܨ , ܦ , ܥ , ܣ , ܢ , ܡ , ܠ , ܟ , ܝ , ܛ , ܚ , ��� , �� , �� , ��� , �� , ��� ,
- basic alphabet in Madnhaya style is: ܬ , ܫ , ܪ , ܩ , ܨ , ܦ , ܥ , ܣ , ܢ , ܡ , ܠ , ܟ , ܝ , ܛ , ܚ , ��� , �� , �� , ��� , �� , ��� ,
Lenguas dravídicas
- Todas las lenguas dravídicas se escriben de izquierda a derecha.
- Todas las lenguas dravídicas tienen escrituras diferentes, pero se pueden encontrar similitudes en su ortografía.
Canarés
- Kannada tiene un alfabeto de 49 letras.
Tamil
- terminaciones de palabras comunes: ள்ளது, கிறது, கின்றன, ம்
- palabras comunes: தமிழ், அவர், உள்ள, சில
- El tamil tiene un alfabeto único de 30 letras. Con la ayuda de signos diacríticos, se pueden escribir hasta 247 letras.
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஔ க ங ச ஞ ட ண த ந ப ம ய ர ல வ ழ ள ற ன
Télugu
El telugu tiene 56 caracteres (aksharamulu), entre los que se incluyen vocales (achchulu) y consonantes (hallulu). El telugu utiliza dieciocho vocales, cada una de las cuales tiene una forma independiente y una forma diacrítica que se utiliza con las consonantes para crear sílabas. El idioma distingue entre vocales cortas y largas.
అ ఆ ఇ ఈ ఉ ఊ ఋ ౠ ఌ ౡ ఎ ఏ ఐ ఒ ఓ ఔ అం అః క ఖ గ ఘ ఙ చ ఛ జ ఝ ఞ ట ఠ డ ఢ ణ త థ ద ధ న ప ఫ బ భ మ య ర ఱ ల ళ వ శ ష స హ
౦ ౧ ౨ ౩ ౪ ౫ ౬ ౭ ౮ ౯
bengalí
El alfabeto bengalí o alfabeto bengalí (bengalí: বাংলা বর্ণমালা, bangla bôrnômala) o escritura bengalí (bengalí: বাংলা লিপি, bangla lipi) es el sistema de escritura, originario del subcontinente indio, para el idioma bengalí y es el quinto sistema de escritura más utilizado en el mundo. La escritura se utiliza para otros idiomas como el asamés, el maithili, el meithei y el bishnupriya manipuri, y se ha utilizado históricamente para escribir el sánscrito en Bengala.
bengalí
El bengalí tiene un alfabeto único de 50 letras.
- La escritura bengalí tiene un total de 9 grafemas vocálicos, cada uno de los cuales se denomina স্বরবর্ণ swôrôbôrnô "letra vocálica". Los swôrôbôrnô representan seis de los siete sonidos vocálicos principales del bengalí, junto con dos diptongos vocálicos. Todos ellos se utilizan tanto en bengalí como en asamés.
অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ
- La escritura bengalí tiene un total de 39 consonantes. Las letras consonantes se denominan ব্যঞ্জনবর্ণ bænjônbôrnô "letra consonante" en bengalí. Los nombres de las letras suelen ser simplemente el sonido de la consonante más la vocal inherente অ ô. Dado que la vocal inherente se asume y no se escribe, la mayoría de los nombres de las letras parecen idénticos a la letra en sí (el nombre de la letra ঘ es en sí ghô, no gh).
ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ
- tiene 10 diacríticos que denotan rimas silábicas -
া ি ী ু ূ ৃ ে ৈ ো ৌ
Assamese
- La escritura asamés tiene un total de 9 grafemas vocálicos, cada uno de los cuales también se denomina স্বরবর্ণ swôrôbôrnô "letra vocal".
অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ
- Tiene un total de 39 consonantes. Las letras consonantes se llaman ব্যঞ্জনবর্ণ bænjônbôrnô "letra consonante" en bengalí.
ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য ৰ ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ
- tiene 10 diacríticos que denotan rimas silábicas -
া ি ী ু ূ ৃ ে ৈ ো ৌ
Sílabas aborígenes canadienses
En la escritura moderna, las sílabas aborígenes canadienses son indicativas de las lenguas cree , inuktitut u ojibwa , aunque las dos últimas también se escriben en escrituras alternativas. El conjunto básico de glifos es ᐁ ᐱ ᑌ ᑫ ᒉ ᒣ ᓀ ᓭ ᔦ, cada uno de los cuales puede aparecer en cualquiera de las cuatro orientaciones, en negrita, en superíndice y con diacríticos que incluyen ᑊ ᐟ ᐠ ᐨ ᒼ ᐣ ᐢ ᐧ ᐤ ᐦ ᕽ ᓫ ᕑ. Esta abugida también se ha utilizado para los pies negros .
Otras sílabas norteamericanas
Cherokee
La escritura Cherokee presenta un silabario único que consta de los siguientes caracteres:
ᎡᎢᎣᎤᎥᎦᎧᎨᎩᎪᎫᎬᎭᎮᎯᎰᎱᎲᎳᎴᎵᎶᎷᎸᎹᎺᎻᎼᎽᎾᎿᏀᏁᏂᏃᏄᏅᏆᏇᏈ ᏉᏊ ᏋᏌᏍᏎᏏᏐᏑᏒᏓᏔᏕᏖᏗᏘᏙᏚᏛᏜᏝᏞᏟᏠᏡᏢᏣᏤᏥᏦᏧᏨᏩᏪᏫᏬᏭᏮᏯᏰᏱᏲ ᏳᏴ.
Lenguajes artificiales
esperanto(Esperanto)
- Palabras: de , la , al , kaj
- Seis letras acentuadas: ĉ Ĉ ĝ Ĝ ĥ Ĥ ĵ Ĵ ŝ Ŝ ŭ Ŭ , su correspondiente representación del sistema H ch Ch gh Gh hh Hh jh Jh sh Shu U o su correspondiente representación del sistema X cx Cx gx Gx hx Hx jx Jx sx sx ux ux
- palabras terminadas en o , a , oj , aj , on , an , ojn , ajn , as , os , is , us , u , i , aŭ
Klingon(el infierno es hol)
- Cuando se escribe en el alfabeto latino, el klingon tiene la propiedad inusual de distinguir entre mayúsculas y minúsculas; q y Q son letras diferentes, y las demás letras siempre (por ejemplo, D, I, S) o nunca (por ejemplo, ch, tlh, v) se escriben en mayúsculas. Esto provoca una gran cantidad de palabras que parecen bastante extrañas para las personas que no están acostumbradas a ello, por ejemplo: yIDoghQo ' , tlhIngan Hol (con mayúsculas y minúsculas mezcladas).
- El apóstrofe es bastante frecuente, especialmente al final de una palabra o sílaba.
- Sufijos comunes: -be', -'a '
- Palabras comunes: ' oH , Qapla '
- Se pueden utilizar uno o más apóstrofos en medio de una palabra: SuvwI″a '
Lojban(lojban.)
- (casi) todo en minúsculas;
- palabras comunes lo , mi , cu , la , nu , do , na , se ;
- párrafos delimitados con ni'o y oraciones delimitadas con .i (o i );
- muchas palabras de cinco letras en forma consonante-vocal CCVCV o CVCCV ;
- muchas palabras cortas con apóstrofes entre vocales, como ko'a pi'o, etc.;
- generalmente no hay puntuación excepto los puntos;
- Se pueden usar comas en medio de las palabras (normalmente nombres propios).
Toki Pona(toki pona)
- El alfabeto está todo en minúsculas, excepto los préstamos.
- Sin diacríticos
- Solo utiliza consonantes sordas en la escritura, por ejemplo p , t , k
Alfabeto completo: p, t, k, s, m, n, l, j, w, a, e, i, o, u
- palabras comunes li , mi , e , sina , ona , jan
- A menudo suena como una forma simplificada y fonética del inglés o el sueco.
- muchas palabras de dos sílabas
Enlaces externos
- Servicio web de identificación de idioma, API de detección de idioma, más de 100 idiomas admitidos
- Google Translate, el servicio de traducción de Google.
- Xerox, un identificador de idiomas en línea, compatible con 47 idiomas
- Language Guesser, un identificador estadístico de idiomas, 74 idiomas reconocidos
- NTextCat: API gratuita de identificación de idiomas para .NET (C#): más de 280 idiomas disponibles de forma inmediata. Reconoce el idioma y la codificación ( UTF-8 , Windows-1252 , Big5 , etc.) del texto. Compatible con Mono .
- ^ https://www.oakton.edu/user/4/billtong/chinaclass/Language/cantonese.htm