La fonología del chino estándar se ha derivado históricamente del dialecto pequinés del mandarín . Sin embargo, la pronunciación varía ampliamente entre hablantes, que pueden introducir elementos de sus variedades locales . Los locutores de televisión y radio son elegidos por su capacidad para afectar un acento estándar . Los elementos del sistema de sonido incluyen no solo los segmentos (por ejemplo, vocales y consonantes ) del idioma, sino también los tonos aplicados a cada sílaba. Además de sus cuatro tonos principales, el chino estándar tiene un tono neutro que aparece en las sílabas débiles.
Este artículo utiliza el Alfabeto Fonético Internacional (AFI) para comparar los valores fonéticos correspondientes a las sílabas romanizadas con pinyin .
Los sonidos que se muestran entre paréntesis a veces no se analizan como fonemas separados ; para más información sobre ellos, consulte el § Serie alveolopalatal a continuación. Excluyendo estos, y excluyendo los glides [ j ] , [ ɥ ] y [ w ] , hay 19 fonemas consonánticos en el inventario.
Entre pares de oclusivas o africadas que tienen el mismo lugar de articulación y manera de articulación , la distinción principal no es sonoras vs. sordas (como en francés o ruso ), sino no aspiradas vs. aspiradas (como en gaélico escocés o islandés ). Sin embargo, las oclusivas y africadas no aspiradas pueden volverse sonoras en sílabas débiles (ver § Reducción de sílabas a continuación). Tales pares se representan en el sistema pinyin principalmente usando letras que en las lenguas romances generalmente denotan pares sordos/sonoros (por ejemplo, [p] y [b] ), o en las lenguas germánicas a menudo denotan pares fortis/lenis (por ejemplo, pares sordos aspirados iniciales/sonoros no aspirados como [pʰ] y [b] ). Sin embargo, los pares aspirados/no aspirados como /pʰ/ y /p/ se representan con p y b respectivamente en pinyin.
En la siguiente tabla se ofrecen más detalles sobre los sonidos consonánticos individuales.
Todas las consonantes pueden aparecer como sonido inicial de una sílaba, con excepción de /ŋ/ (a menos que se asigne el cero inicial a este fonema; véase más abajo). Exceptuando la coda rótica, las únicas consonantes que pueden aparecer en la posición de coda (final) de la sílaba son /n/ y /ŋ/ (aunque [m] puede aparecer como un alófono de /n/ antes de consonantes labiales en el habla rápida). La /n/ y /ŋ/ finales pueden pronunciarse sin un cierre oral completo, lo que da como resultado una sílaba que de hecho termina con una vocal nasalizada larga . [1] : 72 Véase también § Reducción de sílabas, más abajo.
Las consonantes que aparecen en la primera tabla como denti-alveolares se describen a veces como alveolares y a veces como dentales . Las africadas y las fricativas se describen con especial frecuencia como dentales; estas se pronuncian generalmente con la lengua sobre los dientes inferiores. [1] : 27
Las consonantes retroflejas (como las del polaco ) son en realidad apicales en lugar de subapicales , por lo que algunos autores consideran que no son verdaderamente retroflejas; se las puede llamar más exactamente postalveolares. [2] [3] [4] Algunos hablantes que no son de Pekín pueden carecer de las retroflejas en sus dialectos nativos y, por lo tanto, pueden reemplazarlas por dentales. [1] : 26
Las consonantes alveolopalatales (pinyin j , q , x ) tienen una pronunciación estándar de [t͡ɕ, t͡ɕʰ, ɕ] . Algunos hablantes las interpretan como dentales palatalizadas [t͡sʲ] , [t͡sʰʲ] , [sʲ] ; se afirma que esto es especialmente común entre niños y mujeres, [1] : 33 aunque oficialmente se considera de calidad inferior y una característica específica del dialecto de Pekín. [5]
En el análisis fonológico, a menudo se asume que, cuando no van seguidas de una de las vocales frontales altas [i] o [y] , las alveolopalatales consisten en una consonante seguida de un deslizamiento palatal ( [j] o [ɥ] ). Es decir, las sílabas representadas en pinyin como que comienzan con ⟨ji-⟩ , ⟨qi-⟩ , ⟨xi -⟩ , ⟨ju-⟩ , ⟨qu-⟩ , ⟨xu-⟩ (seguidas de una vocal) se toman como que comienzan con [t͡ɕj] , [t͡ɕʰj] , [ɕj] , [t͡ɕɥ] , [t͡ɕʰɥ] , [ɕɥ] . Las pronunciaciones reales son más como [t͡ɕ] , [t͡ɕʰ] , [ɕ] , [t͡ɕʷ ] , [t͡ɕʰʷ] , [ɕʷ] (o para hablantes que usan las variantes dentales, [t͡sʲ] , [t͡sʰʲ] , [sʲ] , [t͡sᶣ] , [t͡sʰᶣ] , [sᶣ] ). Esto es consistente con la observación general (ver en § Deslizamientos) de que los deslizamientos mediales se realizan como palatalización y/o labialización de la consonante precedente (la palatalización ya es inherente en el caso de las palatales).
Según el análisis anterior, las alveolopalatales se encuentran en distribución complementaria con las dentales [t͡s, t͡sʰ, s] , con las velares [k, kʰ, x] y con las retroflejas [ʈ͡ʂ, ʈ͡ʂʰ, ʂ] , ya que ninguna de ellas puede ocurrir antes de vocales frontales altas o deslizamientos palatales, mientras que las alveolopalatales ocurren solo antes de vocales frontales altas o deslizamientos palatales. Por lo tanto, los lingüistas a menudo prefieren clasificar [t͡ɕ, t͡ɕʰ, ɕ] no como fonemas independientes, sino como alófonos de una de las otras tres series. [6] La existencia de las variantes dentales mencionadas anteriormente inclina a algunos a preferir identificar las alveolopalatales con las dentales, pero la identificación con cualquiera de las tres series es posible (a menos que la rima vacía / ɨ / se identifique con / i / , en cuyo caso las velares se convierten en el único candidato). Los sistemas de Yale y Wade-Giles tratan principalmente a las alveolopalatales como alófonos de las retroflejas; Tongyong Pinyin los trata principalmente como alófonos de las dentales; y el Braille chino continental los trata como alófonos de las velares. En pinyin estándar y bopomofo , sin embargo, se representan como una secuencia separada.
Las alveolopalatales surgieron históricamente de una fusión de las dentales [t͡s, t͡sʰ, s] y las velares [k, kʰ, x] antes de vocales altas anteriores y glides. Anteriormente, algunas instancias de la [t͡ɕ(ʰ)i] moderna eran en cambio [k(ʰ)i] , y otras eran [t͡s(ʰ)i] ; distinguir estas dos fuentes de [t͡ɕ(ʰ)i] se conoce como la distinción "redonda-aguda" . El cambio tuvo lugar en los últimos dos o tres siglos en diferentes momentos en diferentes áreas. Esto explica por qué algunas transcripciones europeas de nombres chinos (especialmente en la romanización postal ) contienen ⟨ki-⟩ , ⟨hi-⟩ , ⟨tsi-⟩ , ⟨si-⟩ donde podría esperarse una alveolopalatal en el chino moderno. Ejemplos de ello son Pe k ing por Bei j ing ( [kiŋ] → [tɕiŋ] ), Chung k ing por Chong q ing ( [kʰiŋ] → [tɕʰiŋ] ), Fu k ien por Fu j ian ( cf. Hokkien ), Tien ts in por Tian j in ( [tsin] → [tɕin] ); Sin k iang por X in j iang ( [sinkiaŋ] → [ɕintɕiaŋ] , y S ian por X i'an ( [si] → [ɕi] ). La distribución complementaria con la serie retrofleja surgió cuando las sílabas que tenían una consonante retrofleja seguida de un deslizamiento medial perdieron el deslizamiento medial.
Se dice que una sílaba completa como ai , en la que la vocal no está precedida por ninguna de las consonantes iniciales o glides estándar, tiene un inicio nulo o cero . Esto puede realizarse como un sonido consonántico: [ ʔ ] y [ ɣ ] son posibilidades, como lo son [ŋ] y [ ɦ ] en algunas variedades no estándar. San Duanmu ha sugerido que dicho inicio se considere un fonema especial, o como una instancia del fonema /ŋ/ , aunque también puede tratarse como si no hubiera fonema (ausencia de inicio). Por el contrario, en el caso de la partícula啊 a , que es una sílaba débil sin inicio, el enlace se produce con la sílaba anterior (como se describe en § Reducción de sílabas, más adelante). [1] : 43
Cuando una sílaba china con vocal inicial acentuada sigue a una sílaba con consonante final, la consonante no se vincula directamente con la vocal. En cambio, el inicio del cero parece intervenir en el medio.棉袄; mián'ǎo ("chaqueta de algodón") se convierte en [mjɛnʔau] , [mjɛnɣau] . Sin embargo, en el habla conectada ninguna de estas formas de salida es natural. En cambio, cuando las palabras se pronuncian juntas, la pronunciación más natural es bastante similar a [mjɛ̃ːau] , en la que no hay cierre nasal ni ninguna versión del inicio del cero, y en su lugar se produce la nasalización de la vocal. [7]
Los glides [ j ] , [ ɥ ] y [ w ] suenan respectivamente como la y en inglés yes , la (h)u en francés huit y la w en inglés we . ( Los hablantes de Beijing a menudo reemplazan la [w] inicial con una [ʋ] labiodental , excepto cuando es seguida por [o] o [u] . [1] : 25 ) Los glides se analizan comúnmente no como fonemas independientes, sino como alófonos consonánticos de las vocales altas : [i̯, y̯, u̯] . Esto es posible porque no hay ambigüedad en la interpretación de una secuencia como yao/-iao como /iau/ , y no ocurren secuencias potencialmente problemáticas como */iu/ .
Los deslizamientos pueden ocurrir en posición inicial en una sílaba. Esto ocurre con [ɥ] en las sílabas escritas yu , yuan , yue y yun en pinyin; con [j] en otras sílabas escritas con y inicial en pinyin ( ya , yi , etc.); y con [w] en sílabas escritas con w inicial en pinyin ( wa , wu , etc.). Cuando un deslizamiento es seguido por la vocal de la cual ese deslizamiento se considera un alófono, el deslizamiento puede considerarse como epentético (insertado automáticamente), y no como una realización separada del fonema. Por lo tanto, la sílaba yi , pronunciada [ji] , puede analizarse como que consiste en el único fonema /i/ , y de manera similar, yin puede analizarse como /in/ , yu como /y / y wu como /u/ . [1] : 274ff También es posible escuchar ambos del mismo hablante, incluso en la misma conversación. [1] : 274ff Por ejemplo, uno puede escuchar el número "uno"一; yī como [jí] o [í] .
Los deslizamientos también pueden ocurrir en posición medial , es decir, después de la consonante inicial pero antes de la vocal principal. Aquí se representan en pinyin como vocales: por ejemplo, la i en bie representa [j] , y la u en duan representa [w] . Hay algunas restricciones en las posibles combinaciones de deslizamiento consonante: [w] no ocurre después de labiales (excepto para algunos hablantes en bo , po , mo , fo ); [j] no ocurre después de retroflejas y velares (o después de [f] ); y [ɥ] ocurre medialmente solo en lüe y nüe y después de alveolo-palatales (para lo cual véase más arriba). Una combinación de deslizamiento consonante al comienzo de una sílaba se articula como un solo sonido: el deslizamiento de hecho no se pronuncia después de la consonante, sino que se realiza como palatalización [ʲ] , labialización [ʷ] , o ambas [ᶣ] , de la consonante. [1] : 28 (Las mismas modificaciones de las consonantes iniciales ocurren en sílabas donde son seguidas por una vocal alta, aunque normalmente no se considera que haya deslizamiento allí. Por lo tanto, una consonante generalmente se palataliza [ʲ] cuando es seguida por /i/ , labializa [ʷ] cuando es seguida por /u/ , y ambas [ᶣ] cuando es seguida por /y/ .)
Las vocales deslizantes [j] y [w] también se encuentran como elemento final en algunas sílabas. Estas se analizan comúnmente como diptongos en lugar de secuencias de vocales deslizantes. Por ejemplo, a la sílaba bai se le asigna la representación subyacente /pai̯/ . (En pinyin, el segundo elemento generalmente se escribe ⟨-i⟩ o ⟨-u⟩ , pero /au̯/ se escribe ⟨-ao⟩ ).
Las sílabas escritas en pinyin como zi , ci , si , zhi , chi , shi , ri pueden describirse como una consonante sibilante ( z, c, s, zh, ch, sh, r en pinyin) seguida de una consonante silábica (también conocida como vocal apical en la literatura clásica):
Alternativamente, el núcleo puede describirse no como una consonante silábica, sino como una vocal:
Fonológicamente, estas sílabas pueden analizarse como si tuvieran su propio fonema vocálico, /ɨ/ . Sin embargo, es posible fusionarlo con el fonema /i/ (con el que está históricamente relacionado), ya que los dos están en distribución complementaria , siempre que la serie alveolopalatal § no se fusione o se fusione con las velares en lugar de la serie retrofleja o alveolar. (Es decir, [t͡ɕi] , [t͡sɨ] y [ʈ͡ʂɨ] existen, pero *[ki] y *[kɨ] no existen, por lo que no hay problema en fusionar [i]~[ɨ] y [k]~[t͡ɕ] al mismo tiempo).
Otro enfoque es considerar que las sílabas asignadas anteriormente a /ɨ/ tienen una ranura nuclear vacía (subyacente) ("rima vacía", chino空韵; kōngyùn ), es decir, que no contienen ningún fonema vocálico. Esto es más coherente con la descripción consonántica silábica de estas sílabas, y es coherente con la visión de que las representaciones fonológicas son mínimas (subespecificadas). [8] Cuando este es el caso, a veces se describe que el fonema cambia de sordo a sonoro, por ejemplo, sī se convierte en /sź̩/ .
Las consonantes silábicas también pueden surgir como resultado de una reducción silábica débil; véase más abajo. Las consonantes nasales silábicas también se escuchan en ciertas interjecciones ; las pronunciaciones de tales palabras incluyen [m] , [n] , [ŋ] , [hm] , [hŋ] .
Se puede analizar el chino estándar como si tuviera entre dos y seis fonemas vocálicos. [9] /i, u, y/ (que también pueden analizarse como fonemas subyacentes) son vocales altas (cerradas), /ə/ es media mientras que /a/ es baja (abierta).
La realización precisa de cada vocal depende de su entorno fonético. En particular, la vocal /ə/ tiene dos alófonos amplios [ e ] y [ o ] (que corresponden respectivamente a e y o en pinyin en la mayoría de los casos). Estos sonidos pueden tratarse como un solo fonema subyacente porque están en distribución complementaria . El fonema vocálico medio también puede tratarse como una vocal subespecificada, que atrae características de los sonidos adyacentes o de las reglas predeterminadas que dan como resultado /ə/ . (Ciertas interjecciones , como [ɔ] , [ɛ] , [jɔ] y [lɔ] , proporcionan contraejemplos aparentes , pero normalmente se tratan como casos especiales que operan fuera del sistema fonémico normal. [b] )
Las transcripciones de los alófonos vocálicos (las formas en que se pronuncian en entornos fonéticos particulares) difieren un poco entre las distintas fuentes. En la siguiente tabla se ofrecen más detalles sobre los alófonos vocálicos individuales (sin incluir los valores que aparecen con la coda rótica ). [c]
Zhuyin representa las vocales de forma diferente a los esquemas de romanización normales y, como tal, no se muestra en la tabla anterior.
Los núcleos vocálicos pueden ir precedidos de una vocal glide /j, w, ɥ/ y seguidos de una coda /i, u, n, ŋ/ . Las distintas combinaciones de vocal glide y coda tienen diferentes manifestaciones superficiales, como se muestra en las tablas siguientes. Cualquiera de las tres posiciones puede estar vacía, es decir, ocupada por un metafonema nulo ∅ .
La siguiente tabla ofrece un análisis típico de cinco vocales según Duanmu (2000, p. 37) y Lin (2007). En este análisis, las vocales altas /i, u, y/ son completamente fonémicas y pueden formar secuencias con las codas nasales /n, ŋ/ .
Algunos lingüistas prefieren reducir drásticamente el número de fonemas vocálicos (a costa de incluir deslizamientos subyacentes en sus sistemas). Edwin G. Pulleyblank ha propuesto un sistema que incluye deslizamientos subyacentes, pero ninguna vocal en absoluto. [1] : 37 Más comunes son los sistemas con dos vocales; por ejemplo, en el sistema de Mantaro Hashimoto , [11] hay solo dos núcleos vocálicos, /ə, a/ . En este análisis, las vocales altas [i, u, y] se analizan como deslizamientos /j, w, ɥ/ que aparecen como vocales antes de ∅ o /ən, əŋ/ .
Por regla general, las vocales de las sílabas abiertas (aquellas que no tienen coda después de la vocal principal) se pronuncian largas , mientras que las demás se pronuncian cortas. Esto no se aplica a las sílabas débiles, en las que todas las vocales son cortas. [1] : 42
En chino estándar, las vocales [a] y [ə] armonizan en la parte posterior con la coda. [12] [1] : 72–73 Para [a] , se antepone [a̟] a /i, n/ y se antepone [a̠] a /u, ŋ/ . Para [ə] , se antepone [ə̟] a /n/ y se antepone [ə̠] a /ŋ/ .
Algunos hablantes nativos de mandarín pueden pronunciar [wei̯] , [jou̯] y [wən] como [ui] , [iu] y [un] respectivamente en el primer o segundo tono. [13] : 69
El chino estándar tiene sílabas que terminan con una coda rótica /ɚ/ . Esta característica, conocida en chino como erhua , es particularmente característica del dialecto de Pekín ; muchos otros dialectos no la usan tanto y algunos ni siquiera la usan. [1] : 195 Se da en dos casos:
La r final se pronuncia con una lengua relativamente laxa y se ha descrito como una "vocal retrofleja". [1] : 41
En dialectos que no utilizan la coda rótica, se puede omitir en la pronunciación o, en algunos casos, se puede seleccionar una palabra diferente: por ejemplo, Beijing这儿;這兒; zhèr ; 'aquí' y那儿;那兒; nàr ; 'allí' puede sustituirse por los sinónimos这里;這裡; zhèlǐ y那里;那裡; nàlǐ .
Las sílabas en chino estándar tienen la forma máxima (CG)V(X) T , [13] : 48 tradicionalmente analizada como una consonante "inicial" C, una "final" y un tono T. [14] La final consiste en una G "media" (que puede ser una de las glides [j, w, ɥ] ), una vocal V y una coda X, que puede ser una de [n, ŋ, ɚ̯, i̯, u̯] . La vocal y la coda también pueden agruparse como la " rima ", [13] : 16 a veces escrita " rime ". Cualquiera de C, G y X (y V, en algunos análisis) puede estar ausente. Sin embargo, en algunos análisis, C no puede estar ausente, debido a que el cero inicial se considera una consonante.
Muchas de las combinaciones posibles bajo el esquema anterior no ocurren realmente. Solo hay unas 35 combinaciones finales (medial+rima) en sílabas reales (ver finales pinyin ). En total, solo hay alrededor de 400 sílabas diferentes cuando se ignora el tono, y alrededor de 1300 cuando se incluye el tono. Este es un número mucho menor de sílabas distintas que en un idioma como el inglés. Dado que las sílabas chinas generalmente constituyen palabras completas, o al menos morfemas , la pequeñez del inventario de sílabas resulta en un gran número de homófonos . Sin embargo, en chino estándar, la longitud promedio de palabra es en realidad casi exactamente de dos sílabas, eliminando prácticamente la mayoría de los problemas de homofonía incluso cuando se ignora el tono, especialmente cuando también se tiene en cuenta el contexto. [15] [16] (Aun así, debido al inventario fonético limitado, los juegos de palabras homofónicos en chino mandarín son muy comunes e importantes en la cultura china . [17] [18] )
Para obtener una lista de todas las sílabas del chino estándar (excluyendo el tono y la coda rótica), consulte la tabla pinyin o la tabla zhuyin .
Las sílabas se pueden clasificar en sílabas completas (o fuertes ) y sílabas débiles . Las sílabas débiles suelen ser marcadores gramaticales como了 le o las segundas sílabas de algunas palabras compuestas (aunque muchas otras palabras compuestas constan de dos o más sílabas completas).
Una sílaba completa lleva uno de los cuatro tonos principales y cierto grado de acento. Las sílabas débiles no están acentuadas y tienen un tono neutro. El contraste entre sílabas completas y débiles es distintivo; hay muchos pares mínimos como要事 yàoshì "asunto importante" y钥匙 yàoshi "clave", o大意 dàyì "idea principal" y (con los mismos caracteres) dàyi "descuidado", la segunda palabra en cada caso tiene una segunda sílaba débil. Algunos lingüistas consideran que este contraste es principalmente de acento, mientras que otros lo consideran de tono. Para más información, véase Tono neutro y acento, más abajo.
También hay una diferencia en la longitud de las sílabas. Las sílabas completas pueden analizarse como si tuvieran dos moras ("pesadas"), y la vocal se alarga si no hay coda. Las sílabas débiles, sin embargo, tienen una sola mora ("ligeras") y se pronuncian aproximadamente un 50% más cortas que las sílabas completas. [1] : 88 Cualquier sílaba débil normalmente será una instancia del mismo morfema (y se escribirá con el mismo carácter) que alguna sílaba fuerte correspondiente; sin embargo, la forma débil a menudo tendrá una pronunciación modificada, como se detalla en la siguiente sección.
Aparte de las diferencias en tono, longitud y acento, las sílabas débiles están sujetas a ciertos otros cambios de pronunciación (reducción). [19]
El ejemplo de shénme → shém también implica asimilación , que se escucha incluso en sílabas no reducidas en el habla rápida (por ejemplo, en guǎmbō para广播 guǎngbō "transmisión"). Un caso particular de asimilación es el de la partícula exclamativa final de oración啊 a , una sílaba débil, que tiene diferentes caracteres para sus formas asimiladas:
El chino estándar, como todas las variedades del chino , es tonal . Esto significa que, además de las consonantes y las vocales, se utiliza el contorno tonal de una sílaba para distinguir las palabras entre sí. Muchos hablantes no nativos de chino tienen dificultades para dominar los tonos de cada carácter, pero la pronunciación tonal correcta es esencial para la inteligibilidad debido a la gran cantidad de palabras en el idioma que solo se diferencian por el tono (es decir, son pares mínimos con respecto al tono). Estadísticamente, los tonos son tan importantes como las vocales en el chino estándar. [d] [20]
La siguiente tabla muestra los cuatro tonos principales del chino estándar, junto con el tono neutro (o quinto). Para describir el tono de los tonos, se utiliza su representación en una escala de cinco niveles, visualizada con letras tonales Chao . Los valores del tono para cada tono descrito por Chao se consideran tradicionalmente estándar, sin embargo, también se producen ligeras variaciones regionales e idiolectales en la pronunciación del tono.
Los nombres chinos de los cuatro tonos principales son respectivamente阴平;陰平; yīnpíng ; 'nivel oscuro',阳平;陽平; yángpíng ; 'nivel claro',上; shǎng [23] [24] o shàng [25] ('ascendente'), y去; qù ; 'que se va'. Como descripciones, se aplican más a los tonos del chino medio predecesores que a los tonos modernos.
La mayoría de los sistemas de romanización , incluido el pinyin, representan los tonos como diacríticos en las vocales, al igual que el bopomofo . Algunos, como Wade-Giles , utilizan números superíndices al final de cada sílaba. Las marcas de tono y los números rara vez se utilizan fuera de los libros de texto de idiomas: en particular, suelen estar ausentes en señales públicas, logotipos de empresas, etc. Gwoyeu Romatzyh es un raro ejemplo de un sistema en el que los tonos se representan utilizando letras normales del alfabeto (aunque sin una correspondencia uno a uno).
El primer tono es un tono de alto nivel. Es un sonido alto y constante, producido como si se cantara en lugar de hablarse. Su tono suele ser ˥ 55 o ˦ 44, al mismo nivel en el que comienza el cuarto tono, o un poco más bajo. Ocasionalmente, también es posible un tono alto ligeramente ascendente o descendente ( ˥˦ 54 o ˦˥ 45). [22]
En algunas sílabas, la calidad de la vocal cambia cuando lleva el primer tono; consulte la tabla de vocales más arriba.
El segundo tono es un tono ascendente. Generalmente se describe como agudo ( ˧˥ 35), con un sonido que va de tono medio a agudo (como en la canción inglesa "What?!"). Comienza en el nivel de tono 3 o 2 y luego sube hasta el nivel del primer tono (5 o 4).
También puede comenzar con un segmento descendente o plano, que es bastante corto en hablantes masculinos (una cuarta parte de la longitud total del segundo tono), pero más largo en hablantes femeninas, alcanzando casi la mitad de la longitud total del segundo tono. Esta caída inicial es más evidente en el acento del mandarín del sur de China, incluido el mandarín taiwanés estándar , donde el segundo tono también es más bajo y se describe alternativamente como descendente o de ascenso bajo con un contorno general de ˧˨˧ 323 (su inicio sigue siendo ligeramente más bajo que su tono final). [26] [27] [28] [29]
Este tono suele ser uno de los más difíciles de dominar para los estudiantes de mandarín, así como para los hablantes de variedades de chino no mandarín, que a menudo pronuncian su segundo tono cerca del tercer tono (completo), especialmente en la posición final de palabra antes de una pausa. [29] [30] [22] [31]
El tercer tono es un tono bajo. También se lo suele denominar "tono de inmersión".
Este tono se suele demostrar con un ascenso de tono después de la caída grave; sin embargo, las sílabas de tercer tono que incluyen el ascenso son significativamente más largas que otras sílabas. Cuando una sílaba de tercer tono no se dice de forma aislada, este ascenso normalmente se escucha solo si aparece al final de una oración o antes de una pausa, y generalmente solo en monosílabos acentuados. [1] : 222 El tercer tono sin el ascenso a veces se llama medio tercer tono .
El contorno general del tercer tono se describe tradicionalmente como ˨˩˦ 214, pero para los hablantes de chino estándar modernos, el ascenso, si está presente, no es tan alto. El tercer tono comienza más bajo o alrededor del punto de inicio del segundo tono. En Pekín, su valor se inclina a ˨˩˧ 213 o ˨˩˨ 212, mientras que en Taiwán suele ser ˧˩˨ 312 (los hablantes de chino estándar taiwanés también tienden a no pronunciar nunca la parte ascendente en ningún contexto). [32] A diferencia de los otros tonos, el tercer tono suele pronunciarse con voz chirriante . [33]
Se evitan dos terceros tonos consecutivos cambiando el primer tono por el segundo; consulte § Sandhi del tercer tono a continuación.
El cuarto tono es un tono descendente. Se caracteriza por una caída brusca de un tono alto a uno más bajo (como se escucha en órdenes bruscas en inglés, como "¡Alto!").
Comienza en el mismo nivel de tono o más alto que el primer tono, y luego desciende al tono 1 o 2. En el habla continua, cuando va seguida de sílabas con otros tonos completos, tiende a descender solo de un nivel alto a medio. De manera similar al tercer tono, la parte final solo se pronuncia antes de una pausa o una sílaba átona. Dos cuartos tonos consecutivos se pronuncian en zigzag, con el primero más alto y el segundo más bajo (˥˧ 53 - ˦˩ 41). [34] [35] [22]
También llamado quinto tono o tono cero (轻声;輕聲; qīngshēng ; 'tono claro'), el tono neutro a veces se considera una falta de tono. Se asocia con sílabas débiles, que generalmente son algo más cortas que las sílabas tónicas.
En chino estándar, entre el 15 y el 20 % de las sílabas de los textos escritos se consideran átonas, incluidos ciertos sufijos, clíticos y partículas. Las segundas sílabas de algunas palabras bisílabas también se consideran átonas en los acentos del mandarín del norte, pero muchos hablantes de mandarín del sur de China tienden a conservar su tono inherente.
El tono de una sílaba con tono neutro está determinado por el tono de la sílaba precedente. Chao (1968) consideró que las sílabas de tono neutro no tenían contorno de tono. Introdujo letras de tono punteadas especiales para denotar su tono. Sin embargo, estudios posteriores descubrieron que las sílabas de tono neutro sí tienen contorno de tono. La siguiente tabla muestra el tono en el que se pronuncia el tono neutro en chino estándar después de cada uno de los cuatro tonos principales. Para el análisis de tono contorneado, la primera columna muestra el contorno de tono directamente después de la sílaba de tono completa, y la segunda columna muestra el contorno de tono después de otra sílaba de tono neutro. [36] [22] [37] [38] [39]
Aunque el contraste entre sílabas débiles y sílabas completas es a menudo distintivo, el tono neutro no suele describirse como un tono completo; algunos lingüistas creen que resulta de una "extensión" del tono en la sílaba precedente. Esta idea es atractiva porque sin ella, el tono neutro necesita reglas de sandhi de tonos relativamente complejas para tener sentido; de hecho, tendría que tener cuatro alotonos , uno para cada uno de los cuatro tonos que podrían precederlo. Sin embargo, la teoría de la "extensión" caracteriza de forma incompleta el tono neutro, especialmente en secuencias en las que se encuentra más de una sílaba de tono neutro adyacente. [40] En el mandarín estándar moderno tal como se aplica en A Dictionary of Current Chinese , la segunda sílaba de las palabras con una "variante de sílaba final sin tono" (重·次輕詞語) se puede leer con un tono neutro o con el tono normal. [41] [42] [43]
Los cuatro tonos del chino medio no se corresponden exactamente con los tonos modernos. La siguiente tabla muestra el desarrollo de los tonos tradicionales tal como se reflejan en el chino estándar moderno. El desarrollo de cada tono depende de la consonante inicial de la sílaba: si era una consonante sorda (indicada en la tabla por v−), una obstruyente sonora (v+) o una sonora (s). (La distinción entre sonora y sorda se ha perdido en el chino estándar moderno).
La pronunciación también varía con el contexto según las reglas del sandhi de tonos . Algunos de estos cambios se han señalado anteriormente en las descripciones de los tonos individuales; sin embargo, los fenómenos más destacados de este tipo se relacionan con secuencias consecutivas de sílabas de tercer tono. También hay algunas palabras comunes que tienen un tono variable.
La regla principal del sandhi del tercer tono es:
Por ejemplo,老鼠; lǎoshǔ ; 'ratón' se pronuncia [lau̯˧˥ʂu˨˩] como si fuera láoshǔ . Se ha investigado si el contorno ascendente ( ˧˥ ) en la sílaba anterior es de hecho idéntico a un segundo tono normal. Se ha concluido que es idéntico al menos en términos de percepción auditiva. [1] : 237
Cuando hay tres o más terceras notas seguidas, la situación se complica, ya que una tercera nota que precede a una segunda nota resultante de un sandhi de terceras notas puede o no estar sujeta a un sandhi en sí. Los resultados pueden depender de los límites de las palabras, el acento y las variaciones dialectales. Las reglas generales para las combinaciones de terceras notas de tres sílabas se pueden formular de la siguiente manera:
Algunos lingüistas han propuesto sistemas más completos de reglas de sandhi para secuencias de varios tercios de tono. Por ejemplo, se ha propuesto [1] : 248 que las modificaciones se aplican cíclicamente, inicialmente dentro de los pies rítmicos ( troqueos ; ver más abajo) y que el sandhi "no necesita aplicarse entre dos ramas cíclicas".
Se aplican reglas especiales a los tonos que se escuchan en los morfemas 不( bù ; 'no') y一( yī ; 'uno').
Para不( bù ):
Para一( yī ):
Los números七( qī ; 'siete') y八( bā ; 'ocho') a veces muestran un comportamiento tonal similar al de一 yī , pero para la mayoría de los hablantes modernos siempre se pronuncian con el primer tono. Todos estos números, y不( bù ), eran históricamente tonos Ru y, como se señaló anteriormente, ese tono no tiene reflejos predecibles en el chino moderno; esto puede explicar la variación en el tono de estas palabras. [1] : 228
En el habla conversacional, para el tono ascendente (tono 2) y el tono descendente (tono 4), hay algunas situaciones (según qué tonos se utilicen inmediatamente antes y después) en las que los contornos de tono cambiarán. [44] [21] [22] [1] : 239–241
El tono 2 se vuelve más alto y cambia su dirección, acercándose al contorno de tono del tono 1, cuando se coloca entre el tono 1 o 2 y cualquier otro tono completo.
El tono ascendente inducido por el sandhi del tono 3 también sufre esta transformación.
El estatus de este cambio de tono es ambiguo, y algunos autores lo consideran un sandhi de tono similar al sandhi de tercer tono. Yuen Ren Chao consideró que el tono 2 modificado era idéntico al tono 1, y Cao Wen lo trató como tono 1 (antes de los tonos 1 o 4) o tono 4 (antes de los tonos 2 o 3). [21] [22] Ambos puntos de vista son generalizaciones; el contorno exacto del tono 2 modificado varía entre un ˧ de nivel medio en palabras aisladas o a una velocidad de habla más lenta, y un ˥ ligeramente descendente en una oración portadora, a una velocidad de habla más rápida. [44]
El tono 4 se vuelve más bajo y más plano, pero aún ligeramente descendente, similar al tono 3 cantonés, cuando se coloca entre el tono 3 o 4 y el tono 1 o 4.
A diferencia del cambio de tono 2, el contorno de tono del cambio de tono 4 se vio influenciado de manera insignificante por el cambio de velocidad del habla, siempre que se mantuviera la velocidad de una conversación. Los contornos de tono resultantes, especialmente el del cambio de tono 4, no están asociados con un tono fonémico en mandarín. En experimentos perceptivos, los hablantes nativos de mandarín de Pekín podían reconocer fácilmente el tono pretendido en la palabra original, pero no podían reconocerlo cuando se eliminaba del contexto al reemplazar las sílabas adyacentes con ruido blanco : [44]
Además de la velocidad del habla, la frecuencia de expresión también puede desempeñar un papel en el desencadenamiento de este cambio de tono. Se dice que el cambio de tono 2 que normalmente requería el tono 1 o 2 para precederlo también ocurre en gòngchǎndǎng (共产党;共產黨; 'partido comunista') en lugar del tono sandhi 3, pero aún queda por ver si hay más ejemplos con el tono inicial 4. [1] : 240
Los hablantes chinos no perciben con mucha intensidad el acento dentro de las palabras ( acento verbal ), aunque el acento contrastivo se percibe fácilmente (y funciona de forma muy similar a como sucede en otros idiomas). Una de las razones de la percepción más débil del acento en chino puede ser que las variaciones en la frecuencia fundamental del habla, que en muchos otros idiomas sirven como señal para el acento, se utilizan en chino principalmente para dar forma a los tonos. No obstante, sigue existiendo un vínculo entre el acento y el tono: se ha observado que el rango de variación del tono (para un tono determinado) es mayor en las sílabas que llevan más acento. [1] : 134, 231
Como se ha comentado anteriormente, las sílabas débiles tienen un tono neutro y no están acentuadas. Aunque esta propiedad puede ser contrastiva, algunos interpretan que el contraste se debe principalmente al tono y no al acento. (Algunos lingüistas analizan el chino como si careciera por completo de acento en las palabras). [1] : 134
Aparte de este contraste entre sílabas plenas y débiles, algunos lingüistas también han identificado diferencias en los niveles de acento entre sílabas plenas. En algunas descripciones, se dice que una palabra polisílaba o compuesta [e] tiene el acento más fuerte en la sílaba final, y el siguiente más fuerte generalmente en la primera sílaba. Otros, sin embargo, rechazan este análisis, señalando que el acento aparente en la sílaba final se puede atribuir puramente al alargamiento natural de la sílaba final de una frase, y desaparece cuando una palabra se pronuncia dentro de una oración en lugar de hacerlo de forma aislada. San Duanmu [1] : 136ff adopta este punto de vista y concluye que es la primera sílaba la que se acentúa con mayor fuerza. También señala una tendencia de los chinos a producir troqueos , pies que consisten en una sílaba tónica seguida de una (o en este caso a veces más) sílabas átonas. Desde este punto de vista, si se descarta el efecto del "alargamiento final":
Las posiciones descritas aquí como carentes de acento son las posiciones en las que pueden aparecer sílabas débiles (de tono neutro), aunque con frecuencia también aparecen sílabas completas en estas posiciones.
Existe una fuerte tendencia en la prosa china a emplear "palabras prosódicas" de cuatro sílabas que consisten en sílabas alternadas tónicas y átonas que se subdividen en dos pies trocaicos. Esta estructura, a veces conocida como "plantilla de cuatro caracteres" (四字格), es particularmente frecuente en chengyu , que son modismos clásicos que suelen tener cuatro caracteres de longitud. [45] El análisis estadístico de chengyu y otras frases idiomáticas en textos vernáculos indica que la palabra prosódica de cuatro sílabas se había convertido en una consideración métrica importante durante las dinastías Wei y Jin (siglo IV d. C.). [ 46]
Esta preferencia por los pies trocaicos puede incluso dar lugar a palabras polisilábicas en las que los límites del pie y la palabra (morfema) no se alinean. Por ejemplo, 'Checoslovaquia' se acentúa como捷克/斯洛/伐克y 'Yugoslavia' se acentúa como南斯/拉夫, aunque los límites del morfema son捷克/斯洛伐克'Checo[o]/eslovaco[ia]' y南/斯拉夫'Sur/slav[ia]', respectivamente. El patrón de acentuación preferido también tiene un efecto complejo sobre el tono sandhi de los distintos dialectos chinos. [47]
Esta preferencia por una estructura métrica trocaica también se cita como razón de ciertos fenómenos de variación del orden de las palabras dentro de compuestos complejos, y de la fuerte tendencia a utilizar palabras disílabas en lugar de monosílabos en ciertas posiciones. [1] : 145–194 Muchos monosílabos chinos tienen formas disílabas alternativas con un significado prácticamente idéntico – véase gramática china § Formación de palabras .
Otra función del tono de voz es transmitir la entonación . El chino hace un uso frecuente de partículas para expresar ciertos significados, como duda, consulta, orden, etc., lo que reduce la necesidad de utilizar la entonación. Sin embargo, la entonación todavía está presente en chino (expresando significados de manera bastante similar a como lo hace en inglés estándar), aunque existen diversos análisis sobre cómo interactúa con los tonos léxicos. Algunos lingüistas describen una subida o bajada adicional de la entonación al final de la última sílaba de un enunciado, mientras que otros han descubierto que el tono de todo el enunciado se eleva o baja según el significado entonacional deseado. [1] : 234
A nivel monosilábico, hay muchos homófonos, pero la longitud media de una palabra es de aproximadamente dos sílabas. Por lo tanto, a nivel de la palabra, no hay problemas de homofonía.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace ){{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace )