stringtranslate.com

Fonología japonesa

La fonología japonesa es el sistema de sonidos que se utiliza en la pronunciación del idioma japonés. A menos que se indique lo contrario, este artículo describe la variedad estándar del japonés basada en el dialecto de Tokio .

No hay un consenso general sobre el número de sonidos contrastivos ( fonemas ), pero los enfoques comunes reconocen al menos 12 consonantes distintas (hasta 21 en algunos análisis) y 5 vocales distintas , /a, e, i, o, u/ . La longitud fonética es contrastiva tanto para las vocales como para las consonantes, y la longitud total de las palabras japonesas se puede medir en una unidad de tiempo llamada mora (del latín mora "retraso"). Solo se permiten tipos limitados de grupos consonánticos . Existe un sistema de acento tonal en el que la posición o ausencia de una caída de tono puede determinar el significado de una palabra: /haꜜsiɡa/ (箸が, 'palillos chinos'), /hasiꜜɡa/ (橋が, 'puente'), /hasiɡa/ (端が, 'borde').

La fonología japonesa se ha visto afectada por la presencia de varias capas de vocabulario en el idioma: además del vocabulario japonés nativo, el japonés tiene una gran cantidad de vocabulario basado en el chino (usado especialmente para formar palabras técnicas y cultas, desempeñando un papel similar al vocabulario basado en el latín en inglés ) y préstamos de otros idiomas. [1] Diferentes capas de vocabulario permiten diferentes secuencias de sonido posibles ( fonotáctica ).

Estratos léxicos

Muchas generalizaciones sobre la pronunciación japonesa tienen excepciones si se tienen en cuenta los préstamos recientes. Por ejemplo, la consonante [p] no suele aparecer al principio de palabras nativas (yamato) o derivadas del chino (sino-japonés), pero aparece libremente en esta posición en palabras miméticas y extranjeras. [2] Debido a excepciones como ésta, los análisis de la fonología japonesa suelen referirse a capas o "estratos" de vocabulario. Se pueden distinguir los siguientes cuatro estratos: [1] [3] [4]

Yamato

Esta categoría, denominada wago (和語) [4] o yamato kotoba (大和言葉) en japonés, comprende el vocabulario nativo heredado. Los morfemas de esta categoría muestran una serie de restricciones en cuanto a la estructura que pueden ser violadas por el vocabulario de otras capas.

Mimético

El japonés posee una variedad de palabras miméticas que hacen uso del simbolismo sonoro para cumplir una función expresiva. Al igual que el vocabulario Yamato, estas palabras también son de origen nativo y pueden considerarse pertenecientes al mismo grupo general. Sin embargo, las palabras de este tipo muestran algunas peculiaridades fonológicas que hacen que algunos teóricos las consideren como una capa separada del vocabulario japonés. [3] [5]

Chino-japonés

Las palabras de este estrato, llamadas kango (漢語) en japonés, se originan a partir de varias oleadas de préstamos a gran escala del chino que ocurrieron entre los siglos VI y XIV d. C. Comprenden el 60% de las entradas del diccionario y el 20% del japonés hablado común, y abarcan desde el vocabulario formal hasta las palabras cotidianas. La mayoría de las palabras sino-japonesas se componen de más de un morfema sino-japonés. Los morfemas sino-japoneses tienen una forma fonológica limitada: cada uno tiene una longitud de dos moras como máximo, lo que, según Ito y Mester (2015a), refleja una restricción de tamaño a un solo pie prosódico. Estos morfemas representan la adaptación fonética japonesa de los morfemas monosilábicos del chino medio , cada uno generalmente representado en la escritura por un solo carácter chino , tomado en japonés como kanji (漢字) . Los escritores japoneses también reutilizaron los kanji para representar el vocabulario nativo; Como resultado, existe una distinción entre las lecturas chino-japonesas de kanji, llamadas On'yomi , y las lecturas nativas, llamadas Kun'yomi . [6]

La nasal moraica /N/ es relativamente común en el chino-japonés, y el contacto con el chino medio se describe a menudo como responsable de la presencia de /N/ en japonés (a partir de aproximadamente el año 800 d. C. en el japonés medio temprano ), aunque /N/ también llegó a existir en palabras japonesas nativas como resultado de cambios de sonido. [7]

Extranjero

Esta capa de vocabulario, llamada gairaigo (外来語) en japonés, está formada por palabras no sino-japonesas de origen extranjero, en su mayoría prestadas de lenguas occidentales después del siglo XVI; muchas de ellas entraron en el idioma en el siglo XX. [8] En las palabras de este estrato, se tolera una serie de secuencias de consonante-vocal que no existían anteriormente en japonés, [9] lo que ha llevado a la introducción de nuevas convenciones ortográficas y complica el análisis fonémico de estos sonidos consonánticos en japonés. [10]

Consonantes

Distintos lingüistas analizan el inventario japonés de fonemas consonánticos de formas significativamente diferentes: [11] por ejemplo, Smith (1980) reconoce solo 12 consonantes subyacentes (/mpbntds dz rk ɡ h/), [12] mientras que Okada (1999) reconoce 16, equivalentes a las 12 de Smith más las 4 siguientes (/jw ts ɴ/), [13] y Vance (2008) reconoce 21, equivalentes a las 12 de Smith más las 9 siguientes (/jw ts tɕ (d)ʑ ɕ ɸ NQ/). [14] Las consonantes dentro de paréntesis en la tabla se pueden analizar como alófonos de otros fonemas, al menos en palabras nativas. En los préstamos, /ɸ, ts/ a veces aparecen fonémicamente. [15]

En algunos análisis, los glides [j, w] no se interpretan como fonemas consonánticos. En el vocabulario que no es de préstamos lingüísticos, generalmente pueden ir seguidos solo de un conjunto restringido de sonidos vocálicos: las secuencias permitidas, [ja, jɯ, jo, wa] , a veces se analizan como diptongos ascendentes en lugar de como secuencias consonante-vocal. [16] [17] Lawrence (2004) analiza los glides como variantes no silábicas de los fonemas vocálicos altos /i, u/ , argumentando que el uso de [j, w] frente a [i, ɯ] puede ser predecible si se tiene en cuenta tanto el contexto fonológico como el morfológico.

Notas fonéticas

Detalles de la articulación

Tiempo de inicio de la voz

Al comienzo de una palabra, las oclusivas sordas /p, t, k/ están ligeramente aspiradas [35] —menos que las oclusivas inglesas, pero más que las españolas. [36] Las oclusivas /p, t, k/ que se encuentran en el medio de la palabra parecen no estar aspiradas en promedio. [35] Los estudios fonéticos de la década de 1980 observaron un efecto del acento así como de la posición de la palabra, con un tiempo de inicio de la voz más largo (mayor aspiración) en las sílabas acentuadas que en las sílabas no acentuadas. [37]

Un estudio de 2019 sobre hablantes adultos jóvenes descubrió que, después de una pausa, la /b, d, ɡ/ inicial de palabra puede pronunciarse como oclusivas con un tiempo de inicio de voz positivo nulo o bajo (categorizable como oclusivas sordas no aspiradas o de "retardo corto"); si bien en promedio son significativamente menos aspiradas que la /p, t, k/ inicial de palabra , se observó cierta superposición en el tiempo de inicio de voz. [38] Una pista secundaria de la distinción entre /b, d, ɡ/ y /p, t, k/ en la posición inicial de palabra es un desfase de tono en la siguiente vocal: las vocales después de la /p, t, k/ inicial de palabra (pero no medial de palabra) comienzan con un tono más alto en comparación con las vocales después de /b, d, ɡ/ , incluso cuando estas últimas están fonéticamente ensordecidas. [39] Las /b, d, ɡ/ que se encuentran en el medio de la palabra normalmente son sonoras (o presonoras), pero pueden volverse no oclusivas mediante lenición. [40]

Lenición

Los fonemas /b, d, ɡ/ tienen pronunciaciones no oclusivas debilitadas que pueden transcribirse ampliamente como fricativas sonoras [β, ð, ɣ] , aunque pueden realizarse en cambio como aproximantes sonoras [β̞, ð̞~ɹ, ɣ̞~ɰ] . [41] [42] No hay ningún contexto en el que las pronunciaciones no oclusivas se utilicen de forma consistente, pero ocurren con mayor frecuencia entre vocales:

Estas pronunciaciones debilitadas pueden ocurrir no solo en medio de una palabra, sino también cuando una palabra que comienza con /b, d, ɡ/ sigue a una palabra con vocal final sin pausa intermedia. Maekawa (2018) encontró que, al igual que con la pronunciación de /z/ como [dz] vs. [z] , el uso de realizaciones oclusivas vs. no oclusivas de /b, d, ɡ/ está estrechamente correlacionado con el tiempo disponible para que un hablante articule la consonante, que se ve afectado por la velocidad del habla, así como por la identidad del sonido precedente. [43] Los tres muestran una alta tasa (más del 90%) de pronunciaciones oclusivas después de /Q/ o después de una pausa; Después de /N/ , las pronunciaciones oclusivas ocurren en tasas altas (más del 80%) para /b/ y /d/ , pero con menor frecuencia para /ɡ/ , probablemente porque la /ɡ/ medial después de /N/ a menudo se pronuncia como una nasal velar [ŋ] (aunque el uso de [ŋ] aquí puede estar disminuyendo entre los hablantes más jóvenes). [44] En todos los contextos, /d/ generalmente tiene una tasa más alta de realizaciones oclusivas que /b/ y /ɡ/ . [45]

Consonantes moráicas

Ciertos sonidos consonánticos se denominan «moráicos» porque cuentan para una mora, una unidad de tiempo o longitud prosódica. El análisis fonémico de las consonantes moráicas es objeto de debate. Un enfoque, particularmente popular entre los académicos japoneses, analiza las consonantes moráicas como la realización fonética de «fonemas mora» especiales (モーラ 音素, mōra onso ): una nasal mora /N/ , llamada hatsuon , y una consonante obstruyente mora /Q/ , llamada sokuon . [46] La pronunciación de estos sonidos varía según el contexto: debido a esto, pueden analizarse como fonemas «sin lugar» sin un lugar de articulación fonológicamente especificado . [47] Un enfoque competidor rechaza las transcripciones /Q/ y /N/ y la identificación de las consonantes moraicas como sus propios fonemas, tratándolas en cambio como las realizaciones finales de sílaba de otros fonemas consonánticos [48] (aunque algunos analistas prefieren evitar el uso del concepto de sílabas cuando discuten la fonología japonesa [49] ).

Nasal moraica

La nasal moraica [50] o mora nasal ( hiragana , katakana , romanizada como n o n' ) puede interpretarse como una consonante nasal final de sílaba. [51] Aparte de ciertas excepciones marginales, se encuentra solo después de una vocal, que se nasaliza fonéticamente en este contexto. [52] Puede ir seguida de una consonante, una vocal o el final de una palabra:

Su pronunciación varía según el sonido que le sigue (incluso más allá del límite de una palabra). [56]

Al final de un enunciado, la nasal moraica se pronuncia como un segmento nasal con un lugar de articulación variable y un grado de constricción. [65] Su pronunciación en esta posición se describe y transcribe tradicionalmente como uvular [ ɴ ] , [66] a veces con la calificación de que es, o se acerca, a velar [ ŋ ] después de las vocales anteriores. [67] Algunas descripciones indican que puede tener una oclusión incompleta [55] y potencialmente puede realizarse como una vocal nasalizada, como en la posición intervocálica. [66] [26] Los estudios instrumentales en la década de 2010 mostraron que existe una variabilidad considerable en su realización y que a menudo implica un cierre o constricción de los labios. [68] [69] [70] [71] Un estudio de datos de resonancia magnética en tiempo real recopilados entre 2017 y 2019 encontró que la pronunciación de la nasal moraica en posición final de enunciado implica con mayor frecuencia el cierre del tracto vocal con una posición de la lengua que puede variar de uvular a alveolar: se asimila a la posición de la vocal precedente (por ejemplo, las realizaciones uvulares se observaron solo después de las vocales posteriores /a, o/ ), pero el rango de superposición observado entre pares de vocales similares sugiere que esta asimilación no es una regla alofónica categórica, sino un proceso fonético de gradiente. El 5% de las muestras de nasal moraica de final de enunciado se realizaron como vocales nasalizadas sin cierre: en este caso, se observó una elevación apreciable de la lengua solo cuando la vocal precedente era /a/ . [72]

Existen diversos análisis fonémicos que compiten entre sí sobre la nasal moraica. Puede transcribirse con el símbolo no AFI /N/ y analizarse como una nasal "sin lugar". Algunos analistas no la categorizan como una consonante fonológica. [a] De manera menos abstracta, puede analizarse como una nasal uvular / ɴ / , [76] basándose en la descripción tradicional de su pronunciación antes de una pausa. [77] A veces se la analiza como un alófono final de sílaba de la consonante nasal coronal /n/ , [78] [79] [48] pero esto requiere tratar los límites silábicos o mora como potencialmente distintivos, porque hay un claro contraste en la pronunciación entre la nasal moraica y la /n/ no moraica antes de una vocal [80] o antes de /j/ :

Alternativamente, en un análisis que trata la silabificación como distintiva, la nasal moraica puede interpretarse como un archifonema [82] (una neutralización contextual de fonemas que de otro modo serían contrastivos), ya que no hay contraste en la posición final de sílaba entre /m/ y /n/ .

Así, dependiendo del análisis, una palabra como三枚, sanmai , 'tres hojas', pronunciada fonéticamente como [sammai] , podría transcribirse fonémicamente como /saNmai/ , /saɴmai/ o /sanmai/ .

Obstruyente moraico

Existe un contraste entre los sonidos consonánticos cortos (o singleton) y largos (o geminados ). En comparación con las consonantes singleton, las consonantes geminadas tienen una mayor duración fonética (que se observa en las oclusivas y africadas en forma de una fase de retención más larga antes de la liberación de la consonante, y en las fricativas en forma de un período de fricación más largo). [83] Una geminada puede analizarse fonológicamente como una consonante final de sílaba seguida de una consonante inicial de sílaba (aunque el límite silábico hipotético no es evidente a nivel fonético) [84] y puede transcribirse fonéticamente como dos ocurrencias del mismo fono consonántico en secuencia: una oclusiva o africada geminada se pronuncia con una sola liberación, por lo que la primera parte de dicha geminada puede transcribirse como una oclusiva no liberada . [85] Como se ha comentado anteriormente, las consonantes nasales geminadas se analizan normalmente como secuencias de una nasal moraica seguida de una nasal no moraica, p. ej., [mm] , [nn] = /Nm/ , /Nn/ . [86] En el caso de las consonantes no nasales, la geminación está restringida en su mayor parte por la fonotáctica japonesa a las obstruyentes sordas /ptks/ y sus alófonos. (Sin embargo, otros fonemas consonánticos pueden aparecer como geminados en contextos especiales, como en préstamos lingüísticos).

Las consonantes geminadas también pueden transcribirse fonéticamente con una marca de longitud, como en [ipːai] , pero esta notación oscurece los límites de las moras. Vance (2008) utiliza el marcador de longitud para marcar una nasal moraica, como [sɑ̃mːbɑi] , basándose en el hecho de que una consonante moraica por sí misma tiene el mismo peso prosódico que una secuencia consonante-vocal: en consecuencia, Vance transcribe las consonantes geminadas japonesas con dos marcadores de longitud, por ejemplo [sɑ̃mːːɑi] , [ipːːɑi] , y se refiere a ellas como consonantes "extralargas". [87] En las siguientes transcripciones, las consonantes geminadas se transcribirán fonéticamente como dos ocurrencias de la misma consonante a lo largo de un límite silábico, siendo la primera inédita.

Un análisis fonémico común trata a todas las obstruyentes geminadas como secuencias que comienzan con la misma consonante: una "mora obstruyente" /Q/ . [88] [89] En este análisis, [ak̚ka] , [issai] , [sat̚tɕi] pueden transcribirse fonémicamente como /aQka/ , /iQsai/ , /saQti/ . Este análisis parece estar respaldado por la intuición de hablantes nativos [90] y coincide con el uso en la ortografía kana de un solo símbolo, una versión pequeña del signo tsu ( hiragana , katakana ) para escribir la primera mitad de cualquier obstruyente geminada. [91] Algunos análisis tratan a /Q/ como una consonante subyacente sin lugar. [91] Como alternativa, se ha sugerido que la representación fonémica subyacente de /Q/ podría ser una oclusiva glotal / ʔ / —a pesar del hecho de que fonéticamente no siempre es una oclusiva y, por lo general, no es glotal— basándose en el uso de [ʔ] en ciertas formas marginales que pueden interpretarse como que contienen /Q/ no seguida de otra obstruyente. Por ejemplo, [ʔ] se puede encontrar al final de una exclamación o antes de una sonora en formas con geminación enfática, y se usa como una representación escrita de [ʔ] en estos contextos. Esto sugiere que los hablantes japoneses identifican [ʔ] como la forma predeterminada de /Q/ , o la forma que adopta cuando no es posible que comparta su lugar y modo de articulación con una obstruyente siguiente. [92]

Otro enfoque prescinde de /Q/ y trata las consonantes geminadas como fonemas consonánticos dobles, es decir, como secuencias que consisten en un fonema consonántico seguido de sí mismo: [93] [48] en este tipo de análisis, [ak̚ka] , [issai] , [sat̚tɕi] pueden transcribirse fonémicamente como /a kk a/ , /i ss ai/ , /sa tt i/ . Alternativamente, dado que el contraste entre diferentes consonantes obstruyentes como /k/ , /s/ , /t/ se neutraliza en la posición final de sílaba, la primera mitad de una obstruyente geminada puede interpretarse como un archifonema (al igual que la nasal moraica puede interpretarse como un archifonema que representa la neutralización del contraste entre las consonantes nasales /m/ , /n/ en la posición final de sílaba).

Africada sonora vs. fricativa

La distinción entre las fricativas sonoras [z, ʑ] (originalmente alófonas de /z/ ) y las africadas sonoras [dz, dʑ] (originalmente alófonas de /d/ ) está neutralizada en el japonés estándar y en la mayoría de los dialectos japoneses regionales (aunque no todos). (Algunos dialectos, por ejemplo Tosa , [94] conservan las distinciones entre /zi/ y /di/ y entre /zu/ y /du/ , mientras que otros distinguen solo /zu/ y /du/ pero no /zi/ y /di/ . Sin embargo, otros fusionan las cuatro, por ejemplo Tōhoku del norte .) [94]

En los acentos con fusión, el sonido fonéticamente variable [(d)z] se puede transcribir fonémicamente como /z/ , [95] aunque algunos lo analizan como /dz/ , la contraparte sonora de [ts] . [96] Un estudio de corpus de 2010 encontró que en las variedades neutralizantes, tanto la pronunciación fricativa como la africada se podían encontrar en cualquier posición en una palabra, pero la probabilidad de la realización de la africada aumentaba en condiciones fonéticas que permitían un mayor tiempo para articular la consonante: se encontró que las africadas sonoras ocurrían en promedio el 60% del tiempo después de /N/ , el 74% después de /Q/ y el 80% después de una pausa. [97] Además, la tasa de realizaciones fricativas aumentaba a medida que aumentaba la velocidad del habla. [98] En términos de dirección, estos efectos coinciden con los encontrados para el uso de pronunciaciones oclusivas vs. no oclusivas de las oclusivas sonoras /b, d, ɡ/ ; Sin embargo, la tasa general de realizaciones fricativas de /(d)z/ (incluyendo tanto [dz~z] como [dʑ~ʑ] , tanto en posición intervocálica como postnasal) parece ser mayor que la tasa de realizaciones no oclusivas de /b, d, ɡ/ . [99]

Como resultado de la neutralización, la distinción ortográfica histórica entre estos sonidos ha sido eliminada del estándar escrito moderno excepto en los casos en los que una mora se repite una vez sorda y otra sonora, o cuando rendaku aparece en una palabra compuesta:く[続く] /tuzuku/ ,いちける[位置付ける] /itizukeru/ de |iti+tukeru| . El uso de la ortografía histórica o morfológica en estos contextos no indica una distinción fonética: /zu/ y /zi/ en japonés estándar se pronuncian de forma variable con africadas o fricativas según las tendencias contextuales descritas anteriormente, independientemente de si son sonoras subyacentes o derivadas por rendaku de /tu/ y /ti/ . [100]

Africada coronal sorda

En el vocabulario básico, [ ts ] puede analizarse como un alófono de /t/ antes de /u/ : [101]

Sin embargo, en los préstamos lingüísticos, [ ts ] puede aparecer antes de otras vocales: [102] los ejemplos incluyen [tsaitoɡaisɯto] ツァイトガイスト, tsaitogaisuto , 'zeitgeist'; [eɾitsiɴ] エリツィン, Eritsin , ' Yeltsin '. También hay un pequeño número de formas nativas con [ts] antes de una vocal distinta de /u/ , como otottsan , 'papá', [103] [104] aunque estas son marginales y no estándar [105] (la forma estándar de esta palabra es otōsan ). [102] Basándose en formas dialectales o coloquiales como estas, así como en la distancia fonética entre sonidos oclusivos y africados, Hattori (1950) sostiene que la africada [ts] es su propio fonema, representado por el símbolo no perteneciente al AFI /c/ (que también se interpreta que incluye [tɕ] antes de [i] ). [106] Por el contrario, Shibatani (1990) descarta tales formas por considerarlas excepcionales y prefiere analizar [ts] y [tɕ] como alófonos de /t/ , no como un fonema africado distinto. [107]

Consonantes palatalizadas

La mayoría de las consonantes poseen contrapartes fonéticamente palatalizadas . [108] Los pares de consonantes palatalizadas y no palatalizadas contrastan antes de las vocales posteriores /a o u/ , pero están en distribución complementaria antes de las vocales anteriores: solo la versión palatalizada ocurre antes de /i/ , y solo la versión no palatalizada ocurre antes de /e/ [109] (excluyendo ciertas formas marginales). Las consonantes palatalizadas a menudo se analizan como alófonos condicionados por la presencia de una /i/ o /j/ siguiente . Cuando se adopta este análisis, una consonante palatalizada antes de una vocal posterior se interpreta como una secuencia bifonémica /Cj/ . El análisis fonémico descrito anteriormente se puede aplicar directamente a las contrapartes palatalizadas de /p b k ɡ m n r/ , [110] como en los siguientes ejemplos:

La contraparte palatalizada de /h/ normalmente se describe como [ç] (aunque algunos hablantes no distinguen [ç] de [ɕ] [111] ):

En el análisis presentado anteriormente, una secuencia como [mʲa] se interpreta como que contiene tres fonemas, /mja/ , con un grupo de inicio complejo de la forma /Cj/ . Las consonantes palatalizadas podrían, en cambio, interpretarse como sus propios fonemas, [112] [113] en cuyo caso [mʲa] se compone de /mʲ/ + /a/ . Una tercera alternativa es analizar [ja, jo, jɯ] ~ [ʲa, ʲo, ʲɯ] como diptongos ascendentes [114] [115] [116] ( /i͜a i͜o i͜u/ ), en cuyo caso [mʲa] se compone de /m/ + /i͜a/ . Nogita (2016) aboga por el análisis de conglomerados /Cj/ , señalando que en japonés, sílabas como [bja, ɡja, mja, nja, ɾja] muestran una duración promedio más larga que sus contrapartes no palatalizadas [ba, ɡa, ma, na, ɾa] (mientras que no se encontraron diferencias de duración comparables entre pares de consonantes palatalizadas y no palatalizadas en ruso). [117]

Las gradaciones deslizantes /j w/ no pueden preceder a /j/ . [118] Las sibilantes alveolopalatales [tɕ ɕ (d)ʑ] pueden analizarse como los alófonos palatalizados de /t s z/ , pero se debate si esta interpretación fonémica sigue siendo precisa a la luz de los contrastes encontrados en la fonología de los préstamos lingüísticos.

Sibilantes alveolopalatinos

Las tres sibilantes alveolopalatales [tɕ ɕ (d)ʑ] funcionan, al menos históricamente, como las contrapartes palatalizadas de las cuatro obstruyentes coronales [t s d (d)z] . La /ti/ original pasó a pronunciarse como [tɕi] , la /si/ original pasó a pronunciarse como [ɕi] [ 119] y la /di/ y la /zi/ originales pasaron a pronunciarse como [(d)ʑi] . [120] (Como resultado, las secuencias [ti si di (d)zi] no aparecen en el vocabulario nativo o chino-japonés. [121] )

De la misma manera, la /tj/ original pasó a pronunciarse como [tɕ] , la /sj/ original pasó a pronunciarse como [ɕ] , [122] y la /dj/ y la /zj/ originales pasaron a pronunciarse como [(d)ʑ] : [123]

Por lo tanto, las [tɕ ɕ ʑ] alveolopalatales pueden analizarse como alófonos posicionales de /t d s z/ antes de /i/ , o como la realización superficial de los grupos subyacentes /tj dj sj zj/ antes de otras vocales. Por ejemplo, [ɕi] puede analizarse como /si/ y [ɕa] como /sja/ . Del mismo modo, [tɕi] puede analizarse como /ti/ y /tɕa/ como /tja/ . (Estos análisis corresponden a la representación de estos sonidos en el sistema ortográfico japonés ). La mayoría de los dialectos muestran una fusión en la pronunciación de /d/ y /z/ subyacentes antes de /j/ o /i/ , con el fonador fusionado resultante que varía entre [ʑ] y [dʑ] . El contraste entre /d/ y /z/ también se neutraliza antes de /u/ en la mayoría de los dialectos (véase más arriba).

Si bien los orígenes diacrónicos de estos sonidos como alófonos de /t s d z/ no son controvertidos, existe desacuerdo entre los lingüistas sobre si las sibilantes alveolopalatales continúan funcionando sincrónicamente como alófonos de fonemas consonánticos coronales: la identificación de [tɕ] como un alófono palatalizado de /t/ es especialmente debatida, debido a la presencia de un contraste distintivo entre [tɕi] y [ti] en el estrato extranjero del vocabulario japonés estándar.

[tɕi (d)ʑi]vs. extranjero[ti, di]

Las secuencias [ti, di] se encuentran exclusivamente en préstamos recientes; se les han asignado las nuevas grafías kanaティ, ディ. (Los préstamos tomados antes de que [ti] fuera ampliamente tolerado usualmente reemplazaban esta secuencia con [tɕi] o (más raramente) [te] , [124] y ciertas formas que exhiben estos reemplazos continúan siendo utilizadas; de la misma manera, [(d)ʑi] o [de] pueden encontrarse en lugar de [di] en algunas formas, comoラジオ, rajio , 'radio' yデジタル, dejitaru , 'digital'. [125] ) Basándose en un estudio de frecuencia de tipos en un léxico y frecuencia de tokens en un corpus hablado, Hall (2013) concluye que [t] y [tɕ] se han vuelto tan contrastivos antes de /i/ como lo son antes de /a/ . [126] Algunos analistas sostienen que el uso de [ti, di] en préstamos muestra que el cambio de /ti/ a [tɕi] es una regla inactiva, 'fosilizada', y concluyen que [tɕi] ahora debe analizarse como si contuviera un fonema africado distinto de /t/ ; otros sostienen que la pronunciación de /ti/ como [tɕi] sigue siendo una regla activa de la fonología japonesa, pero que esta regla está restringida a su aplicación a palabras que pertenecen al estrato extranjero. [127]

A diferencia de [ti, di] , las secuencias *[si, zi] no se establecen ni siquiera en préstamos lingüísticos. La /s/ inglesa todavía se adapta normalmente como [ɕ] antes de /i/ [128] (es decir, con katakana, shi ). Un ejemplo esシネマ, shinema [ɕinema] de cinema . [129] Del mismo modo, la /z/ inglesa normalmente se adapta como [(d)ʑ] antes de /i/ (es decir, con katakana, ji ). Pronunciar préstamos lingüísticos con [si] [130] o [zi] es poco común incluso entre los hablantes más innovadores, pero no está completamente ausente. [131] Para transcribir [si] , en oposición a [ɕi] , es posible utilizar la nueva ortografía kanaスィ( su + i minúscula ) [128] (aunque también se ha utilizado para transcribir la [sw] original antes de /i/ en formas comoスィッチ, 'cambio' [sɯittɕi] , [132] como alternativa a las ortografíasスイッチ, suitchi oスウィッチ, suwitchi ). El uso deスィy su contraparte sonoraズィfue mencionado, pero no recomendado oficialmente, por una directiva del gabinete de 1991 sobre el uso de kana para deletrear palabras extranjeras. [133] [134] Nogita (2016) sostiene que la diferencia entre [ɕi] y [si] puede ser marginalmente contrastiva para algunos hablantes, [118] mientras que Labrune (2012) niega que *[si, zi] se distinga alguna vez en la pronunciación de [ɕi, (d)ʑi] en formas adaptadas, independientemente de si las grafíasスィyズィse usan en la escritura. [135]

La secuencia [tsi] (a diferencia de [tɕi] o [ti] ) también tiene algún uso marginal en préstamos lingüísticos. [136] Un ejemplo esエリツィン, Eritsin , ' Yeltsin '. [102] En muchos casos existe una adaptación variante con [tɕi] . [136]

Alternancias que involucran[tɕɕ ( d)ʑ]

Además de los argumentos basados ​​en la fonología de los préstamos, también hay desacuerdo sobre el análisis fonémico de las formas japonesas nativas. Algunos verbos pueden analizarse como si tuvieran una raíz subyacente que termina en /t/ o /s/ ; estos se convierten en [tɕ] o [ɕ] respectivamente antes de sufijos flexivos que comienzan con [i] :

Además, Shibatani (1990) señala que en el habla informal, /se/ o /te/ en formas verbales pueden experimentar coalescencia con un /ba/ siguiente (que marca el condicional), formando [ɕaː] y [tɕaː] respectivamente, como en [kaɕaː] para /kaseba/ 'si (yo) presto' y [katɕaː] para /kateba/ 'si (yo) gano'. [138] Por otra parte, según Vance (1987), [tj, sj] (más específicamente, [tj̥, sj̥] ) puede aparecer en lugar de [tɕ, ɕ] para algunos hablantes en formas de habla contraídas, como [tjɯː] para /tojuː/ 'decir', [139] [matja(ː)] para /mateba/ 'si uno espera', y [hanasja(ː)] para /hanaseba/ 'si uno habla'; Vance señala que estas podrían descartarse como variantes de habla rápida no fonémicas. [140]

Hattori (1950) sostiene que las alternancias en las formas verbales no prueban que [tɕ] sea fonémicamente /t/ , y cita kawanai (con /w/ ) vs. kai , kau , kae , etc. como evidencia de que una consonante final de raíz no siempre se mantiene sin cambio fonémico a lo largo de las formas conjugadas de un verbo, y /joɴdewa/ ~ /joɴzja/ '(no debe) leerse' como evidencia de que la palatalización producida por la coalescencia vocálica puede resultar en alternancia entre diferentes fonemas consonánticos. [141]

Análisis fonémicos en competencia

Hay varias alternativas a la interpretación de [tɕ ɕ (d)ʑ] como alófonos de /t s z/ antes de /i/ o /j/ .

Algunas interpretaciones coinciden con el análisis de [ɕ] como alófono de /s/ y [(d)ʑ] como alófono de /z/ (o /dz/ ), pero tratan a [tɕ] como el alófono palatalizado de un fonema africado coronal sordo [26] / ts / (para aclarar que se analiza como un solo fonema, algunos lingüistas transcriben fonémicamente esta africada como /tˢ/ [26] o con el símbolo no AFI /c/ ). En este tipo de análisis, [tɕi, tɕa] = /tsi, tsja/ . [26]

Otras interpretaciones tratan a [tɕ ɕ (d)ʑ] como sus propios fonemas, mientras que tratan otras consonantes palatalizadas como alófonos o grupos. [142] [118] Se argumenta que el estatus de [tɕ ɕ (d)ʑ] como fonemas en lugar de grupos que terminan en /j/ está respaldado por el uso estable de las secuencias [tɕe (d)ʑe ɕe] en préstamos; en contraste, /je/ es algo inestable (puede reemplazarse variablemente con /ie/ o /e/ [143] ), y otras secuencias de consonante + /je/ como [pje] , [kje] generalmente están ausentes. [144] [118] (Aparte de los préstamos, [tɕe ɕe] también aparece marginalmente en el vocabulario nativo en ciertas formas exclamativas. [145] [146] )

Alternativamente, se ha sugerido que pares como [tɕi] vs. [ti] podrían analizarse como /tji/ vs. /ti/ . [147] Vance (2008) se opone a análisis como /tji/ sobre la base de que la secuencia /ji/ está prohibida en la fonología japonesa. [148]

Fricativa bilabial sorda

En el vocabulario básico, [ ɸ ] aparece solo antes de /u/ y puede analizarse como un alófono de /h/ : [101]

Según algunas descripciones, el sonido inicial de, fu /hu/, no se produce consistentemente como [ɸ] , sino que a veces puede ser un sonido con fricción bilabial débil o nula que podría transcribirse como [h] [149] [150] (una aproximante sorda similar al comienzo del inglés "who" [151] ).

En préstamos, [ɸ] puede aparecer antes de otras vocales o antes de /j/ . Los ejemplos incluyen [ɸiɴ] (フィン, fin , 'fin'), [ɸeɾiː] (フェリー, ferī , 'ferry'), [ɸaɴ] (ファン, fan , 'fan'), [ɸoːmɯ] (フォーム, fōmu , ' forma'), y [ɸjɯː(d)ʑoɴ] (フュージョン, fyūjon , 'fusión'). [152] Incluso en los préstamos, *[hɯ] no se distingue de [ɸɯ] [129] (por ejemplo, en inglés hood y food  >  [ɸɯːdo] フード, fūdo ), pero [ ɸ ] y [ h ] se distinguen antes de otras vocales ( p. ej., tenedor  >  [ɸoːkɯ] フォーク, fōku versus halcón  >  [hoːkɯ] ホーク, hōku ).

La integración de [ɸi] , [ɸe] , [ɸa] , [ɸo] y [ɸjɯ] en el japonés estándar hablado contemporáneo parece haberse completado en algún momento después de mediados del siglo XX, [153] en el período de posguerra: antes de eso, la pronunciación de estas secuencias parece haber sido común solo en la pronunciación culta. [154] Las palabras prestadas más recientemente que alrededor de 1890 muestran de manera bastante consistente que [ ɸ ] es una adaptación de la extranjera [f] . [155] Algunas formas prestadas más antiguas muestran la adaptación de la extranjera [f] a la /h/ japonesa antes de una vocal distinta de /u/ , comoコーヒー, kōhī , 'café' yプラットホーム, purattohōmu , 'plataforma'. Otro patrón de adaptación antiguo era el reemplazo de la [f] extranjera por [ɸɯ] antes de una vocal distinta de /u/ , p. ej. film > [ɸɯ.i.rɯ.mɯ] フイルム, fuirumu . Ambas estrategias de reemplazo están ahora en gran medida obsoletas, [154] aunque ciertas formas adaptadas antiguas continúan utilizándose, a veces con significados especializados en comparación con una pronunciación variante: por ejemplo,フイルム, fuirumu tiende a restringirse en el uso moderno a películas fotográficas, mientras queフィルム, firumu se usa para otros sentidos de "película", como películas cinematográficas. [156]

Fricativa labiodental sonora

Aunque las grafías con kana vu () , va (ヴァ) , vi (ヴィ) , ve (ヴェ) , vo (ヴォ) , vya (ヴャ) , vyu (ヴュ) , vyo (ヴョ) se usan comúnmente en En transcripciones estrechas al japonés , la pronunciación normalmente no se distingue de /b/ : por ejemplo, no existe una diferencia fonológica o fonética significativa en la pronunciación entre Eruvisu (エルヴィス) y Erubisu (エルビス) . [157] Por lo tanto, un contraste fonémico entre * /v/ y /b/ normalmente no se reconoce como parte de la fonología japonesa [158] [29] (aunque algunos analistas han optado en cambio por interpretar /v/ como un fonema innovador que existe para sólo unos pocos hablantes [159] [160] ).

Inicio nasal velar

Para algunos hablantes, la nasal velar [ ŋ ] puede aparecer como inicio en lugar de la oclusiva velar sonora [ ɡ ] en ciertas condiciones. El inicio [ŋ] , llamado bidakuon (鼻濁音) , generalmente se restringe a la posición interna de la palabra, [161] donde puede aparecer después de una vocal (como en禿, ha g e , 'calvicie' [haŋe] [162] ) o después de una nasal moraica /N/ [163] (como en音楽, on g aku , 'música' [oŋŋakɯ~oŋŋakɯ̥] [164] ). Se debate si el inicio [ŋ] constituye un fonema separado o un alófono de /ɡ/ . [165] Se escriben de la misma manera en kana, y los hablantes nativos tienen la intuición de que los dos sonidos pertenecen al mismo fonema. [166] [b]

Los hablantes pueden dividirse en tres grupos según el grado en que utilizan [ŋ] en contextos en los que no se requiere [ɡ] : algunos utilizan [ŋ] de forma constante , algunos nunca utilizan [ŋ] y algunos muestran un uso variable de [ŋ] frente a [ɡ] (o [ɣ] ). Los hablantes que utilizan [ŋ] de forma constante son una minoría. La distribución de [ŋ] frente a [ɡ] para estos hablantes sigue en su mayoría reglas predecibles (como se describe a continuación): sin embargo, existen una serie de complicaciones y excepciones y, como resultado, algunos lingüistas analizan /ŋ/ como un fonema distinto para hablantes nasales constantes. [166] El contraste tiene una carga funcional muy baja, [166] pero para algunos hablantes pares como [oːɡaɾasɯ] (大硝子, 'gran hoja de vidrio') versus [oːŋaɾasɯ] (大烏, 'gran cuervo') pueden citarse como ejemplos de palabras que son segmentariamente idénticas, aparte del uso de [ɡ] versus [ŋ] . [167] Otro par citado comúnmente es [seŋɡo] 千五, 'mil cinco' versus [seŋŋo] 戦後, 'posguerra', aunque aparte de la diferencia segmental en la consonante, estos son prosódicamente distintos: el primero normalmente se pronuncia como dos frases acentuadas, [seꜜŋɡoꜜ] , mientras que el segundo se pronuncia como una frase acentuada única (ya sea [seꜜŋŋo] o [seŋŋo] ). [168]

Distribución de[norte]vs.[ɡ]

Al comienzo de una palabra independiente, todos los hablantes usan [ɡ] en casi todas las circunstancias. Sin embargo, las partículas posposicionales, como el marcador de sujeto, g a , se pronuncian con [ŋ] por hablantes nasales consistentes. [169] Además, ciertas palabras que normalmente aparecen después de otras palabras pueden pronunciarse con [ŋ] incluso cuando aparecen al comienzo de un enunciado: los ejemplos incluyen la conjunción, g a , 'pero' y la palabra g urai , 'aproximadamente'. [169] [170]

En medio de un morfema nativo, los hablantes nasales consistentes siempre usan [ŋ] . Pero en medio de morfemas de estrato extranjero, [ɡ] puede ser usado incluso por hablantes nasales consistentes. [171] También es posible que los morfemas extranjeros se pronuncien con [ŋ] medial : hay una variabilidad considerable, pero esto puede ser más común en préstamos más antiguos (comoオルガン, oru g an , 'órgano', del portugués órgão ) [171] o en préstamos que contenían [ŋ] en el idioma de origen (comoイギリス, i g irisu , 'Inglaterra', del portugués inglês ). [172]

Al comienzo de un morfema en medio de una palabra, puede ser posible [ŋ] o [ɡ] , dependiendo de la palabra. Solo [ɡ] es posible después del prefijo honorífico, o (como enお元気, o g enki , 'salud' [oɡenki] ) o al comienzo de un morfema mimético reduplicado [172] (como enがらがら, gara- g ara , 'traqueteo-traqueteo' [ɡaɾaɡaɾa] ). [173] Los hablantes nasales consistentes suelen usar [ŋ] al comienzo del segundo morfema de una palabra sino-japonesa bimorfémica, o al comienzo de un morfema que ha sufrido rendaku y comienza con /k/ cuando se pronuncia como una palabra independiente. [174] Cuando un morfema que puede ocurrir independientemente como una palabra que comienza con [ɡ] se usa como el segundo elemento de un compuesto, el compuesto puede ser pronunciado con [ɡ] o [ŋ] por hablantes nasales consistentes: factores como el estrato léxico del morfema pueden jugar un papel, pero parece difícil establecer reglas precisas que predigan qué pronunciación ocurre en este contexto, y la pronunciación de algunas palabras varía incluso entre hablantes nasales consistentes, como縞柄, shima g ara , 'patrón rayado' [ɕimaɡaɾa~ɕimaŋaɾa] . [175]

El morfema, go , 'cinco', se pronuncia con [ɡ] cuando se usa como parte de un numeral compuesto, como en [ɲi(d)ʑɯːgo] 二十五, nijū-go , 'veinticinco' (acentuado como [ɲiꜜ(d)ʑɯːgoꜜ] ), [26] aunquepuede potencialmente pronunciarse como [ŋo] cuando ocurre de manera no inicial en ciertos nombres propios o palabras compuestas lexicalizadas, como [tameŋoɾoː] 為五郎(un nombre de pila masculino), [ɕitɕiŋosaɴ] 七五三(el nombre de un festival para niños de siete, cinco o tres años ), o [(d)ʑɯːŋoja] 十五夜(una noche de fiesta de fin de año) luna). [176]

Para resumir:

Sociolingüística de[norte]

La frecuencia de inicio de [ŋ] en el habla japonesa de Tokio estaba cayendo a partir de 2008, y parece haber estado ya en declive en 1940. [177] Las pronunciaciones con [ŋ] son ​​generalmente menos frecuentes para los hablantes más jóvenes, [178] [177] [165] y aunque el uso de [ŋ] fue tradicionalmente prescrito como una característica del japonés estándar, las pronunciaciones con [ɡ] parecen en la práctica haber adquirido un estatus más prestigioso, como lo muestran los estudios que encuentran tasas más altas de uso de [ɡ] cuando los hablantes leen palabras de una lista. [179] [180] La frecuencia de [ŋ] también varía según la región: es rara en los dialectos del suroeste de Kansai , pero más común en los dialectos del noreste de Tohoku , con una frecuencia intermedia en los dialectos de Kanto (que incluye el dialecto de Tokio). [181]

Vocales

Las vocales del japonés estándar en un diagrama vocálico . Adaptado de Okada (1999:117).

Vocales largas y secuencias vocálicas

Todas las vocales muestran un contraste de longitud : las vocales cortas son fonémicamente distintas de las vocales largas:

Las vocales largas se pronuncian con una duración fonética de alrededor de 2,5 o 3 veces la de las vocales cortas, pero se considera que tienen una duración de dos moras a nivel fonológico. [189] En el habla normal, una "vocal doble", es decir, una secuencia de dos vocales cortas idénticas (por ejemplo, a través de los límites de los morfemas), se pronuncia de la misma manera que una vocal larga. Sin embargo, en el habla lenta o formal, una secuencia de dos vocales cortas idénticas puede pronunciarse de manera diferente a una vocal intrínsecamente larga: [190]

En la transcripción anterior, [.] representa un hiato entre vocales; las fuentes difieren en cómo transcriben y describen la realización fonética del hiato en japonés. Labrune (2012) dice que puede ser "una pausa o una oclusión glótica leve", y adopta la transcripción [ˀ] . [190] Shibatani (1990) afirma que no hay un cierre glótico completo y cuestiona si hay algún estrechamiento glótico real en absoluto. [191] Vance lo describe como rearticulación vocálica (una caída en la intensidad) y lo transcribe como [ˀ] [192] o [*] . [193]

Además, una vocal doble puede llevar acento tonal en el primer o segundo elemento, mientras que una vocal intrínsecamente larga puede acentuarse solo en su primera mora. [194] La distinción entre vocales dobles y vocales largas puede analizarse fonológicamente de varias maneras. Un análisis interpreta las vocales largas como terminaciones en un segmento especial /R/ que añade una mora al sonido vocálico precedente [195] (un cronema ). Otro análisis interpreta las vocales largas como secuencias del mismo fonema vocálico dos veces, y las vocales dobles se distinguen por la presencia de una "consonante cero" o inicio vacío entre las vocales. [196] Un tercer enfoque también interpreta las vocales largas como secuencias del mismo fonema vocálico dos veces, pero trata la diferencia entre vocales largas y dobles como una cuestión de silabificación, donde la vocal larga [oː] consiste en los fonemas /oo/ pronunciados en una sílaba, y la vocal doble [oo] consiste en los mismos dos fonemas divididos entre dos sílabas. [197]

Cualquier par de vocales cortas puede aparecer en secuencia [198] (aunque solo se puede encontrar un subconjunto de secuencias vocálicas dentro de un morfema en el vocabulario nativo o sinojaponés). También se dan secuencias de tres o más vocales. De manera similar a la distinción entre vocales largas y vocales dobles, algunos análisis de la fonología japonesa reconocen una distinción entre diptongos (dos fonemas vocálicos diferentes pronunciados en una sílaba) y secuencias vocálicas heterosilábicas; otros análisis no hacen tal distinción.

Desensorción

Las vocales japonesas a veces son sordas desde el punto de vista fonético . La diferencia entre las versiones sonoras y sordas de una vocal no es fonémicamente contrastiva: sin embargo, el uso de vocales sordas se describe a menudo como una característica obligatoria del japonés estándar de Tokio, en el sentido de que suena poco natural utilizar una vocal sonora en posiciones en las que la ensordecimiento es habitual. [199] El ensordecimiento afecta principalmente a las vocales cortas altas (cerradas) /i/ y /u/ cuando están precedidas por una consonante sorda y seguidas por una segunda consonante sorda o por una pausa. [200] [201] Estas vocales normalmente no están sordas si están precedidas o seguidas por una consonante sonora o por otra vocal, aunque se han observado excepciones ocasionales a esto. [202]

/iu/ entre consonantes sordas o antes de una pausa

En general, es muy probable que una vocal alta ( /i/ o /u/ ) entre dos consonantes sordas quede sorda si la segunda consonante es una oclusiva o africada, o si la primera es una oclusiva y la segunda es una fricativa sorda distinta de /h/ . [203]

La ensordecimiento de /i/ y /u/ entre consonantes sordas no se limita al habla rápida [205] y ocurre incluso en una pronunciación cuidadosa. [206] El ensordecimiento se inhibe si la segunda consonante es /h/ [207] [208] [209] y también (en un grado algo menor) si la segunda consonante es una fricativa y la primera consonante es una fricativa o africada. [207] También hay una tendencia a evitar el ensordecimiento de ambas vocales cuando dos sílabas consecutivas (o moras) contienen vocales altas entre consonantes sordas: [210] [211] [205] sin embargo, es posible que ambas vocales sean ensordecidas en este contexto [212] (quizás especialmente en el habla rápida [213] ). Algunas descripciones más antiguas indican que la presencia de acento tonal en una mora inhibe la ensordecimiento de su vocal, pero para los hablantes contemporáneos jóvenes, parece ser posible ensordecer las vocales acentuadas. [214]

La evitación de la ensordecimiento consecutivo se puede ver en pronunciaciones como las siguientes:

La ensordecimiento no sólo ocurre dentro de las palabras, sino que también puede afectar a /i/ o /u/ finales de palabra . Es probable que una vocal alta final de palabra esté ensordecido cuando está precedida por una consonante sorda y seguida sin pausa (o con poca pausa) por una palabra que comienza con una consonante sorda dentro de la misma frase. [216] Una vocal alta final de palabra también puede estar ensordecido cuando está precedida por una consonante sorda y seguida por una ' pausa ' en un límite de frase. [217] El ensordecimiento entre una consonante sorda y una pausa parece ocurrir con menos consistencia general que el ensordecimiento entre consonantes sordas. [218] [206] [219] La /u/ final se ensordece con frecuencia en la cópula común de fin de oraciónです, desu y el sufijo cortésます, masu . [220] [221] [222] [223] Las vocales finales de frase no se ensordece cuando la frase lleva la entonación ascendente asociada con una oración interrogativa, [224] como en la pregunta行きます? , Ikimasu?, '¿Irás?'. [210]

Ensordecimiento atípico

En ocasiones, una vocal alta puede quedar sorda después de una consonante sorda, incluso cuando el sonido que le sigue es sonoro. En este contexto, la ensordecimiento parece ocurrir con más frecuencia antes de nasales o aproximantes que antes de otros sonidos consonánticos sonoros. [202] Algunos estudios también han encontrado ejemplos raros de vocales sordas después de consonantes sonoras. [225] Según Vance 2008, las vocales altas no quedan sordas junto a un segmento sonoro en una pronunciación cuidadosa. [214]

Las vocales no altas /a e o/ a veces se ensordece, generalmente entre consonantes sordas; la ensordecimiento de estas vocales es poco frecuente, opcional, varía entre hablantes y puede verse afectado por la velocidad del habla. [226] [227]

Fonética de la ensordecimiento

Fonéticamente, una vocal sorda puede sonar como un período de ruido turbulento que muestra las características acústicas de una fricativa sorda: por ejemplo, la /i/ sorda de kitai suena como la fricativa palatal sorda [ç] . [228] A veces no hay un límite acústico claro entre el sonido de una vocal sorda y el sonido del fonema consonántico sordo precedente. [229] Por ejemplo, aunque la palabra /suta↓iru/ se analiza fonémicamente como que contiene una /u/ sorda en su primera mora, se puede analizar acústicamente como que comienza con una fricativa [s] que se mantiene hasta la siguiente [t], sin un tercer sonido que intervenga entre estos dos sonidos consonánticos. [230]

Algunos analistas han propuesto que las vocales "sordas" pueden en realidad eliminarse en algunas circunstancias, ya sea a nivel fonético o en algún nivel de la fonología. [231] Sin embargo, se ha argumentado en respuesta que otros fenómenos muestran al menos la presencia subyacente de un fonema vocálico:

Sociolingüística de la ensordecimiento

Los hablantes de japonés no suelen ser conscientes de la diferencia entre el par sonoro y el sordo. Por otra parte, los roles de género influyen en la prolongación de la vocal terminal: se considera afeminado prolongar, en particular la /u/ terminal, como enあります, arimasu , 'hay'. Algunas variedades no estándar del japonés se pueden reconocer por su hipersordicidad, mientras que en algunos dialectos occidentales y algunos registros del habla formal, todas las vocales son sonoras. [ cita requerida ]

Nasalización

Las vocales se nasalizan antes de la nasal moraica /N/ (o equivalentemente, antes de una nasal de final de sílaba). [235]

Inserción de la oclusión glótica

Una oclusión glotal [ ʔ ] puede ocurrir antes de una vocal al comienzo de un enunciado, o después de una vocal al final de un enunciado. [236] Esto se demuestra a continuación con las siguientes palabras (tal como se pronuncian de forma aislada):

Cuando se pronuncia con énfasis una palabra que termina en un enunciado, los hablantes nativos notan la presencia de una oclusión glotal, que puede indicarse por escrito con sokuonっ , lo que sugiere que se identifica con la obstruyente moraica /Q/ [237] (que normalmente se encuentra como la primera mitad de una geminada). Esto también se encuentra en interjecciones comoあっ, a yえっ, e .

Prosodia

Moras

Tradicionalmente, las palabras japonesas se han analizado como compuestas de moras , un concepto distinto del de sílabas. [c] [238] Cada mora ocupa una unidad rítmica, es decir, se percibe que tiene el mismo valor temporal. [239] Una mora puede ser "regular" y estar formada solo por una vocal (V) o una consonante y una vocal (CV), o puede ser una de dos moras "especiales", /N/ y /Q/ . Una glide /j/ puede preceder a la vocal en moras "regulares" (CjV). Algunos análisis postulan una tercera mora "especial", /R/ , la segunda parte de una vocal larga (un cronema ). [d] [240] En la siguiente tabla, el período representa una ruptura de mora, en lugar de la ruptura de sílaba convencional.

^1 Tradicionalmente, las moras se dividían en conjuntos simples y palatales, estos últimos implican la palatalización del elemento consonante. [241]

Así, el bisílabo [ɲip.poɴ] (日本, 'Japón') puede analizarse como /niQpoN/ , dividido en cuatro moras: /ni/ , /Q/ , /po/ y /N/ .

En inglés , las sílabas acentuadas de una palabra se pronuncian más fuerte, más largas y con un tono más alto, mientras que las sílabas no acentuadas tienen una duración relativamente más corta. El japonés suele considerarse un idioma con tiempos de mora , ya que cada mora tiende a tener la misma longitud , [242] aunque no estrictamente: las consonantes geminadas y las moras con vocales sordas pueden ser más cortas que otras moras. [243] Factores como el tono tienen una influencia insignificante en la longitud de la mora. [244]

Acento de tono

El japonés estándar tiene un sistema de acento tonal distintivo , en el que una palabra puede ser inacentuada o llevar acento en una de sus moras. Una mora acentuada se pronuncia con un tono relativamente alto y va seguida de una caída de tono , que se puede marcar en la transcripción colocando una flecha que apunta hacia abajo /ꜜ/ después de la mora acentuada. [245]

El tono de las demás moras de la palabra (o, más precisamente, de la frase acentuada) es predecible. Un modelo simplificado común describe los patrones de tono en términos de una división bidireccional entre moras de tono bajo y alto. El tono bajo se encuentra en todas las moras que siguen a la mora acentuada (si la hay) y, por lo general, también en la primera mora de la frase acentuada (a menos que lleve el acento). El tono alto se encuentra en la mora acentuada (si la hay) y en las moras no iniciales hasta la mora acentuada, o hasta el final de la frase acentuada si no hay mora acentuada. [246]

Según este modelo, no es posible distinguir los patrones de tono de una frase no acentuada y una frase acentuada en la última mora: ambas presentan un tono bajo en la primera mora y un tono alto en cada una de las moras siguientes. En general, se dice que no hay diferencia audible entre estos dos patrones de acentuación. [247] [248] (Algunos experimentos acústicos han encontrado evidencia de que algunos hablantes pueden producir contornos de tono fonético ligeramente diferentes para estos dos patrones de acentuación; [247] [248] sin embargo, incluso cuando existen tales diferencias, no parecen ser perceptibles para los oyentes. [249] ) Sin embargo, la distinción léxica subyacente entre palabras no acentuadas y palabras con acento en la mora final se hace evidente cuando la palabra es seguida por más material dentro de la misma frase acentuada, como la partícula de caso: así, /hasiꜜɡa/ (橋が, ' NOM de puente ') contrasta claramente con /hasiɡa/ (端が, ' NOM de borde '), aunque no se percibe una distinción entre /hasiꜜ/ y /hasi/ cuando se pronuncian de forma aislada.

La colocación del acento tonal y la disminución del tono en una mora inicial no acentuada muestran algunas restricciones que se pueden explicar en términos de la estructura de la sílaba. El acento no se puede colocar en la segunda mora de una sílaba pesada (bimoráica) [250] (que puede ser /Q/ , /N/ o la segunda mora de una vocal larga o diptongo). Una mora inicial no acentuada no siempre se pronuncia con un tono bajo cuando ocurre como parte de una sílaba pesada. [251] Específicamente, cuando la segunda mora de una frase acentuada es /R/ (la última parte de una vocal larga) o /N/ (la nasal moráica), las primeras dos moras son opcionalmente LH (grave-aguda) o HH (aguda-aguda). [252] En contraste, cuando la segunda mora es /Q/ las primeras dos moras son LL (grave-grave). [253] Cuando la segunda mora es /i/ , la bajada inicial parece aplicarse como siempre solo a la primera mora, LH (baja-alta). [253] Labrune (2012) rechaza el uso de la sílaba en las descripciones de la fonología japonesa y, por lo tanto, explica estos fenómenos alternativamente como una consecuencia de que /N/ , /Q/ , /R/ constituyen "moras deficientes", un término que Labrune sugiere que también puede abarcar moras sin inicio, con una vocal sorda o con una vocal epentética. [254]

Los distintos dialectos del japonés tienen diferentes sistemas de acento: algunos distinguen un mayor número de patrones de tono contrastantes que el dialecto de Tokio, mientras que otros hacen menos distinciones. [255]

Pies

El pie bimoráico, una unidad compuesta por dos moras, juega un papel importante en los análisis lingüísticos de la prosodia japonesa. [256] [257] La ​​relevancia del pie bimoráico se puede ver en la formación de nombres hipocorísticos , compuestos recortados y formas abreviadas de palabras más largas.

Por ejemplo, el sufijo hipocorístico -chan se añade al final de un nombre para formar un término cariñoso de tratamiento. Cuando se utiliza este sufijo, el nombre puede permanecer inalterado en su forma, o puede modificarse opcionalmente: las formas modificadas siempre tienen un número par de moras antes del sufijo. [258] Es común utilizar las dos primeras moras del nombre base, pero también hay variaciones que no se producen por simple truncamiento: [e]

Truncamiento de las dos primeras moras: [259]

De la primera mora, con alargamiento: [260]

Con formación de una obstruyente moraica: [261]

Con formación de una nasal moraica: [262]

De dos moras no adyacentes: [263]

Poser (1990) sostiene que los diversos tipos de modificaciones se explican mejor en términos de una "plantilla" de dos moras utilizada en la formación de este tipo de hipocorístico: el pie bimoráico. [264]

Además del pie bimoráico que se muestra arriba, en algunos análisis se considera que los pies monomoráicos (de una mora) (también llamados pies "degenerados") o los pies trimoráicos (de tres moras) aparecen en ciertos contextos. [256]

Sílabas

Aunque existe un debate sobre la utilidad o relevancia de las sílabas para la fonología del japonés, es posible analizar las palabras japonesas como divididas en sílabas. Al adaptar letras japonesas a música (moderna de estilo occidental), una sola nota puede corresponder a una mora o a una sílaba. [265]

Normalmente, cada sílaba contiene al menos una vocal [266] y tiene una longitud de una mora (llamada sílaba ligera) o dos moras (llamada sílaba pesada); por lo tanto, la estructura de una sílaba japonesa típica se puede representar como (C)(j)V(V/N/Q), donde C representa una consonante de inicio, V representa una vocal, N representa una nasal moraica, Q representa una obstruyente moraica, los componentes entre paréntesis son opcionales y los componentes separados por una barra son mutuamente excluyentes. [267] Sin embargo, pueden existir otros tipos de sílabas más marginales (como sílabas trimoraicas o sílabas sin vocales) en contextos restringidos.

La mayoría de las sílabas del habla japonesa espontánea son «ligeras», [268] es decir, de una mora de longitud, con la forma (C)(j)V.

Sílabas pesadas

Las sílabas "pesadas" (de dos moras de longitud) pueden adoptar potencialmente cualquiera de las siguientes formas:

Algunas descripciones de la fonología japonesa se refieren a una secuencia VV dentro de una sílaba como un diptongo; otras usan el término "cuasi-diptongo" como un medio para aclarar que estos se analizan como secuencias de dos fonemas vocálicos dentro de una sílaba, en lugar de como fonemas unitarios. [270] Existe desacuerdo sobre qué secuencias vocálicas no idénticas pueden ocurrir dentro de la misma sílaba. Un criterio utilizado para evaluar esta cuestión es la ubicación del acento tonal: se ha argumentado que, al igual que las sílabas que terminan en vocales largas, las sílabas que terminan en diptongos no pueden llevar un acento tonal en su mora final. [271] También se ha argumentado que los diptongos, al igual que las vocales largas, normalmente no pueden pronunciarse con una oclusión glotal o rearticulación vocálica entre sus dos moras, mientras que esto puede ocurrir opcionalmente entre dos vocales que pertenecen a sílabas separadas. [272] Kubozono (2015a) sostiene que solo /ai/ , /oi/ y /ui/ pueden ser diptongos, [273] aunque alguna literatura previa ha incluido otras secuencias como /ae/ , /ao/ , /oe/ , /au/ , cuando aparecen dentro de un morfema. [274] Labrune (2012) argumenta en contra de la sílaba como unidad de la fonología japonesa y, por lo tanto, concluye que ninguna secuencia de vocales debería analizarse como diptongos. [275]

In some contexts, a VV sequence that could form a valid diphthong is separated by a syllable break at a morpheme boundary, as in /kuruma.iꜜdo/ 'well with a pulley' from /kuruma/ 'wheel, car' and /iꜜdo/ 'well'.[276] However, the distinction between a heterosyllabic vowel sequence and a long vowel or diphthong is not always predictable from the position of morpheme boundaries: that is, syllable breaks between vowels do not always correspond to morpheme boundaries (or vice versa).

For example, some speakers may pronounce the word , honoo, 'flame' with a heterosyllabic /o.o/ sequence, even though this word is arguably monomorphemic in modern Japanese.[277] This is an exceptional case: for the most part, heterosyllabic sequences of two identical short vowels are found only across a morpheme boundary.[277] On the other hand, it is not so rare for a heterosyllabic sequence of two non-identical vowels to occur within a morpheme.[277]

In addition, it seems to be possible in some cases for a VV sequence to be pronounced in one syllable even across a morpheme boundary. For example, 歯医者, haisha, 'dentist' is morphologically a compound of , ha, 'tooth' and 医者, isha, 'doctor' (itself composed of the morphemes , i, 'medical' and , sha, 'person'); despite the morpheme boundary between /a/ and /i/ in this word, they seem to be pronounced in one syllable as a diphthong, making it a homophone with 敗者, haisha, 'defeated person'.[278] Likewise, the morpheme /i/ used as a suffix to form the dictionary form (or affirmative nonpast-tense form) of an i-adjective is almost never pronounced as a separate syllable; instead, it combines with a preceding stem-final /i/ to form the long vowel [iː], or with a preceding stem-final /a/, /o/ or /u/ to form a diphthong.[279]

Superheavy syllables

Syllables of three or more moras, called "superheavy" syllables, are uncommon and exceptional (or "marked"); the extent to which they occur in Japanese words is debated.[280] Superheavy syllables never occur within a morpheme in Yamato or Sino-Japanese.[281] Apparent superheavy syllables can be found in certain morphologically derived Yamato forms (including inflected verb forms where a suffix starting with /t/ is attached to a root ending in -VVC-, derived adjectives in っぽい, -ppoi, or derived demonyms in っこ, -kko) as well as in many loanwords.[281][282]

According to some accounts, certain forms listed in the above table may be avoided in favor of a different pronunciation with an ordinary heavy syllable (by reducing a long vowel to a short vowel or a geminate to a singleton consonant). Vance (1987) suggests there might be a strong tendency to reduce superheavy syllables to the length of two moras in speech at a normal conversational speed, saying that tooQta is often indistinguishable from toQta.[288] Vance (2008) again affirms the existence of a tendency to shorten superheavy syllables in speech at a conversational tempo (specifically, to replace VRQ with VQ, VRN with VN, and VNQ with VN), but stipulates that the distinctions between 通った, tootta and 取った, totta; シーン, shiin and , shin; and コンテ, konte, 'script' and 紺って, kontte, 'navy blue-QUOTATIVE' are clearly audible in careful pronunciation.[289] Ito and Mester explicitly deny that there is a general tendency to shorten the long vowel of forms such as tootte in most styles of speech.[285][290] Ohta (1991) accepts superheavy syllables ending in /RQ/ and /JQ/ but describes /NQ/ as hardly possible, stating that he and the majority of the informants he consulted judged examples such as /roNdoNQko/ to be questionably well-formed in comparison to /roNdoNko/.[291]

It has also been argued that in some cases, an apparent superheavy syllable might actually be a sequence of a light syllable followed by a heavy syllable.

Kubozono (2015c) argues that /VVN/ sequences are generally syllabified as /V.VN/, citing forms where pitch accent is placed on the second vowel such as スペイン風邪, supeiꜜnkaze, 'Spanish influenza', リンカーン杯, rinkaaꜜnhai, 'Lincoln Cup', グリーン車, guriiꜜnsha, 'Green Car' (first-class car of a train) (syllabified per Kubozono as su.pe.in.ka.ze, rin.ka.an.hai, gu.ri.in.sha).[292][293] Ito & Mester (2018) state that compounds formed from words of this shape often exhibit variable accentuation, citing guriꜜinsha~guriiꜜnsha, Uターン率, yuutaaꜜnritsu~yuutaꜜanritsu, 'U-turn percentage', and マクリーン館, makuriiꜜnkan ~ makuriꜜinkan, 'McLean Building'.[294]

Ito & Mester (2015b) note that the pitch-based criterion for syllabifying VV sequences would suggest that Sendaiꜜkko is syllabified as Sen.da.ik.ko;[287] likewise, Ohta (1991) reports a suggestion by Shin’ichi Tanaka (per personal communication) that the accentuation tookyooꜜkko implies the syllable division -kyo.oQ-, although Ohta favors the analysis with a superheavy syllable based on intuitition that this word contains a long vowel and not a sequence of two separate vowels.[295] Ito and Mester ultimately question whether the placement of pitch accent on the second mora really rules out analyzing a three-mora sequence as a single superheavy syllable.

The word rondonkko has a pronunciation where the pitch accent is placed on /N/:[295][287] /roNdoNꜜQko/. Vance (2008) interprets /NꜜQ/ here as its own syllable, separate from the preceding vowel, while stating that a variant pronunciation /roNdoꜜNQko/, with a superheavy syllable /doꜜNQ/, also exists.[251] Ito and Mester consider the syllabification ron.do.nk.ko implausible,[287] and propose that pitch accent, rather than always falling on the first mora of a syllable, may fall on the penultimate mora when a syllable is superheavy.[296] Per Kubozono (2015c), the superheavy syllable in toꜜotta bears accent on its first mora.[297]

Evidence for the avoidance of superheavy syllables includes the adaptation of foreign long vowels or diphthongs to Japanese short vowels before /N/ in loanwords such as the following:

English: foundationJapanese: ファンデーション, romanizedfandēshon
English: stainlessJapanese: ステンレス, romanizedsutenresu
English: corned beefJapanese: コンビーフ, romanizedkonbīfu[298]

There are exceptions to this shortening: /ai/ seems to never be affected, and /au/, although often replaced with /a/ in this context, can be kept, as in the following words:[299]

English: soundJapanese: サウンド, romanizedsaundo
English: mountainJapanese: マウンテン, romanizedmaunten[300]

Vowelless syllables

Some analyses recognize vowelless syllables in restricted contexts.

Phonotactics

Within a mora

Palatals

A Japanese syllable can start with the palatal glide /j/ or with a consonant followed by /j/. These onsets normally can be found only before the back vowels /a o u/.[108]

Before /i/, /j/ never occurs.[108] All consonants are phonetically palatalized before /i/, but do not contrast in this position with unpalatalized consonants: as a result, palatalization in this context can be analyzed as allophonic. In native Japanese vocabulary, coronal obstruent phones (i.e. [t s d (d)z]) do not occur before /i/, and in contexts where a morphological process such as verb inflection would place a coronal obstruent phoneme before /i/, the coronal is replaced with an alveolo-palatal sibilant, resulting in alternations such as [matanai] 'wait' (negative) vs. [matɕimasɯ] 'wait' (polite) or [kasanai] 'lend' (negative) vs. [kaɕimasɯ] 'lend' (polite).[137] Thus, [tɕ ɕ (d)ʑ] function in native vocabulary as the palatalized counterparts of coronal consonant phonemes. However, the analysis of alveolo-palatal sibilants as palatalized allophones of coronal consonants is complicated by loanwords. The sequences [ti di] are distinguished from [tɕi (d)ʑi] in recent loanwords (with [ti] generally preserved in words borrowed more recently than 1930[304]) and to a lesser extent, some speakers may exhibit a contrast in loanwords between [tsi (d)zi si] and [tɕi (d)ʑi ɕi].

Before /e/, [j] was lost in the current standard language, but some dialects (such as Kyushu) and pre-modern versions of the language contain [je], as well as exhibiting [ɕe] in place of modern standard [se].[109] As discussed above, the sequences [tɕe (d)ʑe ɕe] do not occur in standard Japanese outside of foreign loanwords and a few marginal exclamations. There are no morphological alternations motivated by this gap,[305] since no morphemes have an underlying form ending in [tɕ (d)ʑ ɕ]. In borrowed words, [tɕe] has been used consistently at all time periods (the use of [se] in セロ sero from cello seems to be a unique exception).[306][143] Another rare exception, showing adaptation to [tɕi] (vowel raising), is チッキ (chikki) from English check (less common than チェック (chekku)).[307] The sequences [(d)ʑe] and [ɕe] tend to be found in words borrowed more recently than around 1950, whereas words borrowed before that point may show depalatalization to [(d)ze] and [se] respectively,[307] as seen in the 19th-century borrowed forms ゼリー (zerī) from English jelly, ゼントルマン (zentoruman) from English gentleman,[308] and セパード (sepādo) from English shepherd.[309]

The use of [je] in loanwords is inconsistent: adapted pronunciations with [ie] (イエ), such as イエローカード ierōkādo from English yellow card,[310][311] continue to be used even for recent borrowings. In theory, pronunciations with [je] can be represented by the spelling イェ (mostly used to transcribe proper nouns), although it's not clear that the use of the spelling イェ necessarily corresponds to how speakers phonetically realize the sequence.[310] Foreign [je] may also be adapted as /e/ in some cases.[143] For some speakers, the optional, colloquial coalescence of certain other vowel sequences to [eː] can produce [jeː] in native forms, such as [hajeː] (a variant pronunciation of /hajai/ 'fast').[312]

The sequences [ɸʲɯ dʲɯ tʲɯ] occur only in recent loans, such as フュージョン (fyūjon), デュエット (dyuetto), テューバ (tyūba) from fusion, duet, tuba: they can be interpreted as /fju dju tju/ in analyses where [tɕ] is not interpreted as /tj/.[313]

Pre-/u/ consonants

Several Japanese consonants developed special phonetic values before /u/. Though originally allophonic, some of these variants have arguably attained phonemic status because of later neutralizations or the introduction of novel contrasts in loanwords.

In core vocabulary, [ɸɯ] can be analyzed as an allophonic realization of /hu/.[101] However, in words of foreign origin, the voiceless bilabial fricative [ɸ] can occur before vowels other than /u/. This introduces a distinctive contrast between [ɸa ɸe ɸi ɸo] and [ha he çi ho]; therefore, Vance (2008) recognizes [ɸ] as a distinct consonant phoneme /f/, and interprets [ɸɯ] as phonemically /fu/, leaving */hu/ as a gap.[314] In contrast, Watanabe (2009) prefers the analysis /hu/ and argues that /h/ in this context is distinct phonemically and sometimes phonetically from the /f/ [ɸ] found in foreign /fa fe fi fo/[315] (which would leave */fu/ as a gap). In any case, /h/ and /f/ do not contrast before /u/.

Outside of loanwords, [tɯ] and [dɯ] do not occur, because /t d/ were affricated to [ts dz] before /u/.[316]

In dialects that show neutralization of the [dz z] contrast, the merged phone [(d)z] can occur before /a, e, o/ as well as before /u/. Thus, for these dialects, [(d)zɯ] can be phonemically analyzed as /zu/, leaving /du/ as a gap.[317]

In core vocabulary, the voiceless coronal affricate [ts] occurs only before the vowel /u/; thus [tsɯ] can be analyzed as an allophonic realization of /tu/.[101] Verb inflection shows alternations between [t] and [ts], as in [katanai] 'win' (negative) and [katsɯ] 'win' (present tense).[101] However, the interpretation of [tsɯ] as /tu/ (with [ts] merely an allophone of /t/) is complicated by the occurrence of [ts] before vowels other than /u/ in loanwords.[102]

In addition, unaffricated [tɯ dɯ] are sometimes used in recent loanwords. They can be represented in kana by トゥ and ドゥ, which received official recognition by a cabinet notice in 1991 as an alternative to the use of [tsɯ] [(d)zɯ] or [to] [do] to adapt foreign [tu] [du].[318] Forms where [tɯ] and [dɯ] can be found include the following:

English: Today[tɯdei]
French: toujours [tuʒuʀ][tɯ(d)ʑɯːɾɯ]
French: douze [duz][dɯːzɯ][319]

Older loanwords from French display adaptation of [tɯ] as [tsɯ] and of [dɯ] as [do]:

French: Toulouse [tuluz][tsɯːɾɯːzɯ]
French: Pompidou [pɔ̃pidu][pompidoː][320]

Vance (2008) argues that [tɯ] and [dɯ] remain "foreignisms" in Japanese phonology;[321] they are less frequent than [ti di],[322] and this has been interpreted as evidence that a constraint against *[tɯ] remained active in Japanese phonology for longer than the constraint against *[ti].[323]

In both old and recent loanwords, the epenthetic vowel used after word-final or pre-consonantal /t/ or /d/ is normally /o/ rather than /u/ (there is also some use of [tsɯ] and [(d)zɯ][324]). However, adapted forms show some fluctuation between [to do] and [tɯ dɯ] in this context, e.g. French estrade [estʀad] 'stage', in addition to being adapted as /esutoraddo/, has a variant adaptation /esuturaddu/.[319]

Between moras

Special moras

If analyzed as phonemes, the moraic consonants /N/ and /Q/ show a number of phonotactic restrictions (although some constraints can be violated in certain contexts, or may apply only within certain layers of Japanese vocabulary).

/N/

In general, the moraic nasal /N/ can occur between a vowel and a consonant, between vowels (where it contrasts with non-moraic nasal onsets), or at the end of a word.

In Sino-Japanese vocabulary, /N/ can occur as the second and final mora of a Sino-Japanese morpheme.[325] It may be followed by any other consonant or vowel. However, in some contexts Sino-Japanese morpheme-final /N/ may cause changes to the start of a closely connected following morpheme:

Although usually not found at the start of a word, initial /N/ can occur in some colloquial speech forms as a result of dropping of a preceding mora.[331] In this context, its pronunciation is invariably assimilated to the place of articulation of the following consonant:

/naN bjaku neN//N bjaku neN/ [mbjakɯneɴ] 'several hundred years'
/soNna koto//Nna koto/ [nnakoto] 'such thing'[332]

Initial /N/ may also be used in some loanword forms:

[n.dʑa.me.na]~[ɴ.dʑa.me.na] 'N'Djamena (proper noun)'[332]

(This place name has an alternative pronunciation with an epenthetic /u/ inserted before the /N/.[333])

/Q/

The moraic obstruent /Q/ generally occurs only between a vowel and a consonant in the middle of a word. However, word-initial geminates may occur in casual speech as the result of elision:

/mattaku/ ('entirely; totally', an expression of exasperation) → [ttakɯ]
/usseena/ ('shut up') → [sseena][334]

In native Japanese vocabulary, /Q/ is found only before /p t k s/[86] (this includes [ts], [tɕ] and [ɕ], which can be viewed as allophones of /t/ and /s/); in other words, before voiceless obstruents other than /h/. The same generally applies to Sino-Japanese vocabulary. In these layers of vocabulary, [pp] functions as the geminate counterpart of /h/, due to the historical development of Japanese /h/ from Old Japanese [p].[335]

Tamaoka & Makioka (2004) found that in a Japanese newspaper corpus, /Q/ was followed over 98% of the time by one of /p t k s/: however, there were also at least some cases where it was followed by /h b d ɡ z r/.[336]

Geminate /h/ is found only in recent loanwords (e.g. ゴッホ, Gohho, '(van) Gogh', バッハ, Bahha, 'Bach'), and rarely in Sino-Japanese or mixed compounds (e.g. 十針, juhhari, 'ten stitches', 絶不調, zeffuchō, 'terrible slump').[337][338]

Voiced obstruents (/b d ɡ z/) do not occur as geminates in Yamato or Sino-Japanese words.[339] The avoidance of geminated voiced obstruents can be seen in certain morphophonological processes that produce voiceless but not voiced geminate obstruents: e.g. Yamato 突っ立つ, tsuttatsu vs. 突ん出す, tsundasu (not *tsuddasu)[340] and Sino-Japanese 発達, hattatsu vs. 発電, hatsuden[341] (not *hadden).

However, voiced geminate obstruents have been used in words adapted from foreign languages since the 19th century.[342] These loanwords can even come from languages, such as English, that do not feature gemination in the first place. For example, when an English word features a coda consonant preceded by a lax vowel, it can be borrowed into Japanese with a geminate; gemination may also appear as a result of borrowing via written materials, where a word spelled with doubled letters leads to a geminated pronunciation.[343] Because these loanwords can feature voiced geminates, Japanese now exhibits a voice distinction with geminates where it formerly did not:[344]

スラッガー, suraggā ('slugger') vs. surakkā ('slacker')
キッド, kiddo ('kid') vs. kitto ('kit')

The most frequent geminated voiced obstruent is /Qd/, followed by /Qɡ/, /Qz/, /Qb/.[336] In borrowed words, /d/ is the only voiced stop that is regularly adapted as a geminate when it occurs in word-final position after a lax/short vowel; gemination of /b/ and /ɡ/ in this context is sporadic.[345]

Phonetically, voiced geminate obstruents in Japanese tend to have a 'semi-devoiced' pronunciation where phonetic voicing stops partway through the closure of the consonant.[346] High vowels are not devoiced after phonemically voiced geminates.[346]

In some cases, voiced geminate obstruents can optionally be replaced with the corresponding voiceless geminate phonemes:[347][348]

バッド, baddoバット, batto, 'bad'[347]
ドッグ, dogguドック, dokku, 'dog'[347]
ベッド, beddoベット, betto, 'bed'[348]

Phonemic devoicing like this (which may be marked in spelling) has been argued to be conditioned by the presence of another voiced obstruent.[349][350] Another example is doreddo ~ doretto 'dreadlocks'. Kawahara (2006) attributes this to a less reliable distinction between voiced and voiceless geminates compared to the same distinction in non-geminated consonants, noting that speakers may have difficulty distinguishing them due to the partial devoicing of voiced geminates and their resistance to the weakening process mentioned above, both of which can make them sound like voiceless geminates.[351]

A small number of foreign proper names have katakana spellings that would imply a pronunciation with /Qr/, such as アッラー, arrā, 'Allah' and チェッリーニ, Cherrīni, 'Cellini'.[352] The phonetic realization of /Qr/ in such forms varies between a lengthened sonorant sound and a sequence of a glottal stop followed by a sonorant.[353]

Aside from loanwords, consonants that cannot normally occur after /Q/ may be geminated in certain emphatic variants of native words.[354] Reduplicative mimetics may be used in an intensified form where the second consonant of the first portion is geminated, and this can affect consonants that otherwise do not occur as geminates, such as /r/ (as in barra-bara, 'in disorder', borro-boro, 'worn out', gurra-gura, 'shaky', karra-kara, 'dry', perra-pera, 'thin') or /j/ (as in buyyo-buyo, 'flabby').[355] Adjectives may take an emphatic pronunciation where the second consonant is geminated and the following vowel is lengthened, as in naggaai < nagai, 'long', karraai < karai, 'hot', kowwaai < kowai, 'dreadful'.[355] Similarly, per Vance (2008), /Qj/ and /Qm/ can occur in emphatic pronunciations of 速い, hayai, 'fast' and 寒い, samui, 'cold' as [haʔːjai] and [saʔːmɯi].[356] A 2020 study of geminate production in mimetic forms found that emphatically lengthened /r/ could be pronounced either as a lengthened sonorant with uninterrupted voicing, or with some amount of laryngealization such as glottal stop insertion.[357] Another noteworthy characteristic of emphatically lengthened consonants is the potential for a greater than two-way distinction in length.[358][354]

Atypical /Q/ + consonant sequences may also arise in truncated word forms (created by blending some moras from each word in a longer phrase) and in forms produced as the outcome of word games:[353]

カットモデル, katto moderu, 'cut model' /kaQto moderu/kadderu /kaQderu/ (blend)[353]
バット, batto, 'bat' /baQto/tobba /toQba/ (form produced in a reversing language game)[353]

However, there are also reversed argot forms that show replacement of /Q/ with [tsɯ] (likely by influence from its spelling with a small tsu kana) in contexts where /Q/ would be atypical: e.g. rappa 'trumpet' /raQpa/patsura; wappa 'brat' /waQpa/patsuwa; yakko 'guy' /jaQko/kotsuya; batto 'bat' /baQto/totsuba.[359]

Vowel sequences and long vowels

Vowel sequences with no intervening consonant (VV sequences) occur in many contexts:

When the first of two vowels in a VV sequence is higher than the second, there is often not a clear distinction between a pronunciation with hiatus and a pronunciation where a glide with the same frontness as the first vowel is inserted before the second: i.e., the VV sequences /ia io ua ea oa/ may sound like /ija ijo uwa eja owa/.[364] For example, English gear has been borrowed into Japanese as ギア, gia, 'gear', but an alternative form of this word is ギヤ, giya.[365] Per Kawahara (2003), the sequences /eo eu/ are not pronounced like *[ejo ejɯ]. The sequence /iu/ is not pronounced like *[ijɯ], but it is sometimes replaced with [jɯː]:[364] this change is optional in loanwords.[366] Kawahara states that the formation of a glide between /ia io ua ea oa/ may be blocked by a syntactic boundary or by some (though not all) morpheme boundaries (Kawahara suggests that apparent cases of glide formation across morpheme boundaries are best interpreted as evidence that the boundary is no longer transparent).[364]

Many long vowels historically developed from vowel sequences by coalescence, such as /au ou eu iu/ > [oː joː jɯː]. In addition, some vowel sequences in contemporary Japanese may optionally undergo coalescence to a long vowel in colloquial or casual speech (for some sequences, such as /oi/ and /ui/, coalescence is not possible in all contexts, but only in adjective forms).[367] The monophthongization of /ai/, /ae/ or /oi/ to [eː] or [ɛː] is a feature of colloquial male speech.[368]

Within words and phrases, Japanese allows long sequences of phonetic vowels without intervening consonants.[370] Sequences of two vowels within a single word are extremely common, occurring at the end of many i-type adjectives, for example, and having three or more vowels in sequence within a word also occurs, as in あおい, aoi, 'blue/green'. In phrases, sequences with multiple o sounds are most common, due to the direct object particle , o (which comes after a word) being realized as o and the honorific prefix お〜, o, which can occur in sequence, and may follow a word itself terminating in an o sound; these may be dropped in rapid speech. A fairly common construction exhibiting these is 「〜をお送りします」, o o-okuri-shimasu, '...humbly send...'. More extreme examples follow:

Distribution of consonant phonemes based on word position

In Yamato vocabulary, certain consonant phonemes, such as /p/, /h/, /r/ and voiced obstruents, tend to be found only in certain positions in a word.[371] None of these restrictions applies to foreign vocabulary; some do not apply to mimetic or Sino-Japanese vocabulary; and certain generalizations have exceptions even within Yamato vocabulary; nevertheless, some linguists interpret them as still playing a role in Japanese phonology, based on the model of a "stratified" lexicon where some active phonological constraints affect only certain layers of the vocabulary. The gaps in the distribution of these consonant phonemes can also be explained in terms of diachronic sound changes.

The voiced obstruents /b d ɡ z/ occur without restriction at the start of Sino-Japanese and foreign morphemes,[372] but usually do not occur at the start of Yamato words.[373][374] However, suffixes or postposed particles starting with these sounds have been in use since Old Japanese, such as the case particle ga,[375] and morphemes that underlyingly start with a voiceless obstruent often have allomorphs that start with a voiced obstruent in the context of rendaku. In addition, word-initial /b d ɡ z/ occur frequently in the mimetic stratum of native Japanese vocabulary, where they often function as sound-symbolic variants of their voiceless counterparts /p h t k s/.[376] Furthermore, some non-mimetic Yamato words start with voiced obstruents. In some cases, voicing seems to have had an expressive function, adding a negative or pejorative shade to a root.[377][378] Initial voiced obstruents have also arisen in some Yamato words as the result of phonetic developments, such as loss of original word-initial high vowels or alteration of words that originally started with nasal consonants.[379] Diachronically, the scarcity of word-initial voiced obstruents in native Japanese words seems to be a consequence of their origin from Proto-Japonic sequences involving a nasal phoneme followed by an obstruent phoneme, which developed to prenasalized consonants in Old Japanese.[380]

Yamato and mimetic words almost never start with /r/.[381] In contrast, word-initial /r/ occurs without restriction in Sino-Japanese and foreign vocabulary.[382]

In Yamato words, /p/ occurs only as a word-medial geminate (or equivalently, only after /Q/) as in 河童, kappa. In Sino-Japanese words, /p/ occurs only after /Q/ or /N/ (as in 切腹, seppuku, 北方, hoppō, 音符, onpu), alternating with /h/ in other positions. In contrast, mimetic words can contain singleton /p/, either word-initially or word-medially.[383] Singleton /p/ also occurs freely in foreign words,[384] such as パオズ, paozu, ペテン, peten, パーティー, pātī. The gap in the distribution of singleton [p] results from the fact that original *p developed in Japanese to [ɸ] at the start of a word and to /w/ between vowels, resulting in [p] being retained only as part of the geminate [pː] or after /N/.[385] (The labial fricative [ɸ] could be found before all vowels up through Late Middle Japanese, but was eventually debuccalized to [h] before any vowel other than /u/, resulting in the modern Japanese /h/ phoneme. The glide /w/ was eventually lost before any vowel other than /a/.) The few non-mimetic words where /p/ occurs initially include 風太郎, pūtarō, although as a personal name it is still pronounced Fūtarō.

The phoneme /h/ is rarely found in the middle of a Yamato morpheme (a small number of exceptions exist, such as afureru, 'overflow', ahiru, 'duck', yahari, 'likewise') or in the middle of a mimetic root (examples are mostly confined to mimetics that imitate "gutteral" or "laryngeal" sounds, such as goho-goho, 'coughing' and ahaha, 'laughing').[381] In Yamato words, this gap results from the aforementioned change of original *p to /w/, rather than /h/, in intervocalic position.[386] In mimetic words, intervocalic /w/ is also uncommon: therefore, Hamano (2000) proposes that the usual outcome of original *p in this context was /b/, which seems to be disproportionately common as the second consonant of a mimetic root.[387] Likewise, /h/ never occurs in the middle of a Sino-Japanese morpheme.[388]

Epenthetic vowels

Words of foreign origin are systematically adapted to Japanese phonotactics by inserting an epenthetic vowel (usually /u/) after a word-final consonant or between adjacent consonants. While /u/ is inserted after the majority of consonants, it is usual to use /o/ after [t, d] and /i/ after [tʃ, dʒ] (but usually not after [ʃ]). After /hh/ (used to adapt foreign word-final [x]) the epenthetic vowel is often /a/ or /o/, echoing the quality of the vowel before the consonant. There are some deviations from the aforementioned patterns: for example, some older borrowings such as ケーキ, kēki, 'cake' use /i/ after [k].[389] The use of epenthetic vowels in these contexts is an established convention when using kana to transcribe foreign words or names.

Historically, Sino-Japanese morphemes developed epenthetic vowels after most syllable-final consonants. This is usually /u/, in some cases /i/: the identity of the epenthetic vowel is largely, although not completely, predictable from the preceding consonant and vowel.[390] It is debated whether these vowels should be regarded as having epenthetic status in the phonology of modern Japanese.[391] The use of epenthetic vowels in Sino-Japanese forms has undergone some changes over time: for example, the descriptions of Portuguese missionaries indicate that in previous stages of the language, Sino-Japanese morphemes could end in coda [t] with no epenthetic vowel.[392]

Morphophonology

Japanese morphology is generally agglutinative rather than fusional. Nevertheless, Japanese exhibits a number of morphophonological processes that can change the shape of morphemes when they are combined in compounds, derived words, or inflected forms of verbs or adjectives. Various forms of sandhi exist; the Japanese term for sandhi generally is ren'on (連音).

Rendaku

In Japanese, sandhi is prominently exhibited in rendakuconsonant mutation of the initial consonant of a morpheme from unvoiced to voiced in some contexts when it occurs in the middle of a word. This phonetic difference is marked in the kana spelling of a word via the addition of dakuten, as in ka, ga (か/が). In cases where this combines with the yotsugana mergers, notably ji (じ/ぢ) and zu (ず/づ) in standard Japanese, the resulting spelling is morphophonemic rather than purely phonemic.

Yamato gemination or prenasalization

Certain processes, such as onbin sound changes, have acted to produce voiceless geminates in Yamato words (often across morpheme boundaries, but sometimes even within a morpheme). Gemination can arise as the result of emphasis, compounding, or verb conjugation. In this context, sequences of a moraic nasal /N/ and a voiced consonant are found in place of voiced geminate obstruents, which do not occur in native Standard Japanese words (other than marginally as emphatically lengthened variants of single voiced obstruents).

For example, adverbs built from a mimetic root and the suffix -ri may display root-internal gemination,[393] as in nikkori (alongside nikori) from niko 'smiling'. Adverbs derived from roots with voiced medial consonants exhibit forms with a moraic nasal in place of gemination, such as shonbori from shobo 'lonely', unzari from uza 'bored, disappointed', bon'yari from boya 'vague', and funwari from fuwa 'light' (/r/ does not undergo either gemination or /N/-insertion in this context).[394] Likewise, a moraic consonant often occurs between the emphatic prefix /ma/ and a following consonant: its allomorphs /maQ/ and /maN/ are in complementary distribution, with /maQ/ used before voiceless consonants and /maN/ used elsewhere.[395]

Another example where either a voiceless geminate or /N/ is formed depending on the voicing of the following consonant is the derivation of reduced, i.e. contracted, compound verbs. Japanese has a type of compound verb formed by placing the stem of one verb before another. If the first verb has a stem that ends in a consonant, the vowel /i/ is usually placed between the first and second verb stem. But in some compounds, this vowel can be omitted, resulting in the final consonant of the first verb stem being placed directly before the initial consonant of the second verb stem.[396] When this happens, the first consonant assimilates to the second, producing a voiceless geminate if the second is voiceless, and a sequence starting with /N/ if the second is a voiced obstruent or nasal (e.g. hik- 'pull' + tate- 'stand' > hikitateru~hittateru 'support', tsuk- 'stab' + das- 'put out' > tsukidasu~tsundasu 'thrust out'[397]).[398]

In verb conjugation, the voiceless geminate /Qt/ is produced when a verb root that underlyingly ends in /r/, /t/, or /w/ is followed by a suffix starting with /t/ (namely, -te, -ta, -tari, -tara, -tatte[399]), whereas /Nd/ is produced when a verb root that underlyingly ends in /m/, /n/, or /b/ is followed by a suffix starting with /t/.[400] (At the end of a verb stem, /w/ descends from original *p; some generative analyses interpret this as the synchronic underlying form of the consonant.[401])

Sino-Japanese gemination

When the second mora of a Sino-Japanese morpheme is , tsu, , ku, , chi or , ki and it is followed by a voiceless consonant, this mora is sometimes replaced by the sokuon (whose spelling as a small is based on the frequent alternation of these sounds in this context), forming a geminate consonant:

Sino-Japanese morphemes ending in these moras remain unchanged when followed by a voiced consonant, and are usually unchanged when followed by a vowel (but see renjō for exceptional examples of geminate formation before a vowel).

Gemination can also affect Sino-Japanese morphemes that historically ended in , fu and that now end in long vowels:

Most morphemes exhibiting this change derive from Middle Chinese morphemes ending in /t̚/, /k̚/ or /p̚/, which developed a prop vowel after them when pronounced in isolation (e.g., MC */nit̚/ > Japanese /niti/ [ɲitɕi]) but were assimilated to the following consonant in compounds (e.g. 日本 MC */nit̚.pu̯ən/ > Japanese /niQ.poN/ [ɲip̚.poɴ]).

Gemination occurs regularly in words consisting of two Sino-Japanese morphemes, but tends not to occur across the major boundary of a complex compound (where one of the components is formed of more than one Sino-Japanese morpheme). However, there are some cases of gemination in this context.[403]

The formation of a geminate also depends on the identity of the first and second consonant:

Renjō

Sandhi also occurs much less often in renjō (連声), where, most commonly, a terminal /N/ or /Q/ on one morpheme results in /n/ (or /m/ when derived from historical m) or /t̚/ respectively being added to the start of a following morpheme beginning with a vowel or semivowel, as in ten + ō → tennō (天皇: てん + おう → てんのう). Examples:

First syllable ending with /N/
First syllable ending with /N/ from original /m/
First syllable ending with /Q/

Vowel fusion

1. usually not reflected in spelling

During Late Middle Japanese, multiple vowel changes took place. Notably, the vowel /u/ tended to fuse with another vowel that preceded it, creating a long vowel. These vowel fusions are not reflected in historical kana usage, particularly that for classical Japanese.

These historical changes are still germane to modern grammatical analysis and education. For example, the "tentative" auxiliary u () (historically mu ()) notably fused with the last vowel of a mizenkei (未然形)[408][409] (see Japanese conjugation#Verb bases):

Thus, while the mizenkei is listed in inflection tables, a combination of it and the auxiliary u, dubbed ishikei (意志形), must still be learnt separately. Furthermore, results of the above fusions caused some mizenkei to disappear entirely. Dictionaries and grammar guides no longer list たら, だら, でせ and なから as, respectively, the mizenkei of た, だ, です and ない. Instead, たろ, だろ, でしょ and なかろ are perfunctorily used.[408][409] This perfunctory listing may also extend to godan verbs as well, for example 書く may have "two" mizenkei, 書か and 書こ, so that it has enough vowels to justify the term godan (see Japanese godan and ichidan verbs#Godan vs yodan).

Onbin

Another prominent feature is onbin (音便, euphonic sound change). This refers to various historical sound changes that can be loosely described as showing reduction, lenition or coalescence. Alternations resulting from onbin continue to be seen in some areas of Japanese morphology, such as the conjugation of certain verb forms or the form of certain compound verbs.

In some cases, onbin changes occurred within a morpheme, as in hōki (箒 (ほうき), broom), which underwent two sound changes from earlier hahaki (ははき)hauki (はうき) (onbin) → houki (ほうき) (historical vowel change) → hōki (ほうき) (long vowel, sound change not reflected in kana spelling).

One type of onbin caused certain onset consonants to be deleted, mainly before /i/ or /u/,[410] which created vowel sequences, or long vowels by coalescence of /u/ with the preceding vowel.

Another type of onbin resulted in the development of moraic consonants /Q/ or /N/ in certain circumstances in native Japanese words.

Types

Types of onbin are named after their resulting mora. If the resulting mora is /i/, the onbin is called i-onbin (イ音便); if /u/, u-onbin (ウ音便); if /Q/ (促音, sokuon), sokuonbin (促音便); and if /N/ (撥音, hatsuon), hatsuonbin (撥音便).[408]

Historically, sokuonbin was triggered in verb conjugation when any of the morae /ti, ɾi, si, pi/ in a ren'yōkei (連体形) (see Japanese conjugation#Verb bases) was followed by the consonant /t/ (for example in the auxiliary ta () or the particle te ()). In such an environment, the high vowel /i/ was reduced, and the remaining consonant eventually assimilated with /t/:[409]

Grammatical sokuonbin is found predominantly in eastern dialects (including the standard Tokyo dialect taught to foreigners), while western ones (including the Kansai dialect) favor u-onbin triggered by the historical mora /pi/:[409]

On the other hand, hatsuonbin was triggered when any of the morae /mi, bi, ni/ in a ren'yōkei was followed by the consonant /t/. Similar vowel reduction and consonant assimilation occurred:[409]

In general, onbin can occur in the following historical environments:[408][409][411][412][413]

Polite adjective forms

The polite adjective forms (used before the polite copula gozaru (ござる, be) and verb zonjiru (存じる, think, know)) exhibit a one-step or two-step sound change. Firstly, these use the continuative form, -ku (-く), which exhibits onbin, dropping the k as -ku (-く)-u (-う). Secondly, the vowel may combine with the preceding vowel, according to historical sound changes; if the resulting new sound is palatalized, meaning yu, yo (ゆ、よ), this combines with the preceding consonant, yielding a palatalized syllable.

This is most prominent in certain everyday terms that derive from an i-adjective ending in -ai changing to (-ou), which is because these terms are abbreviations of polite phrases ending in gozaimasu, sometimes with a polite o- prefix. The terms are also used in their full form, with notable examples being:

Other forms like this are found in polite speech, such as oishiku (美味しく)oishū (美味しゅう) and ōkiku (大きく)ōkyū (大きゅう).

See also

Notes

  1. ^ Labrune (2012) considers /N/ to be a "special segment", neither a consonant nor a vowel, and analyzes it as a deficient prosodeme specified only for [+consonantal] and [+nasal].[73] Trigo Ferré (1988) analyzes it as a placeless non-consonantal nasal glide.[74] Youngberg (2021a) analyzes Tokyo Japanese as possessing underlying long nasal vowels, e.g. /kẽːka/, and explains the nasal consonant in the surface phonetic form as a non-phonemic transition.[75]
  2. ^ In contexts requiring specialized linguistic transcription of the [ŋ] sound, such as pronunciation dictionaries, the handakuten diacritic can be added to k-series kana to represent [ŋ]: thus か゚, き゚, く゚, け゚, こ゚ can be used to represent [ŋa, ŋi, ŋɯ, ŋe, ŋo] as opposed to [ɡa, ɡi, ɡɯ, ɡe, ɡo]. However, in ordinary writing か゚, き゚, く゚, け゚, こ゚ are not used, and が, ぎ, ぐ, げ, ご can represent either.
  3. ^ Moras are represented orthographically in katakana and hiragana – each mora, with the exception of CjV clusters, being one kana – and are referred to in Japanese as on.
  4. ^ Also notated /H/, following the conventional usage of h for lengthened vowels in romanization.
  5. ^ In content, all examples are taken from Poser (1990:82–89); however, the original phonemic transcriptions have been altered and mora boundaries and romanizations have been added.
  6. ^ Compare iku (行く, "to go") below which undergoes sokuonbin.
  7. ^ Compare yuku (行く, "to go") above which undergoes i-onbin. Early Christian (キリシタン, Kirishitan) writings recorded the i-onbin form /iite/ as well.

References

  1. ^ a b Itō & Mester (1995), p. 817.
  2. ^ Itō & Mester (1995), p. 819.
  3. ^ a b Nasu (2015), p. 253.
  4. ^ a b Labrune (2012), p. 13.
  5. ^ Labrune (2012), pp. 13–14.
  6. ^ Ito & Mester (2015a), pp. 289–290.
  7. ^ Starr & Shih (2017), p. 11.
  8. ^ Labrune (2012), pp. 13, 20.
  9. ^ Nasu (2015), p. 255.
  10. ^ Labrune (2012), pp. 96–98.
  11. ^ Vance (2008), pp. 225–226.
  12. ^ Smith (1980), §3.1.
  13. ^ a b c Okada (1999), p. 117.
  14. ^ Vance (2008), pp. 74–114.
  15. ^ Labrune (2012), p. 59.
  16. ^ Smith (1980), §2.3.2.1, 3.1.
  17. ^ Nasukawa (2015).
  18. ^ Vance (2008), pp. 75–76, 87.
  19. ^ Kochetov (2014), p. 65.
  20. ^ Kochetov (2018), p. 88.
  21. ^ Vance (2008), pp. 78, 82, 84.
  22. ^ Akamatsu (1997), pp. 93, 95, 98.
  23. ^ Akamatsu (1997), pp. 101–103.
  24. ^ Vance (2008), pp. 82–84.
  25. ^ a b Vance (2008), pp. 87–88.
  26. ^ a b c d e f g h i j k l m Okada (1999), p. 118.
  27. ^ Recasens (2013), p. 11.
  28. ^ Maekawa (2020).
  29. ^ a b Vance (2008), p. 81.
  30. ^ a b c d e Labrune (2012), p. 92.
  31. ^ a b Vance (2008), p. 89.
  32. ^ a b c d Akamatsu (1997), p. 106.
  33. ^ Akamatsu (1997) employs a different symbol, [l̆], for the lateral tap.
  34. ^ Arai, Warner & Greenberg (2007), p. 48.
  35. ^ a b Gao & Arai (2019), p. 16.
  36. ^ Riney et al. (2007).
  37. ^ Homma (1981:276–277), also Homma (1980) as cited by Vance (2008:75).
  38. ^ Gao & Arai (2019), p. 19.
  39. ^ Gao & Arai (2019), pp. 22–25.
  40. ^ Gao & Arai (2019), pp. 12, 32.
  41. ^ Vance (2008), pp. 76–78.
  42. ^ Kitagawa & Albin (2023), pp. 5, 7, 19, 23.
  43. ^ Maekawa (2018), pp. 25, 29–32.
  44. ^ Maekawa (2018), pp. 25–29, 33–34.
  45. ^ Maekawa (2018), pp. 24, 27, 33.
  46. ^ Labrune (2012), pp. 132–135.
  47. ^ Labrune (2012), pp. 59, 133, 135.
  48. ^ a b c Kubozono (2015a), p. 34.
  49. ^ Akamatsu (1997), p. 332.
  50. ^ Akamatsu (1997), pp. 153, 331–332.
  51. ^ Vance (2008), pp. 96–101, 240.
  52. ^ Vance (1987), p. 39.
  53. ^ Vance (2008), p. 102.
  54. ^ Vance (2008), p. 103.
  55. ^ a b c Vance (2008), p. 96.
  56. ^ Vance (2008), pp. 101–102.
  57. ^ Vance (2008), pp. 96, 99.
  58. ^ a b c Labrune (2012), pp. 133–134.
  59. ^ Vance (2008), pp. 99–100.
  60. ^ a b c Vance (2008), p. 97.
  61. ^ Vance (2008), pp. 76, 96.
  62. ^ a b Vance (2008), pp. 97, 99.
  63. ^ a b Vance (2008), p. 99.
  64. ^ Akamatsu (1997), pp. 96, 103, 312–313.
  65. ^ Maekawa (2023), p. 209.
  66. ^ a b Shibatani (1990), p. 169.
  67. ^ Saito (2005:94) and National Language Research Institute (1990:514), cited in Maekawa (2023:191–192).
  68. ^ Yamane & Gick (2010).
  69. ^ Hashi et al. (2014).
  70. ^ Nogita & Yamane (2015).
  71. ^ Mizoguchi (2019), p. 65.
  72. ^ Maekawa (2023), pp. 200, 206–207, 209–210.
  73. ^ Labrune (2012), pp. 133, 162.
  74. ^ Trigo Ferré (1988), pp. 44–47.
  75. ^ Youngberg (2021a), pp. 24, 31.
  76. ^ Shibatani (1990), p. 170.
  77. ^ Maekawa (2023), p. 2.
  78. ^ Smith (1980), §3.1.3.1.
  79. ^ Aoyama (2001), p. 17.
  80. ^ Smith (1980), §2.1.1.
  81. ^ Akamatsu (1997), p. 65.
  82. ^ Mizoguchi (2019), p. 2.
  83. ^ Vance (2008), pp. 105–107.
  84. ^ a b c Vance (2008), p. 105.
  85. ^ Labrune (2012), pp. 135–136.
  86. ^ a b Labrune (2012), p. 136.
  87. ^ Vance (2008), pp. 99, 107.
  88. ^ Vance (2008), pp. 106.
  89. ^ Labrune (2012), pp. 132.
  90. ^ Vance (2008), p. 107.
  91. ^ a b Labrune (2012), pp. 135.
  92. ^ Vance (2008), pp. 110–112, 223–225.
  93. ^ Smith (1980), §3.1.3.2.
  94. ^ a b Jeroen van de Weijer; Kensuke Nanjo; Tetsuo Nishihara (2005). Voicing in Japanese. Walter de Gruyter. p. 150. ISBN 978-3-11-019768-6.
  95. ^ Vance (2008), pp. 85–86.
  96. ^ Smith (1980), §3.1.1.
  97. ^ Maekawa (2010), p. 365.
  98. ^ Maekawa (2010), p. 371.
  99. ^ Kitagawa & Albin (2023), p. 29.
  100. ^ Kitagawa & Albin (2023), pp. 16–18.
  101. ^ a b c d e Itō & Mester (1995), p. 825.
  102. ^ a b c d Vance (2008), p. 84.
  103. ^ Labrune (2012), p. 68.
  104. ^ Hattori (1950), p. 102.
  105. ^ Vance (1987), pp. 23, 41.
  106. ^ Hattori (1950), pp. 100–102.
  107. ^ Shibatani (1990), p. 164–165.
  108. ^ a b c Labrune (2012), p. 88.
  109. ^ a b Smith (1980), §3.1.4.2.5.
  110. ^ Vance (1987), pp. 28–29.
  111. ^ Labrune (2012), p. 69.
  112. ^ Vance (2008), pp. 229–232.
  113. ^ Nogita (2016), p. 73.
  114. ^ Labrune (2012), pp. 55–56.
  115. ^ Smith (1980), §2.3.2.1.
  116. ^ Nasukawa (2015), p. 180.
  117. ^ Nogita (2016), pp. 78–79, 83.
  118. ^ a b c d Nogita (2016), p. 75.
  119. ^ Pintér (2015), pp. 135, 148.
  120. ^ Takayama (2015), pp. 632–633.
  121. ^ Takayama (2015), pp. 629, 631.
  122. ^ Pintér (2015), pp. 137–138, 148.
  123. ^ Takayama (2015), pp. 633–634.
  124. ^ Pintér (2015), p. 151.
  125. ^ Irwin (2011), pp. 80–83.
  126. ^ Hall 2013, pp. 11–12.
  127. ^ Pintér (2015), p. 157.
  128. ^ a b Pintér (2015), p. 139.
  129. ^ a b Itō & Mester (1995), p. 828.
  130. ^ Hall (2013), pp. 9, 12.
  131. ^ Irwin (2011), p. 84.
  132. ^ Nogita (2010), p. 8.
  133. ^ Irwin (2011), pp. 165, 181.
  134. ^ "外来語の表記". Agency for Cultural Affairs, Government of Japan. Agency for Cultural Affairs. Retrieved 22 May 2024. 特別な音の書き表し方については,取決めを行わず,自由とすることとしたが,その中には,例えば,「スィ」「ズィ」「グィ」「グェ」「グォ」「キェ」「ニェ」「ヒェ」「フョ」「ヴョ」等の仮名が含まれる。
  135. ^ Labrune (2012), pp. 65–66, 99.
  136. ^ a b Pintér (2015), p. 152.
  137. ^ a b c Crawford (2009), p. 15.
  138. ^ Shibatani (1990), p. 164.
  139. ^ Vance (1987), p. 28.
  140. ^ Vance (1987), p. 31.
  141. ^ Hattori (1950), pp. 103–104.
  142. ^ Vance (2008), pp. 76, 81, 83–85, 92.
  143. ^ a b c Smith (1980), §5.6.
  144. ^ Vance (2008), pp. 228–229.
  145. ^ Itō & Mester (1995), p. 830.
  146. ^ Pintér (2015), pp. 139, 150.
  147. ^ Hall (2013), p. 12.
  148. ^ Vance (2008), p. 228.
  149. ^ Vance (1987), pp. 19–20.
  150. ^ Watanabe (2009), pp. 91, 94.
  151. ^ Maddieson (2005), p. 213.
  152. ^ Vance (2008), pp. 78–80.
  153. ^ Vance (2008), p. 80.
  154. ^ a b Pintér (2015), p. 145.
  155. ^ Crawford (2009), p. 97.
  156. ^ Watanabe (2009), p. 100.
  157. ^ Yuzawa, Tadayuki; Matsuzaki, Hiroshi (25 October 2004). "第6章 「バイオリン」か,「ヴァイオリン」カ? 【外来語の表記と発音】". 音声・音韻探究法 日本語音声へのいざない (in Japanese). Asakura Publishing Co., Ltd. p. 65.
  158. ^ Vance (1987), p. 32.
  159. ^ Bloch (1950), p. 122.
  160. ^ Irwin (2011), pp. 75, 85.
  161. ^ Labrune (2012), pp. 78–79.
  162. ^ Akamatsu (1997), p. 124.
  163. ^ Maekawa (2018), p. 29.
  164. ^ Akamatsu (1997), p. 125.
  165. ^ a b Labrune (2012), p. 78.
  166. ^ a b c Vance (2008), pp. 214–222.
  167. ^ Shibatani (1990), p. 172.
  168. ^ Vance (2008), pp. 219–220.
  169. ^ a b Vance (2008), p. 221.
  170. ^ Labrune (2012), p. 79.
  171. ^ a b Vance (2008), p. 220.
  172. ^ a b Labrune (2012), pp. 79–80.
  173. ^ Vance (2008), p. 216.
  174. ^ Vance (2008), p. 218-219.
  175. ^ Vance (2008), pp. 217–219.
  176. ^ Akamatsu (1997), pp. 129, 325.
  177. ^ a b Vance (2008), p. 214.
  178. ^ Vance (1987), p. 110.
  179. ^ Shibatani (1990), pp. 171–173.
  180. ^ Vance (2008), p. 215.
  181. ^ Sano & Ooigawa (2010).
  182. ^ a b Labrune (2012), p. 25.
  183. ^ Akamatsu (1997), p. 31.
  184. ^ a b c Vance (2008), pp. 54–56.
  185. ^ Murano, Stone & Honda (2005).
  186. ^ Li et al. (2015).
  187. ^ Westbury & Hashi (1997), pp. 413, 417.
  188. ^ Labrune (2012), p. 39.
  189. ^ a b Labrune (2012), p. 40.
  190. ^ a b c Labrune (2012), p. 45.
  191. ^ Shibatani (1990), p. 162.
  192. ^ Vance (1987), p. 15.
  193. ^ Vance (2022), p. 76.
  194. ^ Labrune (2012), p. 47.
  195. ^ Labrune (2012), p. 44.
  196. ^ Labrune (2012), p. 46.
  197. ^ Vance (2008), pp. 59–60.
  198. ^ Vance (2008), p. 61.
  199. ^ Fujimoto (2015), pp. 167–168.
  200. ^ Vance (2008), p. 206.
  201. ^ Labrune (2012), p. 34.
  202. ^ a b Fujimoto (2015), pp. 177–178.
  203. ^ Fujimoto (2015), pp. 171–172, 179.
  204. ^ Fujimoto (2015), p. 179.
  205. ^ a b Tsuchida (2001), p. 225.
  206. ^ a b Vance (2008), p. 210.
  207. ^ a b Fujimoto (2015), pp. 171–172.
  208. ^ Labrune (2012), p. 38.
  209. ^ Hirayama (2009), pp. 55–56.
  210. ^ a b Vance (2008), p. 213.
  211. ^ a b c Fujimoto (2015), p. 188.
  212. ^ Kondo (1997), p. 96.
  213. ^ Tsuchida (2001), fn 3.
  214. ^ a b Vance (2008), p. 211.
  215. ^ Tsuchida (2001), p. 238.
  216. ^ Kilbourn-Ceron & Sonderegger (2017), §5.2, 5.3, 6.3.
  217. ^ Kilbourn-Ceron & Sonderegger (2017), §1.3.
  218. ^ Kondo (1997), p. 90.
  219. ^ Fujimoto 2015, pp. 184–186.
  220. ^ Seward (1992), p. 9.
  221. ^ Fujimoto 2015, p. 185.
  222. ^ Kilbourn-Ceron & Sonderegger (2017), §2.5.3.
  223. ^ Kondo (1997), pp. 78, 100–101.
  224. ^ Fujimoto 2015, p. 186.
  225. ^ Kondo (1997), p. 75.
  226. ^ Fujimoto 2015, pp. 169–170.
  227. ^ Hirayama (2009), pp. 52, 59.
  228. ^ Vance 2008, p. 207.
  229. ^ Kilbourn-Ceron & Sonderegger (2017), §3.
  230. ^ a b Vance (2008), pp. 208–209.
  231. ^ Shaw & Kawahara (2018), pp. 101–102.
  232. ^ Labrune (2012), pp. 36.
  233. ^ Labrune (2012), pp. 36, 39.
  234. ^ Vance (2008), pp. 206, 209.
  235. ^ Vance (2008), pp. 56, 96, 99.
  236. ^ Vance (2008), pp. 222–225.
  237. ^ Vance (2008), pp. 223–224.
  238. ^ Verdonschot, Rinus G.; Kiyama, Sachiko; Tamaoka, Katsuo; Kinoshita, Sachiko; Heij, Wido La; Schiller, Niels O. (2011). "The functional unit of Japanese word naming: Evidence from masked priming". Journal of Experimental Psychology: Learning, Memory, and Cognition. 37 (6): 1458–1473. doi:10.1037/a0024491. hdl:1887/18409. PMID 21895391. S2CID 18278865.
  239. ^ Labrune (2012), p. 143.
  240. ^ Labrune (2012), pp. 143–144.
  241. ^ Itō & Mester (1995:827). In such a classification scheme, the plain counterparts of moras with a palatal glide are onsetless moras.
  242. ^ Aoyama (2001), pp. 1–2.
  243. ^ Aoyama (2001), p. 11.
  244. ^ Aoyama (2001), pp. 7–8.
  245. ^ Vance (2008), p. 143.
  246. ^ Vance (2008), pp. 147–150.
  247. ^ a b Vance (2008), p. 144.
  248. ^ a b Labrune (2012), pp. 182–183.
  249. ^ Labrune (2012), p. 183.
  250. ^ Vance (2008), p. 146.
  251. ^ a b c Vance (2008), p. 147.
  252. ^ Labrune (2012), pp. 154.
  253. ^ a b Labrune (2012), pp. 154–155.
  254. ^ Labrune (2012), pp. 162–164.
  255. ^ Labrune (2012), pp. 251–257, 261, 263.
  256. ^ a b Labrune (2012), p. 171.
  257. ^ Ito & Mester (2015b), p. 384.
  258. ^ Poser (1990), p. 82.
  259. ^ Poser (1990), pp. 82, 84.
  260. ^ Poser (1990), pp. 84–85.
  261. ^ Poser (1990), p. 85.
  262. ^ Poser (1990), pp. 85, 89.
  263. ^ Poser (1990), p. 86.
  264. ^ Poser (1990), pp. 86, 88–89.
  265. ^ Starr & Shih (2017), pp. 6–8.
  266. ^ Vance (2008), pp. 117–118.
  267. ^ a b Shinohara (2004), p. 295.
  268. ^ Otake (2015), p. 504.
  269. ^ Vance (2008), p. 118.
  270. ^ Vance (2017), p. 26.
  271. ^ Vance (2008), p. 135.
  272. ^ Youngberg (2021b), p. 228.
  273. ^ Kubozono (2015a), pp. 5–6.
  274. ^ Labrune (2012), pp. 54.
  275. ^ Labrune (2012), pp. 53–56.
  276. ^ Youngberg (2021b), p. 240.
  277. ^ a b c Vance (2008), p. 62.
  278. ^ Vance (2008), p. 63.
  279. ^ Vance (2008), pp. 174–175.
  280. ^ Itō & Mester (2013), 19:50.
  281. ^ a b Ito & Mester (2015b), pp. 375–376.
  282. ^ Itō & Mester (2013), 16:05-19:42.
  283. ^ a b Kubozono (2015a), p. 13.
  284. ^ a b Aoyama (2001), p. 9.
  285. ^ a b c Ito & Mester (2015b), p. 376.
  286. ^ Ohta (1991), p. 168.
  287. ^ a b c d e f g h Ito & Mester (2015b), p. 377.
  288. ^ Vance (1987), pp. 72–73.
  289. ^ Vance (2008), p. 132.
  290. ^ Itō & Mester (2013), 18:10.
  291. ^ Ohta (1991), pp. 168, 177.
  292. ^ Kubozono (2015a), pp. 13–14.
  293. ^ Kubozono (2015c), pp. 341–342.
  294. ^ Ito & Mester (2018), p. 214.
  295. ^ a b Ohta (1991), p. 177.
  296. ^ Itō & Mester (2013), 25:25-30:15.
  297. ^ Kubozono (2015c), p. 343.
  298. ^ Kubozono, Itô & Mester (2009), p. 956.
  299. ^ Kubozono (2015c), p. 337.
  300. ^ Kubozono (2015c), p. 338.
  301. ^ Kawahara & Shaw (2018), §5.
  302. ^ Vance (2008), p. 119.
  303. ^ Irwin (2011), pp. 75–76.
  304. ^ Broselow et al. (2012), p. 99.
  305. ^ Crawford (2009), p. 69.
  306. ^ Crawford (2009), pp. 71–72.
  307. ^ a b Crawford (2009), p. 72.
  308. ^ Irwin (2011), p. 88.
  309. ^ Smith (1980), §3.1.4.2.5, §5.6.
  310. ^ a b Vance (2008), p. 90.
  311. ^ Irwin (2011), p. 93.
  312. ^ Vance (1987), p. 27.
  313. ^ Vance (2008), pp. 80, 229.
  314. ^ Vance (2008), pp. 80, 82.
  315. ^ Watanabe (2009), p. 90.
  316. ^ Watanabe (2009), pp. 163–176.
  317. ^ Vance (2008), pp. 85–88.
  318. ^ Watanabe (2009), p. 163.
  319. ^ a b Shinohara (2004), p. 316.
  320. ^ Shinohara (2004), p. 299.
  321. ^ Vance (2008), pp. 84, 87.
  322. ^ Watanabe (2009), p. 151.
  323. ^ Pintér (2015), pp. 121–122.
  324. ^ Watanabe (2009), p. 174.
  325. ^ Ito & Mester (2015a), p. 291.
  326. ^ Ito & Mester (2015a), p. 301.
  327. ^ Ito & Mester (2015a), pp. 304–305.
  328. ^ Kitagawa & Albin (2023), p. 56.
  329. ^ Ito & Mester (2015a), pp. 295, 297.
  330. ^ Vance (2015), p. 421.
  331. ^ Vance (2008), p. 104.
  332. ^ a b Kitaoka (2017), p. 6.
  333. ^ Tateishi (2017), p. 534.
  334. ^ Kawahara (2015), p. 66.
  335. ^ Kubozono, Itô & Mester (2009), pp. 955, 972.
  336. ^ a b Tamaoka & Makioka (2004), pp. 540, 542.
  337. ^ Labrune (2012, pp. 70, 136), citing Lawrence (1999, p. 18)
  338. ^ Lawrence (2001), p. 968.
  339. ^ Labrune (2012), p. 104.
  340. ^ Ito, Mester & Padgett (2001), p. 58.
  341. ^ Ito & Mester (2015a), pp. 298–299.
  342. ^ Crawford (2009), pp. 62–65.
  343. ^ Kawahara (2006:537–538), citing Katayama (1998).
  344. ^ Kawahara (2006), p. 538.
  345. ^ Ito, Kubozono & Mester (2017), p. 296.
  346. ^ a b Kawahara (2015), p. 54.
  347. ^ a b c Kawahara (2011), pp. 1–2.
  348. ^ a b Sano (2013), pp. 245–246.
  349. ^ Kawahara (2011), p. 2.
  350. ^ Sano (2013), p. 246.
  351. ^ Kawahara (2006), pp. 559, 561, 565.
  352. ^ Vance (2008), p. 113.
  353. ^ a b c d Kitaoka (2017), p. 5.
  354. ^ a b Kawahara (2015), p. 68.
  355. ^ a b Schourup & Tamori (1992), pp. 137–138.
  356. ^ Vance (2008), p. 110.
  357. ^ Morimoto (2020), pp. 46–51.
  358. ^ Akamatsu (1997), p. 333.
  359. ^ Itô, Kitagawa & Mester (1996), p. 229.
  360. ^ Youngberg (2021b), pp. 224–225.
  361. ^ Labrune (2012), p. 53.
  362. ^ Youngberg (2021b), p. 223.
  363. ^ Ito & Mester (2015a), p. 292.
  364. ^ a b c Kawahara (2003).
  365. ^ Vance (2008), p. 133.
  366. ^ Kubozono (2015c), p. 334.
  367. ^ Kubozono (2015b), pp. 225–228.
  368. ^ Labrune (2012), p. 41.
  369. ^ Kubozono (2015b), pp. 226–227.
  370. ^ Akamatsu (1997), pp. 53–54.
  371. ^ Labrune (2012), pp. 16–17, 60, 69, 93, 100–102.
  372. ^ Nasu (2015), p. 257.
  373. ^ Takayama (2015), p. 628.
  374. ^ Labrune (2012), p. 102.
  375. ^ Frellesvig (2010), p. 43.
  376. ^ Nasu (2015), pp. 260–261.
  377. ^ Nasu (2015), p. 284.
  378. ^ Labrune (2012), pp. 102–103.
  379. ^ Labrune (2012), p. 103.
  380. ^ Frellesvig (2010), pp. 35, 42–43.
  381. ^ a b Nasu (2015), p. 276.
  382. ^ Itō & Mester (1995), p. 836.
  383. ^ Nasu (2015), pp. 261, 266, 280.
  384. ^ Nasu (2015), p. 264.
  385. ^ Labrune (2012), pp. 60–62, 75–76.
  386. ^ Labrune (2012), p. 77.
  387. ^ Hamano (2000), p. 213-218.
  388. ^ Ito & Mester (2015a), p. 293.
  389. ^ Kubozono (2015c), pp. 328–332.
  390. ^ Ito & Mester (2015a), pp. 293–295.
  391. ^ Labrune (2012), pp. 30–32.
  392. ^ Vance (1987), p. 156.
  393. ^ Kawahara (2006), pp. 549–550.
  394. ^ Mester & Itô (1989), p. 275.
  395. ^ Kubozono (2015a), p. 10.
  396. ^ Poser (1986), pp. 171–173.
  397. ^ Poser (1986), p. 173.
  398. ^ Labrune (2012:104–105) points out that the "intensive" prefix |bu| has the same effect on a following consonant; etymologically, this prefix is the assimilated form of the stem /but/ of the verb ぶつ, butsu, 'hit, beat, strike'.
  399. ^ Ito & Mester (2015b), pp. 367, 370.
  400. ^ Poser (1986), pp. 170–171.
  401. ^ Vance (1987), pp. 58, 189–190.
  402. ^ Ito & Mester (2015a), pp. 298.
  403. ^ Vance (1987), p. 161.
  404. ^ Vance (1987), p. 158.
  405. ^ a b Vance (1987), p. 159.
  406. ^ Vance (1987), p. 160.
  407. ^ Irwin (2008).
  408. ^ a b c d Daijirin
  409. ^ a b c d e f Yamaguchi, Akiho; 秋山, 守英 (1 March 2001). 日本語文法大辞典. Meiji Shoin.
  410. ^ Kubozono (2015b), p. 226.
  411. ^ Nihon Kokugo Daijiten
  412. ^ Daijisen
  413. ^ Kōjien
  414. ^ "問う". Online Japanese Accent Dictionary.
  415. ^ "請う". Online Japanese Accent Dictionary.

Bibliography

Further reading