stringtranslate.com

Especificación del léxico de pronunciación

La Especificación del Léxico de Pronunciación (PLS) es una recomendación del W3C diseñada para permitir la especificación interoperable de información de pronunciación para motores de reconocimiento y síntesis de voz dentro de aplicaciones de navegación por voz. El lenguaje está pensado para que sea fácil de usar para los desarrolladores y, al mismo tiempo, admita la especificación precisa de información de pronunciación para uso internacional.

El lenguaje permite especificar una o más pronunciaciones para una palabra o frase utilizando un alfabeto de pronunciación estándar o, si es necesario, utilizando alfabetos específicos del proveedor. Las pronunciaciones se agrupan en un documento PLS al que se puede hacer referencia desde otros lenguajes de marcado, como la Especificación de gramática de reconocimiento de voz SRGS y el Lenguaje de marcado de síntesis de voz SSML .

Uso

A continuación se muestra un ejemplo de documento PLS:

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-US" > <lexema> <grafema> juicio </grafema> <grafema> juicio </grafema> <fonema> ˈdʒʌdʒ.mənt </fonema> <!-- Cadena IPA es:  "ˈdʒʌdʒ.mənt" --> </lexeme> <lexeme> <grapheme> prometido </grapheme> <grapheme> prometido </grapheme> <phoneme> fiˈɒns.eɪ </phoneme> <!-- La cadena IPA es:  "fiˈɒns.eɪ" --> <phoneme> ˌfiː.ɑːnˈseɪ </phoneme> <!-- La cadena IPA es:  "ˌfiː.ɑːnˈseɪ" --> </lexeme> </lexicon>                           

que podría usarse para mejorar TTS como se muestra en el siguiente documento SSML 1.0 :

 <?xml version="1.0" encoding="UTF-8"?> <speak version= "1.0" xmlns= "http://www.w3.org/2001/10/synthesis" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2001/10/synthesis  http://www.w3.org/TR/speech-synthesis/synthesis.xsd" xml:lang= "en-US" > <lexicon uri= "http://www.example.org/lexicon_defined_above.xml" /> <p> A juicio de mi prometido, Las Vegas es el mejor lugar para una luna de miel. Le respondí que prefería Venecia y no creía que el casino veneciano fuera un compromiso aceptable . </p> </speak>                                           

pero también para mejorar ASR en la siguiente gramática SRGS 1.0 :

 <?xml version="1.0" encoding="UTF-8"?> <grammar version= "1.0" xmlns= "http://www.w3.org/2001/06/grammar" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2001/06/grammar  http://www.w3.org/TR/speech-grammar/grammar.xsd" xml:lang= "en-US" root= "movies" mode= "voice" > <lexicon uri= "http://www.example.org/lexicon_defined_above.xml" /> <rule id= "movies" scope= "public" > <one-of> <item> Terminator 2: el juicio final </item> <item> Mi gran y gordo Prometida desagradable </item> <item> El día del juicio de Plutón </item> </one-of> </rule> </grammar>                                 

Casos de uso comunes

Pronunciaciones múltiples para la misma ortografía

En los sistemas ASR es habitual recurrir a múltiples pronunciaciones de la misma palabra o frase para poder hacer frente a las variaciones de pronunciación dentro de un idioma. En el lenguaje Pronunciation Lexicon, las pronunciaciones múltiples se representan mediante más de un elemento <fonema> (o <alias>) dentro del mismo elemento <lexema>.

En el siguiente ejemplo la palabra "Newton" tiene dos pronunciaciones posibles.

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-GB" > <lexema> <grafema> Newton </grafema> <fonema> ˈnjuːtən </fonema> <!-- La cadena IPA es: "ˈnjuːtən" --> <phoneme> ˈnuːtən </phoneme> <!-- La cadena IPA es: "ˈnuːtən" --> </lexeme> </lexicon>                 

Ortografías múltiples

En algunas situaciones, existen representaciones textuales alternativas para la misma palabra o frase. Esto puede deberse a varias razones. Consulte la Sección 4.5 de PLS para obtener más detalles. Debido a que se trata de representaciones que tienen el mismo significado (a diferencia de las homófonas), se recomienda que se representen utilizando un único elemento <lexeme> que contenga varios grafemas.

A continuación se muestran dos ejemplos sencillos de ortografías múltiples: ortografía alternativa de una palabra inglesa y escrituras múltiples de una palabra japonesa.

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-US" > <!-- Entrada en inglés que muestra cómo se manejan las ortografías alternativas --> <lexeme> <grapheme> colour </grapheme> <grapheme> color </grapheme> <phoneme> ˈkʌlər </phoneme> <!-- La cadena IPA es: "ˈkʌlər" --> </lexeme> </lexicon>                  <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "ja" > <!-- Entrada japonesa que muestra cómo se manejan los sistemas de escritura múltiples  : ortografías romaji, kanji e hiragana --> <lexeme> <grapheme> nihongo </grapheme> <grapheme>日本語</grapheme> <grapheme>にほんご</grapheme> <phoneme> ɲihoŋɡo </phoneme> <!-- La cadena IPA es: "ɲihoŋɡo" --> </lexeme> </lexicon>                  

Homófonos

La mayoría de los idiomas tienen homófonos , palabras con la misma pronunciación pero significados diferentes (y posiblemente diferentes ortografías), por ejemplo, "seed" y "cede". Se recomienda que se representen como lexemas diferentes.

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-US" > <lexema> <grafema> cede </grafema> <fonema> siːd </fonema> <!-- La cadena IPA es: "siːd" --> </lexema> <lexema> <grapheme> semilla </grapheme> <phoneme> siːd </phoneme> <!-- La cadena IPA es: "siːd" --> </lexeme> </lexicon>                    

Homógrafos

La mayoría de los idiomas tienen palabras con significados diferentes pero con la misma ortografía (y a veces con diferentes pronunciaciones), llamadas homógrafos . Por ejemplo, en inglés, la palabra bass (pescado) y la palabra bass (en música) tienen ortografías idénticas pero significados y pronunciaciones diferentes. Aunque se recomienda que estas palabras se representen utilizando elementos <lexeme> separados que se distinguen por diferentes valores del atributo role (consulte la Sección 4.4 de PLS 1.0), si un autor de léxico de pronunciación no desea distinguir entre las dos palabras, simplemente se podrían representar como pronunciaciones alternativas dentro del mismo elemento <lexeme>. En este último caso, el procesador TTS no podrá distinguir cuándo aplicar la primera o la segunda transcripción.

En este ejemplo se muestran las pronunciaciones del homógrafo "bass".

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-US" > <lexema> <grafema> bajo </grafema> <fonema> bæs </fonema> <!-- La cadena IPA es: bæs --> <fonema> beɪs </fonema> <!-- La cadena IPA es: beɪs --> </lexeme> </lexicon>                 

Tenga en cuenta que el inglés contiene numerosos ejemplos de pares sustantivo-verbo que pueden tratarse como homógrafos o como pronunciaciones alternativas, según la preferencia del autor. Dos ejemplos son el sustantivo/verbo "refuse" y el sustantivo/verbo "address".

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" xmlns:mypos= "http://www.example.org/my_pos_namespace" alphabet= "ipa" xml:lang= "en-US" > <lexema role= "mypos:verb" > <grafema> rechazar </grafema> <fonema> rɪˈfjuːz </phoneme> <!-- La cadena IPA es: "rɪˈfjuːz" --> </lexeme> <lexeme role= "mypos:noun" > <grapheme> rechazar </grapheme> <phoneme> ˈrɛfjuːs </phoneme> <!-- La cadena IPA es: "ˈrɛfjuːs" --> </lexeme> </lexicon>                       

Pronunciación por ortografía

Para algunas palabras y frases, la pronunciación se puede expresar de forma rápida y cómoda como una secuencia de otras ortografías . No es necesario que el desarrollador tenga conocimientos lingüísticos, sino que hace uso de las pronunciaciones que ya se supone que están disponibles. Para expresar pronunciaciones utilizando otras ortografías se puede utilizar el elemento <alias>.

Esta característica puede ser muy útil para abordar la expansión de acrónimos.

 <?xml version="1.0" encoding="UTF-8"?> <lexicon version= "1.0" xmlns= "http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation= "http://www.w3.org/2005/01/pronunciation-lexicon  http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet= "ipa" xml:lang= "en-US" > <!--  Expansión de acrónimos  --> <lexeme> <grapheme> W3C </grapheme> <alias> Consorcio World Wide Web </alias> </lexeme> <!--  Representación numérica  --> <lexeme> <grapheme> 101 </grapheme> <alias> ciento uno </alias> </lexeme> < !-- mecanismo  de pronunciación rudimentario  --> <lexeme> <grapheme> Tailandia </grapheme> <alias> tie land </alias> </lexeme> <!--  mecanismo de pronunciación rudimentario y expansión de acrónimos  --> <lexeme> <grapheme> BBC 1 </grapheme> <alias> be be sea one </alias> </lexeme> </lexicon>                                         

Situación y futuro

Véase también

Referencias

Enlaces externos