stringtranslate.com

Utau

UTAU es una aplicación de sintetizador de canto japonesa creada por Ameya/Ayame (飴屋/菖蒲). Este programa es similar al software VOCALOID , con la diferencia de que es shareware en lugar de estar sujeto a una licencia de terceros.

Descripción general

En marzo de 2008, Ameya/Ayame lanzó UTAU, un software shareware de herramientas de soporte avanzado y gratuito que se podía descargar desde su sitio web principal. UTAU (歌う), que literalmente significa "cantar" en japonés, tiene su origen en la actividad de "Jinriki Bōkaroido" (人力ボーカロイド, Manual Vocaloid) , donde las personas editan una pista vocal existente, extraen fonemas, ajustan el tono y los vuelven a ensamblar para crear una voz de canto al estilo de Vocaloid . UTAU se creó originalmente para ayudar en este proceso mediante síntesis concatenativa . UTAU puede usar archivos WAV proporcionados por el usuario, de modo que se puede sintetizar una voz de canto introduciendo letras de canciones y melodía. UTAU viene con el sintetizador de voz de AQUEST "AquesTalk" para sintetizar las muestras de voz del banco de voz predeterminado, Utane Uta (también apodada Defoko ( Defoko significa 'chica predeterminada' en japonés)) en su lanzamiento inicial, después de lo cual el generador se elimina a sí mismo. Las voces creadas para el programa UTAU también se denominan oficialmente "UTAU", aunque se las conoce coloquialmente como "UTAUloids", una referencia a VOCALOID. También se las llama "bancos de voz" (más comunes en áreas de habla inglesa) y "bibliotecas (de voz)" en Japón. Los usuarios independientes han desarrollado una gran cantidad de bancos de voz. Estos bancos de voz normalmente se distribuyen directamente de sus creadores a través de descargas de Internet, pero algunos se venden como parte de proyectos comerciales.

UTAU es principalmente un programa japonés y, por lo tanto, muchas de sus voces se crean específicamente para el idioma japonés. Sin embargo, como los usuarios pueden crear sus propios bancos de voz, la base de usuarios ha ideado métodos para permitir que los bancos de voz canten en idiomas distintos del japonés. El formato X-SAMPA se utiliza a menudo para bancos de voz en inglés u otros que no sean japoneses, aunque a veces se utilizan otros sistemas fonéticos, como ARPABET y cualquier cantidad de sistemas fonéticos personalizados. [1]

Los archivos de proyecto de UTAU se guardan con la extensión ".ust" (Utau Sequence Text). Estos archivos se pueden distribuir libremente, lo que permite que diferentes UTAU canten la misma pieza. Los productores han desarrollado varios métodos para producir sus bancos de sonido y los resultados de los bancos de voz varían debido a esto. [2] UTAU también admite el formato MIDI y el formato .vsq.

Ameya/Ayame agregó compatibilidad con Unicode en una versión más nueva no publicada de UTAU, según las capturas de pantalla publicadas en Twitter. Ya se lanzó la compatibilidad con la región fija de cola del backend correspondiente, así como con varias otras codificaciones de audio, mientras que la compatibilidad con el frontend aún no se lanzó a partir de septiembre de 2020. Ameya también actualizó UTAU para que sea compatible con sistemas de 64 bits.

Configuración

El editor es capaz de colocar notas, ingresar fonemas y cambiar el tono y el volumen en un rollo de piano . Solo se puede crear una pista en UTAU, y las notas no se pueden colocar una encima de otra. [ aclaración necesaria ] De forma predeterminada, solo se muestran las notas en el rollo de piano, pero se pueden cambiar las configuraciones de visualización para mostrar la curva de tono, la intensidad del volumen, la envolvente y las banderas. UTAU usa banderas para cambiar aspectos de la voz, como con filtros de paso bajo y paso alto, y para reducir o agregar respiración. Estas banderas difieren según el remuestreador utilizado. La información y los datos de la partitura en el banco de voces se procesan con un remuestreador y wavtool según la partitura creada con el editor. Solo se puede utilizar un remuestreador en un solo archivo .ust. Se utiliza un filtro de formantes para controlar los cambios en la calidad de la voz, que se puede desactivar.

El archivo de audio que se va a cargar se encuentra haciendo coincidir los símbolos de la nota con el nombre del archivo de audio en la biblioteca de voces. Sin embargo, un archivo prefix.map puede cambiar de qué subcarpeta se toma la muestra. El tono de la voz sintetizada se ajusta según la diferencia entre el archivo de sonido original y el tono de la nota en el editor. UTAU utiliza filtros de formantes para evitar cambios extremos en la calidad de la voz, que se pueden desactivar. El procesamiento por lotes se utiliza para generar varias notas a la vez. Durante este proceso se crean archivos de caché. Según el remuestreador, la cantidad de archivos de caché puede aumentar. Hay configuraciones en el menú para eliminar archivos de caché cuando se cierra el programa o después de un cierto período de tiempo.

Hay complementos integrados que pueden fusionar vocales automáticamente y la configuración "Omakase/A la carte" que puede agregar tono y vibrato automáticos a un archivo completo. También se pueden agregar al software otros complementos creados por los usuarios. Los colores del editor también se pueden cambiar en el archivo setting.ini.

Voces

Como se mencionó anteriormente, los archivos WAV se pueden portar a UTAU. Puede haber cientos, o en algunos casos, miles, de estos archivos en un solo banco de voces. Las voces se instalan colocándolas en la carpeta "voz" o arrastrándolas y soltándolas en el icono de UTAU. Estas bibliotecas también vienen con un archivo oto.ini que determina el tiempo y la configuración de cada muestra. Al generar audio desde los datos de la partitura en el editor, el programa usa el archivo oto.ini para establecer el tiempo y la pronunciación. Los archivos oto.ini se pueden crear usando la GUI de UTAU o en software de terceros creado por los usuarios, siendo el más notable de estos programas de terceros SetParam. Las tablas de frecuencia (archivos .frq) se utilizan para procesar la forma de onda al cambiar el tono en el editor. Algunos remuestreadores usan otros tipos de archivos en lugar de .frq. Las voces también pueden venir con archivos de imagen, que generalmente son el formato .bmp y diálogos de voz independientes como lo hacen algunos Vocaloids . También suelen incluir archivos readme que contienen información del software y términos de uso. Los archivos de información de los personajes, comúnmente conocidos como character.txt, también suelen incluirse y contienen información que se puede ver en la sección "Vista previa de voz" de la GUI, que incluye el autor del banco de voz, el nombre, un archivo de muestra que se reproducirá al hacer clic en el botón "muestra" y la imagen del banco de voz. También puede contener otros parámetros especificados por el creador, como el "género".

Algunos bancos de voz son monosilábicos , denominados colectivamente "CV" (consonante-vocal), mientras que otros utilizan trifonos para producir un sonido más suave. [3] Estos bancos de voz trifonéticos se denominan colectivamente "VCV" (vocal-consonante-vocal). Estos requieren considerablemente más tiempo y esfuerzo para realizarse (tienen aproximadamente siete veces el tamaño de un banco de voz CV, en términos de líneas en el archivo oto.ini), pero producen un resultado más natural.

Las voces UTAU posteriores incluirían fonemas compuestos de vocales+consonantes (VC) para adaptarse a otros idiomas además del japonés. Los métodos que emplean esto incluyen "CVVC" (en el que un fonema VC se coloca entre dos fonemas CV), o un método hermano "VCCV", que se basa en CVVC, pero contiene algunas diferencias (diferenciación entre VC aspiradas y no aspiradas, soporte de grupos consonánticos, etc.). "VCCV" se llama así para diferenciarse de las listas CVVC anteriores de su creador. Dos métodos de grabación de voz más raros son CVC, donde un fonema consiste en una consonante-vocal-consonante y se divide en el programa utilizando oto.ini, y un método llamado rentan-jutsu (れんたんじゅつ), en el que se graban una serie de sílabas CV en múltiples archivos wav para crear un resultado más suave sin recurrir a VCV completo.

Dado que los archivos de audio son archivos independientes, se pueden utilizar en otro software como un DAW.

Desarrollo

El desarrollo de UTAU comenzó cuando Ameya empezó a utilizar Audacity para recombinar muestras de otros cantantes y Melodyne para corregir el tono de las muestras y ponerlas en música. El acto de hacer esto se denominó "VOCALOID con voz humana". LOLI.COM, un músico que publicó su propia música de rap en Nico Nico Douga , utilizó su propia voz para Vocaloid con voz humana y lanzó un software de edición de audio que podía ayudar a los usuarios a hacer lo mismo. Dado que el proceso de hacer "VOCALOID con voz humana" a mano requería una cantidad sustancial de tiempo y esfuerzo, Ameya comenzó a desarrollar una nueva herramienta que facilitara el proceso.

La herramienta fue anunciada en Nico Nico Douga el 11 de enero de 2008. En ese momento, era posible ajustar el tiempo del sonido, cambiar la envolvente de una nota y generar archivos por lotes. El 5 de febrero de 2008, se publicó un video que mostraba la GUI. Aquí, era posible estirar el tiempo de las muestras, crear archivos oto.ini y ajustar los cambios de tono de las notas. [4] El 5 de marzo de 2008, se publicó un video que explicaba las especificaciones del programa en Nico Nico Douga, [5] y el 15 de marzo de 2008, la herramienta pasó a llamarse UTAU.

El creador era programador de profesión y no especialista en síntesis vocal, pero utilizó conocimientos previos para crear UTAU. Después de su lanzamiento, Ameya continuó mejorando UTAU y comenzó a desarrollarlo en colaboración con otros desarrolladores de texto a voz. [6]

En junio de 2008, Ameya rechazó la etiqueta de "Jinriki Bōkaroido" (人力 ボ ー カ ロ イ ド, Manual Vocaloid) para UTAU, llamándolo software de síntesis de voz para cantar. [7]

En 2011 se lanzó una versión para Mac llamada UTAU-Synth.

Archivos de audio y derechos de autor

Dado que UTAU puede crear una voz para cantar utilizando cualquier archivo WAV, es posible tomar la voz de una persona existente y utilizarla como datos. A menudo, los actores, cantantes y celebridades tendrán fragmentos de sus voces reutilizados para su uso en UTAU. El creador, Ameya, una vez creó una voz utilizando datos del CD de un actor de doblaje.

En mayo de 2008, Ameya decidió dejar de utilizar datos de audio sin permiso por el momento, a menos que el actor de voz lo permitiera. [8]

Impacto cultural

Aunque el software es muy popular en Japón, sus orígenes e impacto cultural se deben a la popularidad ya establecida del software Vocaloid. UTAU se hizo famoso por primera vez cuando el creador de Kasane Teto lanzó el personaje haciéndose pasar por un personaje de Vocaloid como parte de una broma del Día de los Inocentes en 2008. [ cita requerida ] La influencia del software Vocaloid también llevó a que ambos programas se usaran comúnmente uno al lado del otro. A menudo, las mascotas populares de UTAU como Kasane Teto aparecen en medios basados ​​en VOCALOID como Maker Hikōshiki Hatsune Mix o Hatsune Miku: Project DIVA .

Más tarde, el software UTAU tendría su propio impacto en Vocaloid y otros sintetizadores vocales, con una serie de voces que hacían referencia a UTAU o que se produjeron para el motor desde el principio. Por ejemplo, Megurine Luka V4x fue influenciada por la voz de UTAU Gahata Meiji. [9] Wat de Crypton Future Media también habló con alguien muy familiarizado con UTAU y dijo que la conversación fue "muy interesante". [10] Macne Nana de la serie Macne más tarde se convertiría tanto en una voz de UTAU como en una voz de Vocaloid. El proveedor de voz de English Vocaloid Ruby , Misha, había producido previamente un UTAU en japonés llamado Makune Hachi ( MAKU音ハチ). Además, el vocalista de Dex, Kenji-B, creó a Kenji Baionoto (倍音音ケンジ) para UTAU, y AkiGlancy, la vocalista detrás de la compañera de Dex, Daina, le dio su voz a UTAU Namida (ナミダ) . Kikuko Inoue , la actriz de doblaje de Macne Coco White and Black ( Mac音ココ白・黒) (ver serie Macne ) pasó a expresar un producto de Vocaloid5 con el nombre de Haruno Sora (桜乃そら). El producto viene con dos bancos de voz, Natural y Cool. [11] Después del lanzamiento de Vocaloid 3 con la voz Tohoku Zunko , sus dos hermanas Tohoku Itako y Tohoku Kiritan recibieron las voces de UTAU. [12] Más tarde, Kiritan llevaría a cabo una campaña de financiación colectiva para convertirse en Voiceroid . [13] Además de su influencia en Vocaloid, UTAU ha servido como plataforma de lanzamiento para el desarrollo de otros sintetizadores de voz comerciales. El más notable de ellos es el Synthesizer V de Dreamtonics, que surgió del desarrollo del remuestreador UTAU conocido como Moresampler, ambos desarrollados por Kanru Hua. [14] [15] [16]

Su principal atractivo no se basa únicamente en que se distribuye libremente en internet, sino porque permite a un usuario insertar su propia voz en la base de datos para su uso musical, abriendo las puertas a que los usuarios puedan seguir desarrollando su propia música. UTAU debe su creciente popularidad a su capacidad de proporcionar un método gratuito de creación de voces para uso musical y ha establecido a numerosos productores musicales trabajando con el software en sitios como Niconico y YouTube . Los usuarios también lo ven como una alternativa al software Vocaloid, que ofrece una oferta más limitada de voces a un precio elevado y puede que no ofrezca los tipos de voz que buscan para su música, ya que la gran base de datos de voces suele tener muchas más posibilidades de ofrecer la voz que buscan. Sin embargo, a pesar de la cantidad de bancos de voces que ofrece, el software tiene en general muchos menos productores trabajando con él que Vocaloid. [17]

Una estación de radio creó un programa de una hora que contenía únicamente música basada en Vocaloid y UTAU. [18]

Además, desde el 19 de julio de 2012 se celebró regularmente un evento llamado The UTAU M@STER. El evento fue la principal reunión de grupos o círculos y se llevó a cabo de manera similar al evento relacionado con Vocaloid, THE VOC@LOID M@STER, que existía desde 2007. [19]

Software relacionado

A diferencia de Vocaloid, los archivos UTAU no son restrictivos ya que no se trata de una licencia basada en propiedad. Por lo tanto, es posible utilizar productos con licencia de código abierto con el software UTAU, como los producidos para la serie Macne ( Mac音シリーズ) , lanzados para los programas Reason 4 y GarageBand . Estos productos fueron vendidos por Act2 y al convertir su formato de archivo, también pudieron funcionar con el programa UTAU. [20] Más tarde, los paquetes Macne Whisper☆Angel Sasayaki, Macne Nana 2S y Macne Petit 2S vinieron con bancos de voz UTAU preconstruidos.

El banco de voz predeterminado "Defoko" (Utane Uta) toma prestada su voz del software AquesTalk, específicamente la voz "AquesTalk Female-1" producida por A-quest. Se había concedido permiso para su distribución gratuita con el software. [21] Utane Koe, la hermana de Uta, también toma prestada su voz del software AquesTalk. Namine Ritsu (波音リツ), un banco de voz creado originalmente para UTAU, también se añadió posteriormente a otro software llamado Sinsy como "Namine Ritsu S". Otro banco de voz desarrollado originalmente para el software UTAU, Yamine Renri (闇音レンリ), también se añadió posteriormente a Synthesizer V. El popular personaje de UTAU, Kasane Teto, se publicó como una base de datos de voz de IA de Synthesizer V el 27 de abril de 2023. [22]

Debido al acuerdo de derechos de autor del software, no se permite importar software de licencia no abierta como VOCALOID al software UTAU. [23] Los usuarios también han desarrollado una serie de complementos para el software que agregan y mejoran las voces del software. El programa de software Sugarcape, basado en la misma intención de software gratuito que UTAU, ya ha entrado en la etapa beta. [24] Hubo una versión oficial de UTAU para Mac lanzada el 27 de mayo de 2011, llamada UTAU-Synth. [25] Tiene aproximadamente las mismas características que la versión de Windows. La versión de UTAU-Synth puede importar tanto voces como canciones hechas con la versión de Windows, pero sus archivos de proyecto y configuraciones de banco de voz no son completamente compatibles con la versión de Windows. A fines de 2017 se mencionó que Plogue Art et Technologie, Inc. tenía una adaptación de redireccionamiento funcional que haría que las voces de UTAU aparecieran en su motor Alter/Ego . [26]

OpenUTAU es un sucesor no oficial de código abierto de UTAU desarrollado por el productor de Vocaloid StAkira, con una versión beta lanzada en noviembre de 2021. El software fue diseñado para ser compatible con UTAU pero con una experiencia de usuario moderna. A diferencia de UTAU, no requiere una configuración regional del sistema en japonés para funcionar correctamente. [27]

Uso en la música

Las canciones con licencia del álbum Graduation from Lie , con la participación de Kasane Teto, fueron lanzadas para descargas musicales de Karen-T, bajo Crypton Future Media , como un lanzamiento especial. Este es el primer lanzamiento con licencia de cualquier UTAU. [28]

La biblioteca de voces Momo Momone se utiliza en el video viral de YouTube " Nyan Cat ". Es una versión de "Nyanyanyanyanyanya!", una canción compuesta originalmente por daniwellP y que utiliza el VOCALOID Hatsune Miku . [ cita requerida ]

Véase también

Referencias

  1. ^ "Cuadro de fonemas". ARPAsing . Consultado el 6 de abril de 2024 .
  2. ^ "Grabación de "sonido continuo": UTAU mejora el realismo – Vocaloidism". Vocaloidism . Archivado desde el original el 27 de marzo de 2012 . Consultado el 27 de abril de 2016 .
  3. ^ "Grabación de "sonido continuo": UTAU mejora el realismo – Vocaloidism". Vocaloidism . Archivado desde el original el 27 de marzo de 2012 . Consultado el 27 de abril de 2016 .
  4. ^ "自作ツールを使ってテキスト読み上げソフトに『片道キャッチボール』を". Niconico . 5 de febrero de 2008 . Consultado el 29 de junio de 2021 .
  5. ^ "人力 ボ ー カ ロ イ ド 支 援 ツ ー ル ら し き も の を 作 っ て み た そ の1 導入 編". Niconico . 6 de marzo de 2008.
  6. ^ "あ な た の 声 で 歌 う ソ フ ト 「UTAU 」 の 奇 妙 な 世 界". ASCII.jp . Consultado el 29 de junio de 2021 .
  7. ^ ""真の人力Vocaloid "とは". UTAUについて. Consultado el 29 de junio de 2021 .
  8. ^ Ameya. "テト声の調整に本腰が入った理由 (Por qué me tomé en serio el ajuste de la voz de Teto)" . Consultado el 31 de julio de 2021 .
  9. ^ "crypton_wat". Twitter . Consultado el 27 de abril de 2016 .
  10. ^ "crypton_wat". Twitter . Consultado el 29 de abril de 2016 .
  11. ^ "井上喜久子のVOCALOID、VOICEROIDがついに登場! 新VOCALOID5に対応! 『VOCALOID 桜乃そら』『VOICEROID2 桜乃そら』 8 de julio de 26 de julio". ahsoft.com . AH-Software . Consultado el 29 de junio de 2021 .
  12. ^ "東北 イ タ コ, き り た ん の UTAU 音源" . Consultado el 27 de abril de 2016 .
  13. ^ "ク ラ ウ ド 出 版" . Consultado el 27 de abril de 2016 .
  14. ^ Hua, Kanru (23 de septiembre de 2022), libllsm2 , consultado el 3 de octubre de 2022
  15. ^ "Libllsm2 Release – Kanru Hua's Website". 2018-10-08. Archivado desde el original el 2018-10-08 . Consultado el 2022-10-03 .
  16. ^ "Moresampler – Sitio web de Kanru Hua". 8 de octubre de 2018. Archivado desde el original el 8 de octubre de 2018. Consultado el 3 de octubre de 2022 .
  17. ^ "¿Qué tan grande es la comunidad Vocaloid japonesa?". Archivado desde el original el 13 de diciembre de 2010.
  18. ^ "NHK の本気! ボカロラジオ「エレうた」の高き志" [¡Determinación de NHK! Grandes aspiraciones con Vocaloid Radio "Ere Uta"] (en japonés). Trabajos de medios ASCII . 5 de febrero de 2011 . Consultado el 25 de febrero de 2011 .
  19. ^ "「THE UTAU M@STER」Evento exclusivo de UTAU" . Consultado el 27 de abril de 2016 .
  20. ^ "Mac音 ナ ナ シ リ ー ズ" [Serie Macne Nana] (en japonés). Acto2. Archivado desde el original el 11 de mayo de 2011 . Consultado el 9 de julio de 2010 .
  21. ^ "音声合成ライブラリ製品の紹介 - 株式会社アクエスト" . Consultado el 27 de abril de 2016 .
  22. ^ "Synthesizer V AI 重音テト". 2 de abril de 2023. Archivado desde el original el 3 de abril de 2023 . Consultado el 4 de abril de 2023 .
  23. ^ "Controversias/POCALOID y modificaciones ilegales". Wiki de Vocaloid . Consultado el 1 de septiembre de 2019 .
  24. ^ "Mac で 動 く ボ ー カ ル シ ン セ を 作 る" . Consultado el 27 de abril de 2016 .
  25. ^ "UTAU para Mac: UTAU-Synth". Vocaloidism . Archivado desde el original el 27 de marzo de 2012. Consultado el 27 de abril de 2016 .
  26. ^ "@chipspeech 5:19 pm—10 de noviembre de 2017 Tweet". Twitter . Consultado el 1 de diciembre de 2017 .
  27. ^ "¿Qué es OpenUTAU?". STUDIO OGIEN . 16 de noviembre de 2021. Archivado desde el original el 16 de noviembre de 2021 . Consultado el 25 de febrero de 2022 .
  28. ^ "Kasane Teto "Graduación de la mentira"" (en japonés). Crypton Future Media . Consultado el 2 de octubre de 2010 .

Enlaces externos