En música , la transcripción es la práctica de escribir una pieza o un sonido que anteriormente no estaba escrito y/o no era popular como música escrita, por ejemplo, una improvisación de jazz o la banda sonora de un videojuego . Cuando a un músico se le encarga crear una partitura a partir de una grabación y escribe las notas que componen la pieza en notación musical , se dice que ha creado una transcripción musical de esa grabación. La transcripción también puede significar reescribir una pieza musical, ya sea solista o de conjunto , para otro instrumento u otros instrumentos distintos de los que originalmente estaba destinada. Las sinfonías de Beethoven transcritas para piano solo por Franz Liszt son un ejemplo. La transcripción en este sentido a veces se llama arreglo , aunque estrictamente hablando, las transcripciones son adaptaciones fieles, mientras que los arreglos cambian aspectos significativos de la pieza original.
Otros ejemplos de transcripción musical incluyen la notación etnomusicológica de las tradiciones orales de la música folclórica, como las colecciones de música folclórica nacional de Hungría e Inglaterra de Béla Bartók y Ralph Vaughan Williams , respectivamente. El compositor francés Olivier Messiaen transcribió el canto de los pájaros en la naturaleza y lo incorporó a muchas de sus composiciones, por ejemplo, su Catalogue d'oiseaux para piano solo. La transcripción de esta naturaleza implica el reconocimiento de los grados de la escala y el análisis armónico, para lo cual el transcriptor necesitará oído relativo o perfecto para realizar ambas cosas.
En la música popular y el rock, existen dos formas de transcripción. Los intérpretes individuales copian un solo de guitarra nota por nota u otra línea melódica. Asimismo, los editores musicales transcriben grabaciones completas de solos de guitarra y líneas de bajo y venden las partituras encuadernadas. Los editores musicales también publican transcripciones PVG (piano/voz/guitarra) de música popular, donde se transcribe la línea melódica y luego el acompañamiento de la grabación se organiza como una parte de piano. El aspecto de guitarra del sello PVG se logra a través de acordes de guitarra escritos sobre la melodía. Las letras también se incluyen debajo de la melodía.
Algunos compositores han rendido homenaje a otros compositores creando versiones "idénticas" de las piezas de los compositores anteriores, pero añadiendo su propia creatividad mediante el uso de sonidos completamente nuevos que surgen de la diferencia en la instrumentación. El ejemplo más conocido de esto es el arreglo para orquesta de Ravel de la pieza para piano de Mussorgsky Cuadros de una exposición . Webern utilizó su transcripción para orquesta del ricercar de seis partes de La ofrenda musical de Bach para analizar la estructura de la pieza de Bach, utilizando diferentes instrumentos para tocar diferentes motivos subordinados de los temas y melodías de Bach.
En la transcripción de esta forma, la nueva pieza puede imitar simultáneamente los sonidos originales y recomponerlos con todas las habilidades técnicas de un compositor experto de tal manera que parezca que la pieza fue escrita originalmente para el nuevo medio. Pero algunas transcripciones y arreglos se han hecho por razones puramente pragmáticas o contextuales. Por ejemplo, en la época de Mozart , las oberturas y canciones de sus óperas populares se transcribían para pequeños conjuntos de viento simplemente porque tales conjuntos eran formas comunes de proporcionar entretenimiento popular en lugares públicos. El propio Mozart hizo esto en su ópera Don Giovanni , transcribiendo para pequeños conjuntos de viento varias arias de otras óperas, incluida una de su propia ópera Las bodas de Fígaro . Un ejemplo más contemporáneo es la transcripción de Stravinsky para piano a cuatro manos de La consagración de la primavera , para ser utilizada en los ensayos del ballet. Hoy en día, los músicos que tocan en cafés o restaurantes a veces tocan transcripciones o arreglos de piezas escritas para un grupo más grande de instrumentos.
Otros ejemplos de este tipo de transcripción incluyen el arreglo de Bach de los conciertos para cuatro violines de Vivaldi para cuatro instrumentos de teclado y orquesta; el arreglo de Mozart de algunas fugas de Bach de El clave bien temperado para trío de cuerdas ; el arreglo de Beethoven de su Große Fuge , originalmente escrita para cuarteto de cuerdas , para dúo de piano , y su arreglo de su Concierto para violín como concierto para piano ; los arreglos para piano de Franz Liszt de las obras de muchos compositores, incluidas las sinfonías de Beethoven ; el arreglo de Tchaikovsky de cuatro piezas para piano de Mozart en una suite orquestal llamada " Mozartiana "; la reorquestación de Mahler de las sinfonías de Schumann ; y el arreglo de Schoenberg para orquesta del quinteto para piano de Brahms y el Preludio y fuga de "Santa Ana" de Bach para órgano.
Desde que el piano se convirtió en un instrumento popular, ha surgido una amplia literatura de transcripciones y arreglos para piano de obras para orquesta o conjunto de música de cámara. A veces se las llama " reducciones para piano ", porque la multiplicidad de partes orquestales (en una pieza orquestal puede haber hasta dos docenas de partes instrumentales separadas que se tocan simultáneamente) debe reducirse a lo que un solo pianista (o en ocasiones dos pianistas, en uno o dos pianos, como los diferentes arreglos para Rhapsody in Blue de George Gershwin ) pueden lograr tocar.
Con frecuencia se realizan reducciones para piano de acompañamientos orquestales de obras corales, con fines de ensayo o de interpretación sólo con teclado.
Muchas piezas orquestales han sido transcritas para banda de concierto .
Desde la llegada de la autoedición, los músicos pueden adquirir software de notación musical , que puede recibir el análisis mental de las notas del usuario y luego almacenar y formatear esas notas en notación musical estándar para impresión personal o publicación profesional de partituras. Algunos programas de notación pueden aceptar un archivo MIDI estándar (SMF) o una interpretación MIDI como entrada en lugar de la entrada manual de notas. Estas aplicaciones de notación pueden exportar sus partituras en una variedad de formatos como EPS , PNG y SVG . A menudo, el software contiene una biblioteca de sonidos que permite que la aplicación reproduzca en voz alta la partitura del usuario para su verificación.
Antes de la invención de los dispositivos de transcripción digital, los músicos ralentizaban un disco o una grabación en cinta para poder escuchar las líneas melódicas y los acordes a un ritmo más lento y digerible. El problema de este método era que también cambiaba los tonos, por lo que una vez que se transcribía una pieza, había que transponerla a la tonalidad correcta. El software diseñado para ralentizar el tempo de la música sin cambiar el tono de la misma puede ser muy útil para reconocer tonos, melodías, acordes, ritmos y letras al transcribir música. Sin embargo, a diferencia del efecto de ralentización de un tocadiscos, el tono y la octava original de las notas permanecerán iguales y no descenderán de tono. Esta tecnología es lo suficientemente sencilla como para que esté disponible en muchas aplicaciones de software gratuitas.
El software generalmente sigue un proceso de dos pasos para lograr esto. Primero, el archivo de audio se reproduce a una frecuencia de muestreo más baja que la del archivo original. Esto tiene el mismo efecto que reproducir una cinta o un disco de vinilo a una velocidad más lenta: el tono se reduce, lo que significa que la música puede sonar como si estuviera en una tonalidad diferente. El segundo paso es utilizar el procesamiento de señal digital (o DSP) para volver a subir el tono al nivel de tono original o la tonalidad musical.
Como se mencionó en la sección Transcripción automática de música, algunos programas comerciales pueden rastrear aproximadamente el tono de las melodías dominantes en grabaciones musicales polifónicas. Los escaneos de notas no son exactos y, a menudo, el usuario debe editarlos manualmente antes de guardarlos en un archivo en un formato de archivo propietario o en formato de archivo MIDI estándar . Algunos programas de seguimiento de tono también permiten animar las listas de notas escaneadas durante la reproducción de audio.
El término "transcripción automática de música" fue utilizado por primera vez por los investigadores de audio James A. Moorer, Martin Piszczalski y Bernard Galler en 1977. Con su conocimiento de la ingeniería de audio digital, estos investigadores creían que se podía programar un ordenador para analizar una grabación digital de música de forma que se pudieran detectar los tonos de las líneas melódicas y los patrones de acordes, junto con los acentos rítmicos de los instrumentos de percusión. La tarea de la transcripción automática de música implica dos actividades independientes: realizar un análisis de una pieza musical e imprimir una partitura a partir de ese análisis. [1]
No se trataba de un objetivo sencillo, pero sí que estimularía la investigación académica durante al menos otras tres décadas. Debido a la estrecha relación científica entre el habla y la música, gran parte de la investigación académica y comercial que se dirigía a la tecnología de reconocimiento de voz , que contaba con más recursos económicos , se reciclaría en investigación sobre la tecnología de reconocimiento de música. Aunque muchos músicos y educadores insisten en que hacer transcripciones manuales es un ejercicio valioso para el desarrollo de los músicos, la motivación para la transcripción automática de música sigue siendo la misma que la motivación para las partituras: los músicos que no tienen habilidades intuitivas de transcripción buscarán partituras o un diagrama de acordes, de modo que puedan aprender rápidamente a tocar una canción. Una colección de herramientas creadas por esta investigación en curso podría ser de gran ayuda para los músicos. Dado que gran parte de la música grabada no tiene partituras disponibles, un dispositivo de transcripción automática también podría ofrecer transcripciones que de otro modo no estarían disponibles en las partituras. Hasta la fecha, ninguna aplicación de software puede cumplir por completo la definición de transcripción automática de música de James Moorer. Sin embargo, la búsqueda de la transcripción automática de música ha generado la creación de muchas aplicaciones de software que pueden ayudar en la transcripción manual. Algunos pueden ralentizar la música manteniendo el tono y la octava originales, algunos pueden seguir el tono de las melodías, algunos pueden seguir los cambios de acordes y otros pueden seguir el ritmo de la música.
La transcripción automática consiste básicamente en identificar el tono y la duración de las notas interpretadas. Esto implica rastrear el tono e identificar el comienzo de las notas. Después de capturar esas medidas físicas, esta información se traduce en notación musical tradicional, es decir, en partituras.
El procesamiento de señales digitales es la rama de la ingeniería que proporciona a los ingenieros de software las herramientas y los algoritmos necesarios para analizar una grabación digital en términos de tono (detección de notas de instrumentos melódicos) y el contenido de energía de sonidos no afinados (detección de instrumentos de percusión). Las grabaciones musicales se muestrean a una velocidad de grabación determinada y sus datos de frecuencia se almacenan en cualquier formato de onda digital en la computadora. Dicho formato representa el sonido mediante muestreo digital .
La detección de tono es a menudo la detección de notas individuales que pueden formar una melodía en la música, o las notas de un acorde . Cuando se presiona una sola tecla en un piano, lo que oímos no es solo una frecuencia de vibración de sonido, sino una combinación de múltiples vibraciones de sonido que ocurren en diferentes frecuencias relacionadas matemáticamente. Los elementos de esta combinación de vibraciones en diferentes frecuencias se denominan armónicos o parciales.
Por ejemplo, si se toca la nota A 3 (220 Hz), las frecuencias individuales de la serie armónica del compuesto comenzarán en 220 Hz como frecuencia fundamental : 440 Hz sería el segundo armónico, 660 Hz sería el tercer armónico, 880 Hz sería el cuarto armónico, etc.) Estos son múltiplos enteros de la frecuencia fundamental (por ejemplo, dos veces 220 es 440, el segundo armónico). Si bien solo se necesitan realmente unos ocho armónicos para recrear audiblemente la nota, el número total de armónicos en esta serie matemática puede ser grande, aunque cuanto más alto sea el numeral del armónico, más débil será la magnitud y la contribución de ese armónico. [ cita requerida ] Contrariamente a la intuición, una grabación musical en su nivel físico más bajo no es una colección de notas individuales , sino que es realmente una colección de armónicos individuales. Es por eso que se pueden crear grabaciones con un sonido muy similar con diferentes colecciones de instrumentos y sus notas asignadas. Siempre que se recreen hasta cierto punto los armónicos totales de la grabación, en realidad no importa qué instrumentos o qué notas se utilizaron.
Un primer paso en la detección de notas es la transformación de los datos digitales del archivo de sonido del dominio del tiempo al dominio de la frecuencia , lo que permite la medición de varias frecuencias a lo largo del tiempo. La imagen gráfica de una grabación de audio en el dominio de la frecuencia se denomina espectrograma o sonograma. Una nota musical, como un compuesto de varios armónicos , aparece en un espectrograma como un peine colocado verticalmente , con los dientes individuales del peine representando los diversos armónicos y sus diferentes valores de frecuencia. Una transformada de Fourier es el procedimiento matemático que se utiliza para crear el espectrograma a partir de los datos digitales del archivo de sonido.
La tarea de muchos algoritmos de detección de notas consiste en buscar en el espectrograma la aparición de estos patrones de peine (una combinación de armónicos) causados por notas individuales. Una vez que se detecta el patrón de la forma de peine de armónicos particular de una nota, el tono de la nota se puede medir mediante la posición vertical del patrón de peine en el espectrograma .
Básicamente, existen dos tipos de música diferentes que generan demandas muy diferentes para un algoritmo de detección de tono : música monofónica y música polifónica . La música monofónica es un pasaje con un solo instrumento tocando una nota a la vez, mientras que la música polifónica puede tener múltiples instrumentos y voces tocando a la vez. La detección de tono en una grabación monofónica era una tarea relativamente simple, y su tecnología permitió la invención de los afinadores de guitarra en la década de 1970. Sin embargo, la detección de tono en música polifónica se convierte en una tarea mucho más difícil porque la imagen de su espectrograma ahora aparece como una nube vaga debido a una multitud de patrones de peine superpuestos, causados por los múltiples armónicos de cada nota .
Otro método de detección de tono fue inventado por Martin Piszczalski junto con Bernard Galler en la década de 1970 [2] y desde entonces ha sido ampliamente utilizado. [3] Se centra en la música monofónica. Un aspecto central de este método es cómo el oído humano determina el tono . [4] El proceso intenta imitar aproximadamente la biología del oído interno humano al encontrar solo unos pocos de los armónicos más fuertes en un instante dado. Ese pequeño conjunto de armónicos encontrados se compara a su vez con todos los conjuntos armónicos de tonos posibles resultantes, para plantear la hipótesis de cuál podría ser el tono más probable dado ese conjunto particular de armónicos.
Hasta la fecha, la detección completa de notas de grabaciones polifónicas sigue siendo un misterio para los ingenieros de audio, aunque continúan progresando inventando algoritmos que pueden detectar parcialmente algunas de las notas de una grabación polifónica, como una melodía o una línea de bajo.
El seguimiento del ritmo es la determinación de un intervalo de tiempo repetitivo entre los pulsos percibidos en la música. El ritmo también se puede describir como "golpear con el pie" o "dar palmas" al ritmo de la música. El ritmo suele ser una unidad básica predecible en el tiempo de la pieza musical y puede variar solo ligeramente durante la interpretación. Las canciones se miden con frecuencia por sus pulsaciones por minuto (BPM) para determinar el tempo de la música, ya sea rápido o lento.
Dado que las notas suelen comenzar con un pulso o con una simple subdivisión del intervalo de tiempo del pulso, el software de seguimiento de pulsos tiene el potencial de resolver mejor los inicios de notas que pueden haberse detectado de manera rudimentaria. El seguimiento de pulsos suele ser el primer paso en la detección de instrumentos de percusión.
A pesar de la naturaleza intuitiva del "golpeteo con el pie" del que son capaces la mayoría de los seres humanos, es difícil desarrollar un algoritmo para detectar esos ritmos. La mayoría de los algoritmos de software actuales para la detección de ritmos utilizan una hipótesis de competencia grupal para los pulsos por minuto, a medida que el algoritmo encuentra y resuelve progresivamente picos locales de volumen, que corresponden aproximadamente a los golpes con el pie de la música.
Para transcribir música automáticamente hay que resolver varios problemas:
1. Las notas deben reconocerse: esto se hace generalmente pasando del dominio del tiempo al dominio de la frecuencia. Esto se puede lograr mediante la transformada de Fourier . Los algoritmos informáticos para hacer esto son comunes. El algoritmo de transformada rápida de Fourier calcula el contenido de frecuencia de una señal y es útil para procesar fragmentos musicales.
2. Es necesario detectar el ritmo y el tempo ( detección de ritmo ): este es un problema difícil y con múltiples facetas. [5]
El método propuesto en Costantini et al. 2009 [6] se centra en los eventos de nota y sus características principales: el instante de ataque, el tono y el instante final. La detección del inicio aprovecha una representación binaria de tiempo-frecuencia de la señal de audio. La clasificación de notas y la detección del desplazamiento se basan en la transformada Q constante (CQT) y en máquinas de vectores de soporte (SVM).
Esto, a su vez, genera un “contorno de tono”, es decir, una línea que varía continuamente en el tiempo y que corresponde a lo que los humanos llamamos melodía. El siguiente paso es segmentar este flujo melódico continuo para identificar el principio y el final de cada nota. Después, cada “unidad de nota” se expresa en términos físicos (por ejemplo, 4402 Hz, 0,52 segundos). El paso final es luego representar esta información física en términos familiares de notación musical para cada nota (por ejemplo, un A4, una negra).
En términos de procesamiento informático real, los pasos principales son 1) digitalizar la música analógica interpretada, 2) realizar transformadas rápidas de Fourier (FFT) sucesivas de corto plazo para obtener los espectros que varían con el tiempo, 3) identificar los picos en cada espectro, 4) analizar los picos espectrales para obtener candidatos a tonos, 5) conectar los candidatos a tonos individuales más fuertes para obtener el contorno de tono más probable que varíe con el tiempo, 6) mapear estos datos físicos en los términos de notación musical más cercanos. Estos pasos fundamentales, originados por Piszczalski en la década de 1970, se convirtieron en la base de la transcripción automática de música. [2]
El paso más controvertido y difícil de este proceso es detectar el tono. [7] Los métodos de tono más exitosos operan en el dominio de la frecuencia, no en el dominio del tiempo. Si bien se han propuesto métodos en el dominio del tiempo, pueden fallar en el caso de instrumentos musicales del mundo real que se tocan en salas típicamente reverberantes.
El método de detección de tono inventado por Piszczalski [4] imita nuevamente la audición humana. De ello se desprende que solo ciertos conjuntos de parciales se “fusionan” en la audición humana. Estos son los conjuntos que crean la percepción de un solo tono. La fusión ocurre solo cuando dos parciales están dentro del 1,5 % de ser un par armónico perfecto (es decir, sus frecuencias se aproximan a un conjunto de pares de números enteros bajos como 1:2, 5:8, etc.). Esta coincidencia casi armónica es necesaria para que todos los parciales sean escuchados como un solo tono.
{{cite web}}
: Mantenimiento CS1: fecha y año ( enlace )