característica de croma

(a) Partitura musical de escala de do mayor. (b) Cromagrama obtenido de la partitura. (c) Grabación de audio de la escala de Do mayor tocada en un piano. (d) Cromagrama obtenido de la grabación de audio.

En la música occidental , el término característica cromática o cromagrama se relaciona estrechamente con doce clases de tono diferentes . Las características basadas en croma, que también se conocen como " perfiles de clase de tono ", son una poderosa herramienta para analizar música cuyos tonos se pueden categorizar de manera significativa (a menudo en doce categorías) y cuya afinación se aproxima a la escala de temperamento igual . Una propiedad principal de las características cromáticas es que capturan las características armónicas y melódicas de la música, al mismo tiempo que son resistentes a los cambios de timbre e instrumentación.

Definición

La observación subyacente es que los humanos perciben dos tonos musicales como similares en color si difieren en una octava. Con base en esta observación, un tono se puede separar en dos componentes, a los que se hace referencia como altura del tono y croma . ^[1] Asumiendo la escala de temperamento igual , se consideran doce valores cromáticos representados por el conjunto.

{C, C ♯ , D, D ♯ , E, F, F ♯ , G, G ♯ , A, A ♯ , B}

que consta de los doce atributos ortográficos de tono utilizados en la notación musical occidental. Tenga en cuenta que en la escala de temperamento igual, diferentes grafías de tono, como C ♯ y D ♭, se refieren al mismo croma. Al enumerar los valores de croma, se puede identificar el conjunto de valores de croma con el conjunto de números enteros {1,2,...,12}, donde 1 se refiere al croma C, 2 a C ♯ , etc. Una clase de tono se define como el conjunto de todos los tonos que comparten el mismo croma. Por ejemplo, usando la notación científica de tono , la clase de tono correspondiente al croma C es el conjunto

{..., C ₋₂ , C ₋₁ , C ₀ , C ₁ , C ₂ , C ₃ ...}

que consta de todos los tonos separados por un número entero de octavas. Dada una representación musical (por ejemplo, una partitura musical o una grabación de audio), la idea principal de las características cromáticas es agregar, para una ventana de tiempo local dada (por ejemplo, especificada en tiempos o en segundos), toda la información que se relaciona con un croma determinado en una única coeficiente. Cambiar la ventana de tiempo a lo largo de la representación musical da como resultado una secuencia de características cromáticas, cada una de las cuales expresa cómo el contenido del tono de la representación dentro de la ventana de tiempo se distribuye en las doce bandas cromáticas. La representación cromática temporal resultante también se denomina cromagrama . La figura de arriba muestra cromagramas para una escala de do mayor, una vez obtenidos de una partitura musical y otra de una grabación de audio. Debido a la estrecha relación entre los términos croma y clase de tono, las características de croma también se denominan perfiles de clase de tono .

Aplicaciones

Al identificar tonos que difieren en una octava, las características cromáticas muestran un alto grado de solidez ante las variaciones de timbre y se correlacionan estrechamente con el aspecto musical de la armonía. Ésta es la razón por la que las funciones cromáticas son una herramienta bien establecida para procesar y analizar datos musicales. ^[2] Por ejemplo, básicamente todo procedimiento de reconocimiento de acordes se basa en algún tipo de representación cromática. ^[3]^[4]^[5]^[6] Además, las funciones cromáticas se han convertido en el estándar de facto para tareas como la alineación y sincronización de música ^[7]^[8], así como el análisis de la estructura de audio. ^[9] Finalmente, las funciones cromáticas han resultado ser una poderosa representación de funciones de nivel medio en la recuperación de audio basada en contenido, como la identificación de versiones de canciones, ^[10]^[11] coincidencia de audio ^[12]^[13]^[14]^{[15 ]} o hash de audio. ^[16]^[17]

Computación de cromagramas de audio.

Hay muchas formas de convertir una grabación de audio en un cromagrama. Por ejemplo, la conversión de una grabación de audio en una representación cromática (o cromagrama) se puede realizar utilizando transformadas de Fourier de corta duración en combinación con estrategias de agrupamiento ^[18]^[19]^[20] o empleando bancos de filtros multivelocidad adecuados. ^[12] Además, las propiedades de las características cromáticas se pueden cambiar significativamente introduciendo pasos de pre y post procesamiento adecuados que modifiquen los aspectos espectrales, temporales y dinámicos. Esto conduce a una gran cantidad de variantes cromáticas, que pueden mostrar un comportamiento bastante diferente en el contexto de un escenario de análisis musical específico. ^[21]

Ver también

Referencias

^ Shepard, Roger N. (1964). "Circularidad en juicios de tono relativo". Revista de la Sociedad de Acústica de América . 36 (212): 2346–2353. Código bibliográfico : 1964ASAJ...36.2346S. doi :10.1121/1.1919362.
^ Müller, Meinard (2015). Fundamentos del procesamiento musical. Saltador. doi :10.1007/978-3-319-21945-5. ISBN 978-3-319-21944-8. S2CID 8691186.
^ Cho, Taemin; Bello, Juan Pablo (2014). "Sobre la importancia relativa de los componentes individuales de los sistemas de reconocimiento de acordes". Transacciones IEEE/ACM sobre procesamiento de audio, voz y lenguaje . 22 (2): 477–4920. doi :10.1109/TASLP.2013.2295926. S2CID 16434636.
^ Mauch, Matías; Dixon, Simón (2010). "Estimación simultánea de acordes y contexto musical a partir de audio". Transacciones IEEE sobre procesamiento de audio, voz y lenguaje . 18 (6): 138-153. CiteSeerX 10.1.1.414.7800 . doi :10.1109/TASL.2009.2032947. S2CID 15866073.
^ Fujishima, Takuya (1999). "Reconocimiento de acordes en tiempo real de sonido musical: un sistema que utiliza música Lisp común". Actas de la Conferencia Internacional de Música por Computadora : 464–467.
^ Jiang, Nanzhu; Grosche, Peter; Konz, Verena; Müller, Meinard (2011). "Análisis de tipos de funciones cromáticas para el reconocimiento automatizado de acordes" (PDF) . Actas de la Conferencia AES sobre audio semántico .
^ Hu, Ning; Dannenberg, Roger B.; Tzanetakis, George (2003). "Coincidencia y alineación de audio polifónico para la recuperación de música". Actas del taller IEEE sobre aplicaciones del procesamiento de señales al audio y la acústica .
^ Ewert, Sebastián; Müller, Meinard; Grosche, Peter (2009). "Sincronización de audio de alta resolución mediante funciones de inicio de croma" (PDF) . Conferencia internacional IEEE 2009 sobre acústica, habla y procesamiento de señales . págs. 1869–1872. doi :10.1109/ICASSP.2009.4959972. ISBN 978-1-4244-2353-8. S2CID 16952895.
^ Paulus, Jouni; Müller, Meinard; Klapuri, Ansi (2010). "Análisis de la estructura musical basado en audio" (PDF) . Actas de la Conferencia Internacional sobre Recuperación de Información Musical : 625–636.
^ Ellis, Daniel PW; Poliner, Graham (2007). "Identificación de 'canciones de portada' con funciones cromáticas y seguimiento de ritmos de programación dinámica". Actas de la Conferencia Internacional IEEE sobre Acústica, Habla y Procesamiento de Señales .
^ Serrá, Joan; Gómez, Emilia; Herrera, Perfecto; Serra, Xavier (2008). "Similitud binaria cromática y alineación local aplicadas a la identificación de canciones de portada". Transacciones IEEE sobre procesamiento de audio, voz y lenguaje . 16 (6): 1138-1151. doi :10.1109/TASL.2008.924595. hdl : 10230/16277 . S2CID 10078274.
^ ab Müller, Meinard; Kurth, Frank; Clausen, Michael (2005). "Coincidencia de audio mediante funciones estadísticas basadas en croma" (PDF) . Actas de la Conferencia Internacional sobre Recuperación de Información Musical : 288–295.
^ Kurth, Frank; Müller, Meinard (2008). "Coincidencia de audio eficiente basada en índices". Transacciones IEEE sobre procesamiento de audio, voz y lenguaje . 16 (2): 382–395. doi :10.1109/TASL.2007.911552. S2CID 206601781.
^ Müller, Meinard (2015). Sincronización de música. En Fundamentos del procesamiento musical, capítulo 3, páginas 115-166. Saltador. ISBN 978-3-319-21944-8.
^ Kurth, Frank; Müller, Meinard (2008). "Coincidencia de audio eficiente basada en índices". Transacciones IEEE sobre procesamiento de audio, voz y lenguaje . 16 (2): 382–395. doi :10.1109/TASL.2007.911552. S2CID 206601781.
^ Yu, Yi; Crucianu, Michel; Oria, Vicente; Damiani, Ernesto (2010). "Combinación de LSH basado en histograma de sondas múltiples y estadísticas de pedidos para la recuperación escalable de contenido de audio". Actas de la conferencia internacional sobre Multimedia - MM '10 . Actas de la 18.ª Conferencia Internacional sobre Multimedia 2010. págs. 381–390. doi :10.1145/1873951.1874004. ISBN 9781605589336. S2CID 9033525.
^ Yu, Yi; Crucianu, Michel; Oria, Vicente; Chen, Lei (2009). "Resumen local y LSH multinivel para recuperar pistas de audio multivariantes". Actas de la decimoséptima conferencia internacional ACM sobre Multimedia - MM '09 . Actas de la 17ª Conferencia Internacional sobre Multimedia 2009. págs. 341–350. doi :10.1145/1631272.1631320. ISBN 9781605586083. S2CID 816862.
^ Bartsch, Mark A.; Wakefield, Gregory H. (2005). "Miniaturas de audio de música popular utilizando representaciones basadas en croma". Transacciones IEEE en multimedia . 7 (1): 96-104. CiteSeerX 10.1.1.379.3293 . doi :10.1109/TMM.2004.840597. S2CID 12559221.
^ Gómez, Emilia (2006). "Descripción tonal de las señales de audio musical". Tesis Doctoral, UPF Barcelona, España .
^ Müller, Meinard (2015). Sincronización de música. En Fundamentos del procesamiento musical, capítulo 3, páginas 115-166. Saltador. ISBN 978-3-319-21944-8.
^ Müller, Meinard; Ewert, Sebastián (2011). "Chroma Toolbox: implementaciones de MATLAB para extraer variantes de funciones de audio basadas en Chroma" (PDF) . Actas de la Conferencia de la Sociedad Internacional para la Recuperación de Información Musical : 215–220.

enlaces externos

Chroma Toolbox Implementaciones gratuitas de MATLAB de varios tipos de croma de funciones de audio basadas en tono y croma
Complemento de perfil de clase de tono armónico