stringtranslate.com

Psicoacústica

La psicoacústica es la rama de la psicofísica que involucra el estudio científico de la percepción del sonido y la audiología : cómo el sistema auditivo humano percibe diversos sonidos. Más concretamente, es la rama de la ciencia que estudia las respuestas psicológicas asociadas al sonido (incluido el ruido , el habla y la música ). La psicoacústica es un campo interdisciplinario que incluye psicología, acústica , ingeniería electrónica, física, biología, fisiología e informática. [1]

Fondo

La audición no es un fenómeno puramente mecánico de propagación de ondas , sino que también es un acontecimiento sensorial y perceptivo; es decir, cuando una persona escucha algo, ese algo llega al oído como una onda sonora mecánica que viaja por el aire, pero dentro del oído se transforma en potenciales de acción neuronales . Las células ciliadas externas (OHC) de la cóclea de los mamíferos dan lugar a una mayor sensibilidad y una mejor [ se necesita aclaración ] resolución de frecuencia de la respuesta mecánica de la partición coclear. Estos pulsos nerviosos luego viajan al cerebro donde se perciben. Por lo tanto, en muchos problemas de acústica, como el procesamiento de audio , es ventajoso tener en cuenta no sólo la mecánica del entorno, sino también el hecho de que tanto el oído como el cerebro participan en la experiencia auditiva de una persona. [ se necesita aclaración ] [ se necesita cita ]

El oído interno , por ejemplo, realiza un procesamiento importante de señales al convertir formas de onda de sonido en estímulos neuronales, por lo que ciertas diferencias entre las formas de onda pueden ser imperceptibles. [2] Las técnicas de compresión de datos , como MP3 , aprovechan este hecho. [3] Además, el oído tiene una respuesta no lineal a sonidos de diferentes niveles de intensidad; esta respuesta no lineal se llama sonoridad . Las redes telefónicas y los sistemas de reducción de ruido de audio aprovechan este hecho comprimiendo de forma no lineal muestras de datos antes de la transmisión y luego expandiéndolas para su reproducción. [4] Otro efecto de la respuesta no lineal del oído es que los sonidos que tienen una frecuencia cercana producen notas de ritmo fantasma o productos de distorsión de intermodulación . [5]

El término psicoacústica también surge en discusiones sobre psicología cognitiva y los efectos que las expectativas, prejuicios y predisposiciones personales pueden tener en las evaluaciones y comparaciones relativas de la estética y agudeza sonora de los oyentes y en las diferentes determinaciones de los oyentes sobre las cualidades relativas de diversos instrumentos musicales y artistas intérpretes o ejecutantes. La expresión que uno "oye lo que quiere (o espera) escuchar" puede ser aplicable en tales discusiones. [ cita necesaria ]

Límites de la percepción

Un contorno de igual volumen . Tenga en cuenta la sensibilidad máxima entre 2 y 4 kHz, en el medio de la banda de frecuencia de la voz .

El oído humano nominalmente puede escuchar sonidos en el rango de 20 Hz (0,02 kHz) a 20.000 Hz (20 kHz). El límite superior tiende a disminuir con la edad; la mayoría de los adultos no pueden oír por encima de los 16 kHz. La frecuencia más baja que se ha identificado como tono musical es de 12 Hz en condiciones ideales de laboratorio. [6] Los tonos entre 4 y 16 Hz se pueden percibir a través del sentido del tacto del cuerpo .

La percepción humana de la separación temporal de las señales de audio se ha medido en menos de 10 microsegundos. Esto no significa que las frecuencias superiores a 100 kHz sean audibles, sino que la discriminación temporal no está directamente relacionada con el rango de frecuencia. [7] [8]

La resolución de frecuencia del oído es de aproximadamente 3,6 Hz dentro de la octava de 1000 a 2000 Hz. Es decir, en un entorno clínico se pueden percibir cambios en el tono superiores a 3,6 Hz. [6] Sin embargo, diferencias de tono aún más pequeñas pueden percibirse por otros medios. Por ejemplo, la interferencia de dos tonos a menudo puede escucharse como una variación repetitiva en el volumen del tono. Esta modulación de amplitud se produce con una frecuencia igual a la diferencia de frecuencias de los dos tonos y se conoce como latido .

La escala de semitonos utilizada en la notación musical occidental no es una escala de frecuencia lineal sino logarítmica . Otras escalas se han derivado directamente de experimentos sobre la percepción auditiva humana, como la escala mel y la escala Bark (se utilizan para estudiar la percepción, pero normalmente no en la composición musical), y tienen una frecuencia aproximadamente logarítmica en el extremo de alta frecuencia. , pero casi lineal en el extremo de baja frecuencia.

El rango de intensidad de los sonidos audibles es enorme. Los tímpanos humanos son sensibles a las variaciones en la presión del sonido y pueden detectar cambios de presión desde tan solo unos pocos micropascales (μPa) hasta más de 100 kPa . Por esta razón, el nivel de presión sonora también se mide de forma logarítmica, con todas las presiones referidas a 20 μPa (o 1,97385 × 10 −10 atm ). Por tanto, el límite inferior de audibilidad se define como 0 dB , pero el límite superior no está tan claramente definido. El límite superior es más una cuestión del límite en el que el oído sufrirá daños físicos o tendrá el potencial de causar pérdida auditiva inducida por el ruido .

Una exploración más rigurosa de los límites inferiores de audibilidad determina que el umbral mínimo en el que se puede oír un sonido depende de la frecuencia. Al medir esta intensidad mínima para probar tonos de varias frecuencias, se puede derivar una curva de umbral absoluto de audición (ATH) dependiente de la frecuencia. Normalmente, el oído muestra un pico de sensibilidad (es decir, su ATH más bajo) entre 1 y 5 kHz, aunque el umbral cambia con la edad, y los oídos más viejos muestran una sensibilidad disminuida por encima de 2 kHz. [9]

El ATH es el más bajo de los contornos de igual volumen . Los contornos de igual volumen indican el nivel de presión sonora (dB SPL), en el rango de frecuencias audibles, que se perciben como de igual volumen. Fletcher y Munson midieron por primera vez los contornos de igual volumen en los Laboratorios Bell en 1933 utilizando tonos puros reproducidos a través de auriculares, y los datos que recopilaron se denominan curvas de Fletcher-Munson . Debido a que el volumen subjetivo era difícil de medir, se promediaron las curvas de Fletcher-Munson en muchos sujetos.

Robinson y Dadson refinaron el proceso en 1956 para obtener un nuevo conjunto de curvas de igual volumen para una fuente de sonido frontal medida en una cámara anecoica . Las curvas de Robinson-Dadson se estandarizaron como ISO 226 en 1986. En 2003, ISO 226 se revisó como contorno de igual volumen utilizando datos recopilados de 12 estudios internacionales.

Localización de sonido

La localización del sonido es el proceso de determinar la ubicación de una fuente de sonido. El cerebro utiliza diferencias sutiles en el volumen, el tono y la sincronización entre los dos oídos para permitirnos localizar las fuentes de sonido. [10] La localización se puede describir en términos de posición tridimensional: el acimut o ángulo horizontal, el cenit o ángulo vertical y la distancia (para sonidos estáticos) o velocidad (para sonidos en movimiento). [11] Los humanos, como la mayoría de los animales de cuatro patas , son expertos en detectar la dirección en dirección horizontal, pero menos en dirección vertical debido a que las orejas están colocadas simétricamente. Algunas especies de búhos tienen las orejas colocadas de forma asimétrica y pueden detectar sonidos en los tres planos, una adaptación para cazar pequeños mamíferos en la oscuridad. [12]

Efectos de enmascaramiento

Gráfico de enmascaramiento de audio

Supongamos que un oyente puede oír una determinada señal acústica en condiciones de silencio. Cuando se reproduce una señal mientras se reproduce otro sonido (un enmascarador), la señal debe ser más fuerte para que el oyente la escuche. No es necesario que el enmascarador tenga los componentes de frecuencia de la señal original para que se produzca el enmascaramiento. Se puede escuchar una señal enmascarada aunque sea más débil que el enmascarador. El enmascaramiento ocurre cuando una señal y un enmascarador se reproducen juntos (por ejemplo, cuando una persona susurra mientras otra grita) y el oyente no escucha la señal más débil porque ha sido enmascarada por el enmascarador más fuerte. El enmascaramiento también puede ocurrir con una señal antes de que comience un enmascarador o después de que se detenga. Por ejemplo, un solo aplauso fuerte y repentino puede hacer que los sonidos que preceden o siguen inmediatamente sean inaudibles. Los efectos del enmascaramiento hacia atrás son más débiles que los del enmascaramiento hacia adelante. El efecto de enmascaramiento ha sido ampliamente estudiado en la investigación psicoacústica. Se puede cambiar el nivel del enmascarador y medir el umbral, luego crear un diagrama de una curva de sintonización psicofísica que revelará características similares. Los efectos de enmascaramiento también se utilizan en la codificación de audio con pérdida, como MP3 .

Falta fundamental

Cuando se les presenta una serie armónica de frecuencias en la relación 2 f , 3 f , 4 f , 5 f , etc. (donde f es una frecuencia específica), los humanos tienden a percibir que el tono es f . Se puede encontrar un ejemplo audible en YouTube. [13]

Software

La codificación de audio perceptual utiliza algoritmos basados ​​en psicoacústica.

El modelo psicoacústico proporciona una compresión de señal con pérdidas de alta calidad al describir qué partes de una señal de audio digital determinada se pueden eliminar (o comprimir agresivamente) de forma segura, es decir, sin pérdidas significativas en la calidad del sonido percibida (conscientemente).

Puede explicar cómo un fuerte aplauso puede parecer dolorosamente fuerte en una biblioteca tranquila, pero apenas se nota después de que un automóvil fracasa en una calle urbana concurrida. Esto proporciona un gran beneficio a la relación de compresión general, y el análisis psicoacústico conduce habitualmente a archivos de música comprimidos que tienen entre una décima y una doceava parte del tamaño de los masters de alta calidad, pero con una pérdida de calidad proporcional perceptiblemente menor. Esta compresión es una característica de casi todos los formatos modernos de compresión de audio con pérdida. Algunos de estos formatos incluyen Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (utilizado para la transmisión de audio digital en varios países) y ATRAC , la compresión utilizada en MiniDisc y algunos Modelos de walkman .

La psicoacústica se basa en gran medida en la anatomía humana , especialmente en las limitaciones del oído para percibir el sonido, como se describió anteriormente. En resumen, estas limitaciones son:

Un algoritmo de compresión puede asignar una prioridad más baja a los sonidos fuera del alcance del oído humano. Al alejar cuidadosamente los bits de los componentes sin importancia y acercarlos a los importantes, el algoritmo garantiza que los sonidos que un oyente tiene más probabilidades de percibir estén representados con mayor precisión.

Música

La psicoacústica incluye temas y estudios que son relevantes para la psicología musical y la musicoterapia . Teóricos como Benjamin Boretz consideran que algunos de los resultados de la psicoacústica sólo tienen significado en un contexto musical. [14]

Los LP de la serie Environments de Irv Teibel (1969-1979) son un ejemplo temprano de sonidos disponibles comercialmente lanzados expresamente para mejorar las habilidades psicológicas. [15]

Psicoacústica aplicada

Modelo psicoacústico

La psicoacústica ha disfrutado durante mucho tiempo de una relación simbiótica con la informática . Los pioneros de Internet JCR Licklider y Bob Taylor completaron trabajos de posgrado en psicoacústica, mientras que BBN Technologies se especializó originalmente en consultoría sobre cuestiones acústicas antes de comenzar a construir la primera red de conmutación de paquetes .

Licklider escribió un artículo titulado "Una teoría dúplex de la percepción del tono". [dieciséis]

La psicoacústica se aplica en muchos campos del desarrollo de software, donde los desarrolladores mapean patrones matemáticos probados y experimentales en el procesamiento de señales digitales. Muchos códecs de compresión de audio, como MP3 y Opus, utilizan un modelo psicoacústico para aumentar las relaciones de compresión. El éxito de los sistemas de audio convencionales para la reproducción de música en teatros y hogares se puede atribuir a la psicoacústica [17] y las consideraciones psicoacústicas dieron lugar a nuevos sistemas de audio, como la síntesis de campo sonoro psicoacústico . [18] Además, los científicos han experimentado con éxito limitado en la creación de nuevas armas acústicas, que emiten frecuencias que pueden perjudicar, dañar o matar. [19] La psicoacústica también se aprovecha en la sonificación para hacer que múltiples dimensiones de datos independientes sean audibles y fácilmente interpretables. [20] Esto permite la guía auditiva sin la necesidad de audio espacial y en juegos de computadora con sonificación [21] y otras aplicaciones, como el vuelo de drones y la cirugía guiada por imágenes . [22] También se aplica hoy en día en la música, donde los músicos y artistas continúan creando nuevas experiencias auditivas enmascarando frecuencias no deseadas de instrumentos, lo que hace que otras frecuencias se mejoren. Otra aplicación más es el diseño de altavoces pequeños o de menor calidad, que pueden utilizar el fenómeno de la falta de fundamentos para dar el efecto de notas graves en frecuencias más bajas que las que los altavoces son físicamente capaces de producir (ver referencias).

Los fabricantes de automóviles diseñan sus motores e incluso sus puertas para que tengan un sonido determinado. [23]

Ver también

Campos relacionados

Temas psicoacústicos

Referencias

Notas

  1. ^ Ballou, G (2008). Manual para ingenieros de sonido (Cuarta ed.). Burlington: Prensa focal. pag. 43.
  2. ^ Christopher J. Plack (2005). El sentido del oído. Rutledge. ISBN 978-0-8058-4884-7.
  3. ^ Lars Ahlzen; Canción de Clarence (2003). ¡El Sound Blaster en vivo! Libro. Sin prensa de almidón. ISBN 978-1-886411-73-9.
  4. ^ Rudolf F. Graf (1999). Diccionario moderno de electrónica. Newnes. ISBN 978-0-7506-9866-5.
  5. ^ Jack Katz; Robert F. Burkard y Larry Medwetsky (2002). Manual de audiología clínica. Lippincott Williams y Wilkins. ISBN 978-0-683-30765-8.
  6. ^ ab Olson, Harry F. (1967). Música, Física e Ingeniería. Publicaciones de Dover. págs. 248-251. ISBN 978-0-486-21769-7.
  7. ^ Kuncher, Milind (agosto de 2007). "Audibilidad de la mancha temporal y desalineación temporal de las señales acústicas" (PDF) . boson.physics.sc.edu . Archivado (PDF) desde el original el 14 de julio de 2014.
  8. ^ Robjohns, Hugh (agosto de 2016). "Precisión en el dominio del tiempo MQA y calidad de audio digital". soundonsound.com . Sonido sobre sonido. Archivado desde el original el 10 de marzo de 2023.
  9. ^ Fastl, Hugo; Zwicker, Eberhard (2006). Psicoacústica: hechos y modelos . Saltador. págs. 21-22. ISBN 978-3-540-23159-2.
  10. ^ Thompson, Daniel M. Comprensión del audio: cómo aprovechar al máximo su proyecto o estudio de grabación profesional. Boston, MA: Berklee, 2005. Imprimir.
  11. ^ Carreteras, Curtis. El tutorial de música por computadora. Cambridge, MA: MIT, 2007. Imprimir.
  12. ^ Lewis, DP (2007): Orejas y audición de búho. Páginas de búhos [en línea]. Disponible: http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011, 5 de abril]
  13. ^ Acústica, Musical. "Fundamental faltante". YouTube . Archivado desde el original el 20 de diciembre de 2021 . Consultado el 19 de agosto de 2019 .
  14. ^ Sterne, Jonathan (2003). El pasado audible: orígenes culturales de la reproducción del sonido. Durham: Prensa de la Universidad de Duke. ISBN 9780822330134.
  15. ^ Cummings, Jim. "Irv Teibel murió esta semana: creador de los LP" Environments "de los años 70". Oído de la Tierra . Consultado el 18 de noviembre de 2015 .
  16. ^ Licklider, JCR (enero de 1951). "Una teoría dúplex de la percepción del tono" (PDF) . La Revista de la Sociedad de Acústica de América . 23 (1): 147. Código bibliográfico : 1951ASAJ...23..147L. doi : 10.1121/1.1917296 . Archivado (PDF) desde el original el 2 de septiembre de 2016.
  17. ^ Ziemer, Tim (2020). "Sonido estereofónico convencional". Síntesis del campo sonoro de la música psicoacústica . Investigaciones actuales en Musicología Sistemática. vol. 7. Cham: Springer. págs. 171-202. doi :10.1007/978-3-030-23033-3_7. ISBN 978-3-030-23033-3. S2CID  201142606.
  18. ^ Ziemer, Tim (2020). Síntesis del campo sonoro de la música psicoacústica . Investigaciones actuales en Musicología Sistemática. vol. 7. Cham: Springer. doi :10.1007/978-3-030-23033-3. ISBN 978-3-030-23032-6. ISSN  2196-6974. S2CID  201136171.
  19. ^ "La investigación sobre energía acústica alcanza una nota amarga". Archivado desde el original el 19 de julio de 2010 . Consultado el 6 de febrero de 2010 .
  20. ^ Ziemer, Tim; Schultheis, Holger; Negro, David; Kikinis, Ron (2018). "Sonificación interactiva psicoacústica para navegación de corto alcance". Acta Acustica Unidos con Acustica . 104 (6): 1075-1093. doi :10.3813/AAA.919273. S2CID  125466508.
  21. ^ CURADO. "Juegos y Entrenamiento para Cirugía Mínimamente Invasiva". CURAT . Universidad de Bremen . Consultado el 15 de julio de 2020 .
  22. ^ Ziemer, Tim; Nuchprayoon, Nuttawut; Schultheis, Holger (2019). "Sonificación psicoacústica como interfaz de usuario para la interacción hombre-máquina". Revista Internacional de la Sociedad de Informática . 12 (1). arXiv : 1912.08609 . doi :10.13140/RG.2.2.14342.11848.
  23. ^ Tarmy, James (5 de agosto de 2014). "Las puertas de Mercedes tienen un sonido característico: así es como se hace". Negocio Bloomberg . Consultado el 10 de agosto de 2020 .

Fuentes

enlaces externos