stringtranslate.com

Banda critica

En audiología y psicoacústica , el concepto de bandas críticas , introducido por Harvey Fletcher en 1933 [1] y refinado en 1940, [2] describe el ancho de banda de frecuencia del "filtro auditivo" creado por la cóclea , el órgano sensorial de la audición dentro del oído interno . A grandes rasgos, la banda crítica es la banda de frecuencias de audio dentro de la cual un segundo tono interferirá con la percepción del primer tono por enmascaramiento auditivo .

Psicofisiológicamente , las sensaciones de golpes y aspereza auditiva pueden estar relacionadas con la incapacidad del mecanismo de análisis de frecuencia auditiva para resolver entradas cuya diferencia de frecuencia es menor que el ancho de banda crítico y con el "cosquilleo" irregular resultante [3] del sistema mecánico ( membrana basilar ) que resuena en respuesta a dichas entradas. Las bandas críticas también están estrechamente relacionadas con los fenómenos de enmascaramiento auditivo : audibilidad reducida de una señal de sonido cuando está en presencia de una segunda señal de mayor intensidad dentro de la misma banda crítica. Los fenómenos de enmascaramiento tienen amplias implicaciones, que van desde una relación compleja entre la sonoridad (marco de referencia perceptivo) y la intensidad (marco de referencia físico) hasta los algoritmos de compresión de sonido .

Filtros auditivos

Los filtros se utilizan en muchos aspectos de la audiología y la psicoacústica , incluido el sistema auditivo periférico. Un filtro es un dispositivo que potencia ciertas frecuencias y atenúa otras. En particular, un filtro de paso de banda permite el paso de una gama de frecuencias dentro del ancho de banda, mientras que detiene aquellas que están fuera de las frecuencias de corte. [4]

Un filtro de paso de banda que muestra la frecuencia central (Fc), las frecuencias de corte inferior (F1) y superior (F2) y el ancho de banda. Las frecuencias de corte superior e inferior se definen como el punto en el que la amplitud cae 3 dB por debajo de la amplitud máxima. El ancho de banda es la distancia entre las frecuencias de corte superior e inferior y es el rango de frecuencias que pasa por el filtro.

La forma y organización de la membrana basilar hace que diferentes frecuencias resuenen con especial fuerza en diferentes puntos a lo largo de la membrana. Esto conduce a una organización tonotópica de la sensibilidad a los rangos de frecuencia a lo largo de la membrana, que puede modelarse como una matriz de filtros de paso de banda superpuestos conocidos como "filtros auditivos". [5] Los filtros auditivos están asociados con puntos a lo largo de la membrana basilar y determinan la selectividad de frecuencia de la cóclea y, por lo tanto, la discriminación del oyente entre diferentes sonidos. [4] [6] No son lineales, dependen del nivel y el ancho de banda disminuye desde la base hasta el ápice de la cóclea a medida que la sintonización en la membrana basilar cambia de alta a baja frecuencia. [4] [6] [7] El ancho de banda del filtro auditivo se llama ancho de banda crítico, como lo sugirió por primera vez Fletcher (1940). Si una señal y un enmascarador se presentan simultáneamente, entonces solo las frecuencias del enmascarador que caen dentro del ancho de banda crítico contribuyen al enmascaramiento de la señal. Cuanto mayor sea el ancho de banda crítico, menor será la relación señal/ruido (SNR) y más se enmascarará la señal.

ERB en relación con la frecuencia central. El diagrama muestra el ERB en función de la frecuencia central según la fórmula de Glasberg y Moore. [6]

Otro concepto asociado con el filtro auditivo es el ancho de banda rectangular equivalente (ERB). El ERB muestra la relación entre el filtro auditivo, la frecuencia y el ancho de banda crítico. Un ERB pasa la misma cantidad de energía que el filtro auditivo al que corresponde y muestra cómo cambia con la frecuencia de entrada. [4] [6] A niveles de sonido bajos, el ERB se aproxima mediante la siguiente ecuación según Glasberg y Moore: [6]

ERB(f) = 24,7 * (4,37 f/1000 + 1),

donde ERB está en Hz y f es la frecuencia central en Hz.

Se cree que cada ERB equivale a unos 0,9 mm en la membrana basilar. [6] [7] El ERB se puede convertir en una escala que se relaciona con la frecuencia y muestra la posición del filtro auditivo a lo largo de la membrana basilar. Por ejemplo, un número ERB de 3,36 corresponde a una frecuencia en el extremo apical de la membrana basilar, mientras que un número ERB de 38,9 corresponde a la base y un valor de 19,5 se encuentra a medio camino entre los dos. [6]

Un tipo de filtro utilizado para modelar los filtros auditivos es el filtro gammatone . Proporciona un filtro lineal simple , que por lo tanto es fácil de implementar, pero no puede explicar por sí mismo los aspectos no lineales del sistema auditivo; sin embargo, se utiliza en una variedad de modelos del sistema auditivo . Las variaciones y mejoras del modelo gammatone de filtrado auditivo incluyen el filtro gammachirp, los filtros gammatone de todos los polos y de un cero, el filtro gammatone de dos lados y los modelos de cascada de filtros, y varias versiones dependientes del nivel y dinámicamente no lineales de estos. [8]

Curvas de afinación psicoacústica

Las formas de los filtros auditivos se encuentran mediante el análisis de la sintonización psicoacústica, que son gráficos que muestran el umbral de un sujeto para la detección de un tono en función de los parámetros del enmascarador. [9]

Las curvas de sintonización psicoacústica se pueden medir utilizando el método de ruido con muesca. Esta forma de medición puede llevar una cantidad considerable de tiempo y puede llevar alrededor de 30 minutos encontrar cada umbral enmascarado. [10] En el método de ruido con muesca, al sujeto se le presenta un ruido con muesca como enmascarador y una sinusoide (tono puro) como señal. El ruido con muesca se utiliza como enmascarador para evitar que el sujeto escuche los latidos que se producen si se utiliza un enmascarador sinusoidal. [7] El ruido con muesca es un ruido con una muesca alrededor de la frecuencia de la señal que el sujeto está tratando de detectar, y contiene ruido dentro de un cierto ancho de banda. El ancho de banda del ruido cambia y se miden los umbrales enmascarados para la sinusoide. Los umbrales enmascarados se calculan a través del enmascaramiento simultáneo cuando la señal se reproduce al sujeto al mismo tiempo que el enmascarador y no después.

Para obtener una representación verdadera de los filtros auditivos en un sujeto, se deben calcular muchas curvas de ajuste psicoacústico con la señal a diferentes frecuencias. Para cada curva de ajuste psicoacústico que se mide, se deben calcular al menos cinco, pero preferiblemente entre trece y quince umbrales, con diferentes anchos de muesca. [10] También se debe calcular una gran cantidad de umbrales porque los filtros auditivos son asimétricos, por lo que los umbrales también se deben medir con la muesca asimétrica a la frecuencia de la señal. [9] Debido a las muchas mediciones necesarias, la cantidad de tiempo necesaria para encontrar la forma de los filtros auditivos de una persona es muy larga. Para reducir la cantidad de tiempo necesario, se puede utilizar el método ascendente para encontrar los umbrales enmascarados. Si se utiliza el método ascendente para calcular el umbral, el tiempo necesario para calcular la forma del filtro se reduce drásticamente, ya que se necesitan alrededor de dos minutos para calcular el umbral. [10] Esto se debe a que el umbral se registra cuando el sujeto escucha el tono por primera vez, en lugar de cuando responde a un cierto nivel de estímulo un cierto porcentaje del tiempo.

Anatomía y fisiología de la membrana basilar

El oído humano se compone de tres zonas: el oído externo, el medio y el interno. Dentro del oído interno se encuentra la cóclea . La cóclea es una formación con forma de caracol que permite la transmisión del sonido a través de una vía neurosensorial, en lugar de a través de una vía conductora. [11] La cóclea es una estructura compleja, que consta de tres capas de líquido. La rampa vestibular y la rampa media están separadas por la membrana de Reissner, mientras que la rampa media y la rampa timpánica están divididas por la membrana basilar. [11] El diagrama siguiente ilustra la compleja disposición de los compartimentos y sus divisiones: [4]

Sección transversal de la cóclea, que muestra los diferentes compartimentos (como se describe arriba)

La membrana basilar se ensancha a medida que avanza desde la base hasta el ápice. Por lo tanto, la base (la parte más delgada) tiene una mayor rigidez que el ápice. [4] Esto significa que la amplitud de una onda sonora que viaja a través de la membrana basilar varía a medida que viaja a través de la cóclea. [11] Cuando una vibración se transmite a través de la cóclea, el fluido dentro de los tres compartimentos hace que la membrana basilar responda de manera ondulatoria. Esta onda se conoce como "onda viajera"; este término significa que la membrana basilar no vibra simplemente como una unidad desde la base hacia el ápice.

Cuando se presenta un sonido al oído humano, el tiempo que tarda la onda en viajar a través de la cóclea es de solo 5 milisegundos. [11]

Cuando las ondas de baja frecuencia pasan a través de la cóclea, la onda aumenta gradualmente en amplitud y luego decae casi inmediatamente. La ubicación de la vibración en la cóclea depende de la frecuencia de los estímulos presentados. Por ejemplo, las frecuencias más bajas estimulan principalmente el ápice, en comparación con las frecuencias más altas, que estimulan la base de la cóclea. Esta característica de la fisiología de la membrana basilar se puede ilustrar en forma de un mapa de lugar-frecuencia: [12]

Esquema simplificado de la membrana basilar, que muestra el cambio en la frecuencia característica desde la base hasta el ápice.

La membrana basilar sostiene el órgano de Corti , que se encuentra dentro de la rampa media. [4] El órgano de Corti está compuesto por células pilosas internas y externas. Hay aproximadamente entre 15.000 y 16.000 de estas células pilosas en un oído. [11] Las células pilosas externas tienen estereocilios que se proyectan hacia la membrana tectorial, que se encuentra por encima del órgano de Corti. Los estereocilios responden al movimiento de la membrana tectorial cuando un sonido provoca vibración a través de la cóclea. Cuando esto ocurre, los estereocilios se separan y se forma un canal que permite que se lleven a cabo los procesos químicos. Finalmente, la señal llega al octavo nervio, seguido de su procesamiento en el cerebro. [11]

Relación con el enmascaramiento

Los filtros auditivos están estrechamente relacionados con el enmascaramiento en la forma en que se miden y también en la forma en que funcionan en el sistema auditivo. Como se describió anteriormente, el ancho de banda crítico del filtro aumenta de tamaño con el aumento de la frecuencia, junto con esto, el filtro se vuelve más asimétrico con el aumento del nivel.

Asimetría del filtro auditivo. El diagrama muestra la asimetría creciente del filtro auditivo con el aumento del nivel de entrada. Los filtros resaltados muestran la forma para un nivel de entrada de 90 dB (rosa) y un nivel de entrada de 20 dB (verde). Diagrama adaptado de Moore y Glasberg, [13] que mostraba formas de filtro redondeadas (roex).

Se cree que estas dos propiedades del filtro auditivo contribuyen a la propagación ascendente del enmascaramiento, es decir, las frecuencias bajas enmascaran las frecuencias altas mejor que a la inversa. Como el aumento del nivel hace que la pendiente de las frecuencias bajas sea más suave, al aumentar su amplitud, las frecuencias bajas enmascaran las frecuencias altas más que a un nivel de entrada más bajo.

El filtro auditivo puede reducir los efectos de un enmascarador al escuchar una señal en ruido de fondo mediante la escucha fuera de frecuencia. Esto es posible cuando la frecuencia central del enmascarador es diferente de la de la señal. En la mayoría de las situaciones, el oyente elige escuchar "a través" del filtro auditivo que está centrado en la señal; sin embargo, si hay un enmascarador presente, esto puede no ser apropiado. El filtro auditivo centrado en la señal también puede contener una gran cantidad de enmascarador, lo que hace que la relación señal-ruido del filtro sea baja y disminuya la capacidad del oyente para detectar la señal. Sin embargo, si el oyente escucha a través de un filtro ligeramente diferente que aún contiene una cantidad sustancial de señal pero menos enmascarador, la relación señal-ruido aumenta, lo que permite al oyente detectar la señal. [4]

Escucha fuera de frecuencia. El diagrama A muestra el filtro auditivo centrado en la señal y cómo parte del enmascarador cae dentro de ese filtro, lo que da como resultado una relación señal-ruido baja. El diagrama B muestra un filtro más a lo largo de la membrana basilar, que no está centrado en la señal pero contiene una cantidad sustancial de esa señal y menos enmascarador. Este cambio reduce el efecto del enmascarador al aumentar la relación señal-ruido. Diagrama adaptado de Gelfand (2004). [4]

El primer diagrama de arriba muestra el filtro auditivo centrado en la señal y cómo parte del enmascarador cae dentro de ese filtro. Esto da como resultado una relación señal/ruido baja. El segundo diagrama muestra el siguiente filtro a lo largo de la membrana basilar, que no está centrado en la señal pero contiene una cantidad sustancial de esa señal y menos enmascarador. Esto reduce el efecto del enmascarador al aumentar la relación señal/ruido.

Lo anterior se aplica al modelo de espectro de potencia de enmascaramiento. En general, este modelo se basa en el sistema auditivo que contiene la matriz de filtros auditivos y en la elección del filtro con la señal en su centro o con la mejor relación señal/ruido. Solo el enmascarador que cae dentro del filtro auditivo contribuye al enmascaramiento y el umbral de la persona para escuchar la señal está determinado por ese enmascarador. [6]

Filtros auditivos normales y deteriorados

En un oído "normal" el filtro auditivo tiene una forma similar a la que se muestra a continuación. Este gráfico refleja la selectividad de frecuencia y la sintonización de la membrana basilar.

El filtro auditivo de una cóclea “normal”

La afinación de la membrana basilar se debe a su estructura mecánica. En la base de la membrana basilar es estrecha y rígida y responde mejor a las frecuencias altas. Sin embargo, en el ápice la membrana es ancha y flexible y responde mejor a las frecuencias bajas. Por lo tanto, las diferentes secciones de la membrana basilar vibran dependiendo de la frecuencia del sonido y dan una respuesta máxima a esa frecuencia en particular.

Sin embargo, en un oído dañado el filtro auditivo tiene una forma diferente al de un oído “normal”. [14]

El filtro auditivo de una cóclea deteriorada

El filtro auditivo de un oído afectado es más plano y más ancho en comparación con un oído normal. Esto se debe a que la selectividad de frecuencia y la sintonización de la membrana basilar se reducen a medida que las células pilosas externas están dañadas. Cuando solo las células pilosas externas están dañadas, el filtro es más ancho en el lado de baja frecuencia. Cuando tanto las células pilosas externas como las internas están dañadas, el filtro es más ancho en ambos lados. Esto es menos común. El ensanchamiento del filtro auditivo se produce principalmente en el lado de baja frecuencia del filtro. Esto aumenta la susceptibilidad al enmascaramiento de baja frecuencia, es decir, la propagación ascendente del enmascaramiento como se describió anteriormente. [6]

Véase también

Referencias

  1. ^ https://archive.org/details/bstj12-4-377 | Bell System Technical Journal, octubre de 1933, "La sonoridad, su definición, medición y cálculo"
  2. ^ Fletcher, Harvey (1940). "Patrones auditivos". Reseñas de Física Moderna . 12 (1): 47–65. Bibcode :1940RvMP...12...47F. doi :10.1103/RevModPhys.12.47.
  3. ^ Campbell, M.; Greated, C. (1987). Guía acústica para músicos . Nueva York: Schirmer Books. ISBN 978-0-02-870161-5.
  4. ^ abcdefghi Gelfand, SA (2004). Audición: una introducción a la acústica psicológica y fisiológica (4.ª ed.). Nueva York: Marcel Dekker. ISBN 978-0-585-26606-0.
  5. ^ Munkong, R.; Biing-Hwang Juang (mayo de 2008). "Percepción auditiva y cognición". Revista IEEE Signal Processing . 25 (3): 98–117. Bibcode :2008ISPM...25...98M. doi :10.1109/MSP.2008.918418. S2CID  10077677.
  6. ^ abcdefghi Moore, BCJ (1998). Pérdida auditiva coclear . Londres: Whurr Publishers Ltd. ISBN 978-0-585-12256-4.
  7. ^ abc Moore, BCJ (1986). "Paralelismos entre la selectividad de frecuencia medida psicofísicamente y en la mecánica coclear". Scand. Audio Suppl. (25): 129–52.
  8. ^ RF Lyon; AG Katsiamis; EM Drakakis (2010). "Historia y futuro de los modelos de filtros auditivos" (PDF) . Proc. ISCAS . IEEE.
  9. ^ ab Glasberg, BR; Moore, BCJ (1990). "Derivación de formas de filtros auditivos a partir de datos de ruido con muesca". Hear. Res . 47 (1–2): 103–138. doi :10.1016/0378-5955(90)90170-T. PMID  2228789. S2CID  4772612.
  10. ^ abc Nakaichi, Takeshi; Watanuki, Keisuke; Sakamoto, Shinichi (2003). "Un método de medición simplificado de filtros auditivos para oyentes con discapacidad auditiva". Ciencia y tecnología acústica . 24 (6): 365–375. doi : 10.1250/ast.24.365 .
  11. ^ abcdef Plewes, K. (2006). Anatomía y fisiología del oído .
  12. ^ "Paseo alrededor de la Cóclea". 2003.
  13. ^ Moore, BCJ; Glasberg, BR (1987). "Fórmulas que describen la selectividad de frecuencia como una función de la frecuencia y el nivel, y su uso en el cálculo de patrones de excitación". Hearing Research . 28 (2–3): 209–225. doi :10.1016/0378-5955(87)90050-5. ISSN  0378-5955. PMID  3654390. S2CID  4779671.
  14. ^ Moore, BCJ (2003). Introducción a la psicología de la audición (5.ª ed.). San Diego, CA: Academic Press. ISBN 978-0-12-505627-4.

Enlaces externos