stringtranslate.com

Ambisónicos

Antigua marca registrada de Ambisonics

Ambisonics es un formato de sonido envolvente de esfera completa : además del plano horizontal, cubre las fuentes de sonido por encima y por debajo del oyente. [1]

A diferencia de otros formatos envolventes multicanal, sus canales de transmisión no transmiten señales de altavoz. En cambio, contienen una representación independiente del hablante de un campo sonoro llamado formato B , que luego se decodifica en la configuración de los altavoces del oyente. Este paso adicional permite al productor pensar en términos de direcciones de fuente en lugar de posiciones de los altavoces, y ofrece al oyente un grado considerable de flexibilidad en cuanto al diseño y la cantidad de altavoces utilizados para la reproducción.

Ambisonics se desarrolló en el Reino Unido en la década de 1970 bajo los auspicios de la Corporación Nacional Británica de Desarrollo de la Investigación .

A pesar de su sólida base técnica y sus muchas ventajas, Ambisonics no había hasta hace poco [ ¿cuándo? ] ha sido un éxito comercial y sobrevivió sólo en aplicaciones específicas y entre los entusiastas de la grabación.

Con la amplia disponibilidad de un potente procesamiento de señales digitales (a diferencia de los circuitos analógicos costosos y propensos a errores que tuvieron que usarse durante sus primeros años) y la exitosa introducción en el mercado de los sistemas de sonido envolvente de cine en casa desde la década de 1990, el interés en Ambisonics entre ingenieros de grabación, diseñadores de sonido, compositores, empresas de medios, locutores e investigadores ha regresado y continúa aumentando.

En particular, ha demostrado ser una forma eficaz de presentar audio espacial en aplicaciones de realidad virtual (por ejemplo, vídeo 360 de YouTube), ya que la escena en formato B se puede girar para que coincida con la orientación de la cabeza del usuario y luego decodificarse como estéreo binaural.

Introducción

Ambisonics puede entenderse como una extensión tridimensional del estéreo M/S (medio/lateral) , agregando canales de diferencia adicionales para altura y profundidad. El conjunto de señales resultante se denomina formato B. Los canales que lo componen están etiquetados para la presión sonora (la M en M/S), para el gradiente de presión sonora frontal-menos-atrás, para izquierda-menos-derecha (la S en M/S) y para arriba-menos-abajo. . [nota 1]

La señal corresponde a un micrófono omnidireccional, mientras que los componentes que serían captados por cápsulas en forma de ocho orientadas a lo largo de los tres ejes espaciales.

Panorámica de una fuente

Un panoramizador (o codificador ) Ambisonic simple toma una señal fuente y dos parámetros, el ángulo horizontal y el ángulo de elevación . Posiciona la fuente en el ángulo deseado distribuyendo la señal sobre los componentes Ambisonic con diferentes ganancias:

Al ser omnidireccional, el canal siempre recibe la misma señal de entrada constante, independientemente de los ángulos. Para que tenga más o menos la misma energía media que los demás canales, W se atenúa unos 3 dB (precisamente, dividido por la raíz cuadrada de dos). [2] Los términos para realmente producen los patrones polares de los micrófonos en forma de ocho (ver ilustración a la derecha, segunda fila). Tomamos su valor en y y multiplicamos el resultado con la señal de entrada. El resultado es que la entrada en todos los componentes llega exactamente tan fuerte como la habría captado el micrófono correspondiente.

micrófonos virtuales

Transformación entre diferentes patrones de micrófono virtual.

Los componentes de formato B se pueden combinar para generar micrófonos virtuales con cualquier patrón polar de primer orden (omnidireccional, cardioide, hipercardioide, figura de ocho o cualquier patrón intermedio) apuntando en cualquier dirección. Se pueden derivar varios micrófonos de este tipo con diferentes parámetros al mismo tiempo, para crear pares estéreo coincidentes (como un Blumlein ) o matrices envolventes.

Un micrófono virtual horizontal en ángulo horizontal con patrón viene dado por

.

Este micrófono virtual está normalizado en campo libre , lo que significa que tiene una ganancia constante de uno para sonidos en el eje. La ilustración de la izquierda muestra algunos ejemplos creados con esta fórmula.

Los micrófonos virtuales se pueden manipular en la posproducción: se pueden seleccionar los sonidos deseados, suprimir los no deseados y se puede ajustar el equilibrio entre el sonido directo y reverberante durante la mezcla.

Descodificación

Ingenuo decodificador en fase de banda única para un diseño de altavoz cuadrado.

Un decodificador Ambisonic básico es muy similar a un conjunto de micrófonos virtuales. Para diseños perfectamente regulares, se puede generar un decodificador simplificado apuntando un micrófono cardioide virtual en la dirección de cada altavoz. Aquí hay un cuadrado:

Los signos de los componentes y son la parte importante, el resto son factores de ganancia. El componente se descarta porque no es posible reproducir señales de altura con sólo cuatro altavoces en un plano.

En la práctica, un decodificador Ambisonic real requiere una serie de optimizaciones psicoacústicas para funcionar correctamente. [3]

La decodificación dependiente de la frecuencia también se puede utilizar para producir estéreo binaural; Esto es particularmente relevante en aplicaciones de Realidad Virtual.

Ambisónicos de orden superior

Representación visual de los componentes Ambisonic formato B hasta tercer orden. Las partes oscuras representan regiones donde se invierte la polaridad. Observe cómo las dos primeras filas corresponden a patrones polares de micrófono omnidireccionales y en forma de ocho.

La resolución espacial de los Ambisonics de primer orden como se describe anteriormente es bastante baja. En la práctica, esto se traduce en fuentes ligeramente borrosas, pero también en un área de escucha o punto óptimo comparablemente pequeño . Se puede aumentar la resolución y ampliar el punto óptimo añadiendo grupos de componentes direccionales más selectivos al formato B. Estos ya no se corresponden con los patrones polares de los micrófonos convencionales, sino que parecen hojas de trébol. El conjunto de señales resultante se denomina Ambisónica de segundo , tercer o, colectivamente, de orden superior .

Para un orden determinado , los sistemas de esfera completa requieren componentes de señal y se necesitan componentes para la reproducción solo horizontal.

Históricamente ha habido varias convenciones de formato diferentes para Ambisonics de orden superior; para obtener más detalles, consulte Formatos de intercambio de datos Ambisonic .

Comparación con otros formatos envolventes

Ambisonics se diferencia de otros formatos envolventes en varios aspectos:

En el lado negativo, Ambisonics es:

Fundamento teórico

Análisis de campo sonoro (codificación)

Las señales de formato B comprenden una descomposición armónica esférica truncada del campo sonoro. Corresponden a la presión del sonido y a los tres componentes del gradiente de presión (que no debe confundirse con la velocidad de las partículas relacionada ) en un punto del espacio. Juntos, estos se aproximan al campo sonoro en una esfera alrededor del micrófono; formalmente el truncamiento de primer orden de la expansión multipolar . (la señal mono) es la información de orden cero, correspondiente a una función constante en la esfera, mientras que son los términos de primer orden (los dipolos o figuras de ocho). Este truncamiento de primer orden es sólo una aproximación del campo sonoro general.

Los órdenes superiores corresponden a otros términos de la expansión multipolar de una función en la esfera en términos de armónicos esféricos. En la práctica, los órdenes superiores requieren más altavoces para la reproducción, pero aumentan la resolución espacial y amplían el área donde el campo sonoro se reproduce perfectamente (hasta una frecuencia límite superior).

El radio de esta área para el orden y la frecuencia ambisónicos está dado por

, [4]

donde denota la velocidad del sonido.

Esta área se vuelve más pequeña que una cabeza humana por encima de 600 Hz para el primer orden o 1800 Hz para el tercer orden. Una reproducción precisa en un volumen del tamaño de un cabezal de hasta 20 kHz requeriría un pedido de 32 o más de 1000 altavoces.

En aquellas frecuencias y posiciones de escucha donde ya no es posible una reconstrucción perfecta del campo sonoro , la reproducción Ambisonics debe centrarse en ofrecer señales direccionales correctas para permitir una buena localización incluso en presencia de errores de reconstrucción.

Psicoacústica

El aparato auditivo humano tiene una localización muy precisa en el plano horizontal (tan fina como una separación de fuente de 2° en algunos experimentos). Se pueden identificar dos señales predominantes, para diferentes rangos de frecuencia:

Localización de baja frecuencia

En frecuencias bajas, donde la longitud de onda es grande en comparación con la cabeza humana, el sonido entrante se difracta a su alrededor, de modo que prácticamente no hay sombra acústica y, por tanto, no hay diferencia de nivel entre los oídos. En este rango, la única información disponible es la relación de fase entre las dos señales del oído, llamada diferencia de tiempo interaural o ITD . La evaluación de esta diferencia horaria permite una localización precisa dentro de un cono de confusión : el ángulo de incidencia es inequívoco, pero el ITD es el mismo para los sonidos frontales o traseros. Siempre que el sonido no sea totalmente desconocido para el sujeto, la confusión suele resolverse percibiendo las variaciones tímbricas anteroposteriores provocadas por las orejeras (o pabellones auriculares ).

Localización de alta frecuencia

A medida que la longitud de onda se acerca al doble del tamaño de la cabeza, las relaciones de fase se vuelven ambiguas, ya que ya no está claro si la diferencia de fase entre los oídos corresponde a uno, dos o incluso más períodos a medida que aumenta la frecuencia. Afortunadamente, la cabeza creará una sombra acústica significativa en este rango, lo que provoca una ligera diferencia de nivel entre los oídos. Esto se llama diferencia de nivel interaural o ILD (se aplica el mismo cono de confusión). Combinados, estos dos mecanismos proporcionan localización en todo el rango auditivo.

Reproducción de ITD e ILD en Ambisonics

Gerzon ha demostrado que la calidad de las señales de localización en el campo sonoro reproducido corresponde a dos métricas objetivas: la longitud del vector de velocidad de las partículas para el ITD y la longitud del vector de energía para el ILD. Gerzon y Barton (1992) definen un decodificador para sonido envolvente horizontal como Ambisonic si

En la práctica, se consiguen resultados satisfactorios a niveles moderados incluso en zonas de escucha muy grandes. [6] [7]

Señal HRTF monoaural

Los humanos también pueden obtener información sobre la ubicación de la fuente de sonido en el espacio 3D, teniendo en cuenta la altura. Gran parte de esta capacidad se debe a la forma de la cabeza (especialmente el pabellón auricular ) que produce una respuesta de frecuencia variable según el ángulo de la fuente. La respuesta se puede medir colocando un micrófono en el canal auditivo de una persona y luego reproduciendo sonidos desde varias direcciones. La función de transferencia relacionada con la cabeza grabada (HRTF) se puede utilizar para transmitir ambisónicos a los auriculares, imitando el efecto de la cabeza. Los HRTF difieren de una persona a otra debido a las variaciones en la forma de la cabeza, pero uno genérico puede producir un resultado satisfactorio. [8]

Síntesis de campo sonoro (decodificación)

En principio, las señales de los altavoces se derivan utilizando una combinación lineal de las señales de los componentes Ambisonic, donde cada señal depende de la posición real del altavoz en relación con el centro de una esfera imaginaria cuya superficie pasa a través de todos los altavoces disponibles. En la práctica, las distancias ligeramente irregulares de los altavoces pueden compensarse con retardo .

Sin embargo, la decodificación True Ambisonics requiere una ecualización espacial de las señales para tener en cuenta las diferencias en los mecanismos de localización de sonidos de alta y baja frecuencia en la audición humana. [9] Un detalle adicional tiene en cuenta la distancia entre el oyente y los altavoces ( compensación de campo cercano ). [10]

También se utilizan diversos métodos de decodificación más modernos.

Compatibilidad con canales de distribución existentes

Actualmente, los decodificadores Ambisonics no se comercializan de manera significativa para los usuarios finales y no hay grabaciones nativas de Ambisonic disponibles comercialmente. Por lo tanto, el contenido producido en Ambisonics debe ponerse a disposición de los consumidores en formato estéreo o multicanal discreto.

Estéreo

El contenido de Ambisonics se puede plegar a estéreo automáticamente, sin necesidad de una mezcla descendente dedicada. El método más sencillo es muestrear el formato B con un micrófono estéreo virtual . El resultado equivale a una grabación estéreo coincidente. La imagen dependerá de la geometría del micrófono, pero normalmente las fuentes traseras se reproducirán de forma más suave y difusa. Se omite la información vertical (del canal).

Alternativamente, el formato B se puede codificar matricialmente en formato UHJ , que es adecuado para la reproducción directa en sistemas estéreo. Como antes, la información vertical se descartará, pero además de la reproducción de izquierda a derecha, UHJ intenta retener parte de la información envolvente horizontal traduciendo fuentes en la parte posterior en señales desfasadas. Esto le da al oyente una cierta sensación de localización trasera.

El UHJ de dos canales también se puede decodificar nuevamente en Ambisonics horizontales (con cierta pérdida de precisión), si hay disponible un sistema de reproducción Ambisonic. Existe UHJ sin pérdidas de hasta cuatro canales (incluida la información de altura), pero nunca ha tenido un uso generalizado. En todos los esquemas UHJ, los dos primeros canales son señales convencionales para los altavoces izquierdo y derecho.

Formatos multicanal

Del mismo modo, es posible predecodificar material de Ambisonics en diseños de altavoces arbitrarios, como Quad , 5.1 , 7.1 , Auro 11.1 o incluso 22.2 , nuevamente sin intervención manual. El canal LFE se omite o se crea manualmente una mezcla especial. La predecodificación a medios 5.1 se conoce comoFormato G [11]durante los primeros días del audio DVD, aunque el término ya no es de uso común.

La ventaja obvia de la predecodificación es que cualquier oyente envolvente puede experimentar Ambisonics; no se requiere hardware especial más allá del que se encuentra en un sistema de cine en casa común. La principal desventaja es que se pierde la flexibilidad de transmitir una única señal Ambisonics estándar a cualquier conjunto de altavoces de destino: la señal asume un diseño "estándar" específico y cualquiera que escuche con un conjunto diferente puede experimentar una degradación de la precisión de la localización.

Los diseños de objetivos a partir de 5.1 suelen superar la resolución espacial de los Ambisonics de primer orden, al menos en el cuadrante frontal. Para una resolución óptima, para evitar una diafonía excesiva y evitar irregularidades en el diseño del objetivo, las decodificaciones previas para dichos objetivos deben derivarse del material fuente en Ambisonics de orden superior. [12]

Flujo de trabajo de producción

El contenido ambisónico se puede crear de dos maneras básicas: grabando un sonido con un micrófono adecuado de primer orden o superior, o tomando fuentes monofónicas separadas y panoramizándolas en las posiciones deseadas. El contenido también se puede manipular mientras esté en formato B.

micrófonos ambisónicos

Matrices nativas de formato B

El arreglo diseñado y fabricado por el Dr. Jonathan Halliday de Nimbus Records

Dado que los componentes de Ambisonics de primer orden corresponden a patrones físicos de captación de micrófono, es completamente práctico grabar en formato B directamente, con tres micrófonos coincidentes: una cápsula omnidireccional, una cápsula en forma de 8 orientada hacia adelante y una cápsula en forma de 8 orientada hacia la izquierda. -8 cápsula, produciendo los componentes , y . [13] [14] Esto se conoce como conjunto de micrófonos nativos o Nimbus/Halliday , en honor a su diseñador, el Dr. Jonathan Halliday en Nimbus Records , donde se utiliza para grabar su extensa y continua serie de lanzamientos de Ambisonic. El C700S [15] , un micrófono nativo integrado de formato B, ha sido fabricado y vendido por Josephson Engineering desde 1990.

La principal dificultad inherente a este enfoque es que la localización y la claridad de las altas frecuencias dependen de que los diafragmas se acerquen a una verdadera coincidencia. Apilando las cápsulas verticalmente se obtiene una coincidencia perfecta para las fuentes horizontales. Sin embargo, en teoría, el sonido procedente de arriba o de abajo sufrirá sutiles efectos de filtrado en peine en las frecuencias más altas. En la mayoría de los casos, esto no es una limitación, ya que las fuentes de sonido alejadas del plano horizontal suelen proceder de la reverberación de la sala. Además, los elementos de micrófono apilados en forma de 8 tienen un nulo profundo en la dirección de su eje de apilamiento, de modo que el transductor principal en esas direcciones es el micrófono omnidireccional central. En la práctica, esto puede producir menos error de localización que cualquiera de las alternativas (arreglos tetraédricos con procesamiento o un cuarto micrófono para el eje Z). [ cita necesaria ]

Los arreglos nativos se usan más comúnmente para sonido envolvente solo horizontal, debido al aumento de los errores de posición y los efectos de sombreado al agregar un cuarto micrófono.

El micrófono tetraédrico

Dado que es imposible construir un conjunto de micrófonos perfectamente coincidentes, el siguiente mejor enfoque es minimizar y distribuir el error posicional lo más uniformemente posible. Esto se puede lograr disponiendo cuatro cápsulas cardioides o subcardioides en un tetraedro y ecualizando para obtener una respuesta uniforme de campo difuso. [16] Las señales de la cápsula luego se convierten al formato B con una operación matricial.

Fuera de Ambisonics, los micrófonos tetraédricos se han vuelto populares entre los ingenieros de grabación de ubicaciones que trabajan en estéreo o 5.1 por su flexibilidad en la posproducción; aquí, el formato B sólo se utiliza como intermedio para derivar micrófonos virtuales.

Micrófonos de orden superior

Por encima del primer orden, ya no es posible obtener componentes Ambisonic directamente con cápsulas de micrófono individuales. En cambio, las señales de diferencia de orden superior se derivan de varias cápsulas distribuidas espacialmente (normalmente omnidireccionales) utilizando un procesamiento de señales digitales muy sofisticado. [17]

El em32 Eigenmike [18] y ZYLIA ZM-1 [19] es un conjunto de micrófonos ambisónicos de 32 canales disponible comercialmente.

Un artículo reciente de Peter Craven et al. [20] (posteriormente patentado) describe el uso de cápsulas bidireccionales para micrófonos de orden superior para reducir el extremo de la ecualización involucrada. Aún no se han fabricado micrófonos con esta idea.

Panorámica ambisónica

La forma más sencilla de producir mezclas Ambisonic de orden arbitrariamente alto es tomar fuentes monofónicas y colocarlas con un codificador Ambisonic.

Un codificador de esfera completa suele tener dos parámetros, acimut (u horizonte) y ángulo de elevación. El codificador distribuirá la señal fuente a los componentes Ambisonic de manera que, cuando se decodifique, la fuente aparecerá en la ubicación deseada. Los panoramizadores más sofisticados proporcionarán además un parámetro de radio que se encargará de la atenuación dependiente de la distancia y del refuerzo de graves debido al efecto de campo cercano.

Las unidades de paneo y mezcladores de hardware para Ambisonics de primer orden han estado disponibles desde la década de 1980 [21] [22] [23] y se han utilizado comercialmente. Hoy en día, los complementos de panorámica y otras herramientas de software relacionadas están disponibles para las principales estaciones de trabajo de audio digital, a menudo como software gratuito . Sin embargo, debido a restricciones arbitrarias en el ancho del bus, pocas estaciones de trabajo de audio digital (DAW) profesionales admiten pedidos superiores al segundo. Las excepciones notables son REAPER , Pyramix, ProTools , Nuendo y Ardor .

Manipulación ambisónica

El formato B de primer orden se puede manipular de varias maneras para cambiar el contenido de una escena auditiva. Las manipulaciones bien conocidas incluyen "rotación" y "dominancia" (mover fuentes hacia o lejos de una dirección particular). [5] [24]

Además, el procesamiento de señal lineal invariante en el tiempo, como la ecualización, se puede aplicar al formato B sin alterar las direcciones del sonido, siempre que se aplique a todos los canales componentes por igual.

Los desarrollos más recientes en Ambisonics de orden superior permiten una amplia gama de manipulaciones que incluyen rotación, reflexión, movimiento, reverberación 3D , mezcla a partir de formatos heredados como 5.1 o de primer orden, visualización y enmascaramiento y ecualización direccionalmente dependiente.

El intercambio de datos

La transmisión de formato Ambisonic B entre dispositivos y a usuarios finales requiere un formato de intercambio estandarizado. Si bien el formato B tradicional de primer orden está bien definido y se entiende universalmente, existen convenciones contradictorias para los Ambisonics de orden superior, que difieren tanto en el orden de los canales como en la ponderación, que podrían necesitar soporte durante algún tiempo. Tradicionalmente, el más extendido es el formato de orden superior Furse-Malham en el .ambcontenedor basado en el formato de archivo WAVE-EX de Microsoft. [25] Se escala hasta el tercer orden y tiene una limitación de tamaño de archivo de 4 GB.

Es posible que nuevas implementaciones y producciones quieran considerar la propuesta AmbiX [26].caf , que adopta el formato de archivo y elimina el límite de 4 GB. Se escala a órdenes arbitrariamente altos y se basa en la codificación SN3D. Google ha adoptado la codificación SN3D como base para su formato YouTube 360. [27]

Distribución comprimida

Para distribuir eficazmente datos Ambisonic a no profesionales, se desea una compresión con pérdida para mantener el tamaño de los datos aceptable. Sin embargo, la simple compresión multimono no es suficiente, ya que la compresión con pérdida tiende a destruir la información de fase y, por lo tanto, degrada la localización en forma de reducción espacial, desenfoque y fuente fantasma. Se desea la reducción de la redundancia entre canales, no sólo para mejorar la compresión, sino también para reducir el riesgo de errores de fase susceptibles de ser cortados. [28] (También es posible utilizar el posprocesamiento para ocultar los artefactos). [29]

Al igual que con la codificación estéreo conjunta del lado medio, se puede utilizar un esquema de matriz estática (como en Opus) para ambisónicos de primer orden, pero no es óptimo en el caso de múltiples fuentes. Varios esquemas, como DirAC, utilizan un esquema similar al estéreo paramétrico , donde se codifica una señal mezclada, se registra la dirección principal y se agrega alguna descripción del ambiente. MPEG-H 3D Audio , basándose en algunos trabajos de MPEG Surround , amplía el concepto para manejar múltiples fuentes. MPEG-H utiliza análisis de componentes principales para determinar las fuentes principales y luego codifica una señal multimono correspondiente a las direcciones principales. Estos métodos paramétricos proporcionan buena calidad, siempre que tengan mucho cuidado al suavizar las direcciones del sonido entre fotogramas. [28] PCA/SVD es aplicable para entradas ambisónicas de primer orden y de alto orden. [30]

El desarrollo actual

Fuente abierta

Desde 2018 existe una implementación gratuita y de código abierto en el códec de sonido Opus . Se proporcionan dos modos de codificación de canales: uno que simplemente almacena los canales individualmente y otro que pondera los canales a través de una matriz fija e invertible para reducir la redundancia. [31] En 2020 se publicó una prueba de escucha de Opus ambisonics, como calibración para AMBIQUAL, una métrica objetiva para ambisonics comprimidos de Google. Los ambisónicos de tercer orden de Opus a 256 kbps tienen una precisión de localización similar en comparación con los ambisónicos de primer orden de Opus a 128 kbps. [32] : Figura 12 

Interés corporativo

Desde que Google y otros fabricantes lo adoptaron como el formato de audio elegido para la realidad virtual , Ambisonics ha experimentado un gran interés. [33] [34] [35]

En 2018, Sennheiser lanzó su micrófono VR [36] y Zoom lanzó una grabadora de campo Ambisonics. [37] Ambas son implementaciones del diseño de micrófono tetraédrico que produce Ambisonics de primer orden.

Actualmente, varias empresas están realizando investigaciones en Ambisonics:

Dolby Laboratories ha expresado "interés" en Ambisonics adquiriendo (y liquidando) el especialista en sonido imm de Ambisonics, con sede en Barcelona, ​​antes de lanzar Dolby Atmos , [43] que, aunque su funcionamiento preciso no se ha revelado, implementa el desacoplamiento entre la dirección de la fuente y las posiciones reales de los altavoces. . Atmos adopta un enfoque fundamentalmente diferente en el sentido de que no intenta transmitir un campo sonoro; transmite premezclas o temas discretos (es decir, flujos sin procesar de datos de sonido) junto con metadatos sobre la ubicación y dirección de donde deberían parecer que provienen. Luego, las plicas se decodifican, mezclan y renderizan en tiempo real utilizando cualquier altavoz disponible en el lugar de reproducción.

Uso en juegos

Ambisonics de orden superior ha encontrado un nicho de mercado en los videojuegos desarrollados por Codemasters . Su primer juego que utilizó un motor de audio Ambisonic fue Colin McRae: DiRT , sin embargo, solo usó Ambisonics en la plataforma PlayStation 3 . [44] Su juego Race Driver: GRID extendió el uso de Ambisonics a la plataforma Xbox 360 , [45] y Colin McRae: DiRT 2 usa Ambisonics en todas las plataformas, incluida la PC. [46]

Los juegos recientes de Codemasters, F1 2010 , Dirt 3 , [47] F1 2011 [48] y Dirt: Showdown , [49] utilizan Ambisonics de cuarto orden en PC más rápidas, [50] renderizados por el controlador Rapture3D OpenAL de Blue Ripple Sound y pre -Audio Ambisonic mezclado producido con los complementos WigWare Ambisonic de Bruce Wiggins. [51]

OpenAL Soft [2], una implementación gratuita y de código abierto de la especificación OpenAL, también utiliza Ambisonics para renderizar audio 3D. [52] OpenAL Soft a menudo se puede utilizar como reemplazo directo de otras implementaciones de OpenAL, lo que permite que varios juegos que utilizan la API de OpenAL se beneficien de la renderización de audio con Ambisonics.

Para muchos juegos que no utilizan la API OpenAL de forma nativa, el uso de un contenedor o una cadena de contenedores puede ayudar a que estos juegos utilicen indirectamente la API OpenAL. En última instancia, esto lleva a que el sonido se reproduzca en Ambisonics si se utiliza un controlador OpenAL capaz, como OpenAL Soft. [53]

Unreal Engine admite el renderizado Soundfield Ambisonics desde la versión 4.25. [54] El motor Unity admite trabajar con clips de audio Ambisonics desde la versión 2017.1. [55]

Patentes y marcas

La mayoría de las patentes que cubren los desarrollos de Ambisonic ya han expirado (incluidas las que cubren el micrófono Soundfield ) y, como resultado, la tecnología básica está disponible para que cualquiera pueda implementarla.

El "conjunto" de patentes que comprende la tecnología Ambisonics fue reunido originalmente por la Corporación Nacional de Investigación y Desarrollo (NRDC) del gobierno del Reino Unido, que existió hasta finales de la década de 1970 para desarrollar y promover invenciones británicas y otorgar licencias a fabricantes comerciales, idealmente a un solo licenciatario. Finalmente, el sistema obtuvo la licencia de Nimbus Records (ahora propiedad de Wyastone Estate Ltd).

El logotipo de Ambisonic de "círculos entrelazados" (marcas comerciales del Reino Unido UK00001113276 y UK00001113277 ), y las marcas de texto "AMBISONIC" y "AMBISO N" (marcas comerciales del Reino Unido UK00001500177 y UK00001112259 ), anteriormente propiedad de Wyastone Estate Ltd., han expirado en 2010.

Ver también

Notas

  1. ^ En este párrafo introductorio se utiliza la notación tradicional en formato B, ya que se supone que es posible que el lector ya la haya encontrado. Para Ambisonics de orden superior, se recomienda el uso de la notación ACN .

Referencias

  1. ^ Michael A. Gerzon, Perifonía: reproducción de sonido con altura . Revista de la Sociedad de Ingeniería de Audio, 1973, 21(1):2–10.
  2. ^ Gerzon, MA (febrero de 1980). Perifonía práctica . 65ª Convención de la Sociedad de Ingeniería de Audio. Londres: Sociedad de Ingeniería de Audio . pag. 7. Preimpresión 1571. Para que las señales de formato B transporten una energía promedio más o menos igual, X,Y,Z tienen una ganancia de 2 en sus direcciones de sensibilidad máxima.
  3. ^ Eric Benjamin, Richard Lee y Aaron Heller, ¿Es mi decodificador ambisónico?, 125ª Convención AES, San Francisco 2008
  4. ^ Darren B Ward y Untilhara D Abhayapala, Reproducción de un campo sonoro de onda plana utilizando una matriz de altavoces Archivado el 8 de octubre de 2006 en Wayback Machine , IEEE Transactions on Speech and Audio Processing Vol.9 No.6, septiembre de 2001
  5. ^ ab Michael A Gerzon, Geoffrey J Barton, "Ambisonic Decoders for HDTV", 92ª Convención AES, Viena 1992. http://www.aes.org/e-lib/browse.cfm?elib=6788
  6. ^ Malham, DG (1992). "Experiencia con sistemas de sonido ambisónico 3-D de gran área" (PDF) . Actas del Instituto de Acústica . 14 (5): 209–215. Archivado desde el original (PDF) el 22 de julio de 2011 . Consultado el 24 de enero de 2007 .
  7. ^ Jörn Nettingsmeier y David Dohrmann, Estudios preliminares sobre sistemas de refuerzo de sonido Ambisonic de orden superior a gran escala, Simposio Ambisonics 2011, Lexington (KY) 2011
  8. ^ Armstrong, Cal; Trillar, Lewis; Murphy, Damián; Kearney, Gavin (23 de octubre de 2018). "Una evaluación perceptiva de HRTF individuales y no individuales: un estudio de caso de la base de datos SADIE II". Ciencias Aplicadas . 8 (11): 2029. doi : 10.3390/app8112029 .
  9. ^ Eric Benjamin, Richard Lee y Aaron Heller: localización en sistemas ambisónicos solo horizontales, 121.a convención AES, San Francisco 2006
  10. ^ Jérôme Daniel, Codificación de sonido espacial que incluye el efecto de campo cercano: introducción de filtros de codificación de distancia y un nuevo formato ambisónico viable, 23ª Conferencia AES, Copenhague 2003
  11. ^ Richard Elen, Ambisonics para el nuevo milenio, septiembre de 1998.
  12. ^ Bruce Wiggins, La generación de leyes panorámicas para matrices de hablantes irregulares utilizando métodos heurísticos Archivado el 17 de mayo de 2016 en el Archivo Web Portugués. 31ª Conferencia AES, Londres 2007
  13. ^ EM Benjamin y T. Chen, "The Native B-Format Microphone", AES 119th Convention, Nueva York, 2005, Preprint no. 6621. http://www.aes.org/e-lib/browse.cfm?elib=13348
  14. ^ [1] EM Benjamin y T. Chen, "El micrófono nativo de formato B: Parte II", 120.a convención de AES, París, 2006, Preimpresión no. 6640. http://www.aes.org/e-lib/browse.cfm?elib=13444
  15. ^ Micrófonos de patrón variable C700, Josephson Engineering
  16. ^ Michael A. Gerzon, El diseño de conjuntos de micrófonos precisamente coincidentes para sonido estéreo y envolvente , 50ª Convención AES, Londres 1975, http://www.aes.org/e-lib/browse.cfm?elib=2466
  17. ^ Peter Plessas, Matrices de micrófonos de esfera rígida para grabación espacial y holografía, Tesis de diploma en Ingeniería Eléctrica - Ingeniería de audio, Graz 2009
  18. ^ "Productos | mhacoustics.com". mhacoustics.com . Consultado el 7 de abril de 2018 .
  19. ^ "ZYLIA - Soluciones de posprocesamiento y grabación de audio 3D". Zylia Inc. Consultado el 19 de septiembre de 2023 .
  20. ^ PG Craven, MJ Law y C Travis, Conjuntos de micrófonos que utilizan sensores de velocidad tangencial Archivado el 30 de junio de 2009 en Wayback Machine , Simposio Ambisonics, Graz 2009
  21. ^ Michael A Gerzon y Geoffrey J Barton, Mezcla de sonido envolvente ambisónico para estudios multipista , AES Preprint C1009, segunda conferencia internacional: el arte y la tecnología de la grabación, mayo de 1984. http://www.aes.org/e-lib/browse .cfm?elib=11654
  22. ^ Richard Elen, Mezcla ambisónica: introducción, Studio Sound, septiembre de 1983
  23. ^ Nigel Branwell, Tecnología de sonido envolvente Ambisonic para grabación y transmisión, ingeniero/productor de grabación, diciembre de 1983
  24. ^ Dave G. Malham, Mecanismos de rumbo espacial y reproducción de sonido 1998, consultado el 24 de enero de 2014
  25. ^ Richard Dobson El formato de archivo AMB Ambisonic Archivado el 22 de abril de 2014 en Wayback Machine.
  26. ^ Christian Nachbar, Franz Zotter, Etienne Deleflie y Alois Sontacchi: AmbiX: un formato de Ambisonics sugerido Simposio de Ambisonics 2011, Lexington (KY) 2011
  27. ^ Ayuda de YouTube, uso de audio espacial en videos de 360 ​​grados y de realidad virtual
  28. ^ ab Mahé, Pierre; Ragot, Stéphane; Marchand, Sylvain (2 de septiembre de 2019). Codificación ambisónica de primer orden con matriz PCA e interpolación basada en cuaterniones. 22ª Conferencia Internacional sobre Efectos de Audio Digital (DAFx-19), Birmingham, Reino Unido. pag. 284.
  29. ^ Mahé, Pierre; Ragot, Stéphane; Marchand, Sylvain; Daniel, Jérôme (enero de 2021). Codificación ambisónica con corrección de imágenes espaciales. Conferencia Europea de Procesamiento de Señales (EUSIPCO) 2020.
  30. ^ Zamani, Sina; Nanjundaswamy, Tejaswi; Rose, Kenneth (octubre de 2017). "Descomposición de valores singulares en el dominio de frecuencia para una codificación de audio espacial eficiente". Taller IEEE 2017 sobre aplicaciones del procesamiento de señales al audio y la acústica (WASPAA) . págs. 126-130. arXiv : 1705.03877 . doi :10.1109/WASPAA.2017.8170008. ISBN 978-1-5386-1632-1. S2CID  1036250.
  31. ^ Valin, Jean-Marc. "Lanzamiento de la obra 1.3". Documentación del Opus . Consultado el 7 de septiembre de 2020 .
  32. ^ Narbutt, Miroslaw; Skoglund, enero; Allen, Andrés; Chinen, Michael; Barry, Dan; Hines, Andrew (3 de mayo de 2020). "AMBIQUAL: Hacia una métrica de calidad para audio espacial ambisónico comprimido renderizado con auriculares". Ciencias Aplicadas . 10 (9): 3188. doi : 10.3390/app10093188 . hdl : 10197/11947 .
  33. ^ Especificaciones y herramientas de Google para vídeo de 360º y audio espacial, consultado en mayo de 2016
  34. ^ Sube vídeos de 360 ​​grados, consultado en mayo de 2016.
  35. ^ Centro de desarrolladores de Oculus: funciones compatibles/Ambisonics
  36. ^ "Micrófono Sennheiser AMBEO VR"
  37. ^ "Grabador de campo Ambisonics Zoom H3-VR"
  38. ^ Chris Baume, Anthony Churnside, Upping the Auntie: la visión de una emisora ​​sobre Ambisonics, Publicaciones de investigación y desarrollo de la BBC, 2012
  39. ^ Darius Satongar, Chris Dunn, Yiu Lam y Francis Li Rendimiento de localización de ambisónicos de orden superior para escucha descentrada, Publicaciones de investigación y desarrollo de la BBC, 2013
  40. ^ Paul Power, Chris Dunn, W. Davies y J. Hirst, Localización de fuentes elevadas en ambisónicos de orden superior, Publicaciones de I+D de la BBC, 2013
  41. ^ Johann-Markus Batke y Florian Keiler, Uso de funciones de panorámica derivadas de VBAP para decodificación de ambisónica 3D 2.º Simposio internacional sobre ambisónica y acústica esférica, París 2010
  42. ^ Florian Keiler, Sven Kordon, Johannes Boehm, Holger Kropp y Johann-Markus Batke, Estructura de datos para datos de audio Ambisonics de orden superior, Solicitud de patente europea EP 2450880 A1, 2012
  43. ^ "Dolby Laboratories adquiere imm sound rival". El reportero de Hollywood. 23 de julio de 2012.
  44. ^ Deleflie, Etienne (30 de agosto de 2007). "Entrevista con Simon Goodwin de Codemasters sobre el juego de PS3 DiRT y Ambisonics". Edificio Ambisonia.com . Australia: Etienne Deleflie. Archivado desde el original el 23 de julio de 2011 . Consultado el 7 de agosto de 2010 .
  45. ^ Deleflie, Etienne (24 de junio de 2008). "Codemasters vuelve a mejorar Ambisonics en Race Driver GRID ...". Edificio Ambisonia.com . Australia: Etienne Deleflie. Archivado desde el original el 23 de julio de 2011 . Consultado el 7 de agosto de 2010 .
  46. ^ Firstman, Ben (3 de marzo de 2010). "Entrevista: Simon N Goodwin, Codemasters". El Jabalí . Coventry, Reino Unido: Universidad de Warwick. pag. 18. Núcleo del Volumen 32, Número 11 . Consultado el 7 de agosto de 2010 .
  47. ^ "DiRT3". Noticias de juegos . Sonido de ondulación azul. 23 de mayo de 2011 . Consultado el 21 de noviembre de 2013 .
  48. ^ "F1 2011". Noticias de juegos . Sonido de ondulación azul. 23 de septiembre de 2011. Archivado desde el original el 19 de diciembre de 2013 . Consultado el 21 de noviembre de 2013 .
  49. ^ "Enfrentamiento DiRT". Noticias de juegos . Sonido de ondulación azul. 18 de junio de 2012. Archivado desde el original el 14 de diciembre de 2017 . Consultado el 21 de noviembre de 2013 .
  50. ^ "Audio 3D para juegos". Sonido de ondulación azul. Archivado desde el original el 13 de diciembre de 2013 . Consultado el 21 de noviembre de 2013 .
  51. ^ "Audio espacial mejorado con el software de sonido envolvente Ambisonic: un estudio de caso de impacto de REF". Consejo de Financiación de la Educación Superior de Inglaterra (HEFCE) . Consultado el 18 de febrero de 2016 .
  52. ^ "openal-soft/ambisonics.txt en master · kcat/openal-soft · GitHub". GitHub . Consultado el 15 de junio de 2021 .
  53. ^ "Lista de juegos de PC que utilizan DirectSound3D - Google Docs". Yo bebo lava . Consultado el 26 de junio de 2021 .
  54. ^ "Notas de la versión de Unreal Engine 4.25 | Documentación de Unreal Engine". Juegos épicos, Inc. Consultado el 27 de mayo de 2022 .
  55. ^ "Novedades de Unity 2017.1: Unity". Tecnologías de unidad. Archivado desde el original el 24 de marzo de 2022 . Consultado el 27 de mayo de 2022 .

enlaces externos