stringtranslate.com

Motor de búsqueda de audio

Un motor de búsqueda de audio es un motor de búsqueda basado en la Web que rastrea la Web en busca de contenido de audio . La información puede consistir en páginas web, imágenes, archivos de audio u otro tipo de documento. Existen varias técnicas para realizar búsquedas en estos motores.

Tipos de búsqueda

Búsqueda de audio a partir del texto

El texto introducido por el usuario en la barra de búsqueda se compara con la base de datos del motor de búsqueda. Los resultados coincidentes se acompañan de una breve descripción del archivo de audio y sus características, como la frecuencia de muestreo, la velocidad de bits, el tipo de archivo, la longitud, la duración o el tipo de codificación. El usuario tiene la opción de descargar los archivos resultantes.

Búsqueda de audio a partir de imagen

El sistema Query by Example (QBE) es un algoritmo de búsqueda que utiliza la recuperación de imágenes basada en contenido (CBIR). A partir de la imagen analizada se generan palabras clave que se utilizan para buscar archivos de audio en la base de datos. Los resultados de la búsqueda se muestran en función de las preferencias del usuario en cuanto al tipo de archivo (wav, mp3, aiff…) u otras características.

Arriba: un sonido Una forma de onda
Abajo: un sonido Un espectrograma

Búsqueda de audio desde audio

En la búsqueda de audio a partir de audio , el usuario debe reproducir el audio de una canción ya sea con un reproductor de música, cantando o tarareando al micrófono de la computadora. Posteriormente, se deriva un patrón de sonido, A , de la forma de onda de audio, y una representación de frecuencia se deriva de su Transformada de Fourier . Este patrón se emparejará con un patrón, B , correspondiente a la forma de onda y la transformada de los archivos de sonido encontrados en la base de datos. Todos aquellos archivos de audio en la base de datos cuyos patrones sean similares al patrón buscado se mostrarán como resultados de la búsqueda.

Diseño y algoritmos

Un espectrograma del sonido de un violín.
La zona objetivo de una canción escaneada por Shazam. [ aclaración necesaria ]

La búsqueda de audio ha evolucionado lentamente a través de varios formatos de búsqueda básicos que existen en la actualidad y todos utilizan palabras clave . Las palabras clave para cada búsqueda se pueden encontrar en el título del medio, cualquier texto adjunto al medio y páginas web vinculadas al contenido, también definidas por los autores y usuarios de los recursos alojados en video.

Algunos motores de búsqueda pueden buscar grabaciones de voz, como podcasts, aunque esto puede resultar complicado si hay ruido de fondo. En cada idioma existen alrededor de 40 fonemas y en todos los idiomas hablados unos 400. En lugar de aplicar un algoritmo de búsqueda de texto una vez finalizado el procesamiento de voz a texto, algunos motores utilizan un algoritmo de búsqueda fonética para encontrar resultados dentro de la palabra hablada. Otros funcionan escuchando el podcast completo y creando una transcripción de texto.

Aplicaciones como Munax, utilizan varios algoritmos de clasificación independientes que procesan el índice invertido junto con cientos de parámetros de búsqueda para producir la clasificación final de cada documento. También como Shazam que funciona analizando el sonido capturado y buscando una coincidencia basada en una huella acústica en una base de datos de más de 11 millones de canciones. Shazam identifica canciones basándose en una huella acústica basada en un gráfico de tiempo-frecuencia llamado espectrograma . Shazam almacena un catálogo de huellas acústicas en una base de datos. El usuario etiqueta una canción durante 10 segundos y la aplicación crea una huella acústica. Una vez que crea la huella del audio, Shazam comienza la búsqueda de coincidencias en la base de datos. Si hay una coincidencia, devuelve la información al usuario; de lo contrario, devuelve un diálogo de "canción desconocida". Shazam puede identificar música pregrabada que se transmite desde cualquier fuente, como una radio, televisión, cine o música en un club, siempre que el nivel de ruido de fondo no sea lo suficientemente alto como para evitar que se tome una huella acústica, y que la canción esté presente en la base de datos del software. [ cita requerida ]

Motores notables

Búsqueda de audio profunda

Para teléfonos inteligentes

Véase también

Referencias