La búsqueda por sonido es la recuperación de información basada en la entrada de audio. Hay un puñado de aplicaciones, específicamente para dispositivos móviles, que utilizan la búsqueda por sonido. Shazam , Soundhound , Axwave , ACRCloud y otras han tenido un éxito considerable al utilizar un algoritmo simple para hacer coincidir una huella acústica con una canción en una biblioteca. Estas aplicaciones toman un clip de muestra de una canción o una melodía generada por el usuario y verifican una biblioteca de música / base de datos de música para ver dónde coincide el clip con la canción. A partir de ahí, se consultará la información de la canción y se mostrará al usuario.
Este tipo de aplicaciones se utilizan principalmente para buscar una canción que el usuario no conoce. La búsqueda por sonido no se limita a la identificación de canciones , sino también a la identificación de melodías , tonadas o anuncios publicitarios , gestión de bibliotecas de sonidos y archivos de vídeo .
La forma en que estas aplicaciones buscan por sonido es mediante la generación de una huella acústica , un resumen digital del sonido. Se utiliza un micrófono para captar una muestra de audio, que luego se descompone en una firma numérica simple, un código exclusivo para cada pista. Utilizando el mismo método de identificación de sonidos, cuando Shazam capta un clip de sonido, generará una firma para ese clip. A partir de ahí, se realiza una simple comparación de patrones utilizando una extensa base de datos de música de audio.
Sin embargo, la práctica de utilizar huellas acústicas no se limita sólo a la música, sino también a otras áreas del negocio del entretenimiento. Shazam también puede identificar programas de televisión con la misma técnica de huellas acústicas. Por supuesto, este método de descomponer una muestra de sonido en una firma única es inútil a menos que exista una extensa base de datos de música con claves que coincidan con las muestras. Shazam tiene más de 11 millones de canciones en su base de datos. [1]
Otros servicios como Midomi y Soundhound permiten a los usuarios añadir a esa biblioteca de música para ampliar las posibilidades de hacer coincidir una muestra de sonido con su sonido correspondiente.
Midomi y Soundhound ofrecen consultas tarareando . Se trata de una rama de las huellas dactilares acústicas, pero sigue siendo un sistema de recuperación musical. Después de recibir una melodía tarareada generada por el usuario, que es la consulta de entrada, el sistema devuelve una lista clasificada de canciones que se acercan más a la consulta del usuario.