La melodía "tarareada" es captada por el micrófono, luego se digitalizará, y pasará al módulo de pitch tracking.
El sistema para extraer el pitch, o notas musicales es implementado en MATLAB, y el motor de búsqueda usa un algoritmo por Approximate Pattern Matching para soportar errores en el humming (tarareo).
Es así como la entrada es convertida en una cadena formada con la combinación de esas tres letras.
The Working Group For Electronic Media Technology (AEMT) de la sociedad Fraunhofer en Ilmenau, Alemania; trabaja en diferentes campos del MIR, desde el manejo de metadatos (artista, título, tempo, etc), hasta el desarrollo del software "Query By Humming"; liderados por el Dr. Frank Klefenz.
En otro lado del Instituto Fraunhofer, en el Institute for integrated Circuits IIS, se trabaja en proyecto AudioID, el cual registra todas las características musicales de la canción, incluso diferencia entre versiones de la canción, y está basado en la tecnología MPEG7.