La tasa de cruce por cero (ZCR) es la tasa a la que una señal cambia de positiva a cero a negativa o de negativa a cero a positiva. [1] Su valor ha sido ampliamente utilizado tanto en el reconocimiento de voz como en la recuperación de información musical , siendo una característica clave para clasificar los sonidos de percusión. [2]
ZCR se define formalmente como
donde es una señal de longitud y es una función indicadora .
En algunos casos sólo se cuentan los cruces "positivos" o "negativos", en lugar de todos los cruces, ya que entre un par de cruces por cero positivos adyacentes debe haber un único cruce por cero negativo.
En el caso de señales tonales monofónicas , la tasa de cruce por cero se puede utilizar como un algoritmo primitivo de detección de tono . Las tasas de cruce por cero también se utilizan para la detección de actividad de voz (VAD), que determina si hay voz humana presente en un segmento de audio o no.