stringtranslate.com

Análisis forense de audio

La audioforense es el campo de la ciencia forense relacionado con la adquisición, análisis y evaluación de grabaciones de sonido que, en última instancia, pueden presentarse como prueba admisible en un tribunal de justicia o en algún otro lugar oficial. [1] [2] [3] [4]

La evidencia forense de audio puede provenir de una investigación criminal realizada por autoridades policiales o como parte de una investigación oficial sobre un accidente, fraude, acusación de difamación o algún otro incidente civil. [5]

Los aspectos principales de la análisis forense de audio son establecer la autenticidad de la evidencia de audio, realizar mejoras en las grabaciones de audio para mejorar la inteligibilidad del habla y la audibilidad de sonidos de bajo nivel, e interpretar y documentar evidencia sonora, como identificar a los hablantes, transcribir diálogos y reconstruir el crimen. o escenas de accidentes y cronogramas. [2]

La ciencia forense de audio moderna hace un uso extensivo del procesamiento de señales digitales , quedando obsoleto el uso anterior de filtros analógicos. Se utilizan ampliamente técnicas como el filtrado adaptativo y las transformadas discretas de Fourier . [3] Los avances recientes en técnicas forenses de audio incluyen la biometría de voz y el análisis de frecuencia de redes eléctricas . [6]

Historia

La posibilidad de realizar análisis de audio forense depende de la disponibilidad de grabaciones de audio realizadas fuera de los límites de un estudio de grabación. Las primeras grabadoras de cinta magnética portátiles aparecieron en la década de 1950 y pronto estos dispositivos se utilizaron para obtener grabaciones clandestinas de entrevistas y escuchas telefónicas, así como para grabar interrogatorios. [4]

El primer caso legal que invocó las técnicas de audio forense en los tribunales federales de Estados Unidos fue el caso Estados Unidos contra McKeever, que tuvo lugar en la década de 1950. [7] Por primera vez, se pidió al juez del caso McKeever que determinara la admisibilidad legal de la conversación grabada que involucraba al acusado. [8]

La Oficina Federal de Investigaciones (FBI) de EE. UU. comenzó a implementar análisis forenses de audio y mejoras de audio a principios de la década de 1960. [4]

El campo de la análisis forense de audio se estableció principalmente en 1973 durante el escándalo Watergate . Un tribunal federal encargó a un panel de ingenieros de audio que investigaran las lagunas en las cintas Watergate del presidente Nixon , que eran grabaciones secretas que el presidente estadounidense Richard Nixon realizó mientras estaba en el cargo. La investigación encontró que se habían borrado nueve secciones separadas de una cinta vital. El informe dio lugar a nuevas técnicas para analizar la cinta magnética. [6]

Autenticidad

Una grabación de audio digital puede presentar muchos desafíos para la evaluación de autenticidad. [9] El análisis de autenticidad de las grabaciones de audio digitales se basa en las huellas dejadas dentro de la grabación durante el proceso de grabación y en otras operaciones de edición posteriores. El primer objetivo del análisis es detectar e identificar cuáles de estos rastros se pueden recuperar de la grabación de audio y documentar sus propiedades. En un segundo paso, se analizan las propiedades de las huellas recuperables para determinar si apoyan o contradicen la hipótesis de que la grabación ha sido modificada.

Para acceder a la autenticidad de la evidencia de audio, el examinador necesita varios tipos de observación, tales como: verificar la capacidad de grabación, el formato de grabación, revisar el historial del documento y escuchar el audio completo. [10]

Esquema de bloques que explica la división de autenticidad forense del audio.
Esquema de bloques de autenticidad forense de audio

Los métodos para acceder a la integridad del audio digital se pueden dividir en dos categorías principales: [8]

Análisis de contenedores

El análisis del contenedor consta de cálculo HASH , MAC y análisis de formato de archivo . [8]

Análisis de contenido

El análisis de contenido es la parte central del proceso de análisis forense digital y se basa en el contenido del archivo de audio para encontrar rastros de manipulación y operaciones de procesamiento antiforense. Las técnicas forenses de audio basadas en contenido se pueden dividir en las siguientes categorías:

  1. Frecuencia de la Red Eléctrica (ENF)
  2. Firma del entorno acústico

La ENF

Artículo principal: Análisis de frecuencia de la red eléctrica.

Esquema de extracción de vectores de características ENF

La frecuencia de la red eléctrica es uno de los análisis forenses de audio más confiables y sólidos. [8]

Todos los dispositivos de grabación digital son sensibles a la frecuencia inducida de la fuente de alimentación a 50 o 60 Hz, lo que a su vez proporciona una firma de forma de onda identificable dentro de la grabación. Esto se aplica tanto a unidades alimentadas por red como a dispositivos portátiles cuando estos últimos se utilizan cerca de cables de transmisión o equipos alimentados por red. [13]

El vector de características ENF se obtiene utilizando un filtrado de paso de banda entre el rango 49‑51 Hz, sin volver a muestrear el archivo de audio, para separar la forma de onda ENF de la grabación original. Luego, los resultados se trazan y analizan con la base de datos proporcionada por el proveedor de energía para probar o refutar la integridad de la grabación, proporcionando así autenticación científica y probatoria del material en análisis. [13]

La firma del entorno acústico

Artículo principal: firma acústica

Una grabación de audio suele ser una combinación de múltiples señales acústicas, como: fuentes directas, señales indirectas o reflexiones, fuentes secundarias y ruido ambiental. Las señales indirectas, fuentes secundarias y ruido ambiental se utilizan para caracterizar un entorno acústico. [4] El trabajo difícil es extrapolar las señales acústicas de la grabación de audio.

La identificación del entorno acústico dinámico (AEI) se puede calcular utilizando una estimación de la reverberación y el ruido de fondo. [8]

Mejora de audio

La mejora de audio es un proceso forense que tiene como objetivo mejorar la inteligibilidad del archivo de audio eliminando y limpiando el ruido no deseado de una grabación que de otro modo sería ininteligible. [2]

Los científicos forenses intentan eliminar estos ruidos sin afectar la información original presente en el archivo de audio. La mejora permite obtener una mejor inteligibilidad del expediente, lo que puede ser crucial para determinar la participación o no de una persona en un delito. [8]

El núcleo del análisis de mejora de audio es detectar problemas de ruido y extraerlos del archivo original. De hecho, si se puede aplicar ingeniería inversa al ruido de algún modo, se podrá explotar e investigar para permitir su posterior eliminación o atenuación. [13]

Los objetivos de la mejora del audio forense son:

El primer paso del proceso de mejora del audio es la escucha crítica: se revisa la grabación completa para formular una estrategia forense sólida. Crear clones de la grabación de audio es fundamental, ya que nunca se trabaja sobre la grabación maestra para tener el archivo original y poder comparar con él. A lo largo de todo el proceso de mejora, el original se compara constantemente con la grabación original sin procesar, lo que evita cualquier sobreprocesamiento y evita problemas que puedan surgir más adelante durante una prueba. Seguir las pautas y los procedimientos de trabajo permite que un especialista diferente obtenga los mismos resultados utilizando el mismo procesamiento. [13]

Podemos dividir el sonido que interfiere en dos categorías: ruido estacionario o ruido variable en el tiempo.

El ruido estacionario tiene un carácter constante, como un gemido, zumbido, estruendo o silbido continuo. Supongamos que el ruido estacionario ocupa un rango de frecuencia que difiere de las señales de interés, como una grabación de voz con un ruido constante en el rango de frecuencia inferior a 100 Hz. En ese caso, es posible aplicar un filtro fijo, como un filtro de paso de banda , para pasar aproximadamente el ancho de banda de la voz . Normalmente, el ancho de banda de la voz oscila entre 250 Hz y 4 kHz. [14] En caso de que el ancho de banda del ruido estacionario ocupe el mismo rango de frecuencia de la señal deseada, un simple filtro de separación no será útil. Sin embargo, aún es posible aplicar la ecualización para mejorar la audibilidad/inteligibilidad de la señal deseada. [4]

Las fuentes de ruido variables en el tiempo generalmente requieren un procesamiento más complicado que las fuentes de ruido estacionarias y a menudo no se suprimen de manera efectiva. [4]

Método de mejora

La mejora del audio se realiza con métodos de dominio de tiempo, control automático de ganancia y dominio de frecuencia, filtros selectivos de frecuencia y sustracción espectral. [15]

Control de ganancia automática

La mejora en el dominio del tiempo normalmente implica ajustes de ganancia para normalizar la envolvente de amplitud de la señal de audio grabada. Normalmente se utiliza la técnica de control automático de ganancia , o técnica de compresión /expansión de ganancia, que intenta alcanzar un nivel de sonido constante durante la reproducción: las partes de la grabación que se refieren sólo al ruido se hacen más silenciosas, los pasajes de señal de baja amplitud se amplifican y los los pasajes se atenúan o se dejan solos.

Un enfoque común es aplicar una puerta de ruido o un proceso de silenciamiento a la señal ruidosa. La puerta de ruido puede realizarse como un dispositivo electrónico diseñado para ese fin o puede ser un software para procesar con una computadora. La puerta de ruido compara el nivel de corta duración de su señal de entrada con un umbral de nivel predeterminado. Si el nivel de la señal está por encima del nivel umbral, la puerta se abre y la señal pasa; de lo contrario, si el nivel de la señal está por debajo del umbral, la puerta se cierra y no se permite el paso de la señal. La función del examinador es ajustar el nivel de umbral para que el habla pueda pasar a través de la puerta mientras se bloquea la señal de ruido que se produce en las partes de silencio. Una puerta de ruido puede ayudar al oyente a comprender una señal que se percibe como menos ruidosa porque el sonido de fondo se bloquea durante las pausas de la conversación. Sin embargo, la puerta de ruido en su versión simple no puede reducir el nivel de ruido y aumentar simultáneamente la señal cuando ambos están presentes al mismo tiempo y la puerta está abierta. [2]

Luego también existen sistemas de puerta de ruido más avanzados que aprovechan algunas técnicas de procesamiento de señales digitales para ejecutar una separación de puerta en diferentes bandas de frecuencia. Estos sistemas avanzados ayudan al examinador a eliminar tipos particulares de ruido y silbidos presentes en la grabación de audio. [15]

Filtros selectivos de frecuencia

Los filtros selectivos de frecuencia es una técnica que opera en el dominio de la frecuencia. El principio detrás de esta técnica es mejorar la calidad de una grabación atenuando selectivamente los componentes tonales del espectro, como los zumbidos y zumbidos relacionados con la energía. El uso de un ecualizador de audio multibanda también puede resultar útil para reducir el ruido fuera de banda y al mismo tiempo conservar la banda de frecuencia de interés, como el rango de frecuencia del habla. [15]

Resta espectral

La sustracción espectral es una técnica de procesamiento de señales digitales en la que se estima un espectro de ruido de corta duración a partir de un cuadro y luego se resta del espectro de cuadros cortos de la señal de entrada ruidosa. El espectro obtenido después de la resta se utiliza para reconstruir la trama con ruido reducido de la señal de salida. El proceso continúa en los fotogramas siguientes para crear la señal de salida completa mediante un procedimiento de superposición y adición . [dieciséis]

La eficacia de la sustracción espectral depende de la capacidad de estimar el espectro de ruido. La estimación generalmente se obtiene a partir de un cuadro de señal de entrada que se sabe que contiene solo ruido de fondo, como una pausa entre oraciones en una conversación grabada. Los métodos de reducción de ruido más sofisticados combinan los conceptos de detección de nivel en el dominio del tiempo y sustracción espectral en el dominio de la frecuencia. Se utilizan reglas y modelos de señal adicionales para separar los componentes de la señal que probablemente formen parte de la señal deseada de aquellos que probablemente sean ruido aditivo. [15]

Interpretación

Después de la autenticación y mejora, el archivo de audio examinado debe evaluarse e interpretarse para determinar su importancia para la investigación. [15]

Por ejemplo, en el caso de una grabación de voz, esto significa preparar una transcripción del contenido de audio, identificar a los hablantes, interpretar los sonidos de fondo, etc. [15]

En 2009, la Academia Nacional de Ciencias de Estados Unidos (NAS) publicó un informe titulado Fortalecimiento de la ciencia forense en Estados Unidos: un camino a seguir. [17] El informe fue muy crítico con las muchas áreas de la ciencia forense, incluida la ciencia forense de audio, que tradicionalmente se ha basado en análisis subjetivos y comparaciones.

La importancia y confiabilidad de la evidencia forense dependen de una variedad de contribuciones a una investigación. Casi siempre existe cierto nivel de incertidumbre, porque normalmente la evidencia forense de audio se interpreta con consideraciones objetivas y subjetivas.

Si bien en un estudio científico la incertidumbre se puede medir con algunos indicadores y el análisis continuo puede proporcionar información adicional en el futuro, un examen forense generalmente no está sujeto a una revisión continua. La sentencia debe dictarse en el momento de conocer el caso, por lo que el tribunal debe sopesar las distintas pruebas y evaluar cualquier nivel de duda que pueda haber. [18]

Ver también

Referencias

  1. ^ Phil Manchester (enero de 2010). "Una introducción al audio forense". Sonido sobre sonido.
  2. ^ abcd Maher, Robert C. (marzo de 2009). "Examen forense de audio: autenticidad, mejora e interpretación". Revista de procesamiento de señales IEEE . 26 (2): 84–94. doi :10.1109/msp.2008.931080. S2CID  18216777.
  3. ^ ab Alexander Gelfand (10 de octubre de 2007). "Los expertos en audio forense revelan (algunos) secretos". Revista cableada. Archivado desde el original el 8 de abril de 2012.
  4. ^ abcdef Maher, Robert C. (2018). Principios del análisis de audio forense . Cham, Suiza: Springer. ISBN 9783319994536. OCLC  1062360764.
  5. ^ Maher, Robert C. (verano de 2015). "Prestar oído en la sala del tribunal: acústica forense" (PDF) . Acústica hoy . 11 : 22-29.
  6. ^ ab Williams, Christopher (1 de junio de 2010). "Met Lab afirma 'el mayor avance desde Watergate'". El registro . Consultado el 15 de septiembre de 2021 .
  7. ^ Tribunal de Distrito de los Estados Unidos, Distrito Sur, Nueva York. (1958). Estados Unidos contra McKeever, 169 F. Supp. 426 (SDNY 1958).
  8. ^ abcdef Zakariah, Mahoma; Khan, Muhammad Khurram; Malik, Hafiz (9 de enero de 2017). "Forense del audio multimedia digital: pasado, presente y futuro". Herramientas y aplicaciones multimedia . 77 (1): 1009-1040. doi :10.1007/s11042-016-4277-2. ISSN  1380-7501. S2CID  254830683.
  9. ^ Brixen, EB (2007). "Técnicas para la autenticación de grabaciones de audio digitales". En las actas de la 122ª Convención de la Sociedad de Ingeniería de Audio . Viena, Austria.
  10. ^ Koenig, BE (1990). "Autenticación de grabaciones de audio forenses". J Audio Eng Soc . 38 : 3–33.
  11. ^ Koenig, SER; Lacey, DS (2012). "Análisis forenses de autenticidad de los datos del encabezado en archivos WMA recodificados de pequeñas grabadoras de audio Olympus". J Audio Eng Soc . 60 : 255–265.
  12. ^ Koenig, SER; Lacey, DS (2009). "Autenticación forense de grabaciones de audio digitales". J Audio Eng Soc . 57 : 662–695.
  13. ^ abcd "Introducción al audio forense". www.soundonsound.com . Consultado el 28 de junio de 2022 .
  14. ^ "Definición: frecuencia de voz".
  15. ^ abcdef Maher, Robert C. (2010). "Descripción general de la ciencia forense del audio". Análisis multimedia inteligente para aplicaciones de seguridad . Estudios en Inteligencia Computacional. vol. 282, págs. 127-144. doi :10.1007/978-3-642-11756-5_6. ISBN 978-3-642-11754-1.
  16. ^ Boll, S. (1979). "Un algoritmo de sustracción espectral para la supresión del ruido acústico en el habla". ICASSP '79. Conferencia internacional IEEE sobre acústica, habla y procesamiento de señales . vol. 4. Instituto de Ingenieros Eléctricos y Electrónicos. págs. 200-203. doi :10.1109/icassp.1979.1170696.
  17. ^ Academia Nacional de Ciencias de Estados Unidos (NAS). "Fortalecimiento de la ciencia forense en los Estados Unidos: un camino a seguir" (PDF) .
  18. ^ Morrison, Geoffrey Stewart (2011). "Medición de la validez y confiabilidad de sistemas forenses de índice de verosimilitud". Ciencia y Justicia . 51 (3): 91–98. doi :10.1016/j.scijus.2011.03.002. ISSN  1355-0306. PMID  21889105.