stringtranslate.com

Reconocimiento automático de objetivos

El reconocimiento automático de objetivos ( ATR ) es la capacidad de un algoritmo o dispositivo para reconocer objetivos u otros objetos basándose en datos obtenidos de sensores .

El reconocimiento de objetivos se realizaba inicialmente mediante el uso de una representación audible de la señal recibida, donde un operador capacitado descifraría ese sonido para clasificar el objetivo iluminado por el radar . Si bien estos operadores capacitados tuvieron éxito, se han desarrollado y se continúan desarrollando métodos automatizados que permiten una mayor precisión y velocidad en la clasificación. El ATR se puede utilizar para identificar objetos fabricados por el hombre, como vehículos terrestres y aéreos, así como objetivos biológicos como animales, humanos y vegetación. Esto puede resultar útil para todo, desde reconocer un objeto en un campo de batalla hasta filtrar las interferencias causadas por grandes bandadas de pájaros en el radar meteorológico Doppler.

Las posibles aplicaciones militares incluyen un sistema de identificación simple, como un transpondedor IFF , y se utiliza en otras aplicaciones, como vehículos aéreos no tripulados y misiles de crucero . También se ha mostrado cada vez más interés en utilizar ATR para aplicaciones domésticas. Se han realizado investigaciones sobre el uso de ATR para la seguridad fronteriza, sistemas de seguridad para identificar objetos o personas en las vías del metro, vehículos automatizados y muchos otros.

Concepto

Historia

El reconocimiento de objetivos existe desde casi tanto tiempo como el radar . Los operadores de radar identificarían a los bombarderos y cazas enemigos a través de la representación de audio que recibía la señal reflejada (ver Radar en la Segunda Guerra Mundial ).

El reconocimiento de objetivos se realizó durante años transmitiendo la señal de banda base al operador. Al escuchar esta señal, los operadores de radar capacitados pueden identificar diversos datos sobre el objetivo iluminado, como el tipo de vehículo que es, el tamaño del objetivo y, potencialmente, incluso pueden distinguir objetivos biológicos. Sin embargo, este enfoque tiene muchas limitaciones. El operador debe estar capacitado para saber cómo sonará cada objetivo; si el objetivo viaja a alta velocidad, es posible que ya no sea audible y el componente de decisión humana hace que la probabilidad de error sea alta. Sin embargo, esta idea de representar audiblemente la señal proporcionó una base para la clasificación automatizada de objetivos. Varios esquemas de clasificación que se han desarrollado utilizan características de la señal de banda base que se han utilizado en otras aplicaciones de audio, como el reconocimiento de voz .

Descripción general

Efecto Micro Doppler

El radar determina la distancia a la que se encuentra un objeto cronometrando el tiempo que tarda la señal transmitida en regresar del objetivo iluminado por esta señal. Cuando este objeto no está estacionario, provoca un cambio de frecuencia conocido como efecto Doppler . Además del movimiento de traslación de todo el objeto, la vibración o el giro del objeto pueden provocar un cambio de frecuencia adicional. Cuando esto sucede, la señal Doppler desplazada se modulará. Este efecto Doppler adicional que provoca la modulación de la señal se conoce como efecto micro-Doppler. Esta modulación puede tener un determinado patrón o firma que permitirá desarrollar algoritmos para ATR. El efecto micro-Doppler cambiará con el tiempo dependiendo del movimiento del objetivo, provocando una señal que varía en el tiempo y la frecuencia. [1]

Análisis tiempo-frecuencia

El análisis de la transformada de Fourier de esta señal no es suficiente ya que la transformada de Fourier no puede explicar el componente que varía en el tiempo. El método más sencillo para obtener una función de frecuencia y tiempo es utilizar la transformada de Fourier de tiempo corto (STFT). Sin embargo, se pueden utilizar métodos más robustos, como la transformada de Gabor o la función de distribución de Wigner (WVD), para proporcionar una representación simultánea del dominio de la frecuencia y el tiempo. Sin embargo, en todos estos métodos habrá un equilibrio entre la resolución de frecuencia y la resolución de tiempo. [2]

Detección

Una vez que se extrae esta información espectral, se puede comparar con una base de datos existente que contiene información sobre los objetivos que identificará el sistema y se puede tomar una decisión sobre cuál es el objetivo iluminado. Esto se hace modelando la señal recibida y luego usando un método de estimación estadística como máxima verosimilitud (ML), votación por mayoría (MV) o máximo a posteriori (MAP) para tomar una decisión sobre qué objetivo en la biblioteca se ajusta mejor al modelo construido usando la señal recibida.

Acercarse

Extracción de características

Se han realizado estudios que toman las funciones de audio utilizadas en el reconocimiento de voz para construir sistemas automatizados de reconocimiento de objetivos que identificarán objetivos en función de estos coeficientes inspirados en el audio. Estos coeficientes incluyen el

La señal de banda base se procesa para obtener estos coeficientes, luego se utiliza un proceso estadístico para decidir qué objetivo en la base de datos es más similar a los coeficientes obtenidos. La elección de qué características y qué esquema de decisión utilizar depende del sistema y la aplicación.

Las características utilizadas para clasificar un objetivo no se limitan a coeficientes inspirados en el habla. Se puede utilizar una amplia gama de funciones y algoritmos de detección para lograr ATR.

Algoritmos de detección

Para automatizar la detección de objetivos, es necesario crear una base de datos de entrenamiento. Esto generalmente se hace utilizando datos experimentales recopilados cuando se conoce el objetivo y luego se almacenan para que los utilice el algoritmo ATR.

ATR utilizando funciones de Cepstrum y GMM

En el diagrama de flujo se muestra un ejemplo de un algoritmo de detección. Este método utiliza M bloques de datos, extrae las características deseadas de cada uno (es decir, coeficientes LPC, MFCC) y luego los modela utilizando un modelo de mezcla gaussiana (GMM). Después de obtener un modelo utilizando los datos recopilados, se forma una probabilidad condicional para cada objetivo contenido en la base de datos de entrenamiento. En este ejemplo, hay M bloques de datos. Esto dará como resultado una colección de M probabilidades para cada objetivo en la base de datos. Estas probabilidades se utilizan para determinar cuál es el objetivo mediante una decisión de máxima verosimilitud . Se ha demostrado que este método puede distinguir entre tipos de vehículos (vehículos de ruedas y de orugas, por ejemplo) e incluso decidir cuántas personas están presentes, hasta tres personas, con una alta probabilidad de éxito. [3]

Reconocimiento de objetivos basado en CNN

El reconocimiento de objetivos basado en redes neuronales convolucionales (CNN) puede superar a los métodos convencionales. [4] [5] Se ha demostrado útil para reconocer objetivos (es decir, tanques de batalla) en imágenes infrarrojas de escenas reales después del entrenamiento con imágenes sintéticas, ya que las imágenes reales de esos objetivos son escasas. Debido a la limitación del conjunto de entrenamiento, el grado de realismo de las imágenes sintéticas es muy importante cuando se trata de reconocer el conjunto de pruebas de escenas reales.

La estructura general de las redes CNN contiene 7 capas de convolución, 3 capas de agrupación máxima y una capa Softmax como salida. Las capas de agrupación máxima se encuentran después de la segunda, la cuarta y la quinta capa de convolución. También se aplica una agrupación promedio global antes de la salida. Todas las capas convolucionales utilizan la función de activación de no linealidad Leaky ReLU. [6]

Ver también

Referencias

  1. ^ Chen, V. (febrero de 2011). Efecto Micro-Doppler en Radar . Norwood, MA: Casa Artec. págs. 18-21. ISBN 9781608070589.
  2. ^ Chen, V. (febrero de 2011). Efecto Micro-Doppler en Radar . Norwood, MA: Casa Artec. págs. 21-28. ISBN 9781608070589.
  3. ^ Bilik, yo; Tabrikian, J. (enero de 2006). "Clasificación de objetivos basada en GMM para radar Doppler de vigilancia terrestre". Transacciones IEEE sobre sistemas aeroespaciales y electrónicos . 42 (1): 267–277. Código Bib :2006ITAES..42..267B. doi :10.1109/TAES.2006.1603422. S2CID  10841797.
  4. ^ Yoon, Seok Pil; Canción, Taek Lyul; Kim, Tae Han (1 de febrero de 2013). "Reconocimiento y seguimiento automático de objetivos en secuencias de imágenes infrarrojas prospectivas con un fondo complejo". Revista Internacional de Control, Automatización y Sistemas . 11 (1): 21–32. doi :10.1007/s12555-011-0226-z. ISSN  2005-4092. S2CID  120650459.
  5. ^ Venkataraman, Vijay; Fan, Guoliang; Yu, Liangjiang; Zhang, Xin; Liu, Weiguang; Havlicek, Joseph P. (7 de diciembre de 2011). "Seguimiento y reconocimiento de objetivos automatizados utilizando vistas acopladas y múltiples de identidad para la representación de formas". Revista EURASIP sobre avances en el procesamiento de señales . 2011 (1): 124. Código bibliográfico : 2011EJASP2011..124V. doi : 10.1186/1687-6180-2011-124 . ISSN  1687-6180.
  6. ^ d'Acremont, Antoine; Fábula, Ronan; Baussard, Alejandro; Quin, Guillaume (enero de 2019). "Identificación y reconocimiento de objetivos basados ​​en CNN para imágenes infrarrojas en sistemas de defensa". Sensores . 19 (9): 2040. Código Bib : 2019Senso..19.2040D. doi : 10.3390/s19092040 . PMC 6539764 . PMID  31052320. 

enlaces externos