stringtranslate.com

Reconocimiento automático de objetivos

El reconocimiento automático de objetivos ( ATR ) es la capacidad de un algoritmo o dispositivo de reconocer objetivos u otros objetos basándose en datos obtenidos de sensores .

El reconocimiento de objetivos se hacía inicialmente mediante una representación audible de la señal recibida, donde un operador entrenado descifraba ese sonido para clasificar el objetivo iluminado por el radar . Si bien estos operadores entrenados tuvieron éxito, se han desarrollado y continúan desarrollándose métodos automatizados que permiten una mayor precisión y velocidad en la clasificación. El ATR se puede utilizar para identificar objetos creados por el hombre, como vehículos terrestres y aéreos, así como para objetivos biológicos como animales, humanos y desorden vegetal. Esto puede ser útil para todo, desde reconocer un objeto en un campo de batalla hasta filtrar la interferencia causada por grandes bandadas de pájaros en el radar meteorológico Doppler.

Las posibles aplicaciones militares incluyen un sistema de identificación simple, como un transpondedor IFF , y se utiliza en otras aplicaciones, como vehículos aéreos no tripulados y misiles de crucero . También ha habido un creciente interés en el uso de ATR para aplicaciones domésticas. Se han realizado investigaciones sobre el uso de ATR para seguridad fronteriza, sistemas de seguridad para identificar objetos o personas en una vía de metro, vehículos automatizados y muchos otros.

Concepto

Historia

El reconocimiento de objetivos existe desde hace casi tanto tiempo como el radar . Los operadores de radar identificaban a los bombarderos y cazas enemigos a través de la representación de audio que recibían por la señal reflejada (véase el radar en la Segunda Guerra Mundial ).

Durante años, el reconocimiento de objetivos se ha realizado reproduciendo la señal de banda base para el operador. Al escuchar esta señal, los operadores de radar capacitados pueden identificar diversos datos sobre el objetivo iluminado, como el tipo de vehículo, el tamaño del objetivo e incluso pueden distinguir objetivos biológicos. Sin embargo, este enfoque tiene muchas limitaciones. El operador debe estar capacitado para saber cómo sonará cada objetivo, si el objetivo se desplaza a gran velocidad puede que ya no sea audible y el componente de decisión humana hace que la probabilidad de error sea alta. Sin embargo, esta idea de representar la señal de forma audible proporcionó una base para la clasificación automatizada de objetivos. Varios esquemas de clasificación que se han desarrollado utilizan características de la señal de banda base que se han utilizado en otras aplicaciones de audio, como el reconocimiento de voz .

Descripción general

Efecto micro-Doppler

El radar determina la distancia a la que se encuentra un objeto midiendo el tiempo que tarda la señal transmitida en regresar del objetivo que está iluminado por esta señal. Cuando este objeto no está estacionario, provoca un cambio de frecuencia conocido como efecto Doppler . Además del movimiento de traslación de todo el objeto, se puede producir un cambio de frecuencia adicional por la vibración o el giro del objeto. Cuando esto sucede, la señal desplazada por el efecto Doppler se modula. Este efecto Doppler adicional que provoca la modulación de la señal se conoce como efecto micro-Doppler. Esta modulación puede tener un patrón o firma determinados que permitirán el desarrollo de algoritmos para el ATR. El efecto micro-Doppler cambiará con el tiempo en función del movimiento del objetivo, lo que provocará una señal que varía en el tiempo y la frecuencia. [1]

Análisis de tiempo-frecuencia

El análisis de la transformada de Fourier de esta señal no es suficiente, ya que la transformada de Fourier no puede tener en cuenta el componente variable en el tiempo. El método más simple para obtener una función de frecuencia y tiempo es utilizar la transformada de Fourier de tiempo corto (STFT). Sin embargo, se pueden utilizar métodos más robustos, como la transformada de Gabor o la función de distribución de Wigner (WVD), para proporcionar una representación simultánea del dominio de la frecuencia y el tiempo. Sin embargo, en todos estos métodos habrá un equilibrio entre la resolución de frecuencia y la resolución de tiempo. [2]

Detección

Una vez extraída esta información espectral, se puede comparar con una base de datos existente que contiene información sobre los objetivos que el sistema identificará y se puede tomar una decisión sobre cuál es el objetivo iluminado. Esto se hace modelando la señal recibida y luego utilizando un método de estimación estadística como máxima verosimilitud (ML), votación mayoritaria (MV) o máximo a posteriori (MAP) para tomar una decisión sobre qué objetivo de la biblioteca se ajusta mejor al modelo construido utilizando la señal recibida.

Acercarse

Extracción de características

Se han realizado estudios que utilizan las características de audio utilizadas en el reconocimiento de voz para crear sistemas de reconocimiento de objetivos automatizados que identificarán objetivos en función de estos coeficientes inspirados en el audio. Estos coeficientes incluyen:

La señal de banda base se procesa para obtener estos coeficientes y luego se utiliza un proceso estadístico para decidir qué objetivo de la base de datos es más similar a los coeficientes obtenidos. La elección de qué características y qué esquema de decisión utilizar depende del sistema y la aplicación.

Las características que se utilizan para clasificar un objetivo no se limitan a los coeficientes inspirados en el habla. Se puede utilizar una amplia gama de características y algoritmos de detección para lograr el ATR.

Algoritmos de detección

Para que la detección de objetivos se automatice, es necesario crear una base de datos de entrenamiento. Esto se hace generalmente con datos experimentales recopilados cuando se conoce el objetivo y luego se almacenan para que los use el algoritmo ATR.

ATR utilizando las características de Cepstrum y GMM

En el diagrama de flujo se muestra un ejemplo de un algoritmo de detección. Este método utiliza M bloques de datos, extrae las características deseadas de cada uno (es decir, coeficientes LPC, MFCC) y luego los modela utilizando un modelo de mezcla gaussiana (GMM). Después de obtener un modelo utilizando los datos recopilados, se forma una probabilidad condicional para cada objetivo contenido en la base de datos de entrenamiento. En este ejemplo, hay M bloques de datos. Esto dará como resultado una colección de M probabilidades para cada objetivo en la base de datos. Estas probabilidades se utilizan para determinar cuál es el objetivo utilizando una decisión de máxima verosimilitud . Se ha demostrado que este método puede distinguir entre tipos de vehículos (vehículos con ruedas y vehículos con orugas, por ejemplo) e incluso decidir cuántas personas están presentes hasta tres personas con una alta probabilidad de éxito. [3]

Reconocimiento de objetivos basado en CNN

El reconocimiento de objetivos basado en redes neuronales convolucionales (CNN) es capaz de superar a los métodos convencionales. [4] [5] Se ha demostrado que es útil para reconocer objetivos (por ejemplo, tanques de batalla) en imágenes infrarrojas de escenas reales después del entrenamiento con imágenes sintéticas, ya que las imágenes reales de esos objetivos son escasas. Debido a la limitación del conjunto de entrenamiento, el grado de realismo de las imágenes sintéticas es muy importante cuando se trata de reconocer el conjunto de prueba de escenas reales.

La estructura general de las redes CNN contiene 7 capas de convolución, 3 capas de agrupación máxima y una capa Softmax como salida. Las capas de agrupación máxima se encuentran después de la segunda, la cuarta y la quinta capa de convolución. También se aplica una agrupación promedio global antes de la salida. Todas las capas de convolución utilizan la función de activación de no linealidad Leaky ReLU. [6]

Véase también

Referencias

  1. ^ Chen, V. (febrero de 2011). Efecto micro-Doppler en el radar . Norwood, MA: Artec House. págs. 18-21. ISBN 9781608070589.
  2. ^ Chen, V. (febrero de 2011). Efecto micro-Doppler en el radar . Norwood, MA: Artec House. págs. 21-28. ISBN 9781608070589.
  3. ^ Bilik, I.; Tabrikian, J. (enero de 2006). "Clasificación de objetivos basada en GMM para radar Doppler de vigilancia terrestre". IEEE Transactions on Aerospace and Electronic Systems . 42 (1): 267–277. Bibcode :2006ITAES..42..267B. doi :10.1109/TAES.2006.1603422. S2CID  10841797.
  4. ^ Yoon, Seok Pil; Song, Taek Lyul; Kim, Tae Han (1 de febrero de 2013). "Reconocimiento y seguimiento automático de objetivos en secuencias de imágenes infrarrojas orientadas hacia delante con un fondo complejo". Revista internacional de control, automatización y sistemas . 11 (1): 21–32. doi :10.1007/s12555-011-0226-z. ISSN  2005-4092. S2CID  120650459.
  5. ^ Venkataraman, Vijay; Fan, Guoliang; Yu, Liangjiang; Zhang, Xin; Liu, Weiguang; Havlicek, Joseph P. (7 de diciembre de 2011). "Seguimiento y reconocimiento automatizado de objetivos mediante colectores de identidad y vista acoplados para la representación de formas". Revista EURASIP sobre avances en procesamiento de señales . 2011 (1): 124. Bibcode :2011EJASP2011..124V. doi : 10.1186/1687-6180-2011-124 . ISSN  1687-6180.
  6. ^ d'Acremont, Antoine; Fablet, Ronan; Baussard, Alexandre; Quin, Guillaume (enero de 2019). "Reconocimiento e identificación de objetivos basados ​​en CNN para imágenes infrarrojas en sistemas de defensa". Sensores . 19 (9): 2040. Bibcode :2019Senso..19.2040D. doi : 10.3390/s19092040 . PMC 6539764 . PMID  31052320. 

Enlaces externos