stringtranslate.com

Característica similar a Haar

Las características similares a las de Haar son características de imágenes digitales que se utilizan en el reconocimiento de objetos . Deben su nombre a su similitud intuitiva con las ondículas de Haar y se utilizaron en el primer detector de rostros en tiempo real. [1]

Históricamente, trabajar solo con intensidades de imagen (es decir, los valores de píxeles RGB en todos y cada uno de los píxeles de la imagen) hizo que la tarea de cálculo de características fuera computacionalmente costosa . Una publicación de Papageorgiou et al. [2] discutió el trabajo con un conjunto de características alternativo basado en wavelets de Haar en lugar de las intensidades de imagen habituales. Paul Viola y Michael Jones [1] adaptaron la idea de usar wavelets de Haar y desarrollaron las llamadas características similares a Haar. Una característica similar a Haar considera regiones rectangulares adyacentes en una ubicación específica en una ventana de detección, suma las intensidades de píxeles en cada región y calcula la diferencia entre estas sumas. Esta diferencia luego se utiliza para categorizar subsecciones de una imagen. Por ejemplo, con un rostro humano, es una observación común que entre todos los rostros, la región de los ojos es más oscura que la región de las mejillas. Por lo tanto, una característica Haar común para la detección de rostros es un conjunto de dos rectángulos adyacentes que se encuentran sobre la región de los ojos y las mejillas. La posición de estos rectángulos se define en relación con una ventana de detección que actúa como un cuadro delimitador del objeto objetivo (la cara en este caso).

En la fase de detección del marco de detección de objetos de Viola-Jones , se mueve una ventana del tamaño del objetivo sobre la imagen de entrada y, para cada subsección de la imagen, se calcula la característica similar a Haar. Luego, esta diferencia se compara con un umbral aprendido que separa los objetos de los no objetos. Debido a que una característica similar a Haar de este tipo es solo un aprendiz o clasificador débil (su calidad de detección es ligeramente mejor que la de una suposición aleatoria), se necesita una gran cantidad de características similares a Haar para describir un objeto con suficiente precisión. En el marco de detección de objetos de Viola-Jones, las características similares a Haar se organizan en algo llamado cascada de clasificadores para formar un aprendiz o clasificador fuerte.

La principal ventaja de una característica similar a Haar sobre la mayoría de las demás características es su velocidad de cálculo. Debido al uso de imágenes integrales , una característica similar a Haar de cualquier tamaño se puede calcular en tiempo constante (aproximadamente 60 instrucciones de microprocesador para una característica de 2 rectángulos).

Características rectangulares similares a las de Haar

Un ejemplo de las primeras características similares a Haar utilizadas por Viola y Jones en 2001.

Una característica rectangular simple similar a Haar se puede definir como la diferencia de la suma de píxeles de las áreas dentro del rectángulo, que puede estar en cualquier posición y escala dentro de la imagen original. Este conjunto de características modificado se llama característica de 2 rectángulos . Viola y Jones también definieron características de 3 rectángulos y características de 4 rectángulos. Los valores indican ciertas características de un área particular de la imagen. Cada tipo de característica puede indicar la existencia (o ausencia) de ciertas características en la imagen, como bordes o cambios en la textura. Por ejemplo, una característica de 2 rectángulos puede indicar dónde se encuentra el límite entre una región oscura y una región clara.

Cálculo rápido de características similares a Haar

Hallar la suma del área rectangular sombreada

Una de las contribuciones de Viola y Jones fue utilizar tablas de áreas sumadas [3] , a las que llamaron imágenes integrales . Las imágenes integrales pueden definirse como tablas de búsqueda bidimensionales en forma de matriz con el mismo tamaño que la imagen original. Cada elemento de la imagen integral contiene la suma de todos los píxeles ubicados en la región superior izquierda de la imagen original (en relación con la posición del elemento). Esto permite calcular la suma de áreas rectangulares en la imagen, en cualquier posición o escala, utilizando solo cuatro búsquedas:

donde los puntos pertenecen a la imagen integral , como se muestra en la figura.

Cada característica similar a Haar puede necesitar más de cuatro búsquedas, según cómo se haya definido. Las características de 2 rectángulos de Viola y Jones necesitan seis búsquedas, las características de 3 rectángulos necesitan ocho búsquedas y las características de 4 rectángulos necesitan nueve búsquedas.

Características similares a las de Haar inclinado

La extensión propuesta por Lienhart y Maydt [4]

Lienhart y Maydt [4] introdujeron el concepto de una característica inclinada (45°) similar a Haar. Esto se utilizó para aumentar la dimensionalidad del conjunto de características en un intento de mejorar la detección de objetos en imágenes. Esto tuvo éxito, ya que algunas de estas características pueden describir el objeto de una mejor manera. Por ejemplo, una característica inclinada similar a Haar de 2 rectángulos puede indicar la existencia de un borde a 45°.

Messom y Barczak [5] extendieron la idea a una característica genérica rotada similar a Haar. Aunque la idea es matemáticamente sólida, los problemas prácticos impiden el uso de características similares a Haar en cualquier ángulo. Para ser rápidos, los algoritmos de detección utilizan imágenes de baja resolución que introducen errores de redondeo . Por esta razón, las características rotadas similares a Haar no se utilizan comúnmente.

Referencias

  1. ^ ab Viola y Jones, "Detección rápida de objetos utilizando una cascada potenciada de características simples", Visión artificial y reconocimiento de patrones , 2001
  2. ^ Papageorgiou, Oren y Poggio, "Un marco general para la detección de objetos", Conferencia Internacional sobre Visión por Computador, 1998.
  3. ^ Crow, F, "Tablas de áreas sumadas para mapeo de texturas Archivado el 8 de agosto de 2017 en Wayback Machine ", en Actas de SIGGRAPH , 18(3):207–212, 1984
  4. ^ ab Lienhart, R. y Maydt, J., "Un conjunto extendido de características similares a Haar para la detección rápida de objetos Archivado el 15 de diciembre de 2017 en Wayback Machine ", ICIP02, págs. I: 900–903, 2002
  5. ^ Messom, CH y Barczak, ALC, "Características rotadas rápidas y eficientes similares a Haar usando imágenes integrales rotadas", Conferencia australiana sobre robótica y automatización (ACRA2006), págs. 1-6, 2006

Lectura adicional