En el procesamiento de imágenes digitales , la suma de diferencias absolutas ( SAD ) es una medida de la similitud entre bloques de imágenes . Se calcula tomando la diferencia absoluta entre cada píxel del bloque original y el píxel correspondiente en el bloque que se utiliza para la comparación. Estas diferencias se suman para crear una métrica simple de similitud de bloques, la norma L 1 de la imagen de diferencia o distancia de Manhattan entre dos bloques de imágenes.
La suma de diferencias absolutas se puede utilizar para diversos propósitos, como el reconocimiento de objetos , la generación de mapas de disparidad para imágenes estéreo y la estimación de movimiento para la compresión de vídeo .
En este ejemplo se utiliza la suma de las diferencias absolutas para identificar qué parte de una imagen de búsqueda es más similar a una imagen de plantilla. En este ejemplo, la imagen de plantilla tiene un tamaño de 3 x 3 píxeles, mientras que la imagen de búsqueda tiene un tamaño de 3 x 5 píxeles. Cada píxel está representado por un único número entero del 0 al 9.
Buscar imagen de plantilla 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 5 9 8 4 6 8 5
Hay exactamente tres ubicaciones únicas dentro de la imagen de búsqueda donde la plantilla puede encajar: el lado izquierdo de la imagen, el centro de la imagen y el lado derecho de la imagen. Para calcular los valores SAD, se utiliza el valor absoluto de la diferencia entre cada par de píxeles correspondiente: la diferencia entre 2 y 2 es 0, 4 y 1 es 3, 7 y 8 es 1, y así sucesivamente.
El cálculo de los valores de las diferencias absolutas para cada píxel, para las tres posibles ubicaciones de la plantilla, da lo siguiente:
Centro Izquierda Derecha0 2 0 5 0 3 3 3 13 7 3 3 4 5 0 2 01 1 3 3 1 1 1 3 4
Para cada uno de estos tres parches de imagen, se suman las 9 diferencias absolutas, lo que da como resultado valores SAD de 20, 25 y 17, respectivamente. A partir de estos valores SAD, se podría afirmar que el lado derecho de la imagen de búsqueda es el más similar a la imagen de plantilla, porque tiene la suma más baja de diferencias absolutas en comparación con las otras dos ubicaciones.
La suma de diferencias absolutas proporciona una forma sencilla de automatizar la búsqueda de objetos dentro de una imagen, pero puede resultar poco fiable debido a los efectos de factores contextuales como cambios en la iluminación, el color, la dirección de visualización, el tamaño o la forma. La SAD se puede utilizar junto con otros métodos de reconocimiento de objetos, como la detección de bordes , para mejorar la fiabilidad de los resultados.
SAD es una métrica extremadamente rápida debido a su simplicidad; es efectivamente la métrica más simple posible que tiene en cuenta cada píxel en un bloque. Por lo tanto, es muy eficaz para una amplia búsqueda de movimiento de muchos bloques diferentes. SAD también es fácilmente paralelizable ya que analiza cada píxel por separado, lo que lo hace fácilmente implementable con instrucciones como ARM NEON o x86 SSE2 . Por ejemplo, SSE ha empaquetado la instrucción de suma de diferencias absolutas (PSADBW) específicamente para este propósito. Una vez que se encuentran los bloques candidatos, el refinamiento final del proceso de estimación de movimiento a menudo se realiza con otras métricas más lentas pero más precisas, que tienen mejor en cuenta la percepción humana . Estas incluyen la suma de diferencias transformadas absolutas (SATD), la suma de diferencias al cuadrado (SSD) y la optimización de la tasa de distorsión .