En informática , especialmente en el procesamiento de señales digitales , la operación de multiplicación-acumulación ( MAC ) o multiplicación-suma ( MAD ) es un paso común que calcula el producto de dos números y suma ese producto a un acumulador . La unidad de hardware que realiza la operación se conoce como multiplicador-acumulador ( unidad MAC ) ; la operación en sí también suele denominarse operación MAC o MAD. La operación MAC modifica un acumulador :
Cuando se trabaja con números de punto flotante , se puede realizar con dos redondeos (algo habitual en muchos DSP ) o con un solo redondeo. Cuando se realiza con un solo redondeo, se denomina multiplicación -suma fusionada ( FMA ) o multiplicación-acumulación fusionada ( FMAC ).
Las computadoras modernas pueden contener un MAC dedicado, que consiste en un multiplicador implementado en lógica combinacional seguido de un sumador y un registro acumulador que almacena el resultado. La salida del registro se retroalimenta a una entrada del sumador, de modo que en cada ciclo de reloj, la salida del multiplicador se agrega al registro. Los multiplicadores combinacionales requieren una gran cantidad de lógica, pero pueden calcular un producto mucho más rápido que el método de desplazamiento y adición típico de las computadoras anteriores. Percy Ludgate fue el primero en concebir un MAC en su Máquina Analítica de 1909, [1] y el primero en explotar un MAC para la división (utilizando la multiplicación sembrada por recíproco, a través de la serie convergente (1+ x ) −1 ). Los primeros procesadores modernos equipados con unidades MAC fueron procesadores de señales digitales , pero la técnica ahora también es común en procesadores de propósito general. [2] [3] [4] [5]
Cuando se realiza con números enteros , la operación es típicamente exacta (calculada módulo alguna potencia de dos ). Sin embargo, los números de punto flotante tienen solo una cierta cantidad de precisión matemática . Es decir, la aritmética digital de punto flotante generalmente no es asociativa ni distributiva . (Véase Aritmética de punto flotante § Problemas de precisión ). Por lo tanto, hay una diferencia en el resultado si la multiplicación-suma se realiza con dos redondeos o en una operación con un solo redondeo (una multiplicación-suma fusionada). IEEE 754-2008 especifica que debe realizarse con un redondeo, lo que produce un resultado más preciso. [6]
Una multiplicación-suma fusionada ( FMA o fmadd ) [7] es una operación de multiplicación-suma de punto flotante realizada en un solo paso ( operación fusionada ), con un solo redondeo. Es decir, donde una multiplicación-suma no fusionada calcularía el producto b × c , lo redondearía a N bits significativos, sumaría el resultado a y redondearía de nuevo a N bits significativos, una multiplicación-suma fusionada calcularía toda la expresión a + ( b × c ) a su precisión completa antes de redondear el resultado final a la baja a N bits significativos.
Un FMA rápido puede acelerar y mejorar la precisión de muchos cálculos que implican la acumulación de productos:
Generalmente, se puede confiar en que la multiplicación-suma fusionada dará resultados más precisos. Sin embargo, William Kahan ha señalado que puede dar problemas si se usa sin pensar. [8] Si x 2 − y 2 se evalúa como (( x × x ) − y × y ) (siguiendo la notación sugerida por Kahan en la que los paréntesis redundantes indican al compilador que redondee primero el término ( x × x ) ) utilizando la multiplicación-suma fusionada, entonces el resultado puede ser negativo incluso cuando x = y debido a que la primera multiplicación descarta los bits de baja significancia. Esto podría conducir a un error si, por ejemplo, luego se evalúa la raíz cuadrada del resultado.
Cuando se implementa dentro de un microprocesador , una FMA puede ser más rápida que una operación de multiplicación seguida de una suma. Sin embargo, las implementaciones industriales estándar basadas en el diseño original IBM RS/6000 requieren un sumador de 2 N bits para calcular la suma correctamente. [9]
Otro beneficio de incluir esta instrucción es que permite una implementación de software eficiente de operaciones de división (ver algoritmo de división ) y raíz cuadrada (ver métodos de cálculo de raíces cuadradas ), eliminando así la necesidad de hardware dedicado para esas operaciones. [10]
Algunas máquinas combinan múltiples operaciones de multiplicación y suma fusionadas en un solo paso, por ejemplo, realizando un producto escalar de cuatro elementos en dos registros SIMDa0×b0 + a1×b1 + a2×b2 + a3×b3
de 128 bits con un rendimiento de ciclo único.
La operación FMA está incluida en IEEE 754-2008 .
La instrucción VAX de Digital Equipment Corporation (DEC) se utiliza para evaluar polinomios con la regla de Horner mediante una sucesión de pasos de multiplicación y suma. Las descripciones de las instrucciones no especifican si la multiplicación y la suma se realizan utilizando un único paso FMA. [11] Esta instrucción ha sido parte del conjunto de instrucciones VAX desde su implementación original 11/780 en 1977.POLY
El estándar de 1999 del lenguaje de programación C admite la operación FMA a través de la fma()
función de biblioteca matemática estándar y la transformación automática de una multiplicación seguida de una adición (contracción de expresiones de punto flotante), que se puede habilitar o deshabilitar explícitamente con pragmas estándar ( #pragma STDC FP_CONTRACT
). Los compiladores C GCC y Clang realizan dichas transformaciones de forma predeterminada para las arquitecturas de procesador que admiten instrucciones FMA. Con GCC, que no admite el pragma mencionado anteriormente, [12] esto se puede controlar globalmente mediante la -ffp-contract
opción de línea de comandos. [13]
La operación de multiplicación-suma fusionada se introdujo como "multiplicación-suma fusionada" en el procesador IBM POWER1 (1990), [14] pero se ha agregado a muchos otros procesadores desde entonces: