En el procesamiento de señales digitales (DSP), el procesamiento paralelo es una técnica que duplica unidades de funciones para operar diferentes tareas (señales) simultáneamente. [1] En consecuencia, podemos realizar el mismo procesamiento para diferentes señales en las correspondientes unidades de función duplicadas. Además, debido a las características del procesamiento paralelo , el diseño de DSP paralelo a menudo contiene múltiples salidas, lo que da como resultado un rendimiento mayor que el que no es paralelo.
Ejemplo conceptual
Considere una unidad funcional ( ) y tres tareas ( , y ). El tiempo requerido para que la unidad funcional procese esas tareas es , y , respectivamente. Entonces, si realizamos estas tres tareas en orden secuencial, el tiempo requerido para completarlas es .
Sin embargo, si duplicamos la unidad de función en otras dos copias ( ), el tiempo agregado se reduce a , que es menor que en un orden secuencial.
versus canalización
Mecanismo:
Paralelo: unidades de funciones duplicadas que trabajan en paralelo
Cada tarea es procesada íntegramente por una unidad funcional diferente.
Pipelining : diferentes unidades funcionales trabajando en paralelo
Cada tarea se divide en una secuencia de subtareas, que son manejadas por unidades funcionales especializadas y diferentes.
Las técnicas de procesamiento en paralelo requieren múltiples salidas, que se calculan en paralelo en un período de reloj . Por lo tanto, la velocidad de muestreo efectiva aumenta según el nivel de paralelismo.
Considere una condición en la que podamos aplicar técnicas de procesamiento paralelo y canalización, es mejor elegir técnicas de procesamiento paralelo por las siguientes razones
La canalización suele provocar cuellos de botella de E/S
El procesamiento paralelo también se utiliza para reducir el consumo de energía mientras se utilizan relojes lentos.
El método híbrido de canalización y procesamiento paralelo aumenta aún más la velocidad de la arquitectura.
Filtros FIR paralelos
Considere un filtro FIR de 3 grifos: [2]
que se muestra en la siguiente figura.
Suponga que el tiempo de cálculo para las unidades de multiplicación es T m y T a para las unidades de suma. El período de la muestra está dado por
Al paralelizarlo, la arquitectura resultante se muestra a continuación. La frecuencia de muestreo ahora se vuelve
donde N representa el número de copias.
Tenga en cuenta que, en un sistema paralelo, mientras se mantiene en un sistema canalizado.
Filtros IIR paralelos de primer orden
Considere la función de transferencia de un filtro IIR de primer orden formulado como
donde | un | ≤ 1 para estabilidad, y dicho filtro tiene un solo polo ubicado en z = a ;
La representación recursiva correspondiente es
Considere el diseño de una arquitectura de 4 paralelos ( N = 4). En dicho sistema paralelo, cada elemento de retraso significa un retraso de bloque y el período de reloj es cuatro veces el período de muestra.
Por lo tanto, al iterar la recursividad con n = 4 k , tenemos
La arquitectura correspondiente se muestra a continuación.
El diseño paralelo resultante tiene las siguientes propiedades.
El polo del filtro original está en z = a mientras que el polo del sistema paralelo está en z = a 4 , que está más cerca del origen.
El movimiento de los polos mejora la robustez del sistema frente al ruido de redondeo.
Complejidad del hardware de esta arquitectura: N × N operaciones de multiplicación y suma.
El aumento cuadrado de la complejidad del hardware se puede reducir aprovechando la concurrencia y el cálculo incremental para evitar el cálculo repetido.
Procesamiento paralelo para baja potencia
Otra ventaja de las técnicas de procesamiento en paralelo es que pueden reducir el consumo de energía de un sistema al reducir el voltaje de suministro.
Considere el siguiente consumo de energía en un circuito CMOS normal.
donde el C total representa la capacitancia total del circuito CMOS.
Para una versión paralela, la capacitancia de carga sigue siendo la misma pero la capacitancia total aumenta N veces.
Para mantener la misma frecuencia de muestreo, el período de reloj del circuito N paralelo aumenta a N veces el retardo de propagación del circuito original.
Hace que el tiempo de carga se prolongue N veces. La tensión de alimentación se puede reducir a βV 0 .
Por lo tanto, el consumo de energía del sistema N-paralelo se puede formular como
donde β se puede calcular mediante
Referencias
^ KK Parhi, Sistemas de procesamiento de señales digitales VLSI: diseño e implementación, John Wiley, 1999
^ Diapositivas para sistemas de procesamiento de señales digitales VLSI: diseño e implementación John Wiley & Sons, 1999 ( ISBN 0-471-24186-5 ): http://people.ece.umn.edu/~parhi/publications/books/