Eliminación de subexpresiones comunes

En la teoría del compilador , la eliminación de subexpresiones comunes ( CSE ) es una optimización del compilador que busca instancias de expresiones idénticas (es decir, todas evalúan el mismo valor) y analiza si vale la pena reemplazarlas con una sola variable que contenga el valor calculado. ^[1]

Ejemplo

En el siguiente código:

a = b * c + g;d = b * c * e;

Puede que valga la pena transformar el código a:

tiempo = b * c;a = tiempo + g;d = tiempo * e;

si el coste de almacenamiento y recuperación tmpes menor que el coste de calcular b * cun tiempo extra.

Principio

La posibilidad de realizar CSE se basa en el análisis de expresiones disponibles (un análisis de flujo de datos ). Una expresión b*cestá disponible en un punto p en un programa si:

cada ruta desde el nodo inicial hasta p se evalúa b*cantes de llegar a p ,
y no hay asignaciones hasta bo cdespués de la evaluación sino antes de p .

El análisis costo/beneficio realizado por un optimizador calculará si el costo de almacenar tmpes menor que el costo de la multiplicación; en la práctica, otros factores como qué valores se guardan en qué registros también son significativos.

Los escritores de compiladores distinguen dos tipos de CSE:

La eliminación de subexpresiones comunes locales funciona dentro de un solo bloque básico
La eliminación de subexpresiones comunes globales funciona en un procedimiento completo,

Ambos tipos se basan en el análisis del flujo de datos para saber qué expresiones están disponibles en qué puntos de un programa.

Beneficios

Los beneficios de realizar CSE son tan grandes que se trata de una optimización de uso común.

En casos simples como el del ejemplo anterior, los programadores pueden eliminar manualmente las expresiones duplicadas mientras escriben el código. La mayor fuente de errores comunes de ejecución son las secuencias de código intermedias generadas por el compilador, como los cálculos de indexación de matrices , donde no es posible que el desarrollador intervenga manualmente. En algunos casos, las características del lenguaje pueden crear muchas expresiones duplicadas. Por ejemplo, las macros de C , donde las expansiones de macros pueden dar como resultado subexpresiones comunes que no son evidentes en el código fuente original.

Los compiladores deben ser prudentes con la cantidad de valores temporales que crean para almacenar valores. Una cantidad excesiva de valores temporales genera una presión en los registros que puede provocar que se derramen registros en la memoria, lo que puede llevar más tiempo que simplemente volver a calcular un resultado aritmético cuando es necesario.

Véase también

Referencias

^ Steven Muchnick; Muchnick and Associates (15 de agosto de 1997). Implementación del diseño avanzado de compiladores . Morgan Kaufmann. ISBN 978-1-55860-320-2. Eliminación de subexpresiones comunes.

Steven S. Muchnick , Diseño e implementación de compiladores avanzados ( Morgan Kaufmann , 1997), págs. 378-396
John Cocke . "Eliminación de subexpresiones comunes globales". Actas de un simposio sobre construcción de compiladores , ACM SIGPLAN Notices 5(7), julio de 1970, páginas 850–856.
Briggs, Preston, Cooper, Keith D. y Simpson, L. Taylor. "Numeración de valores". Software-Practice and Experience , 27(6), junio de 1997, páginas 701-724.