stringtranslate.com

Optimización de bucle

En la teoría del compilador , la optimización de bucles es el proceso de aumentar la velocidad de ejecución y reducir los gastos generales asociados con los bucles . Desempeña un papel importante a la hora de mejorar el rendimiento de la caché y hacer un uso eficaz de las capacidades de procesamiento paralelo . La mayor parte del tiempo de ejecución de un programa científico se dedica a bucles; como tal, se han desarrollado muchas técnicas de optimización del compilador para hacerlos más rápidos.

Representación de cálculos y transformaciones.

Dado que las instrucciones dentro de los bucles se pueden ejecutar repetidamente, con frecuencia no es posible dar un límite al número de ejecuciones de instrucciones que se verán afectadas por una optimización del bucle. Esto presenta desafíos al razonar sobre la corrección y los beneficios de una optimización de bucle, específicamente las representaciones del cálculo que se optimiza y las optimizaciones que se realizan. [1]

Optimización mediante una secuencia de transformaciones de bucle.

La optimización de bucle puede verse como la aplicación de una secuencia de transformaciones de bucle específicas (enumeradas a continuación o en Transformaciones del compilador para computación de alto rendimiento [2] ) al código fuente o representación intermedia , y cada transformación tiene una prueba de legalidad asociada. Una transformación (o secuencia de transformaciones) generalmente debe preservar la secuencia temporal de todas las dependencias si quiere preservar el resultado del programa (es decir, ser una transformación legal). Evaluar el beneficio de una transformación o secuencia de transformaciones puede resultar bastante difícil dentro de este enfoque, ya que la aplicación de una transformación beneficiosa puede requerir el uso previo de una o más transformaciones que, por sí solas, darían como resultado un rendimiento reducido.

Las transformaciones de bucle comunes incluyen:

El marco de transformación unimodular.

El enfoque de transformación unimodular [6] utiliza una única matriz unimodular para describir el resultado combinado de una secuencia de muchas de las transformaciones anteriores. Central para este enfoque es la visión del conjunto de todas las ejecuciones de una declaración dentro de n bucles como un conjunto de puntos enteros en un espacio de n dimensiones, con los puntos ejecutándose en orden lexicográfico . Por ejemplo, las ejecuciones de una declaración anidada dentro de un bucle externo con índice i y un bucle interno con índice j pueden asociarse con los pares de números enteros . La aplicación de una transformación unimodular corresponde a la multiplicación de los puntos dentro de este espacio por la matriz. Por ejemplo, el intercambio de dos bucles corresponde a la matriz .

Una transformación unimodular es legal si preserva la secuencia temporal de todas las dependencias ; medir el impacto en el rendimiento de una transformación unimodular es más difícil. Los bucles anidados imperfectamente y algunas transformaciones (como el mosaico) no encajan fácilmente en este marco.

El marco poliédrico o basado en restricciones

El modelo poliédrico [7] maneja una clase más amplia de programas y transformaciones que el marco unimodular. El conjunto de ejecuciones de un conjunto de declaraciones dentro de un conjunto de bucles posiblemente imperfectamente anidados se considera la unión de un conjunto de politopos que representan las ejecuciones de las declaraciones. Se aplican transformaciones afines a estos politopos, produciendo una descripción de un nuevo orden de ejecución. Los límites de los politopos, las dependencias de los datos y las transformaciones a menudo se describen utilizando sistemas de restricciones, y este enfoque a menudo se denomina enfoque basado en restricciones para la optimización de bucles. Por ejemplo, una sola declaración dentro de un bucle externo ' for i := 0 an ' y un bucle interno ' for j := 0 to i+2 ' se ejecuta una vez para cada par (i, j) tal que 0 <= i <= n y 0 <= j <= i+2 .

Una vez más, una transformación es legal si preserva la secuencia temporal de todas las dependencias . Estimar los beneficios de una transformación, o encontrar la mejor transformación para un código determinado en una computadora determinada, sigue siendo tema de investigación en curso al momento de escribir este artículo (2010).

Ver también

Referencias

  1. ^ En el libro Reasoning About Program Transformations , Jean-Francois Collard analiza en profundidad la cuestión general de representar ejecuciones de programas en lugar de texto de programa en el contexto de la optimización estática.
  2. ^ David F. Bacon, Susan L. Graham y Oliver J. Sharp. Transformaciones del compilador para informática de alto rendimiento. Informe No. UCB/CSD 93/781, División de Ciencias de la Computación-EECS, Universidad de California, Berkeley, Berkeley, California 94720, noviembre de 1993 (disponible en CiteSeer [1]). Introduce el análisis del compilador, como el análisis de dependencia de datos y el análisis interprocedimental, así como una lista muy completa de transformaciones de bucle.
  3. ^ "Conjunto de instrucciones 8051". www.win.tue.nl.​ Consultado el 9 de diciembre de 2019 .
  4. ^ "Zona de desarrolladores Intel".
  5. ^ "7.6.3.1 Strip-Mining (Sun Studio 12: Guía de programación de Fortran)".
  6. ^ Steven S. Muchnick, Diseño e implementación de compiladores avanzados, 1997 Morgan Kaufmann. La sección 20.4.2 analiza la optimización del bucle.
  7. ^ R. Allen y K. Kennedy. Optimización de compiladores para arquitecturas modernas. Morgan Kaufmann, 2002.