Eficiencia algorítmica

En informática , la eficiencia algorítmica es una propiedad de un algoritmo que se relaciona con la cantidad de recursos computacionales utilizados por el algoritmo. Se debe analizar un algoritmo para determinar su uso de recursos y la eficiencia de un algoritmo se puede medir en función del uso de diferentes recursos. La eficiencia algorítmica puede considerarse análoga a la productividad de la ingeniería para un proceso repetitivo o continuo.

Para lograr la máxima eficiencia es deseable minimizar el uso de recursos. Sin embargo, diferentes recursos, como la complejidad del tiempo y el espacio , no se pueden comparar directamente, por lo que cuál de los dos algoritmos se considera más eficiente a menudo depende de qué medida de eficiencia se considera más importante.

Por ejemplo, bubble sort y timsort son algoritmos para ordenar una lista de elementos de menor a mayor. La clasificación de burbujas ordena la lista en el tiempo proporcional al número de elementos al cuadrado ( , ver notación O grande ), pero solo requiere una pequeña cantidad de memoria adicional que es constante con respecto a la longitud de la lista ( ). Timsort ordena la lista en tiempo linealítmico (proporcional a una cantidad multiplicada por su logaritmo) en la longitud de la lista ( ), pero tiene un requisito de espacio lineal en la longitud de la lista ( ). Si se deben ordenar listas grandes a alta velocidad para una aplicación determinada, timsort es una mejor opción; sin embargo, si es más importante minimizar la huella de memoria de la clasificación, la clasificación por burbujas es una mejor opción. ${\estilo de texto O(n^{2})}$ ${\estilo de texto O(1)}$ ${\textstyle O(n\log n)}$ ${\estilo de texto O(n)}$

Fondo

La importancia de la eficiencia con respecto al tiempo fue enfatizada por Ada Lovelace en 1843 aplicada a la máquina analítica mecánica de Charles Babbage :

"En casi todos los cálculos es posible una gran variedad de arreglos para la sucesión de los procesos, y varias consideraciones deben influir en las selecciones entre ellos para los propósitos de una máquina de cálculo. Un objetivo esencial es elegir aquel arreglo que tienda a reducirse a un mínimo del tiempo necesario para completar el cálculo" ^[1]

Las primeras computadoras electrónicas tenían velocidad limitada y memoria de acceso aleatorio limitada . Por lo tanto, se produjo una compensación espacio-temporal . Una tarea podría utilizar un algoritmo rápido que utilice mucha memoria, o podría utilizar un algoritmo lento que utilice poca memoria. La solución de ingeniería fue entonces utilizar el algoritmo más rápido que pudiera caber en la memoria disponible.

Las computadoras modernas son significativamente más rápidas que las primeras y tienen una cantidad mucho mayor de memoria disponible ( Gigabytes en lugar de Kilobytes ). Sin embargo, Donald Knuth destacó que la eficiencia sigue siendo una consideración importante:

"En las disciplinas de ingeniería establecidas, una mejora del 12%, que se obtiene fácilmente, nunca se considera marginal y creo que el mismo punto de vista debería prevalecer en la ingeniería de software" ^[2]

Descripción general

Un algoritmo se considera eficiente si su consumo de recursos, también conocido como costo computacional, está en un nivel aceptable o por debajo de él. En términos generales, "aceptable" significa: se ejecutará en una cantidad de tiempo o espacio razonable en una computadora disponible, generalmente en función del tamaño de la entrada. Desde la década de 1950, las computadoras han experimentado aumentos dramáticos tanto en la potencia computacional disponible como en la cantidad de memoria disponible, por lo que los niveles aceptables actuales habrían sido inaceptables incluso hace 10 años. De hecho, gracias a la duplicación aproximada de la potencia de las computadoras cada 2 años , las tareas que son aceptablemente eficientes en los teléfonos inteligentes y sistemas integrados modernos pueden haber sido inaceptablemente ineficientes para los servidores industriales hace 10 años.

Los fabricantes de ordenadores lanzan con frecuencia nuevos modelos, a menudo con mayor rendimiento . Los costos del software pueden ser bastante altos, por lo que en algunos casos la forma más sencilla y económica de obtener un mayor rendimiento podría ser simplemente comprar una computadora más rápida, siempre que sea compatible con una computadora existente.

Hay muchas formas de medir los recursos utilizados por un algoritmo: las dos medidas más comunes son la velocidad y el uso de memoria; otras medidas podrían incluir velocidad de transmisión, uso temporal del disco, uso del disco a largo plazo, consumo de energía, costo total de propiedad , tiempo de respuesta a estímulos externos, etc. Muchas de estas medidas dependen del tamaño de la entrada al algoritmo, es decir, la cantidad de datos a procesar. También podrían depender de la forma en que estén ordenados los datos; por ejemplo, algunos algoritmos de clasificación funcionan mal con datos que ya están ordenados o que están ordenados en orden inverso.

En la práctica, existen otros factores que pueden afectar la eficiencia de un algoritmo, como los requisitos de precisión y/o confiabilidad. Como se detalla a continuación, la forma en que se implementa un algoritmo también puede tener un efecto significativo en la eficiencia real, aunque muchos aspectos de esto se relacionan con cuestiones de optimización .

Análisis teorico

En el análisis teórico de algoritmos , la práctica normal es estimar su complejidad en sentido asintótico. La notación más comúnmente utilizada para describir el consumo de recursos o la "complejidad" es la notación O grande de Donald Knuth , que representa la complejidad de un algoritmo en función del tamaño de la entrada . La notación O grande es una medida asintótica de la complejidad de la función, donde aproximadamente significa que el requisito de tiempo para un algoritmo es proporcional a , omitiendo términos de orden inferior que contribuyen menos que al crecimiento de la función a medida que crece arbitrariamente . Esta estimación puede ser engañosa cuando es pequeña, pero generalmente es suficientemente precisa cuando es grande, ya que la notación es asintótica. Por ejemplo, la ordenación por burbujas puede ser más rápida que la ordenación por combinación cuando solo se van a ordenar unos pocos elementos; sin embargo, es probable que cualquiera de las implementaciones cumpla con los requisitos de rendimiento para una lista pequeña. Por lo general, los programadores están interesados en algoritmos que escalan eficientemente a tamaños de entrada grandes, y se prefiere la ordenación por fusión a la ordenación por burbujas para las listas de longitud que se encuentran en la mayoría de los programas con uso intensivo de datos. ${\estilo de texto n}$ ${\textstyle f(n)=O{\bigl (}g(n){\bigr )}}$ $g(n)$ $g(n)$ ${\estilo de texto n}$ ${\estilo de texto n}$ ${\estilo de texto n}$

Algunos ejemplos de notación Big O aplicada a la complejidad del tiempo asintótico de los algoritmos incluyen:

Benchmarking: medir el desempeño

Para nuevas versiones de software o para proporcionar comparaciones con sistemas de la competencia, a veces se utilizan puntos de referencia , que ayudan a medir el rendimiento relativo de un algoritmo. Si se produce un nuevo algoritmo de clasificación , por ejemplo, se puede comparar con sus predecesores para garantizar que al menos sea eficiente como antes con datos conocidos, teniendo en cuenta cualquier mejora funcional. Los clientes pueden utilizar puntos de referencia al comparar varios productos de proveedores alternativos para estimar qué producto se adaptará mejor a sus requisitos específicos en términos de funcionalidad y rendimiento. Por ejemplo, en el mundo de los mainframes , ciertos productos patentados de compañías de software independientes, como Syncsort , compiten por la velocidad con productos de los principales proveedores, como IBM .

Algunos puntos de referencia brindan oportunidades para producir un análisis que compara la velocidad relativa de varios lenguajes compilados e interpretados, por ejemplo ^[3]^[4] y The Computer Language Benchmarks Game compara el rendimiento de implementaciones de problemas de programación típicos en varios lenguajes de programación.

Incluso la creación de puntos de referencia " hágalo usted mismo " puede demostrar el rendimiento relativo de diferentes lenguajes de programación, utilizando una variedad de criterios especificados por el usuario. Esto es bastante simple, como lo demuestra con el ejemplo un "Resumen del desempeño en nueve idiomas" de Christopher W. Cowell-Shah. ^[5]

Preocupaciones de implementación

Los problemas de implementación también pueden tener un efecto en la eficiencia, como la elección del lenguaje de programación, o la forma en que se codifica realmente el algoritmo, ^[6] o la elección de un compilador para un lenguaje en particular, o las opciones de compilación utilizadas, o incluso el sistema operativo que se utiliza. En muchos casos, un lenguaje implementado por un intérprete puede ser mucho más lento que un lenguaje implementado por un compilador. ^[3] Consulte los artículos sobre compilación justo a tiempo y lenguajes interpretados .

Hay otros factores que pueden afectar cuestiones de tiempo o espacio, pero que pueden estar fuera del control de un programador; estos incluyen alineación de datos , granularidad de datos , localidad de caché , coherencia de caché , recolección de basura , paralelismo a nivel de instrucciones , subprocesos múltiples (ya sea a nivel de hardware o software), multitarea simultánea y llamadas a subrutinas . ^[7]

Algunos procesadores tienen capacidades de procesamiento vectorial , que permiten que una sola instrucción opere en múltiples operandos ; Puede que sea fácil o no para un programador o compilador utilizar estas capacidades. Es posible que sea necesario rediseñar completamente los algoritmos diseñados para el procesamiento secuencial para utilizar el procesamiento paralelo , o podrían reconfigurarse fácilmente. A medida que la informática paralela y distribuida gana importancia a finales de la década de 2010, se están realizando más inversiones en API eficientes de alto nivel para sistemas informáticos paralelos y distribuidos como CUDA , TensorFlow , Hadoop , OpenMP y MPI .

Otro problema que puede surgir en la programación es que los procesadores compatibles con el mismo conjunto de instrucciones (como x86-64 o ARM ) pueden implementar una instrucción de diferentes maneras, de modo que instrucciones que son relativamente rápidas en algunos modelos pueden ser relativamente lentas en otros modelos. . Esto a menudo presenta desafíos para la optimización de los compiladores , que deben tener una gran cantidad de conocimiento de la CPU específica y otro hardware disponible en el destino de la compilación para optimizar mejor el rendimiento de un programa. En el caso extremo, un compilador puede verse obligado a emular instrucciones que no son compatibles con una plataforma de destino de compilación, lo que le obliga a generar código o vincular una llamada de biblioteca externa para producir un resultado que de otro modo no sería computable en esa plataforma, incluso si es compatible de forma nativa. y más eficiente en hardware en otras plataformas. Este suele ser el caso en sistemas integrados con respecto a la aritmética de punto flotante , donde los microcontroladores pequeños y de baja potencia a menudo carecen de soporte de hardware para la aritmética de punto flotante y, por lo tanto, requieren rutinas de software computacionalmente costosas para producir cálculos de punto flotante.

Medidas de uso de recursos

Las medidas normalmente se expresan en función del tamaño de la entrada . $\scriptstyle {n}$

Las dos medidas más comunes son:

Tiempo : ¿cuánto tiempo tarda en completarse el algoritmo?
Espacio : ¿cuánta memoria de trabajo (normalmente RAM) necesita el algoritmo? Esto tiene dos aspectos: la cantidad de memoria que necesita el código (uso de espacio auxiliar) y la cantidad de memoria necesaria para los datos en los que opera el código (uso de espacio intrínseco).

Para computadoras cuya energía es suministrada por una batería (por ejemplo, computadoras portátiles y teléfonos inteligentes ), o para cálculos muy largos/grandes (por ejemplo, supercomputadoras ), otras medidas de interés son:

Consumo de energía directo : energía necesaria directamente para operar la computadora.
Consumo de energía indirecto : energía necesaria para refrigeración, iluminación, etc.

A partir de 2018 ^[actualizar], el consumo de energía está creciendo como una métrica importante para tareas computacionales de todo tipo y en todas las escalas, desde dispositivos integrados de Internet de las cosas hasta dispositivos de sistema en chip y granjas de servidores . Esta tendencia suele denominarse informática verde .

En algunos casos también pueden ser relevantes medidas menos comunes de eficiencia computacional:

Tamaño de transmisión : el ancho de banda podría ser un factor limitante. La compresión de datos se puede utilizar para reducir la cantidad de datos a transmitir. Mostrar una imagen (por ejemplo, el logotipo de Google ) puede implicar la transmisión de decenas de miles de bytes (48 K en este caso), en comparación con la transmisión de seis bytes para el texto "Google". Esto es importante para las tareas informáticas vinculadas a E/S .
Espacio externo : espacio necesario en un disco u otro dispositivo de memoria externo; esto podría ser para un almacenamiento temporal mientras se lleva a cabo el algoritmo, o podría ser un almacenamiento a largo plazo necesario para conservarlo para referencia futura.
Tiempo de respuesta ( latencia ): esto es particularmente relevante en una aplicación en tiempo real cuando el sistema informático debe responder rápidamente ante algún evento externo .
Costo total de propiedad : particularmente si una computadora está dedicada a un algoritmo en particular.

Tiempo

Teoría

Analice el algoritmo, normalmente utilizando el análisis de complejidad del tiempo para obtener una estimación del tiempo de ejecución en función del tamaño de los datos de entrada. El resultado normalmente se expresa utilizando la notación O grande . Esto es útil para comparar algoritmos, especialmente cuando se va a procesar una gran cantidad de datos. Se necesitan estimaciones más detalladas para comparar el rendimiento del algoritmo cuando la cantidad de datos es pequeña, aunque es probable que esto sea de menos importancia. Los algoritmos que incluyen procesamiento paralelo pueden ser más difíciles de analizar .

Práctica

Utilice un punto de referencia para cronometrar el uso de un algoritmo. Muchos lenguajes de programación tienen una función disponible que proporciona uso del tiempo de CPU . Para algoritmos de larga duración, el tiempo transcurrido también podría ser de interés. Por lo general, los resultados deben promediarse entre varias pruebas.

La creación de perfiles basada en ejecución puede ser muy sensible a la configuración del hardware y a la posibilidad de que otros programas o tareas se ejecuten al mismo tiempo en un entorno de multiprocesamiento y multiprogramación .

Este tipo de prueba también depende en gran medida de la selección de un lenguaje de programación, un compilador y las opciones del compilador en particular, por lo que todos los algoritmos que se comparan deben implementarse en las mismas condiciones.

Espacio

Esta sección se ocupa del uso de los recursos de memoria ( registros , caché , RAM , memoria virtual , memoria secundaria ) mientras se ejecuta el algoritmo. En cuanto al análisis de tiempo anterior, analice el algoritmo, normalmente utilizando el análisis de complejidad espacial para obtener una estimación de la memoria de tiempo de ejecución necesaria en función del tamaño de los datos de entrada. El resultado normalmente se expresa utilizando la notación O grande .

Hay hasta cuatro aspectos del uso de la memoria a considerar:

La cantidad de memoria necesaria para contener el código del algoritmo.
La cantidad de memoria necesaria para los datos de entrada .
La cantidad de memoria necesaria para cualquier dato de salida .
- Algunos algoritmos, como el de clasificación, suelen reorganizar los datos de entrada y no necesitan ningún espacio adicional para los datos de salida. Esta propiedad se conoce como operación " in situ ".
La cantidad de memoria necesaria como espacio de trabajo durante el cálculo.
- Esto incluye variables locales y cualquier espacio de pila necesario para las rutinas llamadas durante un cálculo; Este espacio de pila puede ser importante para algoritmos que utilizan técnicas recursivas .

Las primeras computadoras electrónicas y las primeras computadoras domésticas tenían cantidades relativamente pequeñas de memoria de trabajo. Por ejemplo, la calculadora automática de almacenamiento con retardo electrónico (EDSAC) de 1949 tenía una memoria de trabajo máxima de 1024 palabras de 17 bits, mientras que la Sinclair ZX80 de 1980 venía inicialmente con 1024 bytes de memoria de trabajo de 8 bits. A finales de la década de 2010, lo habitual es que las computadoras personales tengan entre 4 y 32 GB de RAM, un aumento de más de 300 millones de veces más memoria.

Jerarquía de memoria y caché

Las computadoras actuales pueden tener cantidades relativamente grandes de memoria (posiblemente Gigabytes), por lo que tener que comprimir un algoritmo en una cantidad limitada de memoria es un problema mucho menor de lo que solía ser. Pero la presencia de cuatro categorías diferentes de memoria puede ser significativa:

Registros de procesador , la más rápida de las tecnologías de memoria de computadora con la menor cantidad de espacio de almacenamiento. La mayor parte del cálculo directo en las computadoras modernas ocurre con los operandos de origen y destino en los registros antes de actualizarse a la memoria caché, la memoria principal y la memoria virtual, si es necesario. En un núcleo de procesador , normalmente hay del orden de cientos de bytes o menos de disponibilidad de registros, aunque un archivo de registro puede contener más registros físicos que los registros arquitectónicos definidos en la arquitectura del conjunto de instrucciones.
La memoria caché es la segunda memoria más rápida y la segunda más pequeña disponible en la jerarquía de memoria. Los cachés están presentes en CPU, GPU, unidades de disco duro y periféricos externos, y normalmente se implementan en RAM estática . Las memorias caché tienen varios niveles ; los niveles inferiores son más grandes, más lentos y normalmente se comparten entre los núcleos del procesador en los procesadores multinúcleo . Para procesar operandos en la memoria caché, una unidad de procesamiento debe recuperar los datos del caché, realizar la operación en registros y escribir los datos nuevamente en el caché. Esto funciona a velocidades comparables (entre 2 y 10 veces más lentas) con la unidad lógica aritmética o la unidad de punto flotante de la CPU o GPU si está en la caché L1 . ^[8] Es aproximadamente 10 veces más lento si hay un error de caché L1 y se debe recuperar y escribir en el caché L2 , y 10 veces más lento si hay un error de caché L2 y se debe recuperar desde un L3. caché , si está presente.
La memoria física principal suele implementarse en RAM dinámica (DRAM). La memoria principal es mucho más grande (normalmente gigabytes en comparación con ≈8 megabytes ) que una caché de CPU L3, con latencias de lectura y escritura normalmente entre 10 y 100 veces más lentas. ^[8] A partir de 2018 ^[actualizar], la RAM se implementa cada vez más en el chip de los procesadores, como memoria de CPU o GPU.
La memoria virtual se implementa con mayor frecuencia en términos de almacenamiento secundario , como un disco duro , y es una extensión de la jerarquía de memoria que tiene un espacio de almacenamiento mucho mayor pero una latencia mucho mayor, generalmente alrededor de 1000 veces más lenta que una pérdida de caché para un valor en RAM. . ^[8] Si bien originalmente estaba motivada para crear la impresión de que había mayores cantidades de memoria disponibles de las que realmente estaban disponibles, la memoria virtual es más importante en el uso contemporáneo por su compensación tiempo-espacio y por permitir el uso de máquinas virtuales . ^[8] Los fallos de caché de la memoria principal se denominan fallos de página e incurren en enormes penalizaciones de rendimiento en los programas.

Un algoritmo cuyas necesidades de memoria quepan en la memoria caché será mucho más rápido que un algoritmo que quepa en la memoria principal, que a su vez será mucho más rápido que un algoritmo que tenga que recurrir a la memoria virtual. Debido a esto, las políticas de reemplazo de caché son extremadamente importantes para la informática de alto rendimiento, al igual que la programación con reconocimiento de caché y la alineación de datos . Para complicar aún más el problema, algunos sistemas tienen hasta tres niveles de memoria caché, con diferentes velocidades efectivas. Los diferentes sistemas tendrán diferentes cantidades de estos distintos tipos de memoria, por lo que el efecto de las necesidades de memoria del algoritmo puede variar mucho de un sistema a otro.

En los primeros días de la informática electrónica, si un algoritmo y sus datos no cabían en la memoria principal, entonces no se podía utilizar el algoritmo. Hoy en día el uso de memoria virtual parece proporcionar mucha memoria, pero a costa del rendimiento. Si un algoritmo y sus datos caben en la memoria caché, entonces se puede obtener una velocidad muy alta; en este caso minimizar el espacio también ayudará a minimizar el tiempo. A esto se le llama principio de localidad , y puede subdividirse en localidad de referencia , localidad espacial y localidad temporal . Un algoritmo que no quepa completamente en la memoria caché pero que muestre localidad de referencia puede funcionar razonablemente bien.

Ver también

Análisis de algoritmos : cómo determinar los recursos que necesita un algoritmo.
Benchmark : un método para medir tiempos de ejecución comparativos en casos definidos
Mejor, peor y promedio de los casos : consideraciones para estimar los tiempos de ejecución en tres escenarios
Optimización del compilador: optimización derivada del compilador
Teoría de la complejidad computacional
Rendimiento de la computadora : métricas del hardware de la computadora
Optimización (informática)
Análisis de rendimiento : métodos para medir el rendimiento real de un algoritmo en tiempo de ejecución.

Referencias

^ Green, Christopher, Clásicos de la historia de la psicología , consultado el 19 de mayo de 2013
^ Knuth, Donald (1974), "Programación estructurada con declaraciones de referencia" (PDF) , Computing Surveys , 6 (4): 261–301, CiteSeerX 10.1.1.103.6084 , doi :10.1145/356635.356640, S2CID 207630080, archivado del original (PDF) el 24 de agosto de 2009 , recuperado 19 de mayo 2013
^ ab "Punto de referencia de coma flotante: comparación de idiomas (Fourmilog: nadie se atreve a llamarlo motivo)". Fourmilab.ch. 4 de agosto de 2005 . Consultado el 14 de diciembre de 2011 .
^ "Historial de referencia de Whetstone". Roylongbottom.org.uk . Consultado el 14 de diciembre de 2011 .
^ Personal de OSNews. "Resumen de rendimiento en nueve idiomas: evaluación comparativa de matemáticas y E/S de archivos". osnews.com . Consultado el 18 de septiembre de 2018 .
^ Kriegel, Hans-Peter ; Schubert, Erich; Zimek, Arthur (2016). "El arte (negro) de la evaluación del tiempo de ejecución: ¿estamos comparando algoritmos o implementaciones?". Sistemas de Conocimiento y Información . 52 (2): 341–378. doi :10.1007/s10115-016-1004-2. ISSN 0219-1377. S2CID 40772241.
^ Guy Lewis Steele, Jr. "Desmentir el mito de la 'llamada a procedimiento costosa', o las implementaciones de llamadas a procedimiento consideradas dañinas, o Lambda: el GOTO definitivo". Laboratorio de IA del MIT. Memo de laboratorio de IA AIM-443. Octubre de 1977.[1]
^ abcd Hennessy, John L; Patterson, David A; Asanović, Krste; Bakos, Jason D; Colwell, Robert P; Bhattacharjee, Abhishek; Conte, Thomas M; Duato, José; Franklin, Diana; Goldberg, David; Jouppi, Norman P ; Li, Sheng; Muralimanohar, Naveen; Peterson, Gregorio D; Pinkston, Timothy Mark; Ranganathan, Prakash; Madera, David Allen; Joven, Clifford; Zaky, Amr (2011). Arquitectura de computadoras: un enfoque cuantitativo (Sexta ed.). Ciencia Elsevier. ISBN 978-0128119051. OCLC 983459758.