En informática , el algoritmo de Prim es un algoritmo voraz que encuentra un árbol de expansión mínimo para un grafo no dirigido ponderado . Esto significa que encuentra un subconjunto de las aristas que forman un árbol que incluye cada vértice , donde el peso total de todas las aristas del árbol se minimiza. El algoritmo funciona construyendo este árbol un vértice a la vez, a partir de un vértice inicial arbitrario, y en cada paso agregando la conexión más barata posible desde el árbol a otro vértice.
El algoritmo fue desarrollado en 1930 por el matemático checo Vojtěch Jarník [1] y posteriormente redescubierto y republicado por los científicos informáticos Robert C. Prim en 1957 [2] y Edsger W. Dijkstra en 1959. [3] Por lo tanto, a veces también se le llama algoritmo de Jarník , [4] algoritmo de Prim-Jarník , [5] algoritmo de Prim-Dijkstra [6] o algoritmo DJP . [7]
Otros algoritmos conocidos para este problema incluyen el algoritmo de Kruskal y el algoritmo de Borůvka . [8] Estos algoritmos encuentran el bosque de expansión mínimo en un gráfico posiblemente desconectado; en contraste, la forma más básica del algoritmo de Prim solo encuentra árboles de expansión mínimos en gráficos conectados. Sin embargo, al ejecutar el algoritmo de Prim por separado para cada componente conectado del gráfico, también se puede utilizar para encontrar el bosque de expansión mínimo. [9] En términos de su complejidad temporal asintótica , estos tres algoritmos son igualmente rápidos para gráficos dispersos , pero más lentos que otros algoritmos más sofisticados. [7] [6] Sin embargo, para gráficos que son suficientemente densos, el algoritmo de Prim se puede ejecutar en tiempo lineal , cumpliendo o mejorando los límites de tiempo para otros algoritmos. [10]
El algoritmo puede describirse informalmente como la realización de los siguientes pasos:
Con más detalle se puede implementar siguiendo el pseudocódigo a continuación.
Como se describió anteriormente, el vértice inicial para el algoritmo se elegirá arbitrariamente, porque la primera iteración del bucle principal del algoritmo tendrá un conjunto de vértices en Q que tienen todos pesos iguales, y el algoritmo iniciará automáticamente un nuevo árbol en F cuando complete un árbol de expansión de cada componente conectado del gráfico de entrada. El algoritmo se puede modificar para comenzar con cualquier vértice particular s estableciendo C [ s ] como un número menor que los otros valores de C (por ejemplo, cero), y se puede modificar para encontrar solo un único árbol de expansión en lugar de un bosque de expansión completo (que coincide más estrechamente con la descripción informal) deteniéndose siempre que encuentre otro vértice marcado como que no tiene una arista asociada.
Las distintas variantes del algoritmo difieren entre sí en la forma en que se implementa el conjunto Q : como una simple lista enlazada o matriz de vértices, o como una estructura de datos de cola de prioridad más complicada. Esta elección conduce a diferencias en la complejidad temporal del algoritmo. En general, una cola de prioridad será más rápida para encontrar el vértice v con un costo mínimo, pero implicará actualizaciones más costosas cuando cambie el valor de C [ w ].
La complejidad temporal del algoritmo de Prim depende de las estructuras de datos utilizadas para el gráfico y para ordenar los bordes por peso, lo que se puede hacer utilizando una cola de prioridad . La siguiente tabla muestra las opciones típicas:
Una implementación simple de Prim, que utiliza una matriz de adyacencia o una representación gráfica de lista de adyacencia y busca linealmente una matriz de pesos para encontrar la arista de peso mínimo que se debe agregar, requiere un tiempo de ejecución de O (|V| 2 ). Sin embargo, este tiempo de ejecución se puede mejorar en gran medida utilizando montículos para implementar la búsqueda de aristas de peso mínimo en el bucle interno del algoritmo.
Una primera versión mejorada utiliza un montón para almacenar todos los bordes del gráfico de entrada, ordenados por su peso. Esto lleva a un tiempo de ejecución de O(|E| log |E|) en el peor de los casos. Pero almacenar vértices en lugar de bordes puede mejorarlo aún más. El montón debe ordenar los vértices por el peso de borde más pequeño que los conecta a cualquier vértice en el árbol de expansión mínimo (MST) parcialmente construido (o infinito si no existe tal borde). Cada vez que se elige un vértice v y se agrega al MST, se realiza una operación de disminución de clave en todos los vértices w fuera del MST parcial de modo que v esté conectado a w , fijando la clave en el mínimo de su valor anterior y el costo de borde de ( v , w ).
Usando una estructura de datos de montón binario simple , ahora se puede demostrar que el algoritmo de Prim se ejecuta en tiempo O (|E| log |V|) donde |E| es el número de aristas y |V| es el número de vértices. Usando un montón de Fibonacci más sofisticado , esto se puede reducir a O (|E| + |V| log |V|), que es asintóticamente más rápido cuando el gráfico es lo suficientemente denso como para que |E| sea ω (|V|), y tiempo lineal cuando |E| es al menos |V| log |V|. Para gráficos de densidad aún mayor (que tengan al menos |V| c aristas para algún c > 1), el algoritmo de Prim se puede hacer que se ejecute en tiempo lineal aún más simplemente, usando un montón d -ario en lugar de un montón de Fibonacci. [10] [11]
Sea P un grafo ponderado y conexo . En cada iteración del algoritmo de Prim, se debe encontrar una arista que conecte un vértice en un subgrafo con un vértice fuera del subgrafo. Como P es conexo, siempre habrá un camino hacia cada vértice. La salida Y del algoritmo de Prim es un árbol , porque la arista y el vértice agregados al árbol Y están conexos. Sea Y 1 un árbol de expansión mínimo del grafo P. Si Y 1 = Y entonces Y es un árbol de expansión mínimo. De lo contrario, sea e la primera arista agregada durante la construcción del árbol Y que no está en el árbol Y 1 , y sea V el conjunto de vértices conectados por las aristas agregadas antes de la arista e . Entonces un punto final de la arista e está en el conjunto V y el otro no. Como el árbol Y 1 es un árbol de expansión del grafo P , hay un camino en el árbol Y 1 que une los dos puntos finales. A medida que uno viaja a lo largo del camino, debe encontrar una arista f que une un vértice en el conjunto V con uno que no está en el conjunto V . Ahora, en la iteración en la que se agregó la arista e al árbol Y , también se podría haber agregado la arista f y se agregaría en lugar de la arista e si su peso fuera menor que e , y dado que no se agregó la arista f , concluimos que
Sea el árbol Y 2 el grafo obtenido al eliminar la arista f y agregar la arista e al árbol Y 1 . Es fácil demostrar que el árbol Y 2 es conexo, tiene el mismo número de aristas que el árbol Y 1 , y los pesos totales de sus aristas no son mayores que los del árbol Y 1 , por lo tanto, también es un árbol de expansión mínimo del grafo P y contiene la arista e y todas las aristas agregadas antes de él durante la construcción del conjunto V . Repita los pasos anteriores y eventualmente obtendremos un árbol de expansión mínimo del grafo P que es idéntico al árbol Y . Esto demuestra que Y es un árbol de expansión mínimo. El árbol de expansión mínimo permite que el primer subconjunto de la subregión se expanda en un subconjunto más grande X , que asumimos que es el mínimo.
El bucle principal del algoritmo de Prim es inherentemente secuencial y, por lo tanto, no paralelizable . Sin embargo, el bucle interno, que determina el siguiente borde de peso mínimo que no forma un ciclo, se puede paralelizar dividiendo los vértices y los bordes entre los procesadores disponibles. [12] El siguiente pseudocódigo demuestra esto.
Este algoritmo se puede implementar generalmente en máquinas distribuidas [12] así como en máquinas de memoria compartida. [13] El tiempo de ejecución es , asumiendo que las operaciones de reducción y difusión se pueden realizar en . [12] También se ha explorado una variante del algoritmo de Prim para máquinas de memoria compartida, en la que el algoritmo secuencial de Prim se ejecuta en paralelo, comenzando desde diferentes vértices. [14] Sin embargo, debe notarse que existen algoritmos más sofisticados para resolver el problema del árbol de expansión mínimo distribuido de una manera más eficiente.