clasificación en montón

En informática , heapsort es un algoritmo de clasificación basado en comparaciones que puede considerarse como "una implementación de clasificación por selección utilizando la estructura de datos correcta ". ^[3] Al igual que la ordenación por selección, heapsort divide su entrada en una región ordenada y otra sin clasificar, y reduce iterativamente la región sin clasificar extrayendo el elemento más grande de ella e insertándolo en la región ordenada. A diferencia de la ordenación por selección, la ordenación en montón no pierde tiempo con un escaneo en tiempo lineal de la región sin clasificar; más bien, la clasificación del montón mantiene la región sin clasificar en una estructura de datos del montón para encontrar de manera eficiente el elemento más grande en cada paso.

Aunque en la práctica es algo más lento en la mayoría de las máquinas que una ordenación rápida bien implementada , tiene las ventajas de una implementación muy simple y un tiempo de ejecución $O (n log n)$ más favorable en el peor de los casos . La mayoría de las variantes de clasificación rápida del mundo real incluyen una implementación de heapsort como alternativa en caso de que detecten que la clasificación rápida se está degenerando. Heapsort es un algoritmo local , pero no es una clasificación estable .

Heapsort fue inventado por JWJ Williams en 1964. ^[4] El artículo también presentó el montón binario como una estructura de datos útil por derecho propio. ^[5] Ese mismo año, Robert W. Floyd publicó una versión mejorada que podía ordenar una matriz in situ, continuando su investigación anterior sobre el algoritmo de clasificación de árboles . ^[5]

Descripción general

El algoritmo de clasificación del montón se puede dividir en dos fases: construcción del montón y extracción del montón.

El montón es una estructura de datos implícita que no ocupa espacio más allá del conjunto de objetos a ordenar; la matriz se interpreta como un árbol binario completo donde cada elemento de la matriz es un nodo y los enlaces padre e hijo de cada nodo se definen mediante aritmética simple en los índices de la matriz. Para una matriz de base cero, el nodo raíz se almacena en el índice 0 y los nodos vinculados al nodo ise

 iNiñoIzquierdo(i) = 2⋅i + 1 iNiñoDerecho(i) = 2⋅i + 2 iPadre(i) = piso((i−1) / 2)

donde la función suelo redondea hacia abajo al entero anterior. Para obtener una explicación más detallada, consulte Montón binario § Implementación del montón .

Este árbol binario es un montón máximo cuando cada nodo es mayor o igual que sus dos hijos. De manera equivalente, cada nodo es menor o igual que su padre. Esta regla, aplicada en todo el árbol, da como resultado que el nodo máximo se ubique en la raíz del árbol.

En la primera fase, se construye un montón a partir de los datos (consulte Montón binario § Construyendo un montón ).

En la segunda fase, el montón se convierte en una matriz ordenada eliminando repetidamente el elemento más grande del montón (la raíz del montón) y colocándolo al final de la matriz. El montón se actualiza después de cada eliminación para mantener la propiedad del montón. Una vez que se han eliminado todos los objetos del montón, el resultado es una matriz ordenada.

La clasificación en montón normalmente se realiza in situ. Durante la primera fase, la matriz se divide en un prefijo sin clasificar y un sufijo ordenado en montón (inicialmente vacío). Cada paso reduce el prefijo y expande el sufijo. Cuando el prefijo está vacío, esta fase se completa. Durante la segunda fase, la matriz se divide en un prefijo ordenado en montón y un sufijo ordenado (inicialmente vacío). Cada paso reduce el prefijo y expande el sufijo. Cuando el prefijo está vacío, la matriz se ordena.

Algoritmo

El algoritmo de clasificación de montón comienza reorganizando la matriz en un montón máximo binario. Luego, el algoritmo intercambia repetidamente la raíz del montón (el elemento más grande que queda en el montón) con su último elemento, que luego se declara como parte del sufijo ordenado. Luego se repara el montón que se dañó al reemplazar la raíz, de modo que el elemento más grande vuelva a estar en la raíz. Esto se repite hasta que solo quede un valor en el montón.

Los pasos son:

Llame a la heapify()función en la matriz. Esto construye un montón a partir de una matriz en operaciones $O (n)$ .
Intercambie el primer elemento de la matriz (el elemento más grande del montón) con el elemento final del montón. Disminuya el rango considerado del montón en uno.
Llame a la siftDown()función en la matriz para mover el nuevo primer elemento a su lugar correcto en el montón.
Vuelva al paso (2) hasta que la matriz restante sea un solo elemento.

La heapify()operación se ejecuta una vez y su rendimiento es $O (n)$ . La siftDown()función se llama $n$ veces y requiere trabajo $O (log n)$ cada vez. Por lo tanto, el rendimiento de este algoritmo es $O (n + n log n) = O (n log n)$ .

El corazón del algoritmo es la siftDown()función. Esto construye montones binarios a partir de montones más pequeños y se puede considerar de dos maneras equivalentes:

dados dos montones binarios y un nodo principal compartido que no forma parte de ninguno de los dos, fusionarlos en un único montón binario más grande; o
dado un montón binario "dañado", donde la propiedad max-heap (ningún hijo es mayor que su padre) se mantiene en todas partes excepto posiblemente entre el nodo raíz y sus hijos, repárelo para producir un montón sin daños.

Para establecer la propiedad max-heap en la raíz, se deben comparar hasta tres nodos (la raíz y sus dos hijos), y el mayor debe convertirse en raíz. Esto se hace más fácilmente encontrando el hijo mayor y luego comparándolo con la raíz. Hay tres casos:

Si no hay hijos (los dos montones originales están vacíos), la propiedad del montón se cumple trivialmente y no se requiere ninguna acción adicional.
Si root es mayor o igual que el hijo mayor, la propiedad del montón se mantiene y, de la misma manera, no se requiere ninguna acción adicional.
Si la raíz es menor que el hijo mayor, intercambie los dos nodos. La propiedad del montón ahora se mantiene en el nodo recién ascendido (es mayor o igual que sus dos hijos y, de hecho, mayor que cualquier descendiente), pero puede ser violada entre el ex-raíz recién degradado y sus nuevos hijos. Para corregir esto, repita la siftDown()operación en el subárbol enraizado en la ex raíz recién degradada.

El número de iteraciones en cualquier siftdown()llamada está limitado por la altura del árbol, que es $⌊ log 2 n ⌋ = O (log n)$ .

Pseudocódigo

La siguiente es una forma sencilla de implementar el algoritmo en pseudocódigo . Las matrices tienen base cero y swapse utilizan para intercambiar dos elementos de la matriz. El movimiento 'hacia abajo' significa desde la raíz hacia las hojas, o desde índices más bajos hacia más altos. Tenga en cuenta que durante la clasificación, el elemento más grande está en la raíz del montón en a[0], mientras que al final de la clasificación, el elemento más grande está en a[end].

Se ingresa  el procedimiento heapsort(a, count) : una matriz desordenada a de longitud count  (Construya el montón en la matriz a para que el valor más grande esté en la raíz) amontonar(a, contar) (El siguiente bucle mantiene las invariantes de que a[0:end−1] es un montón, y  cada elemento a[end:count−1] más allá de end es mayor que todo lo anterior,  es decir, a[end:count−1] es en orden ordenado.) fin ← contar while end > 1 do  (el tamaño del montón se reduce en uno) fin ← fin − 1 (a[0] es la raíz y el valor más grande. El intercambio lo mueve delante de los elementos ordenados). intercambiar(a[fin], a[0]) (el intercambio arruinó la propiedad del montón, así que restáurela) tamizar(a, 0, final)

La rutina de clasificación utiliza dos subrutinas heapifyy siftDown. La primera es la rutina común de construcción del montón in situ, mientras que la segunda es una subrutina común para implementar heapify.

(Coloque los elementos de 'a' en orden de montón, en el lugar) el procedimiento heapify(a, count) es  (el inicio se inicializa en el primer nodo hoja)  (el último elemento en una matriz basada en 0 está en el índice count-1; encontrar el padre de ese elemento) inicio ← iParent(cuenta-1) + 1  while start > 0 do  (ir al último nodo que no es del montón) inicio ← inicio − 1 (busque el nodo en el índice 'inicio' hasta el lugar adecuado de modo que todos los nodos debajo  del índice inicial estén en orden de montón) tamizar(a, iniciar, contar) (después de examinar la raíz, todos los nodos/elementos están en orden de montón) (Repare el montón cuyo elemento raíz está en el índice 'inicio', asumiendo que los montones enraizados en sus hijos son válidos) El procedimiento siftDown(a, root, end) es  while iLeftChild(root) < end do  (Mientras la raíz tiene al menos un niño) niño ← iLeftChild(root) (Hijo izquierdo de la raíz)  (Si hay un hijo derecho y ese hijo es mayor)  si niño+1 < fin y a[niño] < a[niño+1] entonces niño ← niño + 1  si una[raíz] <un[niño] entonces intercambiar(a[raíz], a[niño]) raíz ← hijo (repita para continuar examinando al hijo ahora)  else  (La raíz contiene el elemento más grande. Dado que podemos asumir que los montones enraizados  en los hijos son válidos, esto significa que hemos terminado)  .

El heapifyprocedimiento opera construyendo pequeños montones y fusionándolos repetidamente usando siftDown. Comienza con las hojas, observando que son montones triviales pero válidos por sí mismos, y luego agrega los padres. Comenzando con el elemento $n /2$ y trabajando hacia atrás, cada nodo interno se convierte en la raíz de un montón válido al examinar hacia abajo. El último paso es filtrar el primer elemento, después de lo cual toda la matriz obedece a la propiedad del montón.

Para ver que esto lleva $O (n)$ tiempo, cuente el número de siftDowniteraciones en el peor de los casos. La última mitad de la matriz requiere cero iteraciones, el cuarto anterior requiere como máximo una iteración, el octavo anterior requiere como máximo dos iteraciones, el decimosexto anterior requiere como máximo tres, y así sucesivamente.

Visto de otra manera, si asumimos que cada siftDownllamada requiere el número máximo de iteraciones, la primera mitad de la matriz requiere una iteración, el primer cuarto requiere una más (2 en total), el primer octavo requiere otra (3 en total), etcétera.

Esto totaliza $n /2 + n /4 + n /8 + \dots = n\cdot(1/2 + 1/4 + 1/8 + \dots) , donde la suma infinita es una$ serie geométrica bien conocida cuya suma es $1$ , por tanto el producto es simplemente $n$ .

Lo anterior es una aproximación. Se sabe que el número exacto de comparaciones en el peor de los casos durante la fase de construcción del montón de heapsort es igual a $2 n - 2 s 2 (n) - e 2 (n)$ , donde $s 2 (n)$ es el número de 1 bits en la representación binaria de $n$ y $e 2 (n)$ es el número de bits 0 finales . ^[6]^[7]

Implementación estándar

Aunque es conveniente pensar en las dos fases por separado, la mayoría de las implementaciones combinan las dos, lo que permite expandir una única instancia siftDownen línea . ^[8]^{: Algoritmo H} Dos variables (aquí starty end) realizan un seguimiento de los límites del área del montón. La parte de la matriz anterior startno está ordenada, mientras que la parte que comienza en endestá ordenada. La construcción del montón disminuye starthasta que es cero, después de lo cual la extracción del montón disminuye endhasta que es 1 y la matriz está completamente ordenada.

Se ingresa  el procedimiento heapsort(a, count) : una matriz desordenada a de longitud count  inicio ← piso(cuenta/2) fin ← contar mientras finaliza > 1 hazlo  si inicia > 0 entonces  (construcción del montón) inicio ← inicio − 1 else  (extracción del montón) fin ← fin − 1 intercambiar(a[fin], a[0])  (Lo siguiente es tamizar (a, inicio, fin)) raíz ← inicio mientras iLeftChild(raíz) <fin de hacer niño ← iLeftChild(raíz) (Si hay un hijo correcto y ese hijo es mayor)  si niño+1 <fin y a[niño] <a[niño+1] entonces niño ← niño + 1  si una[raíz] <un[niño] entonces intercambiar(a[raíz], a[niño]) raíz ← hijo (repita para continuar examinando al hijo ahora)  de lo contrario,  romper  (volver al bucle exterior)

Variaciones

Construcción del montón de Williams

La descripción anterior utiliza el algoritmo mejorado de construcción de montón de Floyd, que opera en tiempo $O (n)$ y utiliza la misma siftDownprimitiva que la fase de extracción de montón. Aunque este algoritmo, al ser más rápido y más sencillo de programar, se utiliza en todas las implementaciones prácticas de clasificación de montón, el algoritmo original de Williams puede ser más fácil de entender y es necesario para implementar una cola de prioridad de montón binario más general .

En lugar de fusionar muchos montones pequeños, el algoritmo de Williams mantiene un único montón al frente de la matriz y agrega repetidamente un elemento adicional mediante una siftUpprimitiva. Al estar al final de la matriz, el nuevo elemento es una hoja y no tiene hijos de los que preocuparse, pero puede violar la propiedad del montón al ser mayor que su padre. En este caso intercambiarlo con su padre y repetir la prueba hasta que el padre sea mayor o no quede ningún padre (hemos llegado a la raíz). En pseudocódigo, esto es:

 Se ingresa  el procedimiento siftUp(a, end) :  a es la matriz, que está ordenada en montón hasta el final-1.  El final es el nodo a tamizar.  mientras finaliza > 0 padre := iPadre(fin) si a[padre] < a[end] entonces  (fuera del orden máximo del montón) intercambiar(a[padre], a[fin]) final: = padre (continuar examinando)  de lo contrario  regresar  El procedimiento heapify(a, count) es  (comience con un montón trivial de un solo elemento) final := 1  while end <count (tamizar el nodo al final del índice hasta el lugar adecuado de modo que  todos los nodos por encima del índice final estén en orden de montón) tamizar(a, final) fin := fin + 1 (después de examinar el último nodo, todos los nodos están en orden de montón)

Para comprender por qué este algoritmo puede tardar asintóticamente más tiempo en construir un montón ( $O (n log n)$ vs. $O (n)$ en el peor de los casos), tenga en cuenta que en el algoritmo de Floyd, casi todas las llamadas a siftDownoperaciones se aplican a montones muy pequeños . La mitad de los montones son montones triviales de altura 1 y se pueden omitir por completo, la mitad del resto son montones de altura 2, y así sucesivamente. Solo hay dos llamadas en montones de tamaño $n /2$ y solo siftDownse realiza una operación en el montón completo $de n$ elementos. La operación promedio general siftDowntoma $O (1)$ tiempo.

Por el contrario, el algoritmo de Williams la mayoría de las llamadas a siftUpse realizan en grandes montones de altura $O (log n)$ . La mitad de las llamadas se realizan con un tamaño de montón de $n /2$ o más, las tres cuartas partes se realizan con un tamaño de montón de $n /4$ o más, y así sucesivamente. Aunque el número promedio de pasos es similar a la técnica de Floyd, ^[9]^{: 3} entradas preclasificadas causarán el peor de los casos: cada nodo agregado se filtra hasta la raíz, por lo que la llamada promedio requerirá siftUpaproximadamente $(log 2 n - 1)/2 + (log 2 n - 2)/4 + (log 2 n - 3)/8 + \dots$ $= log 2 n - (1 + 1/2 + 1/4 + \dots)$ $= log 2 n - 2$ iteraciones.

Debido a que está dominado por la segunda fase de extracción del montón, el algoritmo de clasificación del montón en sí tiene una complejidad temporal $O (n log n)$ utilizando cualquiera de las versiones de heapify.

Clasificación de montón de abajo hacia arriba

La clasificación de montón ascendente es una variante que reduce el número de comparaciones requeridas en un factor significativo. Mientras que la clasificación de montón "de arriba hacia abajo" ordinaria requiere $2 n log 2 n + O (n)$ comparaciones en el peor de los casos y en promedio, ^[10] la variante ascendente requiere $n log 2 n + O (1)$ comparaciones en promedio, ^{[ 10]} y $1,5 n log 2 n + O (n)$ en el peor de los casos. ^[11]

Si las comparaciones son baratas (por ejemplo, claves enteras), entonces la diferencia no es importante, ^[12] ya que la clasificación de montón de arriba hacia abajo compara valores que ya se han cargado desde la memoria. Sin embargo, si las comparaciones requieren una llamada a función u otra lógica compleja, entonces la clasificación de montón ascendente es ventajosa.

Esto se logra mediante el uso de un siftDownprocedimiento más elaborado. El cambio mejora ligeramente la fase de creación de montón en tiempo lineal, ^[13] pero es más significativo en la segunda fase. Al igual que la clasificación de montón de arriba hacia abajo, cada iteración de la segunda fase extrae la parte superior del montón a[0]y llena el espacio que deja a[end], luego filtra este último elemento por el montón. Pero este elemento proviene del nivel más bajo del montón, lo que significa que es uno de los elementos más pequeños del montón, por lo que la criba probablemente requerirá muchos pasos para moverlo hacia abajo. ^[14] En la clasificación de montón de arriba hacia abajo, cada paso siftDownrequiere dos comparaciones para encontrar el mínimo de tres elementos: el nuevo nodo y sus dos hijos.

La clasificación de montón de abajo hacia arriba reemplaza conceptualmente la raíz con un valor de −∞ y la tamiza usando solo una comparación por nivel (ya que ningún niño puede ser menor que −∞) hasta que se alcanzan las hojas, luego reemplaza el −∞ con el valor correcto. valor y lo examina ( nuevamente, usando una comparación por nivel) hasta encontrar la posición correcta.

Esto coloca la raíz en la misma ubicación que top-down siftDown, pero se requieren menos comparaciones para encontrar esa ubicación. Para cualquier siftDownoperación, la técnica de abajo hacia arriba es ventajosa si el número de movimientos hacia abajo es al menos 2 ⁄ 3 de la altura del árbol (cuando el número de comparaciones es 4 ⁄ 3 veces la altura para ambas técnicas), y Resulta que esto es más que cierto en promedio, incluso para las entradas del peor de los casos. ^[11]

Una implementación ingenua de este algoritmo conceptual causaría algunas copias de datos redundantes, ya que la poción de filtrado deshace parte del filtrado. Una implementación práctica busca hacia abajo una hoja donde se colocaría −∞ , luego hacia arriba donde debería colocarse la raíz. Finalmente, el recorrido ascendente continúa hasta la posición inicial de la raíz, sin realizar más comparaciones sino intercambiando nodos para completar el reordenamiento necesario. Este formulario optimizado realiza la misma cantidad de intercambios que el formulario de arriba hacia abajo siftDown.

Debido a que llega hasta el final y luego vuelve a subir, algunos autores lo llaman ordenación en montón con rebote . ^[15]

la función leafSearch(a, i, end) es j ← yo while iRightChild(j) < end do  (Determine cuál de los dos hijos de j es mayor)  si a[iRightChild(j)] > a[iLeftChild(j)] entonces j ← iNiñoDerecho(j) demás j ← iLeftChild(j) (En el último nivel, puede haber solo un hijo)  si iLeftChild(j) <end entonces j ← iLeftChild(j) volver j

El valor de retorno de leafSearchse utiliza en la siftDownrutina modificada: ^[11]

procedimiento siftDown(a, i, end) es j ← búsquedahoja(a, i, final) mientras que a[i] > a[j] hacer j ← iPadre(j) mientras j > lo hago intercambiar(a[i], a[j]) j ← iPadre(j)

Se anunció que la clasificación en montón ascendente supera a la clasificación rápida (con selección de pivote mediana de tres) en matrices de tamaño ≥16000. ^[10]

Una reevaluación de este algoritmo en 2008 demostró que no es más rápido que la clasificación de montón de arriba hacia abajo para claves enteras, presumiblemente porque la predicción de rama moderna anula el costo de las comparaciones predecibles que la clasificación de montón de abajo hacia arriba logra evitar. ^[12]

Un refinamiento adicional realiza una búsqueda binaria en la búsqueda ascendente y ordena en el peor de los casos $(n +1)(log 2 (n +1) + log 2 log 2 (n +1) + 1,82) + O (log 2 n)$ comparaciones, acercándose al límite inferior de la teoría de la información de $n log 2 n - 1,4427 n$ comparaciones. ^[dieciséis]

Una variante que utiliza dos bits adicionales por nodo interno ( n −1 bits en total para un montón de n elementos) para almacenar en caché información sobre qué hijo es mayor (se requieren dos bits para almacenar tres casos: izquierdo, derecho y desconocido) ^{[13 ]} usa menos de $n log 2 n + 1,1 n$ en comparación. ^[17]

Otras variaciones

La clasificación de montón ternario utiliza un montón ternario en lugar de un montón binario; es decir, cada elemento del montón tiene tres hijos. Es más complicado de programar, pero realiza un número constante de veces menos operaciones de intercambio y comparación. Esto se debe a que cada paso de filtrado en un montón ternario requiere tres comparaciones y un intercambio, mientras que en un montón binario se requieren dos comparaciones y un intercambio. Dos niveles en un montón ternario cubren 3 ² = 9 elementos, haciendo más trabajo con la misma cantidad de comparaciones que tres niveles en el montón binario, que solo cubren 2 ³ = 8. ^{[ cita necesaria ]} Esto es principalmente de interés académico, o como ejercicio para estudiantes, ^[18] ya que la complejidad adicional no justifica los pequeños ahorros, y la clasificación ascendente supera a ambas.
Heapsort optimizado para memoria ^[19]^{: 87} mejora la localidad de referencia de heapsort al aumentar aún más el número de hijos. Esto aumenta el número de comparaciones, pero como todos los elementos secundarios se almacenan consecutivamente en la memoria, se reduce el número de líneas de caché a las que se accede durante el recorrido del montón, lo que supone una mejora neta en el rendimiento.
La implementación estándar del algoritmo de construcción de montón de Floyd provoca una gran cantidad de errores de caché una vez que el tamaño de los datos excede el del caché de la CPU . ^[19]^{: 87} Se puede obtener un mejor rendimiento en conjuntos de datos grandes fusionando en primer orden en profundidad , combinando submontones lo antes posible, en lugar de combinar todos los submontones en un nivel antes de pasar al superior. ^[9]^[20]
La clasificación en montón fuera de lugar ^[21]^[22]^[14] mejora la clasificación en montón ascendente al eliminar el peor de los casos, garantizando $n log 2 n + O (n)$ comparaciones. Cuando se toma el máximo, en lugar de llenar el espacio vacante con un valor de datos sin clasificar, llénelo con un valor centinela $-\infty$ , que nunca "rebota" hacia arriba. Resulta que esto se puede utilizar como primitivo en un algoritmo "QuickHeapsort" local (y no recursivo). ^[23] Primero, realiza una pasada de partición tipo clasificación rápida, pero invirtiendo el orden de los datos particionados en la matriz. Supongamos ( sin pérdida de generalidad ) que la partición más pequeña es la mayor que el pivote, que debería ir al final de la matriz, pero nuestro paso de partición invertida la coloca al principio. Forme un montón a partir de la partición más pequeña y ordene el montón fuera de lugar, intercambiando los máximos extraídos con valores del final de la matriz. Estos son menores que el pivote, es decir, menores que cualquier valor en el montón, por lo que sirven como valores centinela $-\infty .$ Una vez que se completa la clasificación del montón (y el pivote se mueve justo antes del final ahora ordenado de la matriz), el orden de las particiones se invierte y la partición más grande al comienzo de la matriz se puede ordenar de la misma manera. (Debido a que no hay recursividad sin cola , esto también elimina el uso de la pila $O (log n)$ de clasificación rápida ).
El algoritmo smoothsort ^[24] es una variación del heapsort desarrollado por Edsger W. Dijkstra en 1981. Al igual que heapsort, el límite superior del smoothsort es $O (n log n)$ . La ventaja de la clasificación suave es que se acerca al tiempo $O (n)$ si la entrada ya está ordenada hasta cierto punto , mientras que la clasificación en montón promedia $O (n log n)$ independientemente del estado de clasificación inicial. Debido a su complejidad, rara vez se utiliza la clasificación suave. ^{[ cita necesaria ]}
Levcopoulos y Petersson ^[25] describen una variación de heapsort basada en un montón de árboles cartesianos . Primero, se construye un árbol cartesiano a partir de la entrada en tiempo $O (n)$ y su raíz se coloca en un montón binario de 1 elemento. Luego extraemos repetidamente el mínimo del montón binario, generamos el elemento raíz del árbol y agregamos sus hijos izquierdo y derecho (si los hay), que son en sí mismos árboles cartesianos, al montón binario. ^[26] Como muestran, si la entrada ya está casi ordenada, los árboles cartesianos estarán muy desequilibrados, con pocos nodos con hijos izquierdo y derecho, lo que hará que el montón binario permanezca pequeño y permitirá que el algoritmo ordene más rápidamente que $O (n log n)$ para entradas que ya están casi ordenadas.
Varias variantes, como el Heapsort débil, requieren comparaciones $n log 2 n + O (1)$ en el peor de los casos, cerca del mínimo teórico, utilizando un bit adicional de estado por nodo. Si bien este bit adicional hace que los algoritmos no estén realmente en su lugar, si se puede encontrar espacio para ello dentro del elemento, estos algoritmos son simples y eficientes, ^[9]^{: 40} pero aún más lentos que los montones binarios si las comparaciones de claves son lo suficientemente baratas (por ejemplo, claves enteras) que un factor constante no importa. ^[27]
El "ordenador dinámico definitivo" de Katajainen no requiere almacenamiento adicional, realiza comparaciones $n log 2 n + O (1)$ y un número similar de movimientos de elementos. ^[28] Sin embargo, es aún más complejo y no está justificado a menos que las comparaciones sean muy costosas.

Comparación con otros tipos.

Heapsort compite principalmente con Quicksort , otro algoritmo de clasificación inestable basado en comparación in situ de propósito general muy eficiente.

Las principales ventajas de Heapsort son su código simple y no recursivo , su mínimo requisito de almacenamiento auxiliar y su buen rendimiento confiable: sus mejores y peores casos están dentro de un pequeño factor constante entre sí y del límite inferior teórico de los tipos de comparación . Si bien no puede funcionar mejor que $O (n log n)$ para entradas preclasificadas, tampoco sufre el peor caso de Quicksort $O (n 2)$ .

Las implementaciones de clasificación rápida del mundo real utilizan una variedad de heurísticas para evitar el peor de los casos, pero eso hace que su implementación sea mucho más compleja, y las implementaciones como la introclasificación y la clasificación rápida que anula patrones ^[29] utilizan la clasificación de heapsort como último recurso si detectan problemas degenerados. comportamiento. Por lo tanto, su rendimiento en el peor de los casos es ligeramente peor que si se hubiera utilizado heapsort desde el principio.

Las principales desventajas de Heapsort son su pobre localidad de referencia y su naturaleza inherentemente serial; los accesos al árbol implícito están muy dispersos y en su mayoría aleatorios, y no existe una forma sencilla de convertirlo en un algoritmo paralelo .

Las garantías de rendimiento en el peor de los casos hacen que el heapsort sea popular en la informática en tiempo real y en sistemas relacionados con entradas elegidas maliciosamente ^[30] , como el kernel de Linux. ^[31] La combinación de una implementación pequeña y un rendimiento fiable "suficientemente bueno" lo hacen popular en sistemas integrados y, en general, en cualquier aplicación donde la clasificación no sea un cuello de botella en el rendimiento . Por ejemplo, heapsort es ideal para ordenar una lista de nombres de archivos para su visualización, pero un sistema de gestión de bases de datos probablemente querría un algoritmo de clasificación optimizado más agresivamente.

Una clasificación rápida bien implementada suele ser entre 2 y 3 veces más rápida que una clasificación en montón. ^[19]^[32] Aunque la clasificación rápida requiere menos comparaciones, este es un factor menor. (Los resultados que afirman que hay el doble de comparaciones miden la versión de arriba hacia abajo; consulte § Clasificación en montón de abajo hacia arriba). La principal ventaja de la clasificación rápida es su localidad de referencia mucho mejor: la partición es un escaneo lineal con buena localidad espacial, y la subdivisión recursiva tiene buena localidad temporal. Con un esfuerzo adicional, la clasificación rápida también se puede implementar en código mayoritariamente libre de ramas y se pueden utilizar varias CPU para ordenar subparticiones en paralelo. Por lo tanto, se prefiere la clasificación rápida cuando el rendimiento adicional justifica el esfuerzo de implementación.

El otro algoritmo de ordenación $O (n log n) importante es el$ ordenamiento por fusión , pero rara vez compite directamente con el ordenamiento en montón porque no está implementado. El requisito de ordenación por combinación de $Ω(n)$ espacio adicional (aproximadamente la mitad del tamaño de la entrada) suele ser prohibitivo, excepto en situaciones en las que la ordenación por combinación tiene una clara ventaja:

Cuando se requiere una clasificación estable
Al aprovechar la entrada (parcialmente) preclasificada
Ordenar listas enlazadas (en cuyo caso la ordenación por combinación requiere un espacio adicional mínimo)
Clasificación paralela; La ordenación por combinación se paraleliza incluso mejor que la ordenación rápida y puede lograr fácilmente una aceleración cercana a la lineal
Clasificación externa ; La clasificación por combinación tiene una excelente localidad de referencia.

Ejemplo

Los ejemplos ordenan los valores {6, 5, 3, 1, 8, 7, 2, 4} en orden creciente utilizando ambos algoritmos de construcción de montón. Los elementos que se comparan se muestran en negrita . Por lo general, hay dos cuando se tamiza hacia arriba y tres cuando se tamiza hacia abajo, aunque puede haber menos cuando se llega a la parte superior o inferior del árbol.

Construcción de montón (algoritmo de Williams)

Un ejemplo de clasificación de montón utilizando el algoritmo de construcción de montón de Williams.

Construcción de montón (algoritmo de Floyd)

extracción de montón

Notas

^ Bollobás, B.; Fenner, TI; Friso, AM (1996). "Sobre el mejor caso de Heapsort" (PDF) . Revista de algoritmos . 20 (11): 205–217.
^ Sedgewick, Robert ; Schaffer, Russel W. (octubre de 1990). El mejor caso de Heapsort (Informe técnico). Universidad de Princeton. TR-293-90.
^ Skiena, Steven (2008). "Buscar y ordenar". El manual de diseño de algoritmos (3ª ed.). Saltador. pag. 116.doi : 10.1007 /978-3-030-54256-6_4. ISBN 978-3-030-54255-9. El nombre que normalmente se le da a este algoritmo, heapsort , oscurece el hecho de que el algoritmo no es más que una implementación de clasificación por selección utilizando la estructura de datos correcta.
^ Williams 1964
^ ab Brass, Peter (2008). Estructuras de datos avanzadas . Prensa de la Universidad de Cambridge. pag. 209.ISBN 978-0-521-88037-4.
^ Suchenek, Marek A. (2012). "Análisis elemental pero preciso del peor de los casos del programa de construcción de montones de Floyd". Fundamentos de la informática . 120 (1): 75–92. doi :10.3233/FI-2012-751.
^ Suchenek, Marek A. (7 de abril de 2015). "Un análisis completo del peor de los casos de Heapsort con verificación experimental de sus resultados, un manuscrito". arXiv : 1504.01459 [cs.DS].
^ Knuth 1997
^ abc Bojesen, Jesper; Katajainen, Jyrki; Spork, Maz (2000). "Estudio de caso de ingeniería de rendimiento: construcción en montón" (PostScript) . Revista ACM de algorítmica experimental . 5 (15): 15–es. CiteSeerX 10.1.1.35.3248 . doi :10.1145/351827.384257. S2CID 30995934. Fuente PDF alternativa.
^ abc Wegener, Ingo (13 de septiembre de 1993). "BOTTOM-UP HEAPSORT, una nueva variante de HEAPSORT que supera, en promedio, a QUICKSORT (si n no es muy pequeño)" (PDF) . Informática Teórica . 118 (1): 81–98. doi : 10.1016/0304-3975(93)90364-y .Aunque se trata de una reimpresión de un trabajo publicado por primera vez en 1990 (en la conferencia Mathematical Foundations of Computer Science), la técnica fue publicada por Carlsson en 1987. ^[16]
^ abc Fleischer, Rudolf (febrero de 1994). "Un límite inferior estricto para el peor de los casos de Bottom-Up-Heapsort" (PDF) . Algorítmica . 11 (2): 104-115. doi :10.1007/bf01182770. hdl : 11858/00-001M-0000-0014-7B02-C . S2CID 21075180.También disponible como Fleischer, Rudolf (abril de 1991). Un límite inferior ajustado para el peor de los casos de Bottom-Up-Heapsort (PDF) (Informe técnico). MPI-INF . MPI-I-91-104.
^ ab Mehlhorn, Kurt ; Lijadoras, Peter (2008). "Colas prioritarias" (PDF) . Algoritmos y estructuras de datos: la caja de herramientas básica. Saltador. pag. 142.ISBN 978-3-540-77977-3.
^ ab McDiarmid, CJH; Reed, BA (septiembre de 1989). "Construyendo montones rápidamente" (PDF) . Revista de algoritmos . 10 (3): 352–365. doi :10.1016/0196-6774(89)90033-3.
^ ab MacKay, David JC (diciembre de 2005). "Heapsort, Quicksort y entropía" . Consultado el 12 de febrero de 2021 .
^ Moret, Bernardo ; Shapiro, Henry D. (1991). "8.6 Clasificación en montón". Algoritmos de P a NP Volumen 1: Diseño y Eficiencia . Benjamín/Cummings. pag. 528.ISBN 0-8053-8008-6. A falta de un nombre mejor, llamamos a este programa mejorado 'ordenación en montón con rebote'. '
^ ab Carlsson, Scante (marzo de 1987). "Una variante de heapsort con un número casi óptimo de comparaciones" (PDF) . Cartas de procesamiento de información . 24 (4): 247–250. doi :10.1016/0020-0190(87)90142-6. S2CID 28135103. Archivado desde el original (PDF) el 27 de diciembre de 2016.
^ Wegener, Ingo (marzo de 1992). "El peor de los casos de complejidad de la variante de McDiarmid y Reed de BOTTOM-UP HEAPSORT es menor que n log n + 1,1n". Información y Computación . 97 (1): 86–96. doi : 10.1016/0890-5401(92)90005-Z .
^ Tenenbaum, Aaron M.; Augenstein, Moshe J. (1981). "Capítulo 8: Clasificación". Estructuras de datos utilizando Pascal . pag. 405.ISBN _ 0-13-196501-8. Escriba una rutina de clasificación similar a heapsort excepto que utiliza un montón ternario.
^ abc LaMarca, Anthony; Ladner, Richard E. (abril de 1999). "La influencia de las cachés en el rendimiento de la clasificación". Revista de algoritmos . 31 (1): 66-104. CiteSeerX 10.1.1.456.3616 . doi :10.1006/jagm.1998.0985. S2CID 206567217. Véase en particular la figura 9c en la pág. 98.
^ Chen, Jingsen; Edelkamp, Stefan; Elmasry, Amr; Katajainen, Jyrki (27 a 31 de agosto de 2012). "Construcción de montón in situ con comparaciones, movimientos y errores de caché optimizados" (PDF) . Fundamentos matemáticos de la informática 2012 . 37º congreso internacional sobre fundamentos matemáticos de la informática. Apuntes de conferencias sobre informática. vol. 7464. Bratislava, Eslovaquia. págs. 259-270. doi :10.1007/978-3-642-32589-2_25. ISBN 978-3-642-32588-5. S2CID 1462216. Archivado desde el original (PDF) el 29 de diciembre de 2016.Véase en particular la figura 3.
^ Cantone, Domenico; Concotti, Gianluca (1 a 3 de marzo de 2000). QuickHeapsort, una combinación eficiente de algoritmos de clasificación clásicos. IV Congreso Italiano sobre Algoritmos y Complejidad. Apuntes de conferencias sobre informática. vol. 1767. Roma. págs. 150-162. ISBN 3-540-67159-5.
^ Cantone, Domenico; Concotti, Gianluca (agosto de 2002). "QuickHeapsort, una combinación eficiente de algoritmos de clasificación clásicos" (PDF) . Informática Teórica . 285 (1): 25–42. doi : 10.1016/S0304-3975(01)00288-2 . Zbl 1016.68042.
^ Diekert, Volker; Weiß, Armin (agosto de 2016). "QuickHeapsort: modificaciones y análisis mejorado". Teoría de los Sistemas Computacionales . 59 (2): 209–230. arXiv : 1209.4214 . doi :10.1007/s00224-015-9656-y. S2CID 792585.
^ Dijkstra, Edsger W. Smoothsort: una alternativa a la clasificación in situ (EWD-796a) (PDF) . Archivo EW Dijkstra. Centro de Historia Estadounidense, Universidad de Texas en Austin .(transcripción)
^ Levcopoulos, Christos; Petersson, Ola (1989). "Heapsort: adaptado para archivos preordenados". WADS '89: Actas del taller sobre algoritmos y estructuras de datos . Apuntes de conferencias sobre informática. vol. 382. Londres, Reino Unido: Springer-Verlag. págs. 499–509. doi :10.1007/3-540-51542-9_41. ISBN 978-3-540-51542-5.Heapsort: adaptado para archivos preclasificados (Q56049336).
^ Schwartz, Keith (27 de diciembre de 2010). "CartesianTreeSort.hh". Archivo de Código Interesante . Consultado el 5 de marzo de 2019 .
^ Katajainen, Jyrki (23 de septiembre de 2013). Buscando la mejor cola prioritaria: lecciones aprendidas. Ingeniería de Algoritmos (Seminario 13391). Dagstuhl. págs. 19-20, 24.
^ Katajainen, Jyrki (2 a 3 de febrero de 1998). El montón definitivo. Computación: el cuarto simposio teórico de Australasia. Comunicaciones australianas de informática . vol. 20, núm. 3. Perth. págs. 87–96.
^ Peters, Orson RL (9 de junio de 2021). "Clasificación rápida que derrota los patrones". arXiv : 2106.05123 [cs.DS].
Peters, Orson RL "pdqsort". Github . Consultado el 2 de octubre de 2023 .
^ Morris, John (1998). "Comparación de clasificaciones rápidas y de montón". Estructuras de datos y algoritmos (apuntes de la conferencia). Universidad de Australia Occidental . Consultado el 12 de febrero de 2021 .
^ https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/tree/lib/sort.c#n205 Fuente del kernel de Linux
^ Maus, Arne [en noruego] (14 de mayo de 2014). "Clasificación generando la permutación de clasificación y el efecto del almacenamiento en caché en la clasificación".Consulte la figura 1 en la pág. 6.

Referencias

Williams, JWJ (1964). "Algoritmo 232 - Heapsort". Comunicaciones de la ACM . 7 (6): 347–348. doi :10.1145/512274.512284.
Floyd, Robert W. (1964). "Algoritmo 245 - Treesort 3". Comunicaciones de la ACM . 7 (12): 701. doi : 10.1145/355588.365103 . S2CID 52864987.
Carlsson, Svante [en sueco] (1987). "Resultados de casos promedio en heapsort". BIT Matemáticas Numéricas . 27 (1): 2–17. doi :10.1007/bf01937350. S2CID 31450060.
Knuth, Donald (1997). "§5.2.3, Ordenar por selección". El arte de la programación informática . vol. 3: Clasificación y búsqueda (3ª ed.). Addison-Wesley. págs. 144-155. ISBN 978-0-201-89685-5.
Cormen, Thomas H .; Leiserson, Charles E .; Rivest, Ronald L .; Stein, Clifford (2001). Introducción a los algoritmos (2ª ed.). MIT Press y McGraw-Hill. ISBN 0-262-03293-7.Capítulos 6 y 7 respectivamente: Heapsort y colas de prioridad
Un PDF del artículo original de Dijkstra sobre Smoothsort
Tutorial sobre montones y clasificación de montones por David Carlson, St. Vincent College

enlaces externos

La implementación del algoritmo Wikibook tiene una página sobre el tema: Heapsort

Algoritmos de clasificación animados: clasificación de montón en Wayback Machine (archivado el 6 de marzo de 2015): demostración gráfica
Material didáctico sobre Heapsort de la Univ. Oldenburg – Con texto, animaciones y ejercicios interactivos.
Diccionario de algoritmos y estructuras de datos del NIST: Heapsort
Heapsort implementado en 12 idiomas
Clasificación revisada por Paul Hsieh
Una presentación de PowerPoint que demuestra cómo funciona la clasificación en montón y está dirigida a educadores.
Estructuras de datos abiertas – Sección 11.1.3 – Heap-Sort, Pat Morin