Refinamiento de partición

En el diseño de algoritmos , el refinamiento de particiones es una técnica para representar una partición de un conjunto como una estructura de datos que permite refinar la partición dividiendo sus conjuntos en un mayor número de conjuntos más pequeños. En ese sentido, es dual a la estructura de datos unión-búsqueda , que también mantiene una partición en conjuntos disjuntos pero en la que las operaciones fusionan pares de conjuntos. En algunas aplicaciones de refinamiento de particiones, como la búsqueda lexicográfica de amplitud primero , la estructura de datos mantiene también un orden en los conjuntos de la partición.

El refinamiento de particiones forma un componente clave de varios algoritmos eficientes en gráficos y autómatas finitos , incluida la minimización de DFA , el algoritmo Coffman-Graham para la programación paralela y la búsqueda lexicográfica de gráficos en amplitud . ^[1]^[2]^[3]

Estructura de datos

$Un algoritmo de$ refinamiento de partición mantiene una familia de conjuntos disjuntos $Si$ . Al inicio del algoritmo, esta familia contiene un único conjunto de todos los elementos de la estructura de datos. En cada paso del algoritmo, se presenta un conjunto $X$ al algoritmo, y cada conjunto $Si de la$ familia que contiene miembros de X $se$ $divide$ en dos conjuntos, la intersección $Si \cap X$ y $la$ diferencia $Si \ X.$

Un algoritmo de este tipo se puede implementar de manera eficiente manteniendo estructuras de datos que representen la siguiente información: ^[4]^[5]

La secuencia ordenada de los conjuntos $Si en$ la familia, en una forma como una lista doblemente enlazada que permite insertar nuevos conjuntos en el medio de la secuencia.
Asociado con cada conjunto $Si,$ una colección de sus elementos de $Si$ , en una forma como una lista doblemente enlazada o una estructura de datos de matriz $que$ permite la eliminación rápida de elementos individuales de la colección. Alternativamente, este componente de la estructura de datos se puede representar almacenando todos los elementos de todos los conjuntos en una única matriz, ordenados por la identidad del conjunto al que pertenecen, y representando la colección de elementos en cualquier conjunto S $i .$ por sus posiciones inicial y final en esta matriz.
Asociado a cada elemento, el conjunto al que pertenece.

Para realizar una operación de refinamiento, el algoritmo recorre los elementos del conjunto dado $X.$ Para cada elemento $x$ , encuentra el conjunto $Si$ que contiene $x$ y verifica si ya se ha iniciado $un segundo conjunto$ $para$ $Si \cap X.$ De lo contrario, crea el segundo conjunto y agrega $Si$ a una lista $L$ de conjuntos que se dividen mediante la operación $.$ $Luego ,$ independientemente de si $se$ formó un nuevo conjunto, el algoritmo elimina $x$ de $Si$ y lo suma a $Si \cap X.$ En la representación en la que todos los elementos se almacenan en una única matriz, se puede mover $x$ de un conjunto a otro intercambiando $x con el$ $elemento$ final de $Si$ y luego disminuyendo el índice final de $Si$ $y$ el índice inicial del nuevo. colocar. Finalmente, después de que todos los elementos de $X$ se hayan procesado de esta manera, el algoritmo recorre $L$ , separando cada conjunto actual $Si$ $del$ segundo conjunto que se ha dividido de él, e informa que ambos conjuntos están recién formados por el refinamiento. operación.

El tiempo para realizar una única operación de refinamiento de esta manera es $O (| X |)$ , independiente del número de elementos de la familia de conjuntos y también independiente del número total de conjuntos en la estructura de datos. Por tanto, el tiempo para una secuencia de refinamientos es proporcional al tamaño total de los conjuntos dados al algoritmo en cada paso de refinamiento.

Aplicaciones

Una de las primeras aplicaciones del refinamiento de particiones fue el algoritmo de Hopcroft (1971) para la minimización de DFA . En este problema, se da como entrada un autómata finito determinista y se debe encontrar un autómata equivalente con el menor número de estados posible. El algoritmo de Hopcroft mantiene una partición de los estados del autómata de entrada en subconjuntos, con la propiedad de que dos estados cualesquiera en subconjuntos diferentes deben asignarse a diferentes estados del autómata de salida. Inicialmente, hay dos subconjuntos, uno que contiene todos los estados de aceptación del autómata y otro que contiene los estados restantes. En cada paso se elige uno de los subconjuntos $Si$ y uno de los símbolos de entrada $x$ del autómata, y los subconjuntos de estados se refinan en estados para los cuales una transición etiquetada $x$ $conduciría$ a $Si$ $,$ y estados para los cuales una $x$ - la transición llevaría a otra parte. Cuando un conjunto $Si que ya$ ha sido elegido se divide mediante un refinamiento, sólo es necesario volver a elegir uno de los dos conjuntos resultantes (el más pequeño de los dos); de esta manera, cada estado participa en los conjuntos $X$ para $O (s log n)$ pasos de refinamiento y el algoritmo general toma un tiempo $O (ns log n)$ , donde $n$ es el número de estados iniciales y $s$ es el tamaño del alfabeto. ^[6]

Sethi (1976) aplicó el refinamiento de la partición en una implementación eficiente del algoritmo Coffman-Graham para la programación paralela. Sethi demostró que podría usarse para construir un tipo topológico ordenado lexicográficamente de un gráfico acíclico dirigido dado en tiempo lineal; Este ordenamiento topológico lexicográfico es uno de los pasos clave del algoritmo de Coffman-Graham. En esta aplicación, los elementos de los conjuntos disjuntos son vértices del gráfico de entrada y los conjuntos $X$ utilizados para refinar la partición son conjuntos de vecinos de vértices. Dado que el número total de vecinos de todos los vértices es solo el número de aristas en el gráfico, el algoritmo toma un tiempo lineal en el número de aristas, su tamaño de entrada. ^[7]

El refinamiento de la partición también constituye un paso clave en la búsqueda lexicográfica en amplitud , un algoritmo de búsqueda de gráficos con aplicaciones en el reconocimiento de gráficos cordales y varias otras clases importantes de gráficos. Nuevamente, los elementos del conjunto disjunto son vértices y el conjunto $X$ representa conjuntos de vecinos , por lo que el algoritmo toma tiempo lineal. ^[8]^[9]

Referencias

^ Paige, Robert; Tarjan, Robert E. (1987), "Algoritmos de refinamiento de tres particiones", SIAM Journal on Computing , 16 (6): 973–989, doi :10.1137/0216062, MR 0917035.
^ Habib, Michel; Pablo, Christophe; Viennot, Laurent (1999), "Técnicas de refinamiento de particiones: un interesante conjunto de herramientas algorítmicas", Revista Internacional de Fundamentos de Ciencias de la Computación , 10 (2): 147–170, doi :10.1142/S0129054199000125, MR 1759929.
^ Habib, Michel; Pablo, Christophe; Viennot, Laurent (1998), "Una síntesis sobre el refinamiento de particiones: una rutina útil para cadenas, gráficos, matrices booleanas y autómatas", en Morvan, Michel; Meinel, Christoph; Krob, Daniel (eds.), STACS 98: 15º Simposio anual sobre aspectos teóricos de la informática París, Francia, 25 al 27 de febrero de 1998, Actas (PDF) , Lecture Notes in Computer Science , vol. 1373, Springer-Verlag, págs. 25–38, doi :10.1007/BFb0028546, ISBN 978-3-540-64230-5, señor 1650757.
^ Valmari, Antti; Lehtinen, Petri (2008), "Minimización eficiente de DFA con funciones de transición parciales", en Albers, Susanne ; Weil, Pascal (eds.), 25º Simposio internacional sobre aspectos teóricos de la informática (STACS 2008), Leibniz International Proceedings in Informatics (LIPIcs), vol. 1, Dagstuhl, Alemania: Schloss Dagstuhl: Leibniz-Zentrum fuer Informatik, págs. 645–656, arXiv : 0802.2826 , doi : 10.4230/LIPIcs.STACS.2008.1328, ISBN 978-3-939897-06-4, señor 2873773
^ Knuutila, Timo (2001), "Redescribiendo un algoritmo de Hopcroft", Informática teórica , 250 (1–2): 333–363, doi :10.1016/S0304-3975(99)00150-4, ISSN 0304- 3975
^ Hopcroft, John (1971), "Un algoritmo $n$ $log$ $n$ para minimizar estados en un autómata finito", Teoría de las máquinas y los cálculos (Proc. Internat. Sympos., Technion, Haifa, 1971) , Nueva York: Academic Press, págs. 189–196, SEÑOR 0403320.
^ Sethi, Ravi (1976), "Programación de gráficos en dos procesadores", SIAM Journal on Computing , 5 (1): 73–82, doi :10.1137/0205005, MR 0398156.
^ Rosa, DJ; Tarjan, RE ; Lueker, GS (1976), "Aspectos algorítmicos de la eliminación de vértices en gráficos", SIAM Journal on Computing , 5 (2): 266–283, doi :10.1137/0205021.
^ Corneil, Derek G. (2004), "Primera búsqueda en amplitud lexicográfica: una encuesta", en Hromkovič, Juraj; Nagl, Manfred; Westfechtel, Bernhard (eds.), Métodos teóricos de grafos en informática: 30º taller internacional, WG 2004, Bad Honnef, Alemania, 21 al 23 de junio de 2004, artículos revisados , notas de conferencias en informática , vol. 3353, Springer-Verlag, págs. 1–19, doi :10.1007/978-3-540-30559-0_1.