En el análisis de datos topológicos , un código de barras de persistencia , a veces abreviado como código de barras , es un invariante algebraico asociado con un complejo de cadena filtrado o un módulo de persistencia que caracteriza la estabilidad de las características topológicas a lo largo de una creciente familia de espacios . [1] Formalmente, un código de barras de persistencia consiste en un multiconjunto de intervalos en la línea real extendida , donde la longitud de cada intervalo corresponde a la vida útil de una característica topológica en una filtración , generalmente construida sobre una nube de puntos , un gráfico , una función o, más generalmente, un complejo simplicial o un complejo de cadena . Generalmente, los intervalos más largos en un código de barras corresponden a características más robustas, mientras que los intervalos más cortos tienen más probabilidades de ser ruido en los datos. Un código de barras de persistencia es un invariante completo que captura toda la información topológica en una filtración. [2] En topología algebraica, los códigos de barras de persistencia fueron introducidos por primera vez por Sergey Barannikov en 1994 como invariantes de "formas canónicas" [2] que consisten en un multiconjunto de segmentos de línea con extremos en dos líneas paralelas, y más tarde, en el procesamiento de geometría, por Gunnar Carlsson et al. en 2004. [3]
Sea un cuerpo fijo . Considérese una función de valor real en un complejo de cadena compatible con la diferencial, de modo que siempre que en . Entonces, para cada conjunto de subniveles es un subcomplejo de K , y los valores de en los generadores en definen una filtración (que en la práctica siempre es finita):
Entonces, el teorema de clasificación de complejos filtrados establece que para cualquier complejo de cadena filtrado sobre , existe una transformación lineal que preserva la filtración y lleva al complejo filtrado a la llamada forma canónica , una suma directa definida canónicamente de complejos filtrados de dos tipos: complejos bidimensionales con homología trivial y complejos unidimensionales con diferencial trivial . [2] El multiconjunto de los intervalos o que describe la forma canónica, se llama código de barras , y es el invariante completo del complejo de cadena filtrado.
El concepto de módulo de persistencia está íntimamente ligado a la noción de complejo de cadena filtrada. Un módulo de persistencia indexado sobre consiste en una familia de espacios vectoriales y aplicaciones lineales para cada uno tales que para todo . [4] Esta construcción no es específica de ; de hecho, funciona de manera idéntica con cualquier conjunto totalmente ordenado .
Se dice que un módulo de persistencia es de tipo finito si contiene un número finito de espacios vectoriales únicos de dimensión finita. La última condición a veces se denomina de dimensión finita puntual . [5]
Sea un intervalo en . Defina un módulo de persistencia mediante , donde los mapas lineales son el mapa de identidad dentro del intervalo. El módulo a veces se denomina módulo de intervalo. [6]
Entonces, para cualquier módulo de persistencia indexado de tipo finito, existe un multiconjunto de intervalos tales que , donde la suma directa de los módulos de persistencia se lleva a cabo índice por índice. El multiconjunto se denomina código de barras de , y es único hasta que se reordenen los intervalos. [3]
Este resultado fue extendido al caso de módulos de persistencia de dimensión finita puntuales indexados sobre un conjunto totalmente ordenado arbitrario por William Crawley-Boevey y Magnus Botnan en 2020, [7] basándose en resultados conocidos del teorema de estructura para módulos generados finitamente sobre un PID , así como el trabajo de Cary Webb para el caso de los números enteros . [8]
{{cite book}}
: CS1 maint: location missing publisher (link)