Aprendizaje por diccionarios dispersos

Estos elementos se denominan átomos y componen un diccionario.No es necesario que los átomos del diccionario sean ortogonales, y pueden ser un conjunto sobrecompleto.Esta configuración del problema también permite que la dimensionalidad de las señales representadas sea mayor que la de las señales observadas.Las dos propiedades anteriores conducen a tener átomos aparentemente redundantes que permiten múltiples representaciones de la misma señal, pero también proporcionan una mejora en la escasez y la flexibilidad de la representación.En la detección comprimida, una señal de alta dimensión puede recuperarse con sólo unas pocas medidas lineales, siempre que la señal sea dispersa o casi dispersa.Una vez que una matriz o un vector de alta dimensión se transfiere a un espacio disperso, se pueden utilizar distintos algoritmos de recuperación, como la búsqueda de bases, CoSaMP[1]​ o algoritmos rápidos no iterativos,[2]​ para recuperar la señal.controla el equilibrio entre la dispersión y el error de minimización.[3]​ En algunos casos, se sabe que la norma L1 garantiza la dispersión,[4]​ por lo que lo anterior se convierte en un problema de optimización convexa con respecto a cada una de las variablesEste caso está muy relacionado con la reducción de la dimensionalidad y técnicas como el análisis de componentes principales, que requieren átomosSin embargo, su principal inconveniente es la limitación en la elección de los átomos.Sin embargo, los diccionarios sobrecompletos no requieren que los átomos sean ortogonales (de todos modos, nunca tendrán una base), lo que permite diccionarios más flexibles y representaciones de datos más ricas.Se han desarrollado varios algoritmos para resolverlo (como búsqueda de coincidencia y LASSO) que se incorporan a los algoritmos descritos a continuación.El método de direcciones óptimas (o MOD)[5]​ fue uno de los primeros métodos introducidos para abordar el problema del aprendizaje por diccionarios dispersos.MOD alterna entre obtener la codificación dispersa mediante un método como la búsqueda de coincidencias y actualizar el diccionario calculando la solución analítica del problema dado porK-SVD es un algoritmo que realiza SVD[7]​ en su núcleo para actualizar los átomos del diccionario uno a uno y básicamente es una generalización de K-means.elementos de forma idéntica al enfoque MOD:La esencia de este algoritmo es fijar primero el diccionario, encontrar el mejorbajo la restricción anterior (utilizando búsqueda de coincidencias ortogonales) y luego actualizar iterativamente los átomos del diccionarioSin embargo, comparte debilidades con MOD al ser eficiente sólo para señales con una dimensionalidad relativamente baja y tener la posibilidad de quedarse atascado en mínimos locales.son las denominadas variables duales que forman la matriz diagonalPodemos entonces proporcionar una expresión analítica para el dual de Lagrange tras la minimización sobreResolver este problema es menos difícil computacionalmente porque la cantidad de variables dualesEn este enfoque, el problema de optimización se formula como:minimizando el error mínimo cuadrático sujeto a una restricción de norma L1 en el vector solución, formulada como:controla el equilibrio entre la dispersión y el error de reconstrucción.Entre los enfoques más destacados se incluyen: Muchos enfoques comunes para el aprendizaje por diccionarios dispersos se basan en el hecho de que todos los datos de entradaSin embargo, esto puede no ser así en el mundo real, ya que el tamaño de los datos de entrada puede ser demasiado grande para caber en la memoria.Esta técnica puede aplicarse a problemas de clasificación de forma que, si hemos construido diccionarios específicos para cada clase, la señal de entrada puede clasificarse encontrando el diccionario correspondiente a la representación más escasa.El aprendizaje por diccionarios se utiliza para analizar en detalle las señales médicas.Dichas señales médicas incluyen las procedentes de la electroencefalografía (EEG), la electrocardiografía (ECG), la resonancia magnética (RM), la resonancia magnética funcional (RMf), los monitores continuos de glucosa[22]​ y la tomografía computarizada (USCT), en las que se utilizan distintos supuestos para analizar cada señal.