El aumento de datos es una técnica estadística que permite la estimación de máxima verosimilitud a partir de datos incompletos. [1] [2] El aumento de datos tiene aplicaciones importantes en el análisis bayesiano , [3] y la técnica se usa ampliamente en el aprendizaje automático para reducir el sobreajuste al entrenar modelos de aprendizaje automático, [4] lo que se logra entrenando modelos en varias copias ligeramente modificadas de datos existentes.
La técnica de sobremuestreo de minorías sintéticas (SMOTE, por sus siglas en inglés) es un método que se utiliza para abordar conjuntos de datos desequilibrados en el aprendizaje automático. En dichos conjuntos de datos, la cantidad de muestras en diferentes clases varía significativamente, lo que genera un rendimiento sesgado del modelo. Por ejemplo, en un conjunto de datos de diagnóstico médico con 90 muestras que representan a individuos sanos y solo 10 muestras que representan a individuos con una enfermedad en particular, los algoritmos tradicionales pueden tener dificultades para clasificar con precisión la clase minoritaria. SMOTE reequilibra el conjunto de datos al generar muestras sintéticas para la clase minoritaria. Por ejemplo, si hay 100 muestras en la clase mayoritaria y 10 en la clase minoritaria, SMOTE puede crear muestras sintéticas seleccionando aleatoriamente una muestra de la clase minoritaria y sus vecinos más cercanos, y luego generando nuevas muestras a lo largo de los segmentos de línea que unen a estos vecinos. Este proceso ayuda a aumentar la representación de la clase minoritaria, lo que mejora el rendimiento del modelo. [5]
Cuando las redes neuronales convolucionales se hicieron más grandes a mediados de la década de 1990, hubo una falta de datos para usar, especialmente considerando que una parte del conjunto de datos general debía reservarse para pruebas posteriores. Se propuso perturbar los datos existentes con transformaciones afines para crear nuevos ejemplos con las mismas etiquetas, [6] que se complementaron con las llamadas distorsiones elásticas en 2003, [7] y la técnica se usó ampliamente a partir de la década de 2010. [8] La ampliación de datos puede mejorar el rendimiento de las redes neuronales convolucionales y actúa como una contramedida contra los ataques de creación de perfiles de redes neuronales convolucionales. [9]
La mejora de los datos se ha vuelto fundamental en la clasificación de imágenes, ya que enriquece la diversidad de los conjuntos de datos de entrenamiento para mejorar la generalización y el rendimiento de los modelos. La evolución de esta práctica ha introducido un amplio espectro de técnicas, incluidas las transformaciones geométricas, los ajustes del espacio de color y la inyección de ruido. [10]
Las transformaciones geométricas alteran las propiedades espaciales de las imágenes para simular diferentes perspectivas, orientaciones y escalas. Las técnicas más comunes incluyen:
Las transformaciones del espacio de color modifican las propiedades de color de las imágenes y abordan las variaciones en la iluminación, la saturación del color y el contraste. Las técnicas incluyen:
La inyección de ruido en las imágenes simula imperfecciones del mundo real y enseña a los modelos a ignorar las variaciones irrelevantes. Las técnicas implican:
Se puede utilizar un bootstrap residual o de bloque para ampliar series de tiempo.
La ampliación de datos sintéticos es de suma importancia para la clasificación mediante aprendizaje automático, en particular para los datos biológicos, que tienden a ser muy dimensionales y escasos. Las aplicaciones del control y la ampliación robóticos en sujetos discapacitados y no discapacitados todavía dependen principalmente de análisis específicos del sujeto. La escasez de datos es notable en los problemas de procesamiento de señales, como las señales de electromiografía de la enfermedad de Parkinson , que son difíciles de obtener: Zanini et al. observaron que es posible utilizar una red generativa adversaria (en particular, una DCGAN) para realizar una transferencia de estilo con el fin de generar señales electromiográficas sintéticas que correspondan a las que exhiben los pacientes con enfermedad de Parkinson. [11]
Estos métodos también son importantes en la electroencefalografía (ondas cerebrales). Wang et al. exploraron la idea de utilizar redes neuronales convolucionales profundas para el reconocimiento de emociones basado en EEG; los resultados muestran que el reconocimiento de emociones mejoró cuando se utilizó el aumento de datos. [12]
Un enfoque común consiste en generar señales sintéticas reorganizando los componentes de los datos reales. Lotte [13] propuso un método de "Generación de ensayos artificiales basada en analogía" en el que tres ejemplos de datos proporcionan ejemplos y se forma un ensayo artificial que es a lo que es a . Se aplica una transformación a para hacerlo más similar a , luego se aplica la misma transformación a que genera . Se demostró que este enfoque mejora el rendimiento de un clasificador de análisis discriminante lineal en tres conjuntos de datos diferentes.
Las investigaciones actuales muestran que se puede obtener un gran impacto a partir de técnicas relativamente simples. Por ejemplo, Freer [14] observó que la introducción de ruido en los datos recopilados para formar puntos de datos adicionales mejoraba la capacidad de aprendizaje de varios modelos que, de otro modo, tenían un rendimiento relativamente bajo. Tsinganos et al. [15] estudiaron los enfoques de deformación de magnitud, descomposición de ondículas y modelos EMG de superficie sintéticos (enfoques generativos) para el reconocimiento de gestos de la mano, y encontraron aumentos en el rendimiento de la clasificación de hasta un +16 % cuando se introdujeron datos aumentados durante el entrenamiento. Más recientemente, los estudios de aumento de datos han comenzado a centrarse en el campo del aprendizaje profundo, más específicamente en la capacidad de los modelos generativos para crear datos artificiales que luego se introducen durante el proceso de entrenamiento del modelo de clasificación. En 2018, Luo et al. [16] observaron que los datos útiles de la señal de EEG se podían generar mediante redes generativas antagónicas de Wasserstein condicionales (GAN) que luego se introdujeron en el conjunto de entrenamiento en un marco de aprendizaje de prueba y entrenamiento clásico. Los autores descubrieron que el rendimiento de la clasificación mejoraba cuando se introducían dichas técnicas.
La predicción de señales mecánicas basada en el aumento de datos trae una nueva generación de innovaciones tecnológicas , como el nuevo despacho de energía, el campo de la comunicación 5G y la ingeniería de control robótico. [17] En 2022, Yang et al. [17] integran restricciones, optimización y control en un marco de red profunda basado en el aumento de datos y la poda de datos con correlación de datos espacio-temporales, y mejoran la interpretabilidad, seguridad y controlabilidad del aprendizaje profundo en proyectos industriales reales a través de ecuaciones de programación matemática explícitas y soluciones analíticas.
{{cite book}}
: |website=
ignorado ( ayuda )