Aumento de datos

El aumento de datos es una técnica estadística que permite una estimación de máxima verosimilitud a partir de datos incompletos. ^[1]^[2] El aumento de datos tiene aplicaciones importantes en el análisis bayesiano , ^[3] y la técnica se usa ampliamente en el aprendizaje automático para reducir el sobreajuste al entrenar modelos de aprendizaje automático, ^[4] que se logra entrenando modelos en varias copias ligeramente modificadas de los datos existentes.

Técnicas de sobremuestreo sintético para el aprendizaje automático tradicional.

La técnica de sobremuestreo de minorías sintéticas (SMOTE) es un método utilizado para abordar conjuntos de datos desequilibrados en el aprendizaje automático. En tales conjuntos de datos, el número de muestras en diferentes clases varía significativamente, lo que genera un rendimiento sesgado del modelo. Por ejemplo, en un conjunto de datos de diagnóstico médico con 90 muestras que representan individuos sanos y solo 10 muestras que representan individuos con una enfermedad particular, los algoritmos tradicionales pueden tener dificultades para clasificar con precisión la clase minoritaria. SMOTE reequilibra el conjunto de datos generando muestras sintéticas para la clase minoritaria. Por ejemplo, si hay 100 muestras en la clase mayoritaria y 10 en la clase minoritaria, SMOTE puede crear muestras sintéticas seleccionando aleatoriamente una muestra de la clase minoritaria y sus vecinos más cercanos, y luego generando nuevas muestras a lo largo de los segmentos de línea que unen a estos vecinos. Este proceso ayuda a aumentar la representación de la clase minoritaria, mejorando el rendimiento del modelo. ^[5]

Aumento de datos para clasificación de imágenes.

Cuando las redes neuronales convolucionales crecieron a mediados de la década de 1990, faltaron datos para usar, especialmente considerando que una parte del conjunto de datos general debería reservarse para pruebas posteriores. Se propuso perturbar los datos existentes con transformaciones afines para crear nuevos ejemplos con las mismas etiquetas, ^[6] que se complementaron con las llamadas distorsiones elásticas en 2003, ^[7] y la técnica se utilizó ampliamente a partir de la década de 2010. ^[8] El aumento de datos puede mejorar el rendimiento de CNN y actúa como una contramedida contra los ataques de elaboración de perfiles de CNN. ^[9]

El aumento de datos se ha vuelto fundamental en la clasificación de imágenes, enriqueciendo la diversidad del conjunto de datos de entrenamiento para mejorar la generalización y el rendimiento del modelo. La evolución de esta práctica ha introducido un amplio espectro de técnicas, incluidas transformaciones geométricas, ajustes del espacio de color e inyección de ruido. ^[10]

Transformaciones geométricas

Las transformaciones geométricas alteran las propiedades espaciales de las imágenes para simular diferentes perspectivas, orientaciones y escalas. Las técnicas comunes incluyen:

Rotación: rotar imágenes en un grado específico para ayudar a los modelos a reconocer objetos en varios ángulos.
Voltear: reflejar imágenes horizontal o verticalmente para introducir variabilidad en la orientación.
Recortar: eliminar secciones de la imagen para centrarse en características particulares o simular vistas más cercanas.
Traducción: Desplazar imágenes en diferentes direcciones para enseñar a los modelos la invariancia posicional.

Transformaciones del espacio de color

Las transformaciones del espacio de color modifican las propiedades de color de las imágenes, abordando variaciones en la iluminación, la saturación del color y el contraste. Las técnicas incluyen:

Ajuste de brillo: variar el brillo de la imagen para simular diferentes condiciones de iluminación.
Ajuste de contraste: cambiar el contraste para ayudar a los modelos a reconocer objetos bajo varios niveles de claridad.
Ajuste de saturación: alteración de la saturación para preparar modelos para imágenes con diversas intensidades de color.
Variación de color: ajuste aleatorio de brillo, contraste, saturación y tono para introducir variabilidad de color.

Inyección de ruido

Inyectar ruido en imágenes simula imperfecciones del mundo real, enseñando a los modelos a ignorar variaciones irrelevantes. Las técnicas implican:

Ruido gaussiano: agregar ruido gaussiano imita el ruido o la granulosidad del sensor.
Ruido de sal y pimienta: la introducción aleatoria de píxeles blancos o negros simula el polvo del sensor o los píxeles muertos .

Aumento de datos para procesamiento de señales.

Se puede utilizar bootstrap residual o de bloque para aumentar las series temporales.

Señales biológicas

El aumento de datos sintéticos es de suma importancia para la clasificación del aprendizaje automático, particularmente para los datos biológicos, que tienden a ser muy dimensionales y escasos. Las aplicaciones del control y aumento robóticos en sujetos discapacitados y sanos todavía se basan principalmente en análisis de temas específicos. La escasez de datos es notable en problemas de procesamiento de señales, como las señales de electromiografía de la enfermedad de Parkinson , que son difíciles de obtener - Zanini, et al. señaló que es posible utilizar una red generativa adversaria (en particular, un DCGAN) para realizar una transferencia de estilo con el fin de generar señales electromiográficas sintéticas que correspondan a las exhibidas por quienes padecen la enfermedad de Parkinson. ^[11]

Los abordajes también son importantes en la electroencefalografía (ondas cerebrales). Wang, et al. exploraron la idea de utilizar redes neuronales convolucionales profundas para el reconocimiento de emociones basado en EEG, los resultados muestran que el reconocimiento de emociones mejoró cuando se utilizó el aumento de datos. ^[12]

Un enfoque común es generar señales sintéticas reorganizando componentes de datos reales. Lotte ^[13] propuso un método de "Generación de prueba artificial basada en analogía" donde tres ejemplos de datos proporcionan ejemplos y se forma una idea artificial de lo que es . Se aplica una transformación para hacerlo más similar a , luego se aplica la misma transformación a lo que genera . Se demostró que este enfoque mejora el rendimiento de un clasificador de análisis discriminante lineal en tres conjuntos de datos diferentes. $x_{1},x_{2},x_{3}$ $x_{synthetic}$ $x_{3}$ $x_{2}$ $x_{1}$ $x_{1}$ $x_{2}$ $x_{3}$ $x_{synthetic}$

Las investigaciones actuales muestran que se puede obtener un gran impacto a partir de técnicas relativamente simples. Por ejemplo, Freer ^[14] observó que la introducción de ruido en los datos recopilados para formar puntos de datos adicionales mejoraba la capacidad de aprendizaje de varios modelos que, de otro modo, funcionaban relativamente mal. Tsinganos et al. ^[15] estudiaron los enfoques de deformación de magnitud, descomposición de ondas y modelos EMG de superficie sintética (enfoques generativos) para el reconocimiento de gestos manuales, y encontraron aumentos en el rendimiento de clasificación de hasta +16% cuando se introdujeron datos aumentados durante el entrenamiento. Más recientemente, los estudios de aumento de datos han comenzado a centrarse en el campo del aprendizaje profundo, más específicamente en la capacidad de los modelos generativos para crear datos artificiales que luego se introducen durante el proceso de entrenamiento del modelo de clasificación. En 2018, Luo et al. ^[16] observaron que se podían generar datos útiles de señales de EEG mediante redes adversarias generativas (GAN) condicionales de Wasserstein, que luego se introdujeron en el conjunto de entrenamiento en un marco de aprendizaje clásico de prueba de tren. Los autores encontraron que el rendimiento de la clasificación mejoró cuando se introdujeron tales técnicas.

Señales mecánicas

La predicción de señales mecánicas basada en el aumento de datos trae consigo una nueva generación de innovaciones tecnológicas, como el nuevo despacho de energía, el campo de comunicación 5G y la ingeniería de control robótico. ^[17] En 2022, Yang et al. ^[17] integran restricciones, optimización y control en un marco de red profundo basado en el aumento y la poda de datos con correlación de datos espacio-temporal, y mejoran la interpretabilidad, seguridad y controlabilidad del aprendizaje profundo en proyectos industriales reales a través de ecuaciones de programación matemática explícita y analítica. soluciones.

Ver también

Referencias

^ Dempster, AP; Laird, Nuevo México; Rubin, DB (1977). "Máxima probabilidad de obtener datos incompletos mediante el algoritmo EM". Revista de la Royal Statistical Society: Serie B (Metodológica) . 39 (1): 1–22. doi :10.1111/j.2517-6161.1977.tb01600.x.
^ Rubin, Donald (1987). "Comentario: El cálculo de distribuciones posteriores mediante aumento de datos". Revista de la Asociación Estadounidense de Estadística . 82 (398). doi :10.2307/2289460. JSTOR 2289460.
^ Jackman, Simón (2009). Análisis bayesiano para las ciencias sociales. John Wiley e hijos. pag. 236.ISBN 978-0-470-01154-6.
^ Acortar, Connor; Khoshgoftaar, Taghi M. (2019). "Una encuesta sobre el aumento de datos de imágenes para el aprendizaje profundo". Matemáticas y Computación en Simulación . 6 . saltador: 60. doi : 10.1186/s40537-019-0197-0 .
^ Wang, Shujuan; Dai, Yuntao; Shen, Jihong; Xuan, Jingxue (15 de diciembre de 2021). "Investigación sobre ampliación y clasificación de datos desequilibrados basada en el algoritmo SMOTE". Informes científicos . 11 (1): 24039. Código bibliográfico : 2021NatSR..1124039W. doi :10.1038/s41598-021-03430-5. ISSN 2045-2322. PMC 8674253 . PMID 34912009.
^ Yann Lecun; et al. (1995). Algoritmos de aprendizaje para la clasificación: una comparación sobre el reconocimiento de dígitos escritos a mano (artículo de conferencia) . Científico mundial. págs. 261–276 . Consultado el 14 de mayo de 2023 . {{cite book}}: |website=ignorado ( ayuda )
^ Simard, PY; Steinkraus, D.; Platt, JC (2003). "Mejores prácticas para redes neuronales convolucionales aplicadas al análisis visual de documentos". Séptima Conferencia Internacional sobre Análisis y Reconocimiento de Documentos, 2003. Actas . vol. 1. págs. 958–963. doi :10.1109/ICDAR.2003.1227801. ISBN 0-7695-1960-1. S2CID 4659176.
^ Hinton, Geoffrey E.; Srivastava, nitish; Krizhevsky, Alex; Sutskever, Ilya; Salakhutdinov, Ruslan R. (2012). "Mejora de las redes neuronales evitando la coadaptación de detectores de características". arXiv : 1207.0580 [cs.NE].
^ Cagli, Eleonora; Dumas, Cecile; Prouff, Emmanuel (2017). Fischer, Wieland; Homma, Naofumi (eds.). Redes neuronales convolucionales con aumento de datos contra contramedidas basadas en jitter. Apuntes de conferencias sobre informática. Cham: Editorial Internacional Springer. págs. 45–68. doi :10.1007/978-3-319-66787-4_3. ISBN 978-3-319-66787-4. S2CID 54088207. {{cite book}}: |journal=ignorado ( ayuda )
^ Acortar, Connor; Khoshgoftaar, Taghi M. (6 de julio de 2019). "Una encuesta sobre el aumento de datos de imágenes para el aprendizaje profundo". Revista de Big Data . 6 (1): 60. doi : 10.1186/s40537-019-0197-0 . ISSN 2196-1115.
^ Anicet Zanini, Rafael; Luna Colombini, Esther (2020). "Simulación y aumento de datos de EMG de la enfermedad de Parkinson con DCGAN y transferencia de estilo". Sensores . 20 (9): 2605. Código Bib : 2020Senso..20.2605A. doi : 10.3390/s20092605 . ISSN 1424-8220. PMC 7248755 . PMID 32375217.
^ Wang, colmillo; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan (2018). "Aumento de datos para el reconocimiento de emociones basado en EEG con redes neuronales convolucionales profundas". Modelado multimedia . Apuntes de conferencias sobre informática. vol. 10705. págs. 82–93. doi :10.1007/978-3-319-73600-6_8. ISBN 978-3-319-73599-3. ISSN 0302-9743.
^ Lotte, Fabien (2015). "Enfoques de procesamiento de señales para minimizar o suprimir el tiempo de calibración en interfaces cerebro-computadora basadas en actividad oscilatoria" (PDF) . Actas del IEEE . 103 (6): 871–890. doi :10.1109/JPROC.2015.2404941. ISSN 0018-9219. S2CID 22472204.
^ Más libre, Daniel; Yang, Guang-Zhong (2020). "Aumento de datos para la clasificación de imágenes motoras a su propio ritmo con C-LSTM". Revista de ingeniería neuronal . 17 (1): 016041. Código bibliográfico : 2020JNEng..17a6041F. doi :10.1088/1741-2552/ab57c0. hdl : 10044/1/75376 . ISSN 1741-2552. PMID 31726440. S2CID 208034533.
^ Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, enero; Jansen, Bart; Skodras, Atanasio (2020). "Aumento de datos de electromiografía de superficie para el reconocimiento de gestos con las manos". Sensores . 20 (17): 4892. Código Bib : 2020Senso..20.4892T. doi : 10.3390/s20174892 . ISSN 1424-8220. PMC 7506981 . PMID 32872508.
^ Luo, Yun; Lu, Bao-Liang (2018). "Aumento de datos de EEG para el reconocimiento de emociones mediante una GAN de Wasserstein condicional". 2018 40.a Conferencia Internacional Anual de la Sociedad de Ingeniería en Medicina y Biología (EMBC) del IEEE . vol. 2018. págs. 2535–2538. doi :10.1109/EMBC.2018.8512865. ISBN 978-1-5386-3646-6. PMID 30440924. S2CID 53105445.
^ ab Yang, Yang (2022). "Predicción de la velocidad del viento con poda y aumento de la red de correlación: un método de aprendizaje profundo de dos fases". Energía renovable . 198 (1): 267–282. arXiv : 2306.01986 . doi :10.1016/j.renene.2022.07.125. ISSN 0960-1481. S2CID 251511199.