stringtranslate.com

Aumento de datos

El aumento de datos es una técnica estadística que permite la estimación de máxima verosimilitud a partir de datos incompletos. [1] [2] El aumento de datos tiene aplicaciones importantes en el análisis bayesiano , [3] y la técnica se usa ampliamente en el aprendizaje automático para reducir el sobreajuste al entrenar modelos de aprendizaje automático, [4] lo que se logra entrenando modelos en varias copias ligeramente modificadas de datos existentes.

Técnicas de sobremuestreo sintético para muestras tradicionalesaprendizaje automático

La técnica de sobremuestreo de minorías sintéticas (SMOTE, por sus siglas en inglés) es un método que se utiliza para abordar conjuntos de datos desequilibrados en el aprendizaje automático. En dichos conjuntos de datos, la cantidad de muestras en diferentes clases varía significativamente, lo que genera un rendimiento sesgado del modelo. Por ejemplo, en un conjunto de datos de diagnóstico médico con 90 muestras que representan a individuos sanos y solo 10 muestras que representan a individuos con una enfermedad en particular, los algoritmos tradicionales pueden tener dificultades para clasificar con precisión la clase minoritaria. SMOTE reequilibra el conjunto de datos al generar muestras sintéticas para la clase minoritaria. Por ejemplo, si hay 100 muestras en la clase mayoritaria y 10 en la clase minoritaria, SMOTE puede crear muestras sintéticas seleccionando aleatoriamente una muestra de la clase minoritaria y sus vecinos más cercanos, y luego generando nuevas muestras a lo largo de los segmentos de línea que unen a estos vecinos. Este proceso ayuda a aumentar la representación de la clase minoritaria, lo que mejora el rendimiento del modelo. [5]

Aumento de datos para la clasificación de imágenes

Cuando las redes neuronales convolucionales se hicieron más grandes a mediados de la década de 1990, hubo una falta de datos para usar, especialmente considerando que una parte del conjunto de datos general debía reservarse para pruebas posteriores. Se propuso perturbar los datos existentes con transformaciones afines para crear nuevos ejemplos con las mismas etiquetas, [6] que se complementaron con las llamadas distorsiones elásticas en 2003, [7] y la técnica se usó ampliamente a partir de la década de 2010. [8] La ampliación de datos puede mejorar el rendimiento de las redes neuronales convolucionales y actúa como una contramedida contra los ataques de creación de perfiles de redes neuronales convolucionales. [9]

La mejora de los datos se ha vuelto fundamental en la clasificación de imágenes, ya que enriquece la diversidad de los conjuntos de datos de entrenamiento para mejorar la generalización y el rendimiento de los modelos. La evolución de esta práctica ha introducido un amplio espectro de técnicas, incluidas las transformaciones geométricas, los ajustes del espacio de color y la inyección de ruido. [10]

Transformaciones geométricas

Las transformaciones geométricas alteran las propiedades espaciales de las imágenes para simular diferentes perspectivas, orientaciones y escalas. Las técnicas más comunes incluyen:

Transformaciones del espacio de color

Las transformaciones del espacio de color modifican las propiedades de color de las imágenes y abordan las variaciones en la iluminación, la saturación del color y el contraste. Las técnicas incluyen:

Inyección de ruido

La inyección de ruido en las imágenes simula imperfecciones del mundo real y enseña a los modelos a ignorar las variaciones irrelevantes. Las técnicas implican:

Aumento de datos para el procesamiento de señales

Se puede utilizar un bootstrap residual o de bloque para ampliar series de tiempo.

Señales biológicas

La ampliación de datos sintéticos es de suma importancia para la clasificación mediante aprendizaje automático, en particular para los datos biológicos, que tienden a ser muy dimensionales y escasos. Las aplicaciones del control y la ampliación robóticos en sujetos discapacitados y no discapacitados todavía dependen principalmente de análisis específicos del sujeto. La escasez de datos es notable en los problemas de procesamiento de señales, como las señales de electromiografía de la enfermedad de Parkinson , que son difíciles de obtener: Zanini et al. observaron que es posible utilizar una red generativa adversaria (en particular, una DCGAN) para realizar una transferencia de estilo con el fin de generar señales electromiográficas sintéticas que correspondan a las que exhiben los pacientes con enfermedad de Parkinson. [11]

Estos métodos también son importantes en la electroencefalografía (ondas cerebrales). Wang et al. exploraron la idea de utilizar redes neuronales convolucionales profundas para el reconocimiento de emociones basado en EEG; los resultados muestran que el reconocimiento de emociones mejoró cuando se utilizó el aumento de datos. [12]

Un enfoque común consiste en generar señales sintéticas reorganizando los componentes de los datos reales. Lotte [13] propuso un método de "Generación de ensayos artificiales basada en analogía" en el que tres ejemplos de datos proporcionan ejemplos y se forma un ensayo artificial que es a lo que es a . Se aplica una transformación a para hacerlo más similar a , luego se aplica la misma transformación a que genera . Se demostró que este enfoque mejora el rendimiento de un clasificador de análisis discriminante lineal en tres conjuntos de datos diferentes.

Las investigaciones actuales muestran que se puede obtener un gran impacto a partir de técnicas relativamente simples. Por ejemplo, Freer [14] observó que la introducción de ruido en los datos recopilados para formar puntos de datos adicionales mejoraba la capacidad de aprendizaje de varios modelos que, de otro modo, tenían un rendimiento relativamente bajo. Tsinganos et al. [15] estudiaron los enfoques de deformación de magnitud, descomposición de ondículas y modelos EMG de superficie sintéticos (enfoques generativos) para el reconocimiento de gestos de la mano, y encontraron aumentos en el rendimiento de la clasificación de hasta un +16 % cuando se introdujeron datos aumentados durante el entrenamiento. Más recientemente, los estudios de aumento de datos han comenzado a centrarse en el campo del aprendizaje profundo, más específicamente en la capacidad de los modelos generativos para crear datos artificiales que luego se introducen durante el proceso de entrenamiento del modelo de clasificación. En 2018, Luo et al. [16] observaron que los datos útiles de la señal de EEG se podían generar mediante redes generativas antagónicas de Wasserstein condicionales (GAN) que luego se introdujeron en el conjunto de entrenamiento en un marco de aprendizaje de prueba y entrenamiento clásico. Los autores descubrieron que el rendimiento de la clasificación mejoraba cuando se introducían dichas técnicas.

Señales mecánicas

La predicción de señales mecánicas basada en el aumento de datos trae una nueva generación de innovaciones tecnológicas , como el nuevo despacho de energía, el campo de la comunicación 5G y la ingeniería de control robótico. [17] En 2022, Yang et al. [17] integran restricciones, optimización y control en un marco de red profunda basado en el aumento de datos y la poda de datos con correlación de datos espacio-temporales, y mejoran la interpretabilidad, seguridad y controlabilidad del aprendizaje profundo en proyectos industriales reales a través de ecuaciones de programación matemática explícitas y soluciones analíticas.

Véase también

Referencias

  1. ^ Dempster, AP; Laird, NM; Rubin, DB (1977). "Máxima verosimilitud a partir de datos incompletos mediante el algoritmo EM". Revista de la Royal Statistical Society. Serie B (Metodológica) . 39 (1): 1–22. doi :10.1111/j.2517-6161.1977.tb01600.x. Archivado desde el original el 10 de octubre de 2022. Consultado el 28 de agosto de 2024 .
  2. ^ Rubin, Donald (1987). "Comentario: El cálculo de distribuciones posteriores mediante aumento de datos". Revista de la Asociación Estadounidense de Estadística . 82 (398). doi :10.2307/2289460. JSTOR  2289460. Archivado desde el original el 7 de agosto de 2024. Consultado el 28 de agosto de 2024 .
  3. ^ Jackman, Simon (2009). Análisis bayesiano para las ciencias sociales. John Wiley & Sons. pág. 236. ISBN 978-0-470-01154-6.
  4. ^ Shorten, Connor; Khoshgoftaar, Taghi M. (2019). "Una encuesta sobre la ampliación de datos de imágenes para el aprendizaje profundo". Matemáticas y computadoras en simulación . 6 . springer: 60. doi : 10.1186/s40537-019-0197-0 .
  5. ^ Wang, Shujuan; Dai, Yuntao; Shen, Jihong; Xuan, Jingxue (15 de diciembre de 2021). "Investigación sobre expansión y clasificación de datos desequilibrados basada en el algoritmo SMOTE". Scientific Reports . 11 (1): 24039. Bibcode :2021NatSR..1124039W. doi :10.1038/s41598-021-03430-5. ISSN  2045-2322. PMC 8674253 . PMID  34912009. 
  6. ^ Yann Lecun; et al. (1995). Algoritmos de aprendizaje para la clasificación: una comparación sobre el reconocimiento de dígitos escritos a mano (Artículo de conferencia) . World Scientific. págs. 261–276 . Consultado el 14 de mayo de 2023 . {{cite book}}: |website=ignorado ( ayuda )
  7. ^ Simard, PY; Steinkraus, D.; Platt, JC (2003). "Mejores prácticas para redes neuronales convolucionales aplicadas al análisis visual de documentos". Séptima Conferencia Internacional sobre Análisis y Reconocimiento de Documentos, 2003. Actas . Vol. 1. págs. 958–963. doi :10.1109/ICDAR.2003.1227801. ISBN . 0-7695-1960-1.S2CID 4659176  .
  8. ^ Hinton, Geoffrey E.; Srivastava, Nitish; Krizhevsky, Alex; Sutskever, Ilya; Salakhutdinov, Ruslan R. (2012). "Mejora de las redes neuronales mediante la prevención de la coadaptación de los detectores de características". arXiv : 1207.0580 [cs.NE].
  9. ^ Cagli, Eleonora; Dumas, Cécile; Prouff, Emmanuel (2017). "Redes neuronales convolucionales con aumento de datos contra contramedidas basadas en fluctuaciones: creación de perfiles de ataques sin preprocesamiento". En Fischer, Wieland; Homma, Naofumi (eds.). Hardware criptográfico y sistemas integrados – CHES 2017. Apuntes de clase en informática. Vol. 10529. Cham: Springer International Publishing. págs. 45–68. doi :10.1007/978-3-319-66787-4_3. ISBN 978-3-319-66787-4. Número de identificación del sujeto  54088207.
  10. ^ Shorten, Connor; Khoshgoftaar, Taghi M. (6 de julio de 2019). "Una encuesta sobre aumento de datos de imágenes para aprendizaje profundo". Journal of Big Data . 6 (1): 60. doi : 10.1186/s40537-019-0197-0 . ISSN  2196-1115.
  11. ^ Anicet Zanini, Rafael; Luna Colombini, Esther (2020). "Aumento y simulación de datos EMG de la enfermedad de Parkinson con DCGAN y transferencia de estilo". Sensores . 20 (9): 2605. Bibcode :2020Senso..20.2605A. doi : 10.3390/s20092605 . ISSN  1424-8220. PMC 7248755 . PMID  32375217. 
  12. ^ Wang, Fang; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan (2018). "Aumento de datos para el reconocimiento de emociones basado en EEG con redes neuronales convolucionales profundas". Modelado multimedia . Apuntes de clase en informática. Vol. 10705. págs. 82–93. doi :10.1007/978-3-319-73600-6_8. ISBN 978-3-319-73599-3. ISSN  0302-9743.
  13. ^ Lotte, Fabien (2015). "Enfoques de procesamiento de señales para minimizar o suprimir el tiempo de calibración en interfaces cerebro-computadora basadas en actividad oscilatoria" (PDF) . Actas del IEEE . 103 (6): 871–890. doi :10.1109/JPROC.2015.2404941. ISSN  0018-9219. S2CID  22472204. Archivado (PDF) desde el original el 2023-04-03 . Consultado el 2022-11-05 .
  14. ^ Freer, Daniel; Yang, Guang-Zhong (2020). "Aumento de datos para la clasificación de imágenes motoras a ritmo propio con C-LSTM". Revista de ingeniería neuronal . 17 (1): 016041. Bibcode :2020JNEng..17a6041F. doi :10.1088/1741-2552/ab57c0. hdl : 10044/1/75376 . ISSN  1741-2552. PMID  31726440. S2CID  208034533.
  15. ^ Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, Jan; Jansen, Bart; Skodras, Athanassios (2020). "Aumento de datos de la electromiografía de superficie para el reconocimiento de gestos de la mano". Sensores . 20 (17): 4892. Bibcode :2020Senso..20.4892T. doi : 10.3390/s20174892 . ISSN  1424-8220. PMC 7506981 . PMID  32872508. 
  16. ^ Luo, Yun; Lu, Bao-Liang (2018). "Aumento de datos de EEG para el reconocimiento de emociones mediante una GAN de Wasserstein condicional". 2018 40.ª Conferencia internacional anual de la IEEE Engineering in Medicine and Biology Society (EMBC) . Vol. 2018. págs. 2535–2538. doi :10.1109/EMBC.2018.8512865. ISBN . 978-1-5386-3646-6. Número de identificación personal  30440924. Número de identificación personal  53105445.
  17. ^ ab Yang, Yang (2022). "Pronóstico de la velocidad del viento con poda y aumento de redes de correlación: un método de aprendizaje profundo de dos fases". Energía renovable . 198 (1): 267–282. arXiv : 2306.01986 . doi :10.1016/j.renene.2022.07.125. ISSN  0960-1481. S2CID  251511199.