Técnica en aprendizaje automático
El aprendizaje curricular es una técnica de aprendizaje automático en la que se entrena un modelo con ejemplos de dificultad creciente, donde la definición de "dificultad" puede proporcionarse externamente o descubrirse automáticamente como parte del proceso de entrenamiento. Esto tiene como objetivo lograr un buen desempeño más rápidamente o converger a un mejor óptimo local si no se encuentra el óptimo global . [1] [2]
Acercarse
En términos generales, el aprendizaje curricular es la técnica de aumentar sucesivamente la dificultad de los ejemplos en el conjunto de entrenamiento que se presenta a un modelo a lo largo de múltiples iteraciones de entrenamiento. Esto puede producir mejores resultados que exponer el modelo al conjunto de entrenamiento completo inmediatamente en algunas circunstancias; más típicamente, cuando el modelo es capaz de aprender principios generales a partir de ejemplos más fáciles y luego incorporar gradualmente información más compleja y matizada a medida que se introducen ejemplos más difíciles, como casos extremos . Se ha demostrado que esto funciona en muchos dominios, muy probablemente como una forma de regularización . [3]
Existen varias variaciones importantes en cómo se aplica la técnica:
- Se debe definir un concepto de "dificultad". Este puede provenir de una anotación humana [4] [5] o de una heurística externa ; por ejemplo, en el modelado del lenguaje , las oraciones más cortas pueden clasificarse como más fáciles que las más largas. [6] Otro enfoque es utilizar el rendimiento de otro modelo, y clasificar como más fáciles los ejemplos predichos con precisión por ese modelo (lo que proporciona una conexión con el refuerzo ).
- La dificultad puede aumentarse de forma constante [7] o en épocas distintas [8], y en un cronograma determinista o de acuerdo con una distribución de probabilidad . Esto también puede moderarse mediante un requisito de diversidad en cada etapa, en casos en los que es probable que los ejemplos más fáciles sean desproporcionadamente similares entre sí. [9]
- Las aplicaciones también deben decidir el cronograma para aumentar la dificultad. Los enfoques simples pueden utilizar un cronograma fijo, como entrenar con ejemplos fáciles durante la mitad de las iteraciones disponibles y luego todos los ejemplos durante la segunda mitad. [3] Otros enfoques utilizan el aprendizaje a su propio ritmo para aumentar la dificultad en proporción al desempeño del modelo en el conjunto actual. [10]
Dado que el aprendizaje curricular solo se refiere a la selección y ordenación de los datos de entrenamiento, se puede combinar con muchas otras técnicas de aprendizaje automático. El éxito del método supone que un modelo entrenado para una versión más fácil del problema puede generalizarse a versiones más difíciles, por lo que puede verse como una forma de aprendizaje por transferencia . Algunos autores también consideran que el aprendizaje curricular incluye otras formas de complejidad progresivamente creciente, como el aumento del número de parámetros del modelo. [11] Con frecuencia se combina con el aprendizaje de refuerzo , como aprender primero una versión simplificada de un juego. [12]
Algunos dominios han demostrado tener éxito con el aprendizaje anticurricular : primero se entrena con los ejemplos más difíciles. Un ejemplo es el método ACCAN para el reconocimiento de voz , que primero se entrena con los ejemplos con la menor relación señal-ruido . [13]
Historia
El término "aprendizaje curricular" fue introducido por Yoshua Bengio et al en 2009, [14] con referencia a la técnica psicológica de modelado en animales y educación estructurada para humanos: comenzar con los conceptos más simples y luego construir sobre ellos. Los autores también señalan que la aplicación de esta técnica en el aprendizaje automático tiene sus raíces en el estudio temprano de las redes neuronales como el artículo de Jeffrey Elman de 1993 Aprendizaje y desarrollo en redes neuronales: la importancia de comenzar de a poco . [15] Bengio et al mostraron buenos resultados para problemas en la clasificación de imágenes , como la identificación de formas geométricas con formas progresivamente más complejas, y el modelado del lenguaje , como el entrenamiento con un vocabulario que se expande gradualmente . Concluyen que, para las estrategias curriculares, "su efecto beneficioso es más pronunciado en el conjunto de prueba", lo que sugiere una buena generalización.
Desde entonces, la técnica se ha aplicado a muchos otros ámbitos:
Referencias
- ^ Guo, Sheng; Huang, Weilin; Zhang, Haozhi; Zhuang, Chenfan; Dong, Dengke; Scott, Mateo R.; Huang, Dinglong (2018). "CurriculumNet: aprendizaje débilmente supervisado a partir de imágenes web a gran escala". arXiv : 1808.01097 [cs.CV].
- ^ "Aprendizaje curricular basado en competencias para la traducción automática neuronal" . Consultado el 29 de marzo de 2024 .
- ^ ab Bengio, Yoshua; Louradour, Jérôme; Collobert, Ronan; Weston, Jason (2009). "Aprendizaje curricular". Actas de la 26.ª Conferencia internacional anual sobre aprendizaje automático . págs. 41–48. doi :10.1145/1553374.1553380. ISBN 978-1-60558-516-1. Recuperado el 24 de marzo de 2024 .
- ^ "Aprendizaje curricular de tareas múltiples" . Consultado el 29 de marzo de 2024 .
- ^ Ionescu, Radu Tudor; Alexe, Bogdan; Leordeanu, Marius; Popescu, Marius; Papadopoulos, Dim P.; Ferrari, Vittorio (2016). "¿Qué tan difícil puede ser? Estimación de la dificultad de la búsqueda visual en una imagen". Conferencia IEEE de 2016 sobre visión artificial y reconocimiento de patrones (CVPR) (PDF) . págs. 2157–2166. doi :10.1109/CVPR.2016.237. ISBN. 978-1-4673-8851-1. Recuperado el 29 de marzo de 2024 .
- ^ "Baby Steps: How "Less is More" in unsupervised dependency parsing" (PDF) . Consultado el 29 de marzo de 2024 .
- ^ "Aprendizaje a ritmo propio para modelos de variables latentes". 6 de diciembre de 2010. pp. 1189–1197 . Consultado el 29 de marzo de 2024 .
- ^ Tang, Ye; Yang, Yu-Bin; Gao, Yang (2012). "Aprendizaje de diccionarios a su propio ritmo para la clasificación de imágenes". Actas de la 20.ª conferencia internacional de la ACM sobre multimedia . págs. 833–836. doi :10.1145/2393347.2396324. ISBN . 978-1-4503-1089-5. Recuperado el 29 de marzo de 2024 .
- ^ "Aprendizaje curricular con diversidad para tareas supervisadas de visión artificial" . Consultado el 29 de marzo de 2024 .
- ^ "Aprendizaje curricular a su propio ritmo" . Consultado el 29 de marzo de 2024 .
- ^ Soviany, Petru; Radu Tudor Ionescu; Rota, Paolo; Sebe, Nicu (2021). "Aprendizaje curricular: una encuesta". arXiv : 2101.10382 [cs.LG].
- ^ Narvekar, Sanmit; Peng, Bei; Leonetti, Matteo; Sinapov, Jivko; Taylor, Matthew E.; Stone, Peter (enero de 2020). "Aprendizaje curricular para dominios de aprendizaje por refuerzo: un marco y una encuesta". The Journal of Machine Learning Research . 21 (1): 181:7382–181:7431. arXiv : 2003.04960 . Consultado el 29 de marzo de 2024 .
- ^ "Un método de aprendizaje curricular para mejorar la robustez del ruido en el reconocimiento automático de voz" . Consultado el 29 de marzo de 2024 .
- ^ Bengio, Yoshua; Louradour, Jérôme; Collobert, Ronan; Weston, Jason (2009). "Curriculum Learning". Actas de la 26.ª Conferencia Internacional Anual sobre Aprendizaje Automático . págs. 41–48. doi :10.1145/1553374.1553380. ISBN . 978-1-60558-516-1. Recuperado el 24 de marzo de 2024 .
- ^ Elman, JL (1993). "Aprendizaje y desarrollo en redes neuronales: la importancia de empezar desde abajo". Cognición . 48 (1): 71–99. doi :10.1016/0010-0277(93)90058-4. PMID 8403835 . Consultado el 29 de marzo de 2024 .
- ^ "Aprendizaje del currículo con optimización bayesiana para el aprendizaje de la representación de palabras en tareas específicas" . Consultado el 29 de marzo de 2024 .
- ^ Gong, Yantao; Liu, Cao; Yuan, Jiazhen; Yang, Fan; Cai, Xunliang; Wan, Guanglu; Chen, Jiansong; Niu, Ruiyao; Wang, Houfeng (2021). "Aprendizaje curricular dinámico basado en la densidad para la detección de intenciones". Actas de la 30ª Conferencia Internacional ACM sobre Gestión de la Información y el Conocimiento . págs. 3034–3037. arXiv : 2108.10674 . doi :10.1145/3459637.3482082. ISBN 978-1-4503-8446-9. Recuperado el 29 de marzo de 2024 .
- ^ "Visualización y comprensión del aprendizaje curricular para redes de memoria a corto y largo plazo" . Consultado el 29 de marzo de 2024 .
- ^ "Una exploración empírica del aprendizaje curricular para la traducción automática neuronal" . Consultado el 29 de marzo de 2024 .
- ^ "Optimización curricular basada en aprendizaje de refuerzo para traducción automática neuronal" . Consultado el 29 de marzo de 2024 .
- ^ "Un método de aprendizaje curricular para mejorar la robustez del ruido en el reconocimiento automático del habla" . Consultado el 29 de marzo de 2024 .
- ^ Huang, Yuge; Wang, Yuhan; Tai, Ying; Liu, Xiaoming; Shen, Pengcheng; Li, Shaoxin; Li, Jilin; Huang, Feiyue (2020). "CurricularFace: pérdida de aprendizaje del plan de estudios adaptativo para el reconocimiento facial profundo". Conferencia IEEE/CVF 2020 sobre visión por computadora y reconocimiento de patrones (CVPR) . págs. 5900–5909. arXiv : 2004.00288 . doi :10.1109/CVPR42600.2020.00594. ISBN 978-1-7281-7168-5. Recuperado el 29 de marzo de 2024 .
- ^ "Aprendizaje a ritmo propio del plan de estudios para la detección de objetos en distintos dominios" . Consultado el 29 de marzo de 2024 .
- ^ "Generación automática de gráficos curriculares para agentes de aprendizaje por refuerzo". 4 de febrero de 2017. pp. 2590–2596 . Consultado el 29 de marzo de 2024 .
- ^ Gong, Chen; Yang, Jian; Tao, Dacheng (2019). "Aprendizaje curricular multimodal sobre gráficos". ACM Transactions on Intelligent Systems and Technology . 10 (4): 1–25. doi :10.1145/3322122 . Consultado el 29 de marzo de 2024 .
- ^ Qu, Meng; Tang, Jian; Han, Jiawei (2018). Aprendizaje curricular para la integración de redes estelares heterogéneas mediante aprendizaje de refuerzo profundo. págs. 468–476. doi :10.1145/3159652.3159711. hdl :2142/101634. ISBN 978-1-4503-5581-0. Recuperado el 29 de marzo de 2024 .
- ^ Aprendizaje autodirigido de factorización de matrices. 25 de enero de 2015. pp. 3196–3202. ISBN 978-0-262-51129-2. Recuperado el 29 de marzo de 2024 .
Lectura adicional
- Aprendizaje curricular: una encuesta
- Una encuesta sobre el aprendizaje curricular
- Aprendizaje curricular para dominios de aprendizaje de refuerzo: marco y estudio
- Aprendizaje curricular en IEEE Xplore