stringtranslate.com

Aprendizaje activo (aprendizaje automático)

El aprendizaje activo es un caso especial de aprendizaje automático en el que un algoritmo de aprendizaje puede consultar de forma interactiva a un usuario humano (o alguna otra fuente de información) para etiquetar nuevos puntos de datos con los resultados deseados. El usuario humano debe poseer conocimientos/experiencia en el dominio del problema, incluida la capacidad de consultar/investigar fuentes autorizadas cuando sea necesario. [1] [2] [3] En la literatura estadística, a veces también se lo denomina diseño experimental óptimo . [4] La fuente de información también se denomina profesor u oráculo .

Existen situaciones en las que los datos no etiquetados son abundantes pero el etiquetado manual es costoso. En tal escenario, los algoritmos de aprendizaje pueden consultar activamente al usuario/profesor para obtener etiquetas. Este tipo de aprendizaje supervisado iterativo se denomina aprendizaje activo. Dado que el alumno elige los ejemplos, la cantidad de ejemplos para aprender un concepto a menudo puede ser mucho menor que la cantidad requerida en el aprendizaje supervisado normal. Con este enfoque, existe el riesgo de que el algoritmo se vea abrumado por ejemplos poco informativos. Los desarrollos recientes están dedicados al aprendizaje activo de múltiples etiquetas, [5] aprendizaje activo híbrido [6] y aprendizaje activo en un contexto de una sola pasada (en línea), [7] combinando conceptos del campo del aprendizaje automático (por ejemplo, conflicto e ignorancia) con políticas de aprendizaje adaptativo e incremental en el campo del aprendizaje automático en línea . El uso del aprendizaje activo permite un desarrollo más rápido de un algoritmo de aprendizaje automático, cuando las actualizaciones comparativas requerirían una computadora cuántica o supercomputadora. [8]

Los proyectos de aprendizaje activo a gran escala pueden beneficiarse de marcos de colaboración colectiva como Amazon Mechanical Turk , que incluyen a muchos humanos en el ciclo de aprendizaje activo .

Definiciones

Sea T el conjunto total de todos los datos considerados. Por ejemplo, en un problema de ingeniería de proteínas, T incluiría todas las proteínas que se sabe que tienen una determinada actividad interesante y todas las proteínas adicionales que se deseen analizar para determinar esa actividad.

Durante cada iteración, i , T se divide en tres subconjuntos

  1. :Puntos de datos donde se conoce la etiqueta .
  2. :Puntos de datos donde la etiqueta es desconocida .
  3. :Un subconjunto de T U,i que se elige para ser etiquetado.

La mayor parte de la investigación actual en aprendizaje activo implica el mejor método para elegir los puntos de datos para T C,i .

Escenarios

Estrategias de consulta

Los algoritmos para determinar qué puntos de datos deben etiquetarse se pueden organizar en varias categorías diferentes, según su propósito: [1]

Se ha estudiado una amplia variedad de algoritmos que caen en estas categorías. [1] [4] Si bien las estrategias tradicionales de AL pueden lograr un rendimiento notable, a menudo es difícil predecir de antemano qué estrategia es la más adecuada en una situación particular. En los últimos años, los algoritmos de metaaprendizaje han ganado popularidad. Algunos de ellos se han propuesto para abordar el problema del aprendizaje de estrategias de AL en lugar de depender de estrategias diseñadas manualmente. Un punto de referencia que compare los "enfoques de metaaprendizaje para el aprendizaje activo" con el "aprendizaje activo tradicional basado en heurísticas" puede brindar intuiciones si el "aprendizaje del aprendizaje activo" está en una encrucijada [18].

Hiperplano marginal mínimo

Algunos algoritmos de aprendizaje activo se basan en máquinas de vectores de soporte (SVM) y aprovechan la estructura de las SVM para determinar qué puntos de datos se deben etiquetar. Estos métodos suelen calcular el margen , W , de cada dato no etiquetado en T U,i y tratan a W como una distancia n -dimensional desde ese dato hasta el hiperplano de separación.

Los métodos de hiperplano marginal mínimo suponen que los datos con el W más pequeño son aquellos sobre los que el SVM tiene mayor incertidumbre y, por lo tanto, se deben colocar en T C,i para etiquetarlos. Otros métodos similares, como el hiperplano marginal máximo, eligen los datos con el W más grande. Los métodos de compensación eligen una combinación de los W más pequeños y más grandes .

Véase también

Literatura

Referencias

  1. ^ abc Settles, Burr (2010). "Active Learning Literature Survey" (PDF) . Informe técnico de ciencias de la computación 1648. Universidad de Wisconsin-Madison . Consultado el 18 de noviembre de 2014 .
  2. ^ Rubens, Neil; Elahi, Mehdi; Sugiyama, Masashi; Kaplan, Dain (2016). "Aprendizaje activo en sistemas de recomendación". En Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación (PDF) (2.ª ed.). Springer US. doi :10.1007/978-1-4899-7637-6. hdl :11311/1006123. ISBN 978-1-4899-7637-6.S2CID11569603  .​
  3. ^ Das, Shubhomoy; Wong, Weng-Keen; Dietterich, Thomas; Fern, Alan; Emmott, Andrew (2016). "Incorporación de la retroalimentación de expertos en el descubrimiento activo de anomalías". En Bonchi, Francesco; Domingo-Ferrer, Josep; Baeza-Yates, Ricardo; Zhou, Zhi-Hua; Wu, Xindong (eds.). 16.ª Conferencia Internacional sobre Minería de Datos del IEEE. IEEE. págs. 853–858. doi :10.1109/ICDM.2016.0102. ISBN . 978-1-5090-5473-2.S2CID15285595  .​
  4. ^ ab Olsson, Fredrik (abril de 2009). "Un estudio de la literatura sobre aprendizaje automático activo en el contexto del procesamiento del lenguaje natural". Informe técnico SICS T2009:06.
  5. ^ Yang, Bishan; Sun, Jian-Tao; Wang, Tengjiao; Chen, Zheng (2009). "Aprendizaje activo multietiqueta eficaz para la clasificación de textos" (PDF) . Actas de la 15.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos - KDD '09 . pág. 917. CiteSeerX 10.1.1.546.9358 . doi :10.1145/1557019.1557119. ISBN.  978-1-60558-495-9.S2CID 1979173  .
  6. ^ Lughofer, Edwin (febrero de 2012). "Aprendizaje activo híbrido para reducir el esfuerzo de anotación de los operadores en sistemas de clasificación". Reconocimiento de patrones . 45 (2): 884–896. Bibcode :2012PatRe..45..884L. doi :10.1016/j.patcog.2011.08.009.
  7. ^ Lughofer, Edwin (2012). "Aprendizaje activo de una sola pasada con conflicto e ignorancia". Sistemas en evolución . 3 (4): 251–271. doi :10.1007/s12530-012-9060-7. S2CID  43844282.
  8. ^ Novikov, Ivan (2021). "El paquete MLIP: potenciales tensoriales de momento con MPI y aprendizaje activo". Aprendizaje automático: ciencia y tecnología . 2 (2): 3, 4. arXiv : 2007.08555 . doi : 10.1088/2632-2153/abc9fe .
  9. ^ DataRobot. "Aprendizaje automático de aprendizaje activo: qué es y cómo funciona". Blog de DataRobot . DataRobot Inc. Consultado el 30 de enero de 2024 .
  10. ^ Wang, Liantao; Hu, Xuelei; Yuan, Bo; Lu, Jianfeng (5 de enero de 2015). "Aprendizaje activo mediante síntesis de consultas y búsqueda del vecino más cercano" (PDF) . Neurocomputing . 147 : 426–434. doi :10.1016/j.neucom.2014.06.042. S2CID  3027214.
  11. ^ Bouneffouf, Djallel; Laroche, Romain; Urvoy, Tanguy; Féraud, Raphael; Allesiardo, Robin (2014). "Bandido contextual para el aprendizaje activo: Thompson activo". En Loo, CK; Yap, KS; Wong, KW; Teoh, A.; Huang, K. (eds.). Procesamiento de información neuronal (PDF) . Apuntes de clase en informática. Vol. 8834. págs. 405–412. doi :10.1007/978-3-319-12637-1_51. ISBN 978-3-319-12636-4. S2CID  1701357. Identificación de HAL: hal-01069802.
  12. ^ Bouneffouf, Djallel (8 de enero de 2016). "Exponentiated Gradient Exploration for Active Learning". Computadoras . 5 (1): 1. arXiv : 1408.2196 . doi : 10.3390/computers5010001 . S2CID  14313852.
  13. ^ abcd Faria, Bruno; Perdigão, Dylan; Brás, Joana; Macedo, Luis (2022). "El papel conjunto del tamaño del lote y la estrategia de consulta en la predicción basada en el aprendizaje activo: un estudio de caso en el dominio del ataque cardíaco". En Goreti Marreiros; Bruno Martins; Ana Paiva; Bernardete Ribeiro; Alberto Sardinha (eds.). Progreso en inteligencia artificial . 21.ª Conferencia EPIA sobre Inteligencia Artificial, EPIA 2022, Lisboa, Portugal, 31 de agosto al 2 de septiembre de 2022. Lecture Notes in Computer Science. Vol. 13566. págs. 464–475. doi :10.1007/978-3-031-16474-3_38. ISBN 978-3-031-16473-6.
  14. ^ "shubhomoydas/ad_examples". GitHub . Consultado el 4 de diciembre de 2018 .
  15. ^ Makili, Lázaro Emílio; Sánchez, Jesús A. Vega; Dormido-Canto, Sebastián (2012-10-01). "Aprendizaje activo mediante predictores conformes: aplicación a la clasificación de imágenes". Fusion Science and Technology . 62 (2): 347–355. Bibcode :2012FuST...62..347M. doi :10.13182/FST12-A14626. ISSN  1536-1055. S2CID  115384000.
  16. ^ Zhao, Shuyang; Heittola, Toni; Virtanen, Tuomas (2020). "Aprendizaje activo para la detección de eventos sonoros". Transacciones IEEE/ACM sobre procesamiento de audio, habla y lenguaje . arXiv : 2002.05033 .
  17. ^ Bernard, Jürgen; Zeppelzauer, Matthias; Lehmann, Markus; Müller, Martin; Sedlmair, Michael (junio de 2018). "Hacia algoritmos de aprendizaje activo centrados en el usuario". Computer Graphics Forum . 37 (3): 121–132. doi :10.1111/cgf.13406. ISSN  0167-7055. S2CID  51875861.
  18. ^ Desreumaux, Louis; Lemaire, Vincent (2020). ¿Aprender el aprendizaje activo en la encrucijada? Evaluación y debate . Actas del taller sobre aprendizaje adaptativo interactivo celebrado conjuntamente con la Conferencia europea sobre aprendizaje automático y principios y práctica del descubrimiento de conocimientos en bases de datos ({ECML} {PKDD} 2020), Gante, Bélgica, 2020. S2CID  221794570.