stringtranslate.com

Adaptación del dominio

Distinción entre la configuración habitual de aprendizaje automático y el aprendizaje por transferencia , y posicionamiento de la adaptación del dominio

La adaptación de dominios [1] [2] [3] es un campo asociado con el aprendizaje automático y el aprendizaje por transferencia . Este escenario surge cuando nuestro objetivo es aprender un modelo a partir de una distribución de datos de origen y aplicar ese modelo en una distribución de datos de destino diferente (pero relacionada). Por ejemplo, una de las tareas del problema común de filtrado de spam consiste en adaptar un modelo de un usuario (la distribución de origen) a un nuevo usuario que recibe correos electrónicos significativamente diferentes (la distribución de destino). La adaptación de dominios también ha demostrado ser beneficiosa para el aprendizaje de fuentes no relacionadas. [4] Nótese que, cuando hay más de una distribución de origen disponible, el problema se conoce como adaptación de dominios de múltiples fuentes. [5]

Descripción general

La adaptación de dominio es la capacidad de aplicar un algoritmo entrenado en uno o más "dominios de origen" a un "dominio de destino" diferente (pero relacionado). La adaptación de dominio es una subcategoría del aprendizaje por transferencia. En la adaptación de dominio, los dominios de origen y destino tienen todos el mismo espacio de características (pero diferentes distribuciones); por el contrario, el aprendizaje por transferencia incluye casos en los que el espacio de características del dominio de destino es diferente del espacio o espacios de características de origen. [6]

Cambio de dominio

Un cambio de dominio [ 7] o cambio de distribución [ 8] es un cambio en la distribución de datos entre el conjunto de datos de entrenamiento de un algoritmo y un conjunto de datos que encuentra cuando se implementa. Estos cambios de dominio son comunes en aplicaciones prácticas de inteligencia artificial. Los algoritmos de aprendizaje automático convencionales a menudo se adaptan mal a los cambios de dominio. La comunidad moderna de aprendizaje automático tiene muchas estrategias diferentes para intentar lograr una mejor adaptación al dominio. [7]

Ejemplos

Otras aplicaciones incluyen la detección de localización Wi-Fi y muchos aspectos de la visión por computadora . [6]

Formalización

Sea el espacio de entrada (o espacio de descripción) y sea el espacio de salida (o espacio de etiquetas). El objetivo de un algoritmo de aprendizaje automático es aprender un modelo matemático (una hipótesis) capaz de adjuntar una etiqueta de a un ejemplo de . Este modelo se aprende a partir de una muestra de aprendizaje .

Generalmente, en el aprendizaje supervisado (sin adaptación de dominio), suponemos que los ejemplos se extraen iid de una distribución de soporte (desconocida y fija). El objetivo es entonces aprender (de ) de manera que se cometa el menor error posible al etiquetar nuevos ejemplos provenientes de la distribución .

La principal diferencia entre el aprendizaje supervisado y la adaptación de dominio es que en esta última situación estudiamos dos distribuciones diferentes (pero relacionadas) y en [ cita requerida ] . La tarea de adaptación de dominio consiste entonces en la transferencia de conocimiento del dominio de origen al de destino . El objetivo es entonces aprender (a partir de muestras etiquetadas o no etiquetadas que provienen de los dos dominios) de manera tal que se cometan los menores errores posibles en el dominio de destino [ cita requerida ] .

La cuestión principal es la siguiente: si un modelo se aprende de un dominio de origen, ¿cuál es su capacidad para etiquetar correctamente los datos que provienen del dominio de destino?

Los diferentes tipos de adaptación de dominio

Existen varios contextos de adaptación de dominios, que difieren en la información considerada para la tarea objetivo.

  1. Adaptación de dominio no supervisada : la muestra de aprendizaje contiene un conjunto de ejemplos fuente etiquetados, un conjunto de ejemplos fuente no etiquetados y un conjunto de ejemplos destino no etiquetados.
  2. La adaptación de dominio semisupervisada : en esta situación, también consideramos un conjunto "pequeño" de ejemplos de objetivos etiquetados.
  3. La adaptación del dominio supervisada : todos los ejemplos considerados deben estar etiquetados.

Cuatro principios algorítmicos

Algoritmos de reponderación

El objetivo es volver a ponderar la muestra etiquetada de origen de modo que "se parezca" a la muestra de destino (en términos de la medida de error considerada). [14] [15]

Algoritmos iterativos

Un método de adaptación consiste en "etiquetar automáticamente" iterativamente los ejemplos objetivo. [16] El principio es simple:

  1. Se aprende un modelo a partir de los ejemplos etiquetados;
  2. etiqueta automáticamente algunos ejemplos objetivo;
  3. Se aprende un nuevo modelo a partir de los nuevos ejemplos etiquetados.

Tenga en cuenta que existen otros enfoques iterativos, pero generalmente necesitan ejemplos etiquetados como objetivo. [17] [18]

Búsqueda de un espacio de representación común

El objetivo es encontrar o construir un espacio de representación común para los dos dominios. El objetivo es obtener un espacio en el que los dominios estén cerca uno del otro y al mismo tiempo mantener un buen desempeño en la tarea de etiquetado de fuentes. Esto se puede lograr mediante el uso de técnicas de aprendizaje automático adversarial donde se fomenta que las representaciones de características de muestras en diferentes dominios sean indistinguibles. [19] [20]

Modelo bayesiano jerárquico

El objetivo es construir un modelo jerárquico bayesiano , que es esencialmente un modelo de factorización para conteos , para derivar representaciones latentes dependientes del dominio que permitan factores latentes compartidos globalmente y específicos del dominio. [4]

Software

En las últimas décadas se han implementado varias compilaciones de algoritmos de adaptación de dominio y aprendizaje por transferencia:

Referencias

  1. ^ Redko, Ievgen; Morvant, Emilie; Habrard, Amaury; Sebban, Marc; Bennani, Younès (2019). Avances en la teoría de la adaptación de dominios. Prensa ISTE - Elsevier. pag. 187.ISBN​ 9781785482366.
  2. ^ Bridle, John S.; Cox, Stephen J (1990). "RecNorm: normalización y clasificación simultáneas aplicadas al reconocimiento de voz" (PDF) . Conferencia sobre sistemas de procesamiento de información neuronal (NIPS) . págs. 234–240.
  3. ^ Ben-David, Shai; Blitzer, John; Crammer, Koby; Kulesza, Alex; Pereira, Fernando; Wortman Vaughan, Jennifer (2010). "Una teoría del aprendizaje desde diferentes dominios" (PDF) . Aprendizaje automático . 79 (1–2): 151–175. doi : 10.1007/s10994-009-5152-4 .
  4. ^ ab Hajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalayghareh, Alireza; Zhou, Mingyuan; Qian, Xiaoning (2018). "Aprendizaje multidominio bayesiano para el descubrimiento de subtipos de cáncer a partir de datos de recuento de secuenciación de próxima generación". arXiv : 1810.09433 [stat.ML].
  5. ^ Crammer, Koby; Kearns, Michael; Wortman, Jeniifer (2008). "Aprendizaje a partir de múltiples fuentes" (PDF) . Revista de investigación en aprendizaje automático . 9 : 1757–1774.
  6. ^ ab Sun, Shiliang; Shi, Honglei; Wu, Yuanbin (julio de 2015). "Un estudio de adaptación de dominios de múltiples fuentes". Information Fusion . 24 : 84–92. doi :10.1016/j.inffus.2014.12.003. S2CID  18385140.
  7. ^ ab Sun, Baochen, Jiashi Feng y Kate Saenko. "El regreso de una adaptación de dominios frustrantemente fácil". En la 30.ª Conferencia AAAI sobre Inteligencia Artificial, 2016.
  8. ^ Amodei, Darío, Chris Olah, Jacob Steinhardt, Paul Christiano, John Schulman y Dan Mané. "Problemas concretos en la seguridad de la IA". Preimpresión de arXiv arXiv:1606.06565 (2016).
  9. ^ Daumé III, Hal. "Adaptación de dominios frustrantemente fácil". Preimpresión arXiv arXiv:0907.1815 (2009).
  10. ^ Ben-David, Shai, John Blitzer, Koby Crammer y Fernando Pereira. "Análisis de representaciones para la adaptación de dominios". En Advances in neural information processing systems, págs. 137-144. 2007.
  11. ^ Hu, Yipeng; Jacob, Joseph; Parker, Geoffrey JM; Hawkes, David J.; Hurst, John R.; Stoyanov, Danail (junio de 2020). "Los desafíos de implementar modelos de inteligencia artificial en una pandemia de rápida evolución". Nature Machine Intelligence . 2 (6): 298–300. arXiv : 2005.12137 . doi : 10.1038/s42256-020-0185-2 . ISSN  2522-5839.
  12. ^ Matthews, Dylan (26 de marzo de 2019). "El desastre de la IA no se parecerá a Terminator. Será más espeluznante". Vox . Consultado el 21 de junio de 2020 .
  13. ^ "Nuestro extraño comportamiento durante la pandemia está alterando los modelos de IA". MIT Technology Review . 11 de mayo de 2020 . Consultado el 21 de junio de 2020 .
  14. ^ Huang, Jiayuan; Smola, Alexander J.; Gretton, Arthur; Borgwardt, Karster M.; Schölkopf, Bernhard (2006). "Corrección del sesgo de selección de muestra mediante datos no etiquetados" (PDF) . Conferencia sobre sistemas de procesamiento de información neuronal (NIPS) . págs. 601–608.
  15. ^ Shimodaira, Hidetoshi (2000). "Mejora de la inferencia predictiva en condiciones de cambio de covariable ponderando la función de verosimilitud logarítmica". Journal of Statistical Planning and Inference . 90 (2): 227–244. doi :10.1016/S0378-3758(00)00115-4. S2CID  9238949.
  16. ^ Gallego, AJ; Calvo-Zaragoza, J.; Fisher, RB (2020). "Entrenamiento incremental no supervisado de dominios adversarios de redes neuronales" (PDF) . Transacciones IEEE sobre redes neuronales y sistemas de aprendizaje . PP (11): 4864–4878. doi :10.1109/TNNLS.2020.3025954. hdl : 20.500.11820/72ba0443-8a7d-4cdd-8212-38682d4f0730 . PMID  33027004. S2CID  210164756.
  17. ^ Arief-Ang, IB; Salim, FD; Hamilton, M. (8 de noviembre de 2017). DA-HOC: adaptación de dominio semisupervisada para la predicción de ocupación de habitaciones utilizando datos de sensores de CO2. 4.ª Conferencia internacional de la ACM sobre sistemas para entornos construidos energéticamente eficientes (BuildSys). Delft, Países Bajos. págs. 1–10. doi :10.1145/3137133.3137146. ISBN . 978-1-4503-5544-5.
  18. ^ Arief-Ang, IB; Hamilton, M.; Salim, FD (1 de diciembre de 2018). "Una predicción escalable de la ocupación de una sala con descomposición de series temporales transferibles de datos de sensores de CO2". ACM Transactions on Sensor Networks . 14 (3–4): 21:1–21:28. doi :10.1145/3217214. S2CID  54066723.
  19. ^ Ganin, Yaroslav; Ustinova, Evgeniya; Ajakan, Hana; Germain, Pascal; Larochelle, Hugo; Laviolette, François; Marchand, Mario; Lempitsky, Victor (2016). "Entrenamiento de redes neuronales en dominios adversarios" (PDF) . Revista de investigación en aprendizaje automático . 17 : 1–35.
  20. ^ Hajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalayghareh, Alireza; Zhou, Mingyuan; Qian, Xiaoning (2017). "Abordaje del cambio de apariencia en robótica al aire libre con adaptación de dominio adversario". arXiv : 1703.01461 [cs.RO].
  21. ^ de Mathelin, Antoine y Deheeger, François y Richard, Guillaume y Mougeot, Mathilde y Vayatis, Nicolas (2020) "ADAPT: Impresionante caja de herramientas de Python para la adaptación de dominios"
  22. ^ Mingsheng Long Junguang Jiang, Bo Fu. (2020) "Biblioteca de transferencia-aprendizaje"
  23. ^ Ke Yan. (2016) "Caja de herramientas de adaptación de dominio"