Massive Online Analysis ( MOA ) es un proyecto de software libre y de código abierto específico para la minería de flujo de datos con deriva de conceptos . Está escrito en Java y desarrollado en la Universidad de Waikato , Nueva Zelanda . [2]
Descripción
MOA es un software de marco de código abierto que permite crear y ejecutar experimentos de aprendizaje automático o minería de datos en flujos de datos en evolución. Incluye un conjunto de aprendices y generadores de flujos que se pueden utilizar desde la interfaz gráfica de usuario (GUI), la línea de comandos y la API de Java. MOA contiene varias colecciones de algoritmos de aprendizaje automático:
- Clasificación
- Clasificadores bayesianos
- Bayes ingenuo
- Multinomio bayesiano ingenuo
- Clasificadores de árboles de decisión
- Tocón de decisión
- Árbol de Hoeffding
- Árbol de opciones de Hoeffding
- Árbol adaptativo de Hoeffding
- Clasificadores meta
- Harpillera
- Impulsando
- Ensacado con ADWIN
- Embolsado utilizando árboles Hoeffding de tamaño adaptable.
- Apilamiento de perceptrones de árboles de Hoeffding restringidos
- Aprovechar el ensacado
- Conjunto actualizado de precisión en línea
- Clasificadores de funciones
- Clasificadores de deriva
- Memoria autoajustable [3]
- Ventanas adaptativas probabilísticas
- Clasificadores multietiqueta [4]
- Clasificadores de aprendizaje activo [5]
- Regresión
- FIMTDD [6]
- Reglas de AM [7]
- Agrupamiento [8]
- Transmisión KM++
- Flujo de trabajo
- Árbol de clúster
- Transmisión D
- Telaraña.
- Detección de valores atípicos [9]
- TORMENTA
- Resumen-C
- BACALAO
- MCOD
- CualquieraFuera [10]
- Sistemas de recomendación
- Minería de patrones frecuente
- Conjuntos de elementos [11]
- Gráficos [12]
- Algoritmos de detección de cambios [13]
Estos algoritmos están diseñados para el aprendizaje automático a gran escala, abordando la deriva conceptual y los flujos de grandes datos en tiempo real.
MOA admite la interacción bidireccional con Weka (aprendizaje automático) . MOA es un software libre publicado bajo la licencia GNU GPL .
Véase también
Referencias
- ^ "Versión 24.07.0". 18 de julio de 2024. Consultado el 23 de julio de 2024 .
- ^ Bifet, Albert; Holmes, Geoff; Kirkby, Richard; Pfahringer, Bernhard (2010). "MOA: Análisis masivo en línea". Revista de investigación en aprendizaje automático . 99 : 1601–1604.
- ^ Losing, Viktor; Hammer, Barbara; Wersing, Heiko (2017). "Abordar la deriva heterogénea de conceptos con la memoria autoajustable (SAM)". Sistemas de conocimiento e información . 54 : 171–201. doi :10.1007/s10115-017-1137-y. ISSN 0885-6125. S2CID 29600755.
- ^ Read, Jesse; Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard (2012). "Clasificación multietiqueta escalable y eficiente para flujos de datos en evolución". Aprendizaje automático . 88 (1–2): 243–272. doi : 10.1007/s10994-012-5279-6 . ISSN 0885-6125. S2CID 14676146.
- ^ Zliobaite, Indre; Bifet, Albert; Pfahringer, Bernhard; Holmes, Geoffrey (2014). "Aprendizaje activo con datos de transmisión en deriva". IEEE Transactions on Neural Networks and Learning Systems . 25 (1): 27–39. doi :10.1109/TNNLS.2012.2236570. ISSN 2162-237X. PMID 24806642. S2CID 14687075.
- ^ Ikonomovska, Elena; Gama, João; Džeroski, Sašo (2010). "Aprendizaje de árboles de modelos a partir de flujos de datos en evolución" (PDF) . Minería de datos y descubrimiento de conocimiento . 23 (1): 128–168. doi :10.1007/s10618-010-0201-y. ISSN 1384-5810. S2CID 7114108.
- ^ Almeida, Ezilda; Ferreira, Carlos; Gama, João (2013). "Reglas de modelos adaptativos a partir de flujos de datos". Ingeniería de sistemas de información avanzada . Apuntes de clase en informática. Vol. 8188. págs. 480–492. CiteSeerX 10.1.1.638.5472 . doi :10.1007/978-3-642-40988-2_31. ISBN . 978-3-642-38708-1. ISSN 0302-9743.
- ^ Kranen, Philipp; Kremer, Hardy; Jansen, Timm; Seidl, Thomas; Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard (2010). "Rendimiento de agrupamiento en flujos de datos en evolución: evaluación de algoritmos y medidas de evaluación dentro de MOA". Talleres de la Conferencia Internacional IEEE sobre Minería de Datos de 2010. págs. 1400–1403. doi :10.1109/ICDMW.2010.17. ISBN 978-1-4244-9244-2.S2CID2064336 .
- ^ Georgiadis, Dimitrios; Kontaki, María; Gounaris, Anastasios; Papadopoulos, Apostolos N.; Tsichlas, Kostas; Manolopoulos, Yannis (2013). "Detección continua de valores atípicos en flujos de datos". Actas de la conferencia internacional de 2013 sobre Gestión de datos - SIGMOD '13 . pag. 1061. doi : 10.1145/2463676.2463691. ISBN 9781450320375. Número de identificación del sujeto 1886134.
- ^ Assent, Ira; Kranen, Philipp; Baldauf, Corinna; Seidl, Thomas (2012). "AnyOut: detección de valores atípicos en cualquier momento en datos en streaming". Sistemas de bases de datos para aplicaciones avanzadas . Apuntes de clase en informática. Vol. 7238. págs. 228–242. doi :10.1007/978-3-642-29038-1_18. ISBN 978-3-642-29037-4. ISSN 0302-9743.
- ^ Quadrana, Massimo; Bifet, Albert; Gavaldà, Ricard (2013). "Un minero de conjuntos de elementos frecuentes y cerrados eficiente para el sistema de minería de flujo MOA". Frontiers in Artificial Intelligence and Applications . 256 (Investigación y desarrollo de inteligencia artificial): 203. doi :10.3233/978-1-61499-320-9-203.
- ^ Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard; Gavaldà, Ricard (2011). "Explotación de grafos cerrados frecuentes en flujos de datos en evolución". Actas de la 17.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos - KDD '11 . pág. 591. CiteSeerX 10.1.1.297.1721 . doi :10.1145/2020408.2020501. ISBN . 9781450308137.ID S2C 8588858.
- ^ Bifet, Albert; Read, Jesse; Pfahringer, Bernhard; Holmes, Geoff; Žliobaitė, Indrė (2013). "CD-MOA: marco de detección de cambios para análisis masivo en línea". Avances en análisis inteligente de datos XII . Apuntes de clase en informática. Vol. 8207. págs. 92–103. doi :10.1007/978-3-642-41398-8_9. ISBN 978-3-642-41397-1. ISSN 0302-9743.
Enlaces externos
- Página de inicio del Proyecto MOA en la Universidad de Waikato en Nueva Zelanda
- Página de inicio del Proyecto SAMOA en Yahoo Labs