Análisis masivo en línea

Massive Online Analysis ( MOA ) es un proyecto de software libre y de código abierto específico para la minería de flujo de datos con deriva de conceptos . Está escrito en Java y desarrollado en la Universidad de Waikato , Nueva Zelanda . ^[2]

Descripción

MOA es un software de marco de código abierto que permite crear y ejecutar experimentos de aprendizaje automático o minería de datos en flujos de datos en evolución. Incluye un conjunto de aprendices y generadores de flujos que se pueden utilizar desde la interfaz gráfica de usuario (GUI), la línea de comandos y la API de Java. MOA contiene varias colecciones de algoritmos de aprendizaje automático:

Clasificación
- Clasificadores bayesianos
  - Bayes ingenuo
  - Multinomio bayesiano ingenuo
- Clasificadores de árboles de decisión
  - Tocón de decisión
  - Árbol de Hoeffding
  - Árbol de opciones de Hoeffding
  - Árbol adaptativo de Hoeffding
- Clasificadores meta
  - Harpillera
  - Impulsando
  - Ensacado con ADWIN
  - Embolsado utilizando árboles Hoeffding de tamaño adaptable.
  - Apilamiento de perceptrones de árboles de Hoeffding restringidos
  - Aprovechar el ensacado
  - Conjunto actualizado de precisión en línea
- Clasificadores de funciones
  - Perceptrón
  - Descenso de gradiente estocástico (SGD)
  - Pegasos
- Clasificadores de deriva
  - Memoria autoajustable ^[3]
  - Ventanas adaptativas probabilísticas
- Clasificadores multietiqueta ^[4]
- Clasificadores de aprendizaje activo ^[5]
Regresión
- FIMTDD ^[6]
- Reglas de AM ^[7]
Agrupamiento ^[8]
- Transmisión KM++
- Flujo de trabajo
- Árbol de clúster
- Transmisión D
- Telaraña.
Detección de valores atípicos ^[9]
- TORMENTA
- Resumen-C
- BACALAO
- MCOD
- CualquieraFuera ^[10]
Sistemas de recomendación
- Predictor BRISMF
Minería de patrones frecuente
- Conjuntos de elementos ^[11]
- Gráficos ^[12]
Algoritmos de detección de cambios ^[13]

Estos algoritmos están diseñados para el aprendizaje automático a gran escala, abordando la deriva conceptual y los flujos de grandes datos en tiempo real.

MOA admite la interacción bidireccional con Weka (aprendizaje automático) . MOA es un software libre publicado bajo la licencia GNU GPL .

Véase también

Flujo de trabajo ADAMS: motor de flujo de trabajo para MOA y Weka (aprendizaje automático)
Streams: entorno modular flexible para el diseño y ejecución de experimentos de flujo de datos
Weka (aprendizaje automático)
Conejo de votos
Lista de software de análisis numérico

Referencias

^ "Versión 24.07.0". 18 de julio de 2024. Consultado el 23 de julio de 2024 .
^ Bifet, Albert; Holmes, Geoff; Kirkby, Richard; Pfahringer, Bernhard (2010). "MOA: Análisis masivo en línea". Revista de investigación en aprendizaje automático . 99 : 1601–1604.
^ Losing, Viktor; Hammer, Barbara; Wersing, Heiko (2017). "Abordar la deriva heterogénea de conceptos con la memoria autoajustable (SAM)". Sistemas de conocimiento e información . 54 : 171–201. doi :10.1007/s10115-017-1137-y. ISSN 0885-6125. S2CID 29600755.
^ Read, Jesse; Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard (2012). "Clasificación multietiqueta escalable y eficiente para flujos de datos en evolución". Aprendizaje automático . 88 (1–2): 243–272. doi : 10.1007/s10994-012-5279-6 . ISSN 0885-6125. S2CID 14676146.
^ Zliobaite, Indre; Bifet, Albert; Pfahringer, Bernhard; Holmes, Geoffrey (2014). "Aprendizaje activo con datos de transmisión en deriva". IEEE Transactions on Neural Networks and Learning Systems . 25 (1): 27–39. doi :10.1109/TNNLS.2012.2236570. ISSN 2162-237X. PMID 24806642. S2CID 14687075.
^ Ikonomovska, Elena; Gama, João; Džeroski, Sašo (2010). "Aprendizaje de árboles de modelos a partir de flujos de datos en evolución" (PDF) . Minería de datos y descubrimiento de conocimiento . 23 (1): 128–168. doi :10.1007/s10618-010-0201-y. ISSN 1384-5810. S2CID 7114108.
^ Almeida, Ezilda; Ferreira, Carlos; Gama, João (2013). "Reglas de modelos adaptativos a partir de flujos de datos". Ingeniería de sistemas de información avanzada . Apuntes de clase en informática. Vol. 8188. págs. 480–492. CiteSeerX 10.1.1.638.5472 . doi :10.1007/978-3-642-40988-2_31. ISBN . 978-3-642-38708-1. ISSN 0302-9743.
^ Kranen, Philipp; Kremer, Hardy; Jansen, Timm; Seidl, Thomas; Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard (2010). "Rendimiento de agrupamiento en flujos de datos en evolución: evaluación de algoritmos y medidas de evaluación dentro de MOA". Talleres de la Conferencia Internacional IEEE sobre Minería de Datos de 2010. págs. 1400–1403. doi :10.1109/ICDMW.2010.17. ISBN 978-1-4244-9244-2.S2CID2064336 .
^ Georgiadis, Dimitrios; Kontaki, María; Gounaris, Anastasios; Papadopoulos, Apostolos N.; Tsichlas, Kostas; Manolopoulos, Yannis (2013). "Detección continua de valores atípicos en flujos de datos". Actas de la conferencia internacional de 2013 sobre Gestión de datos - SIGMOD '13 . pag. 1061. doi : 10.1145/2463676.2463691. ISBN 9781450320375. Número de identificación del sujeto 1886134.
^ Assent, Ira; Kranen, Philipp; Baldauf, Corinna; Seidl, Thomas (2012). "AnyOut: detección de valores atípicos en cualquier momento en datos en streaming". Sistemas de bases de datos para aplicaciones avanzadas . Apuntes de clase en informática. Vol. 7238. págs. 228–242. doi :10.1007/978-3-642-29038-1_18. ISBN 978-3-642-29037-4. ISSN 0302-9743.
^ Quadrana, Massimo; Bifet, Albert; Gavaldà, Ricard (2013). "Un minero de conjuntos de elementos frecuentes y cerrados eficiente para el sistema de minería de flujo MOA". Frontiers in Artificial Intelligence and Applications . 256 (Investigación y desarrollo de inteligencia artificial): 203. doi :10.3233/978-1-61499-320-9-203.
^ Bifet, Albert; Holmes, Geoff; Pfahringer, Bernhard; Gavaldà, Ricard (2011). "Explotación de grafos cerrados frecuentes en flujos de datos en evolución". Actas de la 17.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos - KDD '11 . pág. 591. CiteSeerX 10.1.1.297.1721 . doi :10.1145/2020408.2020501. ISBN . 9781450308137.ID S2C 8588858.
^ Bifet, Albert; Read, Jesse; Pfahringer, Bernhard; Holmes, Geoff; Žliobaitė, Indrė (2013). "CD-MOA: marco de detección de cambios para análisis masivo en línea". Avances en análisis inteligente de datos XII . Apuntes de clase en informática. Vol. 8207. págs. 92–103. doi :10.1007/978-3-642-41398-8_9. ISBN 978-3-642-41397-1. ISSN 0302-9743.

Enlaces externos

Página de inicio del Proyecto MOA en la Universidad de Waikato en Nueva Zelanda
Página de inicio del Proyecto SAMOA en Yahoo Labs