Conjunto de software de aprendizaje automático escrito en Java
Waikato Environment for Knowledge Analysis ( Weka ) es una colección de software gratuito de aprendizaje automático y análisis de datos con licencia pública general GNU . Fue desarrollado en la Universidad de Waikato , Nueva Zelanda , y es el software complementario del libro "Minería de datos: herramientas y técnicas prácticas de aprendizaje automático". [1]
Descripción
Weka contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo , junto con interfaces gráficas de usuario para un fácil acceso a estas funciones. [1] La versión original de Weka que no era Java era una interfaz Tcl / Tk para algoritmos de modelado (en su mayoría de terceros) implementados en otros lenguajes de programación, además de utilidades de preprocesamiento de datos en C y un sistema basado en archivos MAKE para ejecutar la máquina. experimentos de aprendizaje. Esta versión original fue diseñada principalmente como una herramienta para analizar datos de dominios agrícolas, [2] [3] pero la versión más reciente totalmente basada en Java (Weka 3), cuyo desarrollo comenzó en 1997, ahora se utiliza en muchas aplicaciones diferentes. en particular con fines educativos y de investigación. Las ventajas de Weka incluyen:
- Disponibilidad gratuita bajo la Licencia Pública General GNU .
- Portabilidad, ya que está completamente implementado en el lenguaje de programación Java y, por lo tanto, se ejecuta en casi cualquier plataforma informática moderna.
- Una colección completa de técnicas de modelado y preprocesamiento de datos.
- Facilidad de uso debido a sus interfaces gráficas de usuario.
Weka admite varias tareas estándar de minería de datos , más específicamente, preprocesamiento de datos, agrupación , clasificación , regresión , visualización y selección de características . Se espera que la entrada a Weka tenga el formato de archivo relacional de atributos y que el nombre del archivo tenga la extensión .arff. Todas las técnicas de Weka se basan en el supuesto de que los datos están disponibles como un archivo plano o relación, donde cada punto de datos se describe mediante un número fijo de atributos (normalmente, atributos numéricos o nominales, pero también se admiten algunos otros tipos de atributos). . Weka proporciona acceso a bases de datos SQL utilizando Java Database Connectivity y puede procesar el resultado devuelto por una consulta de base de datos. Weka brinda acceso al aprendizaje profundo con Deeplearning4j . [4] No es capaz de realizar minería de datos multirelacional, pero existe un software independiente para convertir una colección de tablas de bases de datos vinculadas en una sola tabla que es adecuada para procesar con Weka. [5] Otra área importante que actualmente no está cubierta por los algoritmos incluidos en la distribución Weka es el modelado de secuencias.
Paquetes de extensión
En la versión 3.7.2, se agregó un administrador de paquetes para permitir una instalación más sencilla de los paquetes de extensión. [6]
Algunas funciones que solían incluirse con Weka antes de esta versión se han trasladado a dichos paquetes de extensión, pero este cambio también facilita que otros contribuyan con extensiones a Weka y mantengan el software, ya que esta arquitectura modular permite Actualizaciones independientes del núcleo Weka y extensiones individuales.
Historia
- En 1993, la Universidad de Waikato en Nueva Zelanda comenzó a desarrollar la versión original de Weka, que se convirtió en una mezcla de Tcl/Tk, C y makefiles.
- En 1997, se tomó la decisión de volver a desarrollar Weka desde cero en Java, incluidas implementaciones de algoritmos de modelado. [7]
- En 2005, Weka recibió el premio SIGKDD al servicio de descubrimiento de conocimientos y minería de datos. [8] [9]
- En 2006, Pentaho Corporation adquirió una licencia exclusiva para utilizar Weka para inteligencia empresarial . [10] Forma el componente de análisis predictivo y minería de datos de la suite de inteligencia empresarial Pentaho. Desde entonces, Pentaho ha sido adquirida por Hitachi Vantara, y Weka ahora sustenta el componente de código abierto PMI (Plugin for Machine Intelligence). [11]
Herramientas relacionadas
Ver también
Referencias
- ^ ab Witten, Ian H .; Frank, Eibe; Salón, Mark A.; Pal, Christopher J. (2011). "Minería de datos: herramientas y técnicas prácticas de aprendizaje automático, tercera edición". Morgan Kaufmann, San Francisco (CA) . Consultado el 19 de enero de 2011 .
- ^ Holmes, Geoffrey; Donkin, Andrés; Witten, Ian H. (1994). "Weka: un banco de trabajo de aprendizaje automático" (PDF) . Actas de la Segunda Conferencia de Australia y Nueva Zelanda sobre Sistemas de Información Inteligentes, Brisbane, Australia . Consultado el 25 de junio de 2007 .
- ^ Garner, Stephen R.; Cunningham, Sally Jo; Holmes, Geoffrey; Nevill-Manning, Craig G .; Witten, Ian H. (1995). "Aplicación de un banco de trabajo de aprendizaje automático: Experiencia con bases de datos agrícolas" (PDF) . Actas del taller de aprendizaje automático en la práctica, Conferencia sobre aprendizaje automático, Tahoe City (CA), EE. UU . págs. 14-21 . Consultado el 25 de junio de 2007 .
- ^ "Metadatos del paquete Weka". FuenteForge . 2017 . Consultado el 11 de noviembre de 2017 .
- ^ Reutemann, Pedro; Pfahringer, Bernhard; Frank, Eibe (2004). "Adecuado: una caja de herramientas para aprender a partir de datos relacionales con alumnos proposicionales y de instancias múltiples". 17ª Conferencia Conjunta Australiana sobre Inteligencia Artificial (AI2004) . Springer-Verlag. CiteSeerX 10.1.1.459.8443 .
- ^ "weka-wiki - Paquetes" . Consultado el 27 de enero de 2020 .
- ^ Witten, Ian H.; Frank, Eibe; Trigg, Len; Salón, Mark A.; Holmes, Geoffrey; Cunningham, Sally Jo (1999). "Weka: técnicas y herramientas prácticas de aprendizaje automático con implementaciones de Java" (PDF) . Actas del taller ICONIP/ANZIIS/ANNES'99 sobre ingeniería del conocimiento emergente y sistemas de información basados en conexionistas . págs. 192-196 . Consultado el 26 de junio de 2007 .
- ^ Piatetsky-Shapiro, Gregory I. (28 de junio de 2005). "Noticias de KDnuggets sobre el premio al servicio SIGKDD 2005" . Consultado el 25 de junio de 2007 .
- ^ "Resumen de los ganadores del premio al servicio SIGKDD". 2005 . Consultado el 25 de junio de 2007 .
- ^ "Pentaho adquiere el proyecto Weka". Pentaho . Consultado el 6 de febrero de 2018 .
- ^ "Complemento para inteligencia artificial".
- ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H .; Leyton-Brown, Kevin (2013). Auto-WEKA: selección combinada y optimización de hiperparámetros de algoritmos de clasificación. KDD '13 Actas de la 19ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos. págs. 847–855.
enlaces externos
Wikimedia Commons tiene medios relacionados con Weka (aprendizaje automático) .
- Sitio web oficial de la Universidad de Waikato en Nueva Zelanda