stringtranslate.com

Weka (programa informático)

Waikato Environment for Knowledge Analysis ( Weka ) es una colección de software libre de aprendizaje automático y análisis de datos con licencia GNU General Public License . Fue desarrollado en la Universidad de Waikato , Nueva Zelanda y es el software complementario del libro "Data Mining: Practical Machine Learning Tools and Techniques". [1]

Descripción

Weka contiene una colección de herramientas de visualización y algoritmos para el análisis de datos y el modelado predictivo , junto con interfaces gráficas de usuario para un fácil acceso a estas funciones. [1] La versión original no Java de Weka era un front-end Tcl / Tk para algoritmos de modelado (en su mayoría de terceros) implementados en otros lenguajes de programación, además de utilidades de preprocesamiento de datos en C y un sistema basado en makefile para ejecutar experimentos de aprendizaje automático. Esta versión original fue diseñada principalmente como una herramienta para analizar datos de dominios agrícolas, [2] [3] pero la versión más reciente completamente basada en Java (Weka 3), para la cual el desarrollo comenzó en 1997, ahora se usa en muchas áreas de aplicación diferentes, en particular con fines educativos y de investigación. Las ventajas de Weka incluyen:

Weka admite varias tareas estándar de minería de datos , más específicamente, preprocesamiento de datos, agrupamiento , clasificación , regresión , visualización y selección de características . Se espera que la entrada a Weka esté formateada de acuerdo con el formato de archivo relacional de atributos y con el nombre de archivo con la extensión .arff. Todas las técnicas de Weka se basan en el supuesto de que los datos están disponibles como un archivo plano o relación, donde cada punto de datos se describe mediante un número fijo de atributos (normalmente, atributos numéricos o nominales, pero también se admiten otros tipos de atributos). Weka proporciona acceso a bases de datos SQL mediante Java Database Connectivity y puede procesar el resultado devuelto por una consulta de base de datos. Weka proporciona acceso al aprendizaje profundo con Deeplearning4j . [4] No es capaz de realizar minería de datos multirelacional, pero existe un software independiente para convertir una colección de tablas de bases de datos vinculadas en una sola tabla que sea adecuada para su procesamiento con Weka. [5] Otra área importante que actualmente no está cubierta por los algoritmos incluidos en la distribución de Weka es el modelado de secuencias.

Paquetes de extensión

En la versión 3.7.2, se agregó un administrador de paquetes para permitir una instalación más sencilla de los paquetes de extensión. [6] Algunas funciones que solían estar incluidas con Weka antes de esta versión se han trasladado desde entonces a dichos paquetes de extensión, pero este cambio también hace que sea más fácil para otros contribuir con extensiones a Weka y mantener el software, ya que esta arquitectura modular permite actualizaciones independientes del núcleo de Weka y extensiones individuales.

Historia

Herramientas relacionadas

Véase también

Referencias

  1. ^ ab Witten, Ian H. ; Frank, Eibe; Hall, Mark A.; Pal, Christopher J. (2011). Minería de datos: herramientas y técnicas prácticas de aprendizaje automático (3.ª ed.). San Francisco (CA): Morgan Kaufmann . ISBN 9780080890364. Recuperado el 19 de enero de 2011 .
  2. ^ Holmes, Geoffrey; Donkin, Andrew; Witten, Ian H. (1994). Weka: un banco de trabajo de aprendizaje automático (PDF) . Actas de la Segunda Conferencia de Australia y Nueva Zelanda sobre Sistemas de Información Inteligentes, Brisbane, Australia . Consultado el 25 de junio de 2007 .
  3. ^ Garner, Stephen R.; Cunningham, Sally Jo; Holmes, Geoffrey; Nevill-Manning, Craig G .; Witten, Ian H. (1995). Aplicación de un banco de trabajo de aprendizaje automático: experiencia con bases de datos agrícolas (PDF) . Actas del taller Machine Learning in Practice, Machine Learning Conference , Tahoe City (CA), EE. UU., págs. 14–21 . Consultado el 25 de junio de 2007 .
  4. ^ "Metadatos del paquete Weka". 2017. Consultado el 11 de noviembre de 2017 a través de SourceForge .
  5. ^ Reutemann, Peter; Pfahringer, Bernhard; Frank, Eibe (2004). "Proper: una caja de herramientas para aprender a partir de datos relacionales con aprendices proposicionales y de múltiples instancias". 17.ª Conferencia conjunta australiana sobre inteligencia artificial (AI2004) . Springer-Verlag. CiteSeerX 10.1.1.459.8443 . 
  6. ^ "weka-wiki - Paquetes" . Consultado el 27 de enero de 2020 – vía GitHub .
  7. ^ Witten, Ian H.; Frank, Eibe; Trigg, Len; Hall, Mark A.; Holmes, Geoffrey; Cunningham, Sally Jo (1999). Weka: Herramientas y técnicas prácticas de aprendizaje automático con implementaciones en Java (PDF) . Actas del taller ICONIP/ANZIIS/ANNES'99 sobre ingeniería de conocimiento emergente y sistemas de información basados ​​en conexiones. págs. 192–196 . Consultado el 26 de junio de 2007 .
  8. ^ Piatetsky-Shapiro, Gregory I. (28 de junio de 2005). "Ganador del premio SIGKDD Data Mining and Knowledge Discovery Service Award". KDnuggets . Consultado el 25 de junio de 2007 .
  9. ^ "Resumen de los ganadores del premio al servicio SIGKDD". ACM. 2005. Consultado el 25 de junio de 2007 .
  10. ^ "Pentaho adquiere el proyecto Weka". Pentaho . Consultado el 6 de febrero de 2018 .
  11. ^ "Plugin para inteligencia artificial". Hitachi Vantara .
  12. ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H .; Leyton-Brown, Kevin (11 de agosto de 2013). Auto-WEKA: selección combinada y optimización de hiperparámetros de algoritmos de clasificación . Actas de la 19.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . ACM. págs. 847–855. doi :10.1145/2487575.2487629. ISBN . 978-1-4503-2174-7.

Enlaces externos