Desde 2006, KNIME se ha utilizado en la investigación farmacéutica [3] y en otras áreas, como el análisis de datos de clientes de CRM , la inteligencia empresarial , la minería de texto y el análisis de datos financieros. Recientemente, se ha intentado utilizar KNIME como herramienta de automatización de procesos robóticos (RPA). [4] [ ¿cuándo? ]
La sede central de KNIME se encuentra en Zúrich, con oficinas adicionales en Constanza, Berlín y Austin (EE. UU.). [ cita requerida ]
Historia
El desarrollo de KNIME comenzó en enero de 2004, con un equipo de ingenieros de software de la Universidad de Konstanz , como una plataforma de código abierto. El equipo original, encabezado por Michael Berthold , provenía de una empresa de software de la industria farmacéutica de Silicon Valley. El objetivo inicial era crear una plataforma de procesamiento de datos modular, altamente escalable y abierta que permitiera la fácil integración de diferentes módulos de carga, procesamiento, transformación, análisis y exploración visual de datos, sin centrarse en ningún área de aplicación en particular. La plataforma estaba destinada a ser una plataforma de colaboración e investigación y también servir como plataforma de integración para varios otros proyectos de análisis de datos. [5]
En 2006 se lanzó la primera versión de KNIME. Varias compañías farmacéuticas comenzaron a utilizar KNIME y varios proveedores de software de ciencias biológicas comenzaron a integrar sus herramientas en la plataforma. [6] [7] [8] [9] [10] Más tarde ese año, después de un artículo en la revista alemana c't , [11] se unieron usuarios de varias otras áreas [12] [13] . A partir de 2012, KNIME está en uso por más de 15.000 usuarios reales (es decir, sin contar las descargas, pero los usuarios que recuperan actualizaciones regularmente) en las ciencias biológicas y en bancos, editoriales, fabricantes de automóviles, empresas de telecomunicaciones, empresas de consultoría y varias otras industrias, y una gran cantidad de grupos de investigación, en todo el mundo. [ cita requerida ] [ necesita actualización ] Las últimas actualizaciones de KNIME Server y KNIME Big Data Extensions brindan soporte para Apache Spark 2.3, Parquet y almacenamiento de tipo HDFS. [ cita requerida ]
Por sexto año consecutivo, KNIME ha sido ubicado como líder en plataformas de ciencia de datos y aprendizaje automático en el Cuadrante Mágico de Gartner . [ cita requerida ] [ año necesario ]
Filosofía y características del diseño
Estos son los principios y características de diseño que sigue el software KNIME: [14]
Modularidad : las unidades de procesamiento y los contenedores de datos deben permanecer independientes entre sí. Esta opción de diseño permite una distribución sencilla de los cálculos y el desarrollo independiente de diferentes algoritmos . Los tipos de datos dentro de KNIME están encapsulados , lo que significa que no hay tipos predefinidos. Esta opción de diseño facilita la adición de nuevos tipos de datos y su integración con los existentes, lo que permite la incorporación de comparadores y renderizadores específicos de cada tipo. Además, este principio permite la inspección de los resultados al final de cada operación de datos individual.
Extensibilidad : el software KNIME está diseñado para ser extensible . La incorporación de nuevos nodos de procesamiento o vistas se simplifica mediante un mecanismo de complemento . Este mecanismo garantiza que los usuarios puedan distribuir sus funcionalidades personalizadas sin necesidad de procedimientos complicados de instalación o desinstalación.
Combinación de código y no código : la plataforma admite la integración de enfoques de programación visual ( sin código ) y programación basada en scripts (por ejemplo, Python , R , Javascript ) para el análisis de datos. Este principio de diseño se conoce como low-code .
Automatización y escalabilidad : por ejemplo, el uso de parametrización mediante variables de flujo o la encapsulación de segmentos de flujo de trabajo en componentes contribuyen a reducir el trabajo manual y los errores en los análisis. Además, la programación de la ejecución del flujo de trabajo (disponible en KNIME Business Hub y KNIME Community Hub for Teams) reduce la dependencia de los recursos humanos. En términos de escalabilidad, algunos ejemplos incluyen la capacidad de manejar grandes conjuntos de datos (millones de filas), ejecutar múltiples procesos simultáneamente de forma inmediata y reutilizar segmentos de flujo de trabajo.
Usabilidad completa : debido a su naturaleza de código abierto , KNIME Analytics Platform ofrece usabilidad completa gratuita sin períodos de prueba limitados.
Internos
KNIME permite a los usuarios crear visualmente flujos de datos (o pipelines), ejecutar selectivamente algunos o todos los pasos de análisis y luego inspeccionar los resultados y modelos mediante widgets y vistas interactivas. KNIME está escrito en Java y basado en Eclipse . Utiliza un mecanismo de extensión para agregar complementos que brindan funcionalidad adicional. La versión principal incluye cientos de módulos para la integración de datos (E/S de archivos, nodos de base de datos que admiten todos los sistemas de administración de bases de datos comunes a través de JDBC o conectores nativos: SQLite, MS-Access, SQL Server, MySQL, Oracle, PostgreSQL, Vertica y H2), transformación de datos (filtro, convertidor, divisor, combinador, ensamblador) y los métodos comúnmente utilizados de estadísticas, minería de datos, análisis y análisis de texto. La visualización es compatible con la extensión Report Designer. Los flujos de trabajo de KNIME se pueden usar como conjuntos de datos para crear plantillas de informes que se pueden exportar a formatos de documentos como doc, ppt, xls, pdf y otros. Otras capacidades de KNIME son:
La arquitectura básica de KNIME permite procesar grandes volúmenes de datos que solo están limitados por el espacio disponible en el disco duro (no por la RAM disponible). Por ejemplo, KNIME permite analizar 300 millones de direcciones de clientes, 20 millones de imágenes de células y 10 millones de estructuras moleculares.
Los complementos adicionales permiten la integración de métodos de minería de texto , minería de imágenes, así como análisis de series de tiempo y redes.
KNIME está implementado en Java , permite que los wrappers llamen a otro código, además de proporcionar nodos que le permiten ejecutar Java , Python , R , Ruby y otros fragmentos de código. [ cita requerida ]
Licencia
En 2024, la versión 5.3 de KNIME se lanza bajo la misma licencia GPLv3 que las versiones anteriores. [16]
A partir de la versión 2.1, KNIME se lanza bajo la licencia GPLv3 , con una excepción que permite a otros usar la API de nodo bien definida para agregar extensiones propietarias. [17] [ necesita actualización ] Esto permite a los proveedores de software comercial agregar envoltorios que llamen a sus herramientas desde KNIME.
Cursos de KNIME
KNIME permite realizar análisis de datos sin conocimientos de programación. Se ofrecen dos líneas de cursos en línea, basados en Data Wrangling y Data Science. [18]
Véase también
Weka : algoritmos de aprendizaje automático que se pueden integrar en KNIME
ELKI : marco de minería de datos con numerosos algoritmos de agrupamiento
Orange : un kit de herramientas de minería de datos, aprendizaje automático y visualización de datos de código abierto con una interfaz de programación visual similar
^ "Novedades en KNIME Analytics Platform 5.3". knime.com .
^ Berthold, Michael R.; Cebrón, Nicolás; Eneldo, Fabián; Gabriel, Thomas R.; Kötter, Tobías; Meinl, Thorsten; Ah, Pedro; Thiel, Kilian; Wiswedel, Bernd (16 de noviembre de 2009). "KNIME: el minero de información de Constanza" (PDF) . Boletín de exploraciones de ACM SIGKDD . 11 (1): 26. doi :10.1145/1656274.1656280. S2CID 408188.
^ Tiwari, Abhishek; Sekhar, Arvind KT (octubre de 2007). "Marco basado en flujo de trabajo para informática de ciencias de la vida". Computational Biology and Chemistry . 31 (5–6): 305–319. doi :10.1016/j.compbiolchem.2007.08.009. PMID 17931570.
^ "Bot de la plataforma de análisis KNIME".,
^ "Abierto a la innovación". KNIME.com .
^ Tripos, Inc. Archivado el 17 de julio de 2011 en Wayback Machine.
^ Schrödinger Archivado el 25 de septiembre de 2009 en Wayback Machine.
^ ChemAxon Archivado el 17 de julio de 2011 en Wayback Machine
^ NovaMechanics Ltd.
^ Consultores Treweren
^ Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
^ Foro en el sitio web de KNIME
^ "Pervasivo". Archivado desde el original el 29 de agosto de 2010. Consultado el 7 de diciembre de 2010 .
^ Berthold, Michael R., et al. "KNIME, el minero de información de Konstanz: versión 2.0 y más allá". Boletín de exploraciones AcM SIGKDD 11.1 (2009): 26-31.
^ Beisken, S.; Meinl, T.; Wiswedel, B.; De Figueiredo, LF; Berthold, M.; Steinbeck, C. (2013). "KNIME-CDK: quimioinformática basada en flujo de trabajo". BMC Bioinformatics . 14 : 257. doi : 10.1186/1471-2105-14-257 . PMC 3765822 . PMID 24103053.
^ "Términos y condiciones de la licencia de KNIME 5.3". 2024-08-03.
^ Se lanzó KNIME 2.1.0 Archivado el 17 de abril de 2010 en Wayback Machine