stringtranslate.com

Aprendizaje profundo 4J

Eclipse Deeplearning4j es una biblioteca de programación escrita en Java para la máquina virtual Java (JVM). [2] [3] Es un marco con amplio soporte para algoritmos de aprendizaje profundo. [4] Deeplearning4j incluye implementaciones de la máquina de Boltzmann restringida , red de creencias profundas , autocodificador profundo, autocodificador de eliminación de ruido apilado y red tensorial neuronal recursiva , word2vec , doc2vec y GloVe . Todos estos algoritmos incluyen versiones paralelas distribuidas que se integran con Apache Hadoop y Spark . [5]

Deeplearning4j es un software de código abierto publicado bajo la Licencia Apache 2.0, [6] desarrollado principalmente por un grupo de aprendizaje automático con sede en San Francisco . [7] Cuenta con el respaldo comercial de la startup Skymind, que agrupa DL4J, TensorFlow , Keras y otras bibliotecas de aprendizaje profundo en una distribución empresarial llamada Skymind Intelligence Layer. [8] Deeplearning4j fue aportado a la Fundación Eclipse en octubre de 2017. [9] [10]

Introducción

Deeplearning4j se basa en el lenguaje de programación ampliamente utilizado Java , aunque es compatible con Clojure e incluye una interfaz de programación de aplicaciones (API) Scala . Está impulsado por su propia biblioteca de computación numérica de código abierto, ND4J, y funciona tanto con unidades centrales de procesamiento (CPU) como con unidades de procesamiento gráfico (GPU). [11] [12]

Deeplearning4j se ha utilizado en varias aplicaciones comerciales y académicas. El código está alojado en GitHub . [13] Se mantiene un foro de soporte en Gitter . [14]

El marco es componible, lo que significa que se pueden agregar redes neuronales superficiales, como máquinas de Boltzmann restringidas, redes convolucionales, autocodificadores y redes recurrentes, para crear redes profundas de distintos tipos. También cuenta con amplias herramientas de visualización [15] y un gráfico de cálculo [16] .

Repartido

El entrenamiento con Deeplearning4j se realiza en un clúster. Las redes neuronales se entrenan en paralelo mediante una reducción iterativa, que funciona en Hadoop -YARN y en Spark . [7] [17] Deeplearning4j también se integra con núcleos CUDA para realizar operaciones de GPU puras y funciona con GPU distribuidas.

Computación científica para la JVM

Deeplearning4j incluye una clase de matriz n-dimensional que utiliza ND4J y que permite realizar cálculos científicos en Java y Scala, de forma similar a las funciones que NumPy proporciona a Python . Se basa en una biblioteca para álgebra lineal y manipulación de matrices en un entorno de producción.

Biblioteca de vectorización DataVec para aprendizaje automático

DataVec vectoriza varios formatos de archivo y tipos de datos utilizando un sistema de formato de entrada/salida similar al uso de MapReduce por parte de Hadoop; es decir, convierte varios tipos de datos en columnas de escalares denominadas vectores . DataVec está diseñado para vectorizar archivos CSV, imágenes, sonido, texto, video y series temporales. [18] [19]

Texto y PNL

Deeplearning4j incluye un conjunto de herramientas de modelado de espacios vectoriales y de modelado de temas , implementado en Java y que se integra con GPU paralelas para mejorar el rendimiento. Está diseñado para manejar conjuntos de texto de gran tamaño.

Deeplearning4j incluye implementaciones de frecuencia de término-frecuencia de documento inversa ( tf–idf ), aprendizaje profundo y el algoritmo word2vec de Mikolov, [20] doc2vec y GloVe, reimplementados y optimizados en Java. Se basa en la incrustación de vecinos estocásticos distribuidos en t (t-SNE) para visualizaciones de nubes de palabras.

Casos de uso e integraciones del mundo real

Los casos de uso del mundo real para Deeplearning4j incluyen detección de intrusiones en la red y ciberseguridad, detección de fraudes para el sector financiero, [21] [22] detección de anomalías en industrias como la fabricación, sistemas de recomendación en comercio electrónico y publicidad, [23] y reconocimiento de imágenes. [24] Deeplearning4j se ha integrado con otras plataformas de aprendizaje automático como RapidMiner, Prediction.io, [25] y Weka . [26]

Servidor de modelos de aprendizaje automático

Deeplearning4j ofrece modelos de aprendizaje automático para la inferencia en producción mediante la edición gratuita para desarrolladores de SKIL, la capa de inteligencia de Skymind. [27] [28] Un servidor de modelos ofrece modelos de aprendizaje automático paramétrico que toman decisiones sobre los datos. Se utiliza para la etapa de inferencia de un flujo de trabajo de aprendizaje automático, después de las canalizaciones de datos y el entrenamiento del modelo. Un servidor de modelos es la herramienta que permite implementar la investigación científica de datos en un entorno de producción del mundo real.

Un servidor de modelos es para la IA lo que un servidor web es para Internet. Cuando un servidor web recibe una solicitud HTTP y devuelve datos sobre un sitio web, un servidor de modelos recibe datos y devuelve una decisión o predicción sobre esos datos: por ejemplo, si se envía una imagen, un servidor de modelos puede devolver una etiqueta para esa imagen, identificando rostros o animales en fotografías.

El servidor de modelos SKIL puede importar modelos de marcos Python como Tensorflow, Keras, Theano y CNTK, superando una barrera importante en la implementación de modelos de aprendizaje profundo.

Puntos de referencia

Deeplearning4j es tan rápido como Caffe para tareas de reconocimiento de imágenes no triviales que utilizan múltiples GPU. [29] Para los programadores que no están familiarizados con HPC en la JVM, hay varios parámetros que se deben ajustar para optimizar el tiempo de entrenamiento de la red neuronal. Estos incluyen la configuración del espacio de almacenamiento dinámico, el algoritmo de recolección de basura, el empleo de memoria fuera del almacenamiento dinámico y el preguardado de datos (pickling) para un ETL más rápido. [30] En conjunto, estas optimizaciones pueden generar una aceleración de 10 veces en el rendimiento con Deeplearning4j.

Lenguajes API: Java, Scala, Python, Clojure y Kotlin

Deeplearning4j se puede utilizar a través de múltiples lenguajes API, incluidos Java, Scala, Python, Clojure y Kotlin. Su API de Scala se llama ScalNet. [31] Keras sirve como su API de Python. [32] Y su contenedor de Clojure se conoce como DL4CLJ. [33] Los lenguajes principales que realizan las operaciones matemáticas a gran escala necesarias para el aprendizaje profundo son C, C++ y CUDA C.

Tensorflow, Keras y Deeplearning4j

Tensorflow, Keras y Deeplearning4j trabajan juntos. Deeplearning4j puede importar modelos de Tensorflow y otros frameworks de Python si se crearon con Keras. [34]

Véase también

Referencias

  1. ^ "Lanzamientos · eclipse/deeplearning4j". github.com . Consultado el 3 de abril de 2021 .
  2. ^ Metz, Cade (2 de junio de 2014). "La misión de llevar la inteligencia artificial de Google al resto del mundo". Wired.com . Consultado el 28 de junio de 2014 .
  3. ^ Vance, Ashlee (3 de junio de 2014). "Aprendizaje profundo para (algunas de) las personas". Bloomberg Businessweek . Archivado desde el original el 4 de junio de 2014. Consultado el 28 de junio de 2014 .
  4. ^ Novet, Jordan (14 de noviembre de 2015). "¿Quieres un marco de aprendizaje profundo de código abierto? Elige el que más te guste". VentureBeat . Consultado el 24 de noviembre de 2015 .
  5. ^ "Adam Gibson, DeepLearning4j sobre Spark y ciencia de datos en JVM con nd4j, SF Spark @Galvanize 20150212". SF Spark Meetup . 2015-02-12 . Consultado el 2015-03-01 .
  6. ^ "Repositorio de Github". GitHub . Abril de 2020.
  7. ^ desde "deeplearning4j.org".
  8. ^ "Skymind Intelligence Layer Community Edition". Archivado desde el original el 7 de noviembre de 2017. Consultado el 2 de noviembre de 2017 .
  9. ^ "Página del proyecto Eclipse Deeplearning4j". 22 de junio de 2017.
  10. ^ "Deeplearning4j de Skymind, la Fundación Eclipse y la computación científica en la JVM". Jaxenter . 13 de noviembre de 2017 . Consultado el 15 de noviembre de 2017 .
  11. ^ Novet, Jordania (28 de septiembre de 2016). "La startup de aprendizaje profundo Skymind recauda 3 millones de dólares y lanza la distribución de Intelligence Layer". VentureBeat .
  12. ^ Novet, Jordan (2 de junio de 2014). "Skymind se lanza con funciones de aprendizaje profundo plug-and-play de código abierto para su aplicación". VentureBeat .
  13. ^ "deeplearning4j/deeplearning4j". 29 de abril de 2023. Consultado el 29 de abril de 2023 en GitHub.
  14. ^ "Elemento". app.gitter.im . Consultado el 29 de abril de 2023 .
  15. ^ "Herramientas de visualización de Deeplearning4j". Archivado desde el original el 10 de agosto de 2017. Consultado el 17 de agosto de 2016 .
  16. ^ "Gráfico computacional de Deeplearning4j". Archivado desde el original el 10 de agosto de 2017. Consultado el 17 de agosto de 2016 .
  17. ^ "Reducción iterativa". GitHub . 15 de marzo de 2020.
  18. ^ "DataVec ETL para aprendizaje automático". Archivado desde el original el 2017-10-02 . Consultado el 2016-09-18 .
  19. ^ "Detección de anomalías para datos de series temporales con aprendizaje profundo". InfoQ . Consultado el 29 de abril de 2023 .
  20. ^ "Archivo de código de Google: almacenamiento a largo plazo para el alojamiento de proyectos de código de Google". code.google.com . Consultado el 29 de abril de 2023 .
  21. ^ "Copia archivada". Archivado desde el original el 10 de marzo de 2016. Consultado el 22 de febrero de 2016 .{{cite web}}: CS1 maint: archived copy as title (link)
  22. ^ "skymind.ai". skymind.ai . Consultado el 29 de abril de 2023 .
  23. ^ "Copia archivada". Archivado desde el original el 10 de marzo de 2016. Consultado el 22 de febrero de 2016 .{{cite web}}: CS1 maint: archived copy as title (link)
  24. ^ "skymind.ai". skymind.ai . Consultado el 29 de abril de 2023 .
  25. ^ "DeepLearning4J(Stable) | RapidMiner China". www.rapidminerchina.com . Archivado desde el original el 18 de mayo de 2016. Consultado el 22 de mayo de 2022 .
  26. ^ "Inicio - WekaDeeplearning4j". deeplearning.cms.waikato.ac.nz . Consultado el 29 de abril de 2023 .
  27. ^ "Productos". Archivado desde el original el 21-09-2017 . Consultado el 20-09-2017 .
  28. ^ "Servidor de modelos para aprendizaje profundo e IA - Deeplearning4j: aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 21 de septiembre de 2017. Consultado el 20 de septiembre de 2017 .
  29. ^ "GitHub - deeplearning4j/Dl4j-benchmark: Repositorio para realizar un seguimiento del código de referencia de dl4j". GitHub . 19 de diciembre de 2019.
  30. ^ "Deeplearning4j Benchmarks - Deeplearning4j: Aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 2017-08-09 . Consultado el 2017-01-30 .
  31. ^ "Scala, Spark y Deeplearning4j - Deeplearning4j: aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 25 de febrero de 2017. Consultado el 25 de febrero de 2017 .
  32. ^ "Ejecución de Keras con Deeplearning4j - Deeplearning4j: aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 25 de febrero de 2017. Consultado el 25 de febrero de 2017 .
  33. ^ "Aprendizaje profundo con Clojure - Deeplearning4j: aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 25 de febrero de 2017. Consultado el 25 de febrero de 2017 .
  34. ^ "Tensorflow y Deeplearning4j - Deeplearning4j: aprendizaje profundo distribuido de código abierto para la JVM". Archivado desde el original el 8 de septiembre de 2017. Consultado el 7 de septiembre de 2017 .