stringtranslate.com

Ladrillos de datos

Databricks, Inc. es una empresa de software estadounidense fundada por los creadores originales de Apache Spark . [2] Databricks desarrolla una plataforma basada en web para trabajar con Spark, que proporciona administración automatizada de clústeres y cuadernos estilo IPython . La empresa desarrolla Delta Lake , un proyecto de código abierto para aportar confiabilidad a los lagos de datos para el aprendizaje automático y otros casos de uso de ciencia de datos. [3]

Historia

Stand de ladrillos de datos

Databricks surgió del proyecto AMPLab de la Universidad de California, Berkeley , que participó en la creación de Apache Spark , un marco informático distribuido de código abierto construido sobre Scala . La empresa fue fundada por Ali Ghodsi , Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica , Matei Zaharia , [4] Patrick Wendell y Reynold Xin .

En noviembre de 2017, la empresa se anunció como un servicio propio en Microsoft Azure a través de la integración de Azure Databricks. [5]

En junio de 2020, Databricks adquirió Redash, una herramienta de código abierto diseñada para ayudar a los científicos y analistas de datos a visualizar y crear paneles interactivos de sus datos. [6]

En febrero de 2021, junto con Google Cloud , Databricks proporcionó integración con Google Kubernetes Engine y la plataforma BigQuery de Google . [7] Fortune clasificó a Databricks como uno de los mejores "lugares de trabajo para Millennials" grandes en 2021. [8] En ese momento, la compañía dijo que más de 5000 organizaciones utilizaban sus productos. [9]

En agosto de 2021, Databricks finalizó su octava ronda de financiación recaudando 1.600 millones de dólares y valorando la empresa en 38.000 millones de dólares. [10]

En octubre de 2021, Databricks realizó su segunda adquisición de la empresa alemana sin código 8080 Labs. 8080 Labs crea Bamboolib, una herramienta de exploración de datos que no requiere codificación para su uso. [11]

En respuesta a la popularidad de ChatGPT de OpenAI , en marzo de 2023, la compañía introdujo un modelo de lenguaje de código abierto , llamado Dolly en honor a la oveja Dolly , que los desarrolladores podían usar para crear sus propios chatbots . Su modelo utiliza menos parámetros para producir resultados similares a los de ChatGPT, pero Databricks no había publicado pruebas de referencia formales para mostrar si su bot realmente igualaba el rendimiento de ChatGPT. [12] [13] [14]

Databricks adquirió la startup de seguridad de datos Okera en mayo de 2023 para ampliar sus capacidades de gobernanza de datos. [15] Al mes siguiente, adquirió MosaicML, una startup de inteligencia artificial generativa de código abierto, por 1.400  millones de dólares. [16] [17]

En octubre de 2023, Databricks adquirió la startup de replicación de datos Arcion por 100 millones de dólares. [18]

Fondos

En septiembre de 2013, Databricks anunció que había recaudado 13,9 millones de dólares de Andreessen Horowitz y dijo que su objetivo era ofrecer una alternativa al sistema MapReduce de Google . [19] [20] Microsoft fue un destacado inversor de Databricks en 2019 y participó en la Serie E de la compañía por una cantidad no especificada. [21] [22] La empresa ha recaudado 1.900 millones de dólares en financiación, incluida una Serie G de 1.000 millones de dólares liderada por Franklin Templeton con una valoración posterior al dinero de 28.000 millones de dólares en febrero de 2021. Otros inversores incluyen Amazon Web Services , CapitalG (una firma de capital de crecimiento bajo Alphabet Inc. ) y Salesforce Ventures . [9]

Productos

Databricks desarrolla y vende una plataforma de datos en la nube utilizando el término de marketing "lakehouse", un acrónimo basado en los términos " almacén de datos " y " lago de datos ". [31] Lakehouse de Databricks se basa en el marco de código abierto Apache Spark que permite consultas analíticas en datos semiestructurados sin un esquema de base de datos tradicional . [32] En octubre de 2022, Lakehouse recibió el estatus de autorización de FedRAMP para su uso con el gobierno federal de EE. UU. y contratistas. [33]

Delta Engine de Databricks se lanzó en junio de 2020 como un nuevo motor de consultas que se superpone a Delta Lake para mejorar el rendimiento de las consultas. [34] Es compatible con Apache Spark y MLflow, que también son proyectos de código abierto que los empleados de Databricks ayudaron a crear. [35]

En noviembre de 2020, Databricks presentó Databricks SQL (anteriormente conocido como SQL Analytics) para ejecutar informes de análisis e inteligencia empresarial sobre lagos de datos. Los analistas pueden consultar conjuntos de datos directamente con SQL estándar o utilizar conectores de productos para integrarlos directamente con herramientas de inteligencia empresarial como Tableau , Qlik , SigmaComputing, Looker y ThoughtSpot . [36]

Databricks ofrece una plataforma para otras cargas de trabajo, incluido el aprendizaje automático, el almacenamiento y procesamiento de datos, el análisis de transmisión y la inteligencia empresarial. [37]

La empresa también ha creado Delta Lake, MLflow y Koalas, proyectos de código abierto que abarcan ingeniería de datos , ciencia de datos y aprendizaje automático . [38] Además de construir la plataforma Databricks, la compañía ha coorganizado cursos masivos abiertos en línea sobre Spark [39] y una conferencia para la comunidad Spark llamada Data + AI Summit, [40] anteriormente conocida como Spark Summit.

Operaciones

Databricks tiene su sede en San Francisco . [41] También tiene operaciones en Canadá , Reino Unido , Países Bajos , Singapur , Australia , Alemania , Francia , Japón , China , Corea del Sur , India , Brasil , Suiza , Costa Rica y Serbia . [42]

Referencias

  1. ^ ab Loten, Angus (5 de agosto de 2022). "Databricks dice que ha superado los mil millones de dólares en ingresos anualizados". El periodico de Wall Street . Archivado desde el original el 5 de agosto de 2022.
  2. ^ Dwoskin, Elizabeth (9 de junio de 2016). "Aquí es donde tiene lugar la verdadera acción de la inteligencia artificial". El Correo de Washington . Consultado el 16 de agosto de 2016 .
  3. ^ "Databricks lanza Delta Lake, un proyecto de confiabilidad de lago de datos de código abierto". VentureBeat . 2019-04-24 . Consultado el 6 de abril de 2021 .
  4. ^ Zaharia, Matei. «Matei Zaharia» . Consultado el 16 de agosto de 2016 .
  5. ^ "Microsoft convierte a Databricks en un servicio propio en Azure". TechCrunch . 15 de noviembre de 2017 . Consultado el 6 de abril de 2021 .[ enlace muerto permanente ]
  6. ^ "Databricks adquiere Redash, un servicio de visualización para científicos de datos". TechCrunch . 24 de junio de 2020 . Consultado el 6 de abril de 2021 .[ enlace muerto permanente ]
  7. ^ "Databricks lleva su casa del lago a Google Cloud". TechCrunch . 17 de febrero de 2021 . Consultado el 18 de febrero de 2021 .[ enlace muerto permanente ]
  8. ^ "Los 100 mejores lugares de trabajo grandes para los millennials". Fortuna . 16 de junio de 2021 . Consultado el 16 de julio de 2021 .
  9. ^ ab Konrad, Alex (2 de febrero de 2021). "Databricks recauda mil millones de dólares con una valoración de 28 mil millones de dólares, con la élite de la nube participando". Forbes . Consultado el 29 de julio de 2021 .
  10. ^ Mellor, Chris (1 de septiembre de 2021). "Databricks genera un lago de datos en efectivo con una valoración monstruosa de 380.000 millones de dólares". Bloques y archivos . Consultado el 4 de septiembre de 2021 .
  11. ^ Eric Rosenbaum (6 de octubre de 2021). "Databricks, la nueva empresa de software de 38.000 millones de dólares, realiza una adquisición para dejar el código atrás". CNBC . Consultado el 20 de febrero de 2022 .
  12. ^ Hu, Krystal; Nellis, Stephen (24 de marzo de 2023). "Databricks impulsa el chatbot de código abierto como una alternativa ChatGPT más económica". Reuters . Archivado desde el original el 25 de marzo de 2023.
  13. ^ Loften, Angus (24 de marzo de 2023). "Databricks lanza 'Dolly', otro rival de ChatGPT" . El periodico de Wall Street . Archivado desde el original el 24 de marzo de 2023.
  14. ^ Goldman, Sharon (24 de marzo de 2023). "Databricks presenta Dolly similar a ChatGPT, un clon que cualquier empresa puede poseer". VentureBeat . Archivado desde el original el 11 de abril de 2023.
  15. ^ Palazzolo, Stephanie (3 de mayo de 2023). "Exclusivo: Databricks, el favorito de los datos y la inteligencia artificial por valor de 38 mil millones de dólares, adquiere la startup de seguridad Okera" . Business Insider . Archivado desde el original el 3 de mayo de 2023.
  16. ^ Datta, Tiyashi; Hu, Krystal (26 de junio de 2023). "Databricks llega a un acuerdo por 1.300 millones de dólares para la startup de inteligencia artificial generativa MosaicML". Reuters .
  17. ^ Consejo, Stephen (26 de junio de 2023). "La empresa de tecnología de SF Databricks comprará una startup de 2 años por 21 millones de dólares por empleado". PUERTA SF .
  18. ^ "Después de una valoración de 43.000 millones de dólares, Databricks adquiere la startup de replicación de datos Arcion por 100 millones de dólares". TechCrunch . 2023-10-23 . Consultado el 23 de octubre de 2023 .
  19. ^ ab Harris, Derrick (25 de septiembre de 2013). "Databricks recauda 14 millones de dólares de Andreessen Horowitz y quiere enfrentarse a MapReduce con Spark". Archivado desde el original el 15 de enero de 2022 . Consultado el 28 de septiembre de 2014 .
  20. ^ Lorica, Ben (25 de septiembre de 2013). "Databricks tiene como objetivo crear herramientas analíticas de próxima generación para Big Data". Medios O'Reilly . Consultado el 28 de septiembre de 2014 .
  21. ^ "Databricks recauda 250 millones de dólares con una valoración de 2,750 millones de dólares para su plataforma de análisis". TechCrunch . 5 de febrero de 2019 . Consultado el 8 de abril de 2021 .[ enlace muerto permanente ]
  22. ^ Novet, Jordania (5 de febrero de 2019). "Microsoft solía asustar a las empresas emergentes, pero ahora es un 'socio extraordinariamente bueno', dice el inversor de Silicon Valley Ben Horowitz". CNBC . Consultado el 6 de abril de 2021 .
  23. ^ Miller, Ron (30 de junio de 2014). "Databricks obtiene 33 millones de dólares en la serie B y estrena plataforma en la nube para procesar big data". TechCrunch . Consultado el 28 de septiembre de 2014 .
  24. ^ Shieber, Jonathan (15 de diciembre de 2016). "Databricks recauda 60 millones de dólares para ser el próximo gran paso adelante del big data". TechCrunch . Consultado el 16 de diciembre de 2016 .
  25. ^ "Databricks obtiene 140 millones de dólares para acelerar el análisis y la inteligencia artificial en la empresa". Ladrillos de datos . 22 de agosto de 2017 . Consultado el 16 de mayo de 2019 .
  26. ^ "La financiación de 250 millones de dólares de Databricks respalda un crecimiento explosivo y la demanda global de análisis unificados; eleva la valoración a 2,750 millones de dólares". Ladrillos de datos . 5 de febrero de 2019 . Consultado el 5 de febrero de 2019 .
  27. ^ "Databricks anuncia una ronda de 400 millones de dólares con una valoración de 6.200 millones de dólares a medida que la plataforma de análisis continúa creciendo". TechCrunch . 22 de octubre de 2019 . Consultado el 24 de octubre de 2019 .[ enlace muerto permanente ]
  28. ^ "Databricks recauda mil millones de dólares con una valoración de 28 mil millones de dólares y alcanza un ARR de 425 millones de dólares". Crisis tecnológica . febrero de 2021 . Consultado el 14 de febrero de 2021 .
  29. ^ "Databricks recauda 1.600 millones de dólares con una valoración de 38.000 millones de dólares y supera los 600 millones de dólares ARR". Crisis tecnológica . Consultado el 1 de julio de 2021 .
  30. ^ Nishant, Niket; Hu, Krystal (14 de septiembre de 2023). "Databricks recauda más de 500 millones de dólares con una valoración de 43 mil millones de dólares". Reuters . Consultado el 20 de septiembre de 2023 .
  31. ^ Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (enero de 2021). "Lakehouse: una nueva generación de plataformas abiertas que unifican el almacenamiento de datos y el análisis avanzado" (PDF) . Conferencia sobre investigación de sistemas de datos innovadores . Consultado el 29 de julio de 2021 .
  32. ^ "Con una infusión masiva de mil millones de dólares, Databricks apunta a la OPI y a su rival Snowflake". ÁNGULO de silicio . 2021-02-01 . Consultado el 8 de abril de 2021 .
  33. ^ Simone, Stephanie (17 de octubre de 2022). "Databricks alcanza el estado autorizado por FedRAMP". KMWorld . Información hoy . Consultado el 20 de octubre de 2022 .
  34. ^ "Databricks mejora el rendimiento de Delta Lake y consigue Redash para SQL Viz". Datanami . 2020-06-24 . Consultado el 8 de abril de 2021 .
  35. ^ "Databricks lanza Delta Lake, un proyecto de confiabilidad de lago de datos de código abierto". VentureBeat . 2019-04-24 . Consultado el 8 de abril de 2021 .
  36. ^ "Databricks lanza SQL Analytics". TechCrunch . 12 de noviembre de 2020 . Consultado el 8 de abril de 2021 .[ enlace muerto permanente ]
  37. ^ Brust, Andrés. "Databricks, campeón del modelo de" casa del lago "de datos, cierra una ronda de financiación serie G de mil millones de dólares". ZDNet . Consultado el 8 de abril de 2021 .
  38. ^ "Índice de código abierto de Two Sigma Ventures". Dos empresas Sigma . Consultado el 8 de abril de 2021 .
  39. ^ "Databricks para ejecutar dos cursos masivos en línea sobre Apache Spark". Ladrillos de datos . 2014-12-02 . Consultado el 16 de diciembre de 2016 .
  40. ^ "Cumbre Datos + IA". Ladrillos de datos . Consultado el 8 de abril de 2021 .
  41. ^ personal, CNBC com (16 de junio de 2020). "36. Ladrillos de datos". CNBC . Consultado el 8 de abril de 2021 .
  42. ^ "Ubicaciones en todo el mundo" . Consultado el 20 de octubre de 2022 .