[6] En su estudio sobre los lagos de datos observaron que las empresas estaban «empezando a extraer datos y colocarlos para su análisis en un único repositorio basado en Hadoop».
Hortonworks, Google, Oracle, Microsoft, Zaloni, Teradata, Impetus Technologies, Cloudera, MongoDB y Amazon Web Services ya usaban el término en 2016.
[7] Muchas empresas usan servicios de almacenamiento en la nube como Google Cloud Storage o Amazon S3 o un sistema de archivos distribuido como el Hadoop Distributed File System (HDFS).
[9] Un anterior lago de datos (Hadoop 1.0) tenía capacidades limitadas con su procesamiento por lotes MapReduce.
Otra crítica del término «lago de datos» es que no es útil porque es usado con muchos sentidos diferentes.