數據湖是一個集中式存儲庫,是一種以原生格式存儲各種大型原始數據集的數據庫,它允許以任意規模存儲所有結構化和非結構化數據。數據湖的概念最初是由大數據廠商提出的,表面上看,數據都是承載在基於可向外擴展的HDFS廉價存儲硬件之上的。

數據湖的一部分價值是把不同種類的數據匯聚到一起,另一部分價值是不需要預定義的模型就能進行數據分析。
在商業智能和數據倉庫還沒有被淘汰的今天,大數據分析和大數據湖正在向更多類型的實時智能服務發展,這些實時的智能服務可以支持實時的決策制定。
使用數據湖能夠在更短的時間內從更多來源利用更多數據,並使用戶能夠以不同方式協同處理和分析數據,從而做出更好、更快的決策。