什麼是資料湖?
General 更新 2022年9月13日
資料湖是一個集中式儲存庫,是一種以原生格式儲存各種大型原始資料集的資料庫,它允許以任意規模儲存所有結構化和非結構化資料。資料湖的概念最初是由大資料廠商提出的,表面上看,資料都是承載在基於可向外擴充套件的HDFS廉價儲存硬體之上的。
什麼是資料湖
資料湖的一部分價值是把不同種類的資料匯聚到一起,另一部分價值是不需要預定義的模型就能進行資料分析。
在商業智慧和資料倉庫還沒有被淘汰的今天,大資料分析和大資料湖正在向更多型別的實時智慧服務發展,這些實時的智慧服務可以支援實時的決策制定。
使用資料湖能夠在更短的時間內從更多來源利用更多資料,並使使用者能夠以不同方式協同處理和分析資料,從而做出更好、更快的決策。