什麼是資料倉庫資料倉庫的組成

General 更新 2024年11月24日

  資料倉庫是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個數據儲存,出於分析性報告和決策支援目的而建立。那麼你對資料倉庫瞭解多少呢?以下是由小編整理關於什麼是資料倉庫的內容,希望大家喜歡!

  資料倉庫的特點

  1、資料倉庫是面向主題的;操作型資料庫的資料組織面向事務處理任務,而資料倉庫中的資料是按照一定的主題域進行組織。主題是指使用者使用資料倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型資訊系統相關。

  2、資料倉庫是整合的,資料倉庫的資料有來自於分散的操作型資料,將所需資料從原來的資料中抽取出來,進行加工與整合,統一與綜合之後才能進入資料倉庫;

  資料倉庫中的資料是在對原有分散的資料庫資料抽取、清理的基礎上經過系統加工、彙總和整理得到的,必須消除源資料中的不一致性,以保證資料倉庫內的資訊是關於整個企業的一致的全域性資訊。

  資料倉庫的資料主要供企業決策分析之用,所涉及的資料操作主要是資料查詢,一旦某個資料進入資料倉庫以後,一般情況下將被長期保留,也就是資料倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、重新整理。

  資料倉庫中的資料通常包含歷史資訊,系統記錄了企業從過去某一時點如開始應用資料倉庫的時點到當前的各個階段的資訊,通過這些資訊,可以對企業的發展歷程和未來趨勢做出定量分析和預測。

  3、資料倉庫是不可更新的,資料倉庫主要是為決策分析提供資料,所涉及的操作主要是資料的查詢;

  4、資料倉庫是隨時間而變化的,傳統的關係資料庫系統比較適合處理格式化的資料,能夠較好的滿足商業商務處理的需求。穩定的資料以只讀格式儲存,且不隨時間改變。

  5、彙總的。操作性資料對映成決策可用的格式。

  6、大容量。時間序列資料集合通常都非常大。

  7、非規範化的。Dw資料可以是而且經常是冗餘的。

  8、元資料。將描述資料的資料儲存起來。

  9、資料來源。資料來自內部的和外部的非整合作業系統。

  資料倉庫,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它並不是所謂的“大型資料庫”。資料倉庫的方案建設的目的,是為前端查詢和分析作為基礎,由於有較大的冗餘,所以需要的儲存也較大。

  資料倉庫的體系結構

  資料來源

  是資料倉庫系統的基礎,是整個系統的資料來源泉。通常包括企業內部資訊和外部資訊。內部資訊包括存放於RDBMS中的各種業務處理資料和各類文件資料。外部資訊包括各類法律法規、市場資訊和競爭對手的資訊等等;

  資料的儲存與管理

  是整個資料倉庫系統的核心。資料倉庫的真正關鍵是資料的儲存和管理。資料倉庫的組織管理方式決定了它有別於傳統資料庫,同時也決定了其對外部資料的表現形式。要決定採用什麼產品和技術來建立資料倉庫的核心,則需要從資料倉庫的技術特點著手分析。針對現有各業務系統的資料,進行抽取、清理,並有效整合,按照主題進行組織。資料倉庫按照資料的覆蓋範圍可以分為企業級資料倉庫和部門級資料倉庫通常稱為資料集市。

  OLAP伺服器

  對分析需要的資料進行有效整合,按多維模型予以組織,以便進行多角度、多層次的分析,並發現趨勢。其具體實現可以分為:ROLAP關係型線上分析處理、MOLAP多維線上分析處理和HOLAP混合型線上分析處理。ROLAP基本資料和聚合資料均存放在RDBMS之中;MOLAP基本資料和聚合資料均存放於多維資料庫中;HOLAP基本資料存放於RDBMS之中,聚合資料存放於多維資料庫中。

  前端工具

  主要包括各種報表工具、查詢工具、資料分析工具、資料探勘工具以資料探勘及各種基於資料倉庫或資料集市的應用開發工具。其中資料分析工具主要針對OLAP伺服器,報表工具、資料探勘工具主要針對資料倉庫。

  資料倉庫的組成

  資料抽取工具

  把資料從各種各樣的儲存方式中拿出來,進行必要的轉化、整理,再存放到資料倉庫內。對各種不同資料儲存方式的訪問能力是資料抽取工具的關鍵,應能生成COBOL程式、MVS作業控制語言JCL、UNIX指令碼、和SQL語句等,以訪問不同的資料。資料轉換都包括,刪除對決策應用沒有意義的資料段;轉換到統一的資料名稱和定義;計算統計和衍生資料;給缺值資料賦給預設值;把不同的資料定義方式統一。

  資料庫

  是整個資料倉庫環境的核心,是資料存放的地方和提供對資料檢索的支援。相對於操縱型資料庫來說其突出的特點是對海量資料的支援和快速的檢索技術。

  元資料

  元資料是描述資料倉庫內資料的結構和建立方法的資料。可將其按用途的不同分為兩類,技術元資料和商業元資料。

  技術元資料是資料倉庫的設計和管理人員用於開發和日常管理資料倉庫使用的資料。包括:資料來源資訊;資料轉換的描述;資料倉庫內物件和資料結構的定義;資料清理和資料更新時用的規則;源資料到目的資料的對映;使用者訪問許可權,資料備份歷史記錄,資料匯入歷史記錄,資訊釋出歷史記錄等。

  商業元資料從商業業務的角度描述了資料倉庫中的資料。包括:業務主題的描述,包含的資料、查詢、報表;

  元資料為訪問資料倉庫提供了一個資訊目錄informationdirectory,這個目錄全面描述了資料倉庫中都有什麼資料、這些資料怎麼得到的、和怎麼訪問這些資料。是資料倉庫執行和維護的中心,資料倉庫伺服器利用他來存貯和更新資料,使用者通過他來了解和訪問資料。

  資料集市

  為了特定的應用目的或應用範圍,而從資料倉庫中獨立出來的一部分資料,也可稱為部門資料或主題資料subjectarea。在資料倉庫的實施過程中往往可以從一個部門的資料集市著手,以後再用幾個資料集市組成一個完整的資料倉庫。需要注意的就是在實施不同的資料集市時,同一含義的欄位定義一定要相容,這樣在以後實施資料倉庫時才不會造成大麻煩。

  國外知名的Garnter關於資料集市產品報告中,位於第一象限的敏捷商業智慧產品有QlikView, Tableau和SpotView,都是全記憶體計算的資料集市產品,在大資料方面對傳統商業智慧產品巨頭形成了挑戰。國內BI產品起步較晚,知名的敏捷型商業智慧產品有PowerBI, 永洪科技的Z-Suite,SmartBI,FineBI商業智慧軟體等,其中永洪科技的Z-Data Mart是一款熱記憶體計算的資料集市產品。國內的德昂資訊也是一家資料集市產品的系統整合商。

  資料倉庫管理

  安全和特權管理;跟蹤資料的更新;資料質量檢查;管理和更新元資料;審計和報告資料倉庫的使用和狀態;刪除資料;複製、分割和分發資料;備份和恢復;儲存管理。

  資訊釋出系統

  把資料倉庫中的資料或其他相關的資料傳送給不同的地點或使用者。基於Web的資訊釋出系統是對付多使用者訪問的最有效方法。

  訪問工具

  為使用者訪問資料倉庫提供手段。有資料查詢和報表工具;應用開發工具;管理資訊系統EIS工具;線上分析OLAP工具;資料探勘工具。

資料倉庫的組成“的人還:

什麼是授權授權的程式
什麼是情感性精神病情感性精神病的治療
相關知識
什麼是臨床路徑臨床路徑的組成要素
什麼是數控機床數控機床的組成
什麼是市場環境市場環境的組成要素
什麼是壟斷企業壟斷企業的形成原因
什麼是用電負荷用電負荷的構成特點
什麼是肇事逃逸肇事逃逸的構成
什麼是敬業精神敬業精神的構成
什麼是群體意識群體意識的形成條件
什麼是股權結構股權結構的形成
什麼是侵權行為侵權行為的構成要件