資料倉儲

in in in

簡介

數據倉庫是一種資訊系統的資料儲存理論,此理論強調利用某些特殊資料儲存方式,讓所包含的資料,特別有利於分析處理,以產生有價值的資訊並依此作決策。
利用數據倉庫方式所存放的資料,具有一但存入,便不隨時間而更動的特性,同時存入的資料必定包含時間屬性,通常一個數據倉庫皆會含有大量的歷史性資料,並利用特定分析方式,自其中發掘出特定資訊。

數據倉庫的特性

主題導向(Subject-Oriented)
有別於一般OLTP系統,數據倉庫的資料模型設計,著重將資料按其意義歸類至相同的主題區(subject area),因此稱為主題導向。舉例如Party、Arrangement、Event、Product等。
集成性(Integrated)
資料來自企業各OLTP系統,在數據倉庫中是集成過且一致的。
時間差異性(Time-Variant)
資料的變動,在數據倉庫中是能夠被紀錄以及追蹤變化的,有助於能反映出能隨著時間變化的資料軌跡。
不變動性(Nonvolatile)
資料一旦確認寫入後是不會被取代或刪除的,即使資料是錯誤的亦同。(i.e.錯誤的後續修正,便可因上述時間差異性的特性而被追蹤)

ODS、數據倉庫和資料超市之異同

Operational data store(ODS)、數據倉庫和資料超市三者相同之處在於均不屬於任一OLTP系統,並且都是以資料導向的設計而非流程(process)導向。
相異之處在於,ODS的特性較著重於戰術性查詢,變動性大。數據倉庫通常為企業層級,用來解答即興式、臨時性的問題。而資料超市則較偏向解決特定單位或部門的問題,部分採用維度模型(dimensional model)。

數據挖掘、OLAP和數據倉庫

數據倉庫可以作為數據挖掘和OLAP等分析工具的資料來源,由於存放於數據倉庫中的資料,必需經過篩選與轉換,因此可以避免分析工具使用錯誤的資料,而得到不正確的分析結果。
數據挖掘和OLAP同為分析工具,其差別在於OLAP提供用戶一便利的多維度觀點和方法,以有效率的對資料進行複雜的查詢動作,其預設查詢條件由用戶預先設定,而數據挖掘,則能由資訊系統主動發掘資料來源中,未曾被查覺的隱藏資訊,和透過用戶的認知以產生知識。
數據挖掘(Data Mining)技術是經由自動或半自動的方法探勘及分析大量的資料,以創建有效的模型及規則,而企業透過數據挖掘更了解他們的客戶,進而改進他們的行銷、業務及客服的運作。 數據挖掘是數據倉庫的一種重要運用。基本上,它是用來將你的資料中隱藏的資訊挖掘出來,所以 Data Mining 其實是所謂的 Knowledge Discovery 的一部份,Data Mining 使用了許多統計分析與 Modeling 的方法,到資料中尋找有用的特徵(Patterns)以及關連性(Relationships)。 Knowledge Discovery 的過程對 Data Mining 的套用成功與否有重要的影響,只有它才能確保 Data Mining 能獲得有意義的結果。

相關詞條

熱門詞條

聯絡我們