data base

中科永聯高級技術培訓中心(www.itisedu.com)

data base,簡稱DB資料庫)是依照某種數據模型組織起來並存放二級存儲器中的數據集合。這種數據集合具有如下特點:儘可能不重複,以最優方式為某個特定組織的多種套用服務,其數據結構獨立於使用它的套用程式,對數據的增、刪、改和檢索由統一軟體進行管理和控制。從發展的歷史看,資料庫是數據管理的高級階段,它是由檔案管理系統發展起來的。

資料庫的基本結構分三個層次,反映了觀察資料庫的三種不同角度。

(1)物理數據層。它是資料庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字元和字組成。

(2)概念數據層。它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯繫,是存貯記錄的集合。它所涉及的是資料庫所有對象的邏輯關係,而不是它們的物理情況,是資料庫管理員概念下的資料庫。

(3)邏輯數據層。它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。

資料庫不同層次之間的聯繫是通過映射進行轉換的。資料庫具有以下主要特點:

(1)實現數據共享。數據共享包含所有用戶可同時存取資料庫中的數據,也包括用戶可以用各種方式通過接口使用資料庫,並提供數據共享。

(2)減少數據的冗餘度。同檔案系統相比,由於資料庫實現了數據共享,從而避免了用戶各自建立套用檔案。減少了大量重複數據,減少了數據冗餘,維護了數據的一致性。

(3)數據的獨立性。數據的獨立性包括資料庫中資料庫的邏輯結構和應用程式相互獨立,也包括數據物理結構的變化不影響數據的邏輯結構。

(4)數據實現集中控制。檔案管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其檔案之間毫無關係。利用資料庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯繫。

(5)數據一致性和可維護性,以確保數據的安全性和可靠性。主要包括:
①安全性控制:以防止數據丟失、錯誤更新和越權使用;
②完整性控制:保證數據的正確性、有效性和相容性;
③並發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常互動作用;
④故障的發現和恢復:由資料庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞

資料庫邏輯設計
資料庫邏輯設計分為三個階段,分別是:收集和分析用戶要求、建立E -R 模型和資料庫模式設計。主要任務是創建資料庫模式。

資料庫邏輯設計中的第一階段收集和分析用戶需求是按以下四步進行的:分析用戶活動,確定系統範圍,分析用戶活動所涉及的數據和分析系統數據。

數據流圖是一種從數據和對數據的加工兩方面表達系統工作過程的圖形表示法。含有四種基本成分:帶箭頭的線段表示數據及其流動方向,圓形框表示對數據的加工,卡片形框表示檔案,方框表示源點和終點。

畫數據流圖應遵循:由外向內、自頂向下原則進行。

資料庫系統的生命期可以分為五個階段,依次是分析、設計、編碼、測試、運行。

所謂分析用戶活動所涉及的數據就是以數據流圖的形式表示出數據的流向和對數據所分析系統數據就是對數據流圖中的每一個數據流名、每個檔案名稱、每個加工名,都要給出具體定義,都需要用一個條目進行描述。描述後的產物是數據字典。數據流圖和數據字典結合在一起,加上必要的說明構成系統說明書。數據字典是對數據流圖中的四個成分(數據流、數據項、檔案、加工)的描述。

教材中所講的資料庫設計方法稱為視圖設計法,即從分析用戶的活動入手,針對用戶的局部視圖,然後進行綜合,用E-R 圖表示資料庫的概念,進而轉換為關係模式。

邏輯設計第二階段建立E-R 模型分兩步,首先應進行局部E -R 模型設計,然後進行總體E -R 模型的設計。

邏輯設計第三階段在資料庫模式設計階段分兩步進行,第一步初步設計:把E -R 圖轉換為關係模型,第二步最佳化設計:對模式進行調整和改善。

最佳化是在性能預測的基礎上進行的,一般用三方面指標來衡量:1 、單位時間內所訪問的邏輯記錄個數要少,2 、單位時間內數據傳送量要少;3 、系統占用的存儲空間儘量要少。

資料庫系統的功能和特徵


  資料庫系統由文卷系統發展而來。與文卷系統相比,這種系統具有數據、體系和控制三個方面的主要特徵。

數據特徵
  在文卷系統中雖然 程式 與 數據 之間可用存取方法進行轉換,但 文卷 還是與應用程式對應的,即數據仍面向套用(圖1)。每一套用各自建立自己的一組文卷。不同的套用若涉及相同的數據,則這些數據分別納入各自的文卷之中。文卷的各種記錄之間沒有建立聯繫,因而數據冗餘度大。增加新的套用,必須同時增加新的文卷。因此,文卷系統中的文卷是無結構的、不易擴充的信息集合。資料庫則不僅描述數據本身,而且描述數據之間的聯繫。它的 數據結構 反映了某一部門的整體信息結構,數據冗餘度小、易於擴充新的套用,因而是面向數據總體結構的信息集合,可為多個用戶共享。

體系特徵
 一切數據都有邏輯和物理兩個側面。在資料庫系統中,數據邏輯結構的描述稱為邏輯模式。邏輯模式又分為描述全局邏輯結構的全局模式(簡稱模式)和描述某些套用所涉及的局部邏輯結構的子模式。數據物理結構的描述稱為存儲模式。這兩種模式總稱為資料庫模式。資料庫系統的體系結構如圖2。

資料庫系統中,用戶根據子模式編製程序。子模式與模式、模式與存儲模式之間有軟體進行映射。因此,程式與數據之間具有兩級獨立性:物理獨立性和邏輯獨立性。數據的存儲模式改變,而模式可以不改變,因而不必改寫應用程式,這稱為物理獨立性。模式改變時,子模式可能不改變,也就不必改寫應用程式,這稱為邏輯獨立性。由於資料庫系統具備比較高的程式與數據的獨立性,可以使程式設計師在編制應用程式時集中精力考慮算法邏輯,不必過問物理細節,而且可以大大減少應用程式維護的工作量。

控制特徵
  資料庫數據數量龐大,結構複雜,又為多個用戶所共享。因此,必須由資料庫管理系統在定義、建立、運行以及維護時進行統一管理和控制,以保證資料庫數據的安全性、完整性和並發操作的一致性。此外,還必須有資料庫管理員專門負責對資料庫的管理、控制監督和改進。

由於資料庫系統具有上述特徵,它的出現使信息系統的研製從圍繞加工數據的程式為中心,轉變到圍繞共享的資料庫來進行。這便於數據的集中管理,有利於應用程式的研製和維護。數據減少了冗餘度和提高了相容性,從而提高了作出決策的相容性。因此,大型複雜的信息系統大多以資料庫為核心,資料庫系統在 計算機套用 中起著越來越重要的作用。

研究課題  資料庫研究的課題,主要涉及三個領域。

資料庫管理系統軟體的研製
  DBMS是資料庫系統的基礎。研製DBMS的基本目標,是擴大功能,提高性能和可用性,從而提高用戶的生產率。70年代以來,研製的重點是探索關係資料庫管理系統的設計,內容包括關係數據語言、查詢最佳化、並發控制和系統性能等。另一課題是對DBMS標準化的研究,即研究一個統一的DBMS體系結構的規範。

資料庫設計
  這是在計算機系統具有的資料庫管理系統的基礎上,按照套用要求以及計算機系統所提供的數據模型和功能,設計一個結構良好、使用方便、效率較高的,以資料庫為核心的套用信息系統。這一領域主要的研究課題,是資料庫設計方法學和設計工具的探索。例如,運用 軟體工程 的方法和工具指導 資料庫設計 ;研究資料庫設計各個階段中完備的方法和工具;以 關係資料庫 的規範化理論為指南進行資料庫邏輯設計等。

資料庫理論
  主要研究關係資料庫理論。關係資料庫理論研究的意義,一方面在於它為資料庫學科奠定了理論基礎;另一方面它為資料庫設計提供了判別標準,從而成為資料庫設計的有力指南。研究的主要內容是關係的規範化理論。關係規範化理論已套用於資料庫設計的各個階段。

發展

資料庫技術是 計算機科學 中發展最快的領域之一,新的領域越來越多。

分散式資料庫系統
  隨著70年代後期 分布計算機系統 的發展,相應地研究成功分散式資料庫系統。分散式資料庫系統是一個在邏輯上完整,而在物理上分散在若干台互相連線的結點機上的資料庫系統。它既具有分布性又具有資料庫的綜合性。這是資料庫系統發展的一個重要方向。分散式資料庫系統結構複雜,其中最複雜的是分散式資料庫管理系統

資料庫機器
  新的計算機系統的體系結構。它把由 中央處理器 包辦的資料庫操作分散給一些局部的部件來執行,或轉移到一個與主計算機相連的專用計算機去執行,以提高並行性。資料庫機器的發展,包括智慧型控制器和存儲器,專用處理機和 資料庫計算機 。

資料庫語義模型
  資料庫的數據模型基本上屬於語法模型,語義體現很不完備,不能明顯地含有現實世界的意義。因此,用戶只能按照DBMS所提供的數據操縱語言訪問資料庫。語義模型能準確地描述現實世界中某個部門的信息集合及其意義,使用戶能基於對現實世界的認識或用類似於自然語言的形式來訪問資料庫。這方面的研究已發展為數據語義學。

資料庫智慧型檢索
  資料庫技術和人工智慧相結合,根據資料庫中的事實和知識進行推理,演繹出正確答案,這就是資料庫的智慧型檢索。這涉及到自然語言用戶接口、邏輯演繹功能和資料庫語義模型等問題,如70年代末所開始的知識庫管理系統和演繹資料庫的研究。

辦公室自動化系統中的資料庫
  研究在 辦公室自動化 系統中資料庫技術的套用,其中主要研究對各種非格式化數據如圖像、聲音、正文的處理,以及面向端點用戶的高級語言接口。

相關詞條

相關搜尋

熱門詞條

聯絡我們