數據存取數據通道

數據存取數據通道(Data access in data channel)是指建立了與主機連線的磁碟數據通道模型的外存數據的快速存取技術。數據存儲對象包括數據流在加工過程中產生的臨時檔案或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。由磁碟系統的通道模型可知,提高位密度和主軸轉速增大Tp、縮短找道時間以增大a等都是提高有效傳輸率的重要途徑

數據儲蓄

簡介

數據存儲對象包括數據流在加工過程中產生的臨時檔案或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特徵的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特徵;數據存儲反映系統中靜止的數據,表現出靜態數據的特徵。

存儲介質

磁碟和磁帶都是常用的存儲介質。數據存儲組織方式因存儲介質而異。在磁帶上數據僅按順序檔案方式存取;在磁碟上則可按使用要求採用順序存取或直接存取方式。數據存儲方式與數據檔案組織密切相關,其關鍵在於建立記錄的邏輯與物理順序間對應關係,確定存儲地址,以提高數據存取速度。

三類存儲方式

DAS

DAS(Direct Attached Storage)直接附加存儲方式與我們普通的PC存儲架構一樣,外部存儲設備都是直接掛接在伺服器內部匯流排上,數據存儲設備是整個伺服器結構的一部分。

NAS

NAS(Network Attached Storage)數據存儲方式全面改進了以前低效的DAS存儲方式。它採用獨立於伺服器,單獨為網路數據存儲而開發的一種檔案伺服器來連線所存儲設備,自形成一個網路。這樣數據存儲就不再是伺服器的附屬,而是作為獨立網路節點而存在於網路之中,可由所有的網路用戶共享。

SAN

1991年,IBM公司在S/390伺服器中推出了ESCON(Enterprise System Connection)技術。它是基於光纖介質,最大傳輸速率達17MB/s的伺服器訪問存儲器的一種連線方式。在此基礎上,進一步推出了功能更強的ESCON Director(FC SWitch),構建了一套最原始的SAN系統。

磁碟數據通道

無論是大型機的專用I/O處理機、存儲通道部件還是小型機的存取伺服器乃至微型機的磁碟控制器或適配器,磁碟數據通道的最基本功能是管理磁碟的數據存取。因而我們可將其抽象為如下的數據通道模型。如附圖所示,它由主連線通道Host channel、緩衝部件Buffer或Cache及連線驅動器設備通道Device channel組成。其中T。是驅動器讀寫所能提供的最大傳輸率(峰值傳輸率)、T是磁碟系統回響主機系統讀寫請求過程中所能提供的傳輸率,它是一段時間內的平均值。

這裡,為簡化分析,假定主通道和設備通道容量很大,足以維持最大傳輸率傳送數據,以便著重討論磁碟系統的關鍵技術問題。

由於磁碟驅動器的數據信息是三維(扇段號,柱面號,頭號)分布的,在找道和旋轉等待期間不能傳送數據,加之數據塊域附有地址標誌、ECC域,和各域間的間隙,故扇段數據塊傳送峰值之間都有一段空隙。單通道的平均數據傳輸率可表示為:

數據存取數據通道 數據存取數據通道
數據存取數據通道 數據存取數據通道
數據存取數據通道 數據存取數據通道

式中,、分別為平均找道時間和平均旋轉等待時間,B,T分別為扇段的位元組數和讀寫時間,s為讀寫扇段數,g為扇段間間隙旋轉時間。T=B/T是單讀寫通道的峰值傳輸率,它由記錄位密度和主軸轉速決定;

數據存取數據通道 數據存取數據通道

是傳輸有效係數,它與平均找道時間t、主軸轉速、扇段長與空隙長之比以及讀寫扇段數有關,對於多個獨立讀寫通道磁碟系統,

數據存取數據通道 數據存取數據通道

其有效平均傳輸率為

假定控制器有一定容量的Buffer或Cache,許多數據傳送可在Buffe:或Cache主機之間重複進行,這樣主通道的有效數據傳輸率T,可表示為:

其中β是等效復傳係數,它與Buffer或Cache容量、預讀和替換策略等因素有關。

快速存取技術

提高有效傳輸率

從以上磁碟系統的通道模型可知,除了提高位密度和主軸轉速增大Tp、縮短找道時間以增大a外,如下的方法也是提高有效傳輸率的重要途徑:

•a.用固定頭磁碟消除找道延時增大a;

•b.用並行傳輸磁碟(PTD)增加讀寫通道數增大Tu;

•c.用磁碟Cache提高s;

•d.用適宜的磁碟調度策略減小定位時間增大a;

•e.用鏡象盤減小旋轉等待時間增大a;

•f.用固態盤提高β和提供大批量的驅動器與控制器間數據傳輸增大a。

(1)固定頭磁碟是每道一頭的磁碟驅動器,它無需找道時間開銷t,從而可有效地增大a。在早期計算機中它被用作虛擬存儲器的後援存儲器,如今每個盤面達到千道以上,這種方法從經濟上是不合適的。但每面多磁頭、分區讀寫以減少找道時間的方法則仍在套用,如IBM 3390- 2的快速型驅動器。

(2)並行傳輸磁碟提供多個讀寫通道直接提高數據傳輸率T. Cray公司的DD--19和DD一49、富士通公司M 2350A 、 M 2360A和M 2380A等都是並行傳輸磁碟。在Cray-DD--49並行傳輸磁碟中,有兩個獨立的小車執行機構,小車上裝有16個磁頭,每面有兩個磁頭。每個小車可獨立定址所有柱面,減小了平均找道時間.這樣在增大TD的同時還提高了a,是一種高性能的典型磁碟系統。

(3)磁碟高速 Csche是設定在主機和磁碟間的緩衝存儲器,用它實現外存與主機間高速數據傳輸。磁碟C2che有兩方面作用。

•其一,作為兩種不同速率通道傳輸的緩衝池(也叫Buffer)以實現傳輸速度匹配。由於磁碟驅動器所支持的數據傳輸是以扇段長為單位的分塊連續傳輸,且傳輸速率較低。而主機與磁碟系統之間的數據通路可以較大的數據塊的分塊甚至是連續的快速傳輸。這兩種不同性質和速率的通道傳輸靠高速Buffer來實現匹配;

•其二,它是主機存儲管理技術的部分下移,即暫存重複調用的數據,並以先讀和後寫技術提高外存回響和數據傳輸的快速性。

•其具體做法是,採用一定的算法讓磁碟讀往Cache的操作先於主機的讀請求,以便主機讀請求到來時立即從Cache中讀取數據。同時主機寫磁碟操作當寫到Cache時即認為寫操作完成,實際磁碟寫操作的完成滯後於主機寫操作完成,有些重複調用率高的數據可能在主機和Cache間多次傳輸後才寫入磁碟,從通道模型來看,磁碟Cache是引入了較大的等效數據復傳率β。

磁碟Cache的有效性一方面取決於Cache管理算法;另一方面依賴於各種套用的數據分布特性。Cache管理一般採用LRU(最近最少使用)、FIFO(先進先出)等算法,它應與主機調用數據的時域特性相一致。主機請求傳輸的數據應具有較好的空間、時間局部性,這種局部性決定了預讀的有效性、Cache中數據重複利用的可能性和連續磁碟寫入的批處理效果。數據的空間時域分布局部性又取決於套用環境、軟體算法及檔案組織方式等因素。對於磁碟系統來說,較小數據塊的隨機存取難以使磁碟Cache得到有效利用;較大數據塊的順序存取和重複調用有利用磁碟Cache的效能發揮。

(4)磁碟調度是在一組I/O請求中以定位時間極短為目標來調度磁碟讀寫,從而減小總體的機械定位延遲和增大a。廣義的磁碟調度包括如下兩方面:

•第一,在磁碟系統中設定命令緩衝器,一次接受多個I/O請求命令,並以某種算法(如找道時間最短算法)對I /O請求命令排隊。然後,按順序執行命令佇列,即以總體上最短的找道時間處理I /O命令。佇列中下一個被執行的I/O命令應選擇存取的數據位置離當前讀寫頭最近,使找道時間最短。這種方法在I/O請求佇列較長、數據存取回響立即性要求不太高的系統中相當有效。

•第二,磁碟系統對管轄下的多台磁碟串按“重疊操作”的原則實行同時並發的定位操作,以減小整體的定位時間。同時,按“旋轉最佳化”的原則調度,選擇磁頭最靠近所要求扇段的磁碟驅動器去首先執行數據讀寫,以使旋轉等待時間減少至最小。從整體上講減小了數據定位時間因而增大了有效係數a。

(5)鏡像磁碟通常用作提高磁碟系統的可靠性和數據可用性。它是使數據同時存放在兩個磁碟的相應位置上,數據分布互為鏡像。在讀取時,一個盤上數據出錯便讀取另一盤上的鏡像數據,只有當兩個盤同時出錯才算出錯,因而數據可用性高。

在無誤碼或故障的情況,可以採用兩種方法調度磁碟使數據定位時間縮短以增大有效係數a。第一種方法是以極小找道時間來調度。具體做法是根據兩個磁碟的當前磁頭位置距離主機請求的數據位置的道差,調度較小道差的磁碟作為主磁碟優先去完成讀寫操作,另一磁碟作為其鏡像盤,其讀寫數據作為糾錯備用。這種算法回響主機請求的時間最短。第二種方法是將磁碟數據區域按柱面劃分兩部分,每個磁碟作為主磁碟的一部分,相當於主磁碟的找道行程縮短了一半。

(6)固態盤又稱為SSD (Static -StateDisk )。它是由速度相對較慢的存儲器晶片構成,可視之為一種大型低速主存或小型高速磁碟。以快速、連續的大塊數據傳輸回響主機的讀寫請求,從面向主機的數據通道來看,相當於一個大容量的磁碟Cache,大大提高了磁碟系統模型中的等效復傳係數R,現今被視為新一代較大容量的外存儲設備。

使用固態磁碟

可用三種不同的方式來使用固態磁碟:

a)擴展存儲器ES (Extanded Storage ) ;

b)邏輯磁碟(或叫虛擬磁碟);

c)用作檔案的主存Cache和磁碟設備間的二級Cache。

作為擴展存儲器時,SSD通過一個寬頻的高速數據通道連線到主存,其最大數據傳輸率較磁碟要快兩個數量級。例如:IBM 3090系列機上擴存與主存之間的傳輸率為216MB/s一每個字18. 5ns。Cray X一MP和Y -MP機上用作擴存的SSD在25μs之記憶體取9096位元組,數據傳輸率為160MB/s。

Cray X一MP和Y一MP還支持作為邏輯磁碟和二級Cache的SSD。SSD相對磁碟來說存儲空間小得多,因而作為邏輯盤使用時常出現空間爭用現象,這是邏輯盤難免的因難。Cray系統研究人員發現,SSD作為多道程式的二級Cache可使Unix作業系統下的運行環境加速四倍。

大量實踐經驗表明,存儲系統中20%的數據接受了80%的存取訪問頻度,亦即相對少量的活躍(hot spot)數據被重複訪間,其訪問次數之和占所有訪問次數總和的絕大多數比例。SSD非常適合於存放這些hot spot數據。數據hot spot規律是促進SSD發展的根本動力。

相關詞條

熱門詞條

聯絡我們