倒排檔

倒排檔

計算機存儲中由輔關鍵字及其所屬情報主關鍵字的集合所組成的記錄方式。

倒排檔

正文

計算機中存儲的輔關鍵字索引。所謂輔關鍵字是指能在多個情報中同時出現的關鍵字,諸如情報中的主題詞、作者、分類號等,它們與情報沒有一一對應關係;而與情報有一一對應關係的關鍵字則稱之為主關鍵字,如文獻情報中的文獻號、存儲地址等。
倒排檔記錄一般總是由輔關鍵字及其所屬情報主關鍵字的集合所組成,常見的組織方式有多表方式、倒排表方式和點陣圖方式,其邏輯結構可圖示如下:其中,假設字母表示輔關鍵字;數字表示情報的編號。也就是說,假定情報1包含輔關鍵字A;情報2包含輔關鍵字B;情報3包含輔關鍵字A;情報4包含輔關鍵字C。

倒排檔倒排檔
點陣圖方式為定長記錄,處理簡單,但存儲空間浪費較多;倒排表採用變長記錄,節省存儲,但處理比較複雜;而多表方式使用半固定長記錄,處理比倒排表簡單,但比點陣圖方式複雜,存儲量比倒排表大,但比點陣圖方式小。
正如索引能加快手工查找速度一樣,在計算機建立倒排檔往往也能加快情報的檢索速度。在線上情報檢索要求實時回響,故大多數在線上檢索系統都使用倒排檔進行檢索或輔助檢索。不過,建立倒排檔需要時間與空間,維護也比較困難,因而一次性的定題情報檢索(SDI) 系統往往都不使用倒排檔;為了儘可能的減少不必要的存儲,在在線上情報檢索中往往不對所有的輔關鍵字建立倒排檔,而只是對常用的輔關鍵字:主題詞、作者等建立倒排檔,因此,在對倒排檔檢索以後,往往還要補充對原文檔進行二次檢索。前者人們又常稱之為集合檢索,後者則稱之為順序檢索。

配圖

相關連線

相關詞條

相關搜尋

熱門詞條

聯絡我們