關鍵字索引

關鍵字索引

關鍵字索引是以出現在文獻題名(或正文及文摘)中的描述文獻主題內容的關鍵字為標目的字順索引。

關鍵字索引

正文

以出現在文獻題名(或正文及文摘)中的描述文獻主題內容的關鍵字為標目的字順索引。它將每個關鍵字輪排於索引款目中的標目位置,以提供多個檢索入口。一般分為兩類:一類是帶上下文的索引,如題內關鍵字索引、題外關鍵字索引、雙重關鍵字索引等;另一類是不帶上下文的索引,如單純關鍵字索引和詞對式關鍵字索引。關鍵字索引通常用計算機編制,較為簡便,適用於快速報導文獻和進行瀏覽性文獻檢索。由於關鍵字屬未經規範的自然語言,利用關鍵字索引難於查全同一主題的文獻,一般不用於編制累積索引。
簡史 西方15~16世紀出現的《聖經索引》和19世紀前期英、德等國家圖書館目錄中的主詞款目,已帶有關鍵字索引的性質。1856年英國A.克里斯塔多羅《圖書館編目技術》一書中出現了對關鍵字索引法的最早論述。1958年美國H.P.盧恩和P.B.巴克森德爾同時向在華盛頓召開的國際科學情報會議提交關於用穿孔卡片分檢機編制關鍵字索引的論文。次年,盧恩發表題為《技術文獻的上下文關鍵字索引》的論文。此後他又致力於用計算機自動編制題內關鍵字索引的研究,使機編關鍵字索引逐步在科技檢索刊物中得到套用。20世紀60年代以後,在題內關鍵字索引的基礎上又陸續產生了題外關鍵字索引、雙重關鍵字索引等一系列新品種。對關鍵字索引的研究,促進了自動標引的實現和全文資料庫的建立。70年代以來,中國的一些圖書館、情治單位已開始用機編關鍵字索引技術編制圖書館目錄和檢索刊物的主題索引。
題內關鍵字索引 簡稱KWIC,又稱上下文關鍵字索引。是最早出現的機編索引,首先套用於1960年美國化學文摘社創辦的《化學題錄》。題內關鍵字索引的標目在款目的中部,左右均為該標目的上下文;索引款目按位於款目中部作為標目的關鍵字的字順排列。格式如:

關鍵字索引關鍵字索引
KWIC的設計思想是:①文獻題名通常具有揭示文獻主題內容的作用,從題名中抽取的關鍵字能有效地將用戶指向相關主題的文獻;②保留題名中關鍵字前後的上下文,有助於說明關鍵字的含義,可用作限定標目含義的說明語。
KWIC的編制步驟包括:①把經過人工處理的文獻題名(包括增補的關鍵字)輸入計算機。②計算機用“非用詞表”剔除題名中的介詞、連詞、冠詞等,篩選出有檢索意義的關鍵字。③將每個關鍵字依次輪流用作索引標目,同時保留其上下文。若題名過長,可以截斷或移位。④編成索引款目,並進行編排加工,最後交付印刷。上述工序除第一步由人工完成外,其餘皆由計算機完成。例如,一篇題為Play therapy for maladjusted children(《孤僻兒童的遊戲療法》)的論文,輸入計算機後可產生以下幾條索引款目:

關鍵字索引關鍵字索引
檢索時先在索引款目中部找到與檢索課題有關的關鍵字,再查看其左右的上下文,尋找切題的文獻。
題外關鍵字索引 簡稱KWOC。最早出現的KWIC改進形式。與KWIC相比,其標目的位置不在款目的中部而是在款目的左端或提行至左上方,標目之後(或之下)仍保留完整的文獻題名。其款目格式為:編制時依次輪流將題名中的每個關鍵字置於標目的位置,原題名中的關鍵字也可用一符號(如星號)代替,題名之後註明文獻地址,最後款目按關鍵字的字順排列起來。上例如按KWOC編制,可產生以下幾條款目:

關鍵字索引關鍵字索引
children
play therapy for maladjusted *3000
maladjusted
play therapy for *children 3000
play
*therapy for maladjusted children 3000
therapy
play * for maladjusted children 3000
KWOC因標目位置突出,款目形式與普通主題索引接近,可讀性比題內關鍵字索引強,符合用戶的檢索習慣。但所占篇幅比KWIC大,並容易造成複合主題的文獻在字順序列中被分散在多處。
雙重關鍵字索引 也稱雙重上下文關鍵字索引,是KWIC和KWOC的結合形式,由美國A.E.彼特拉克於1969年創製。其特點是雙重標目,主標目(第一關鍵字)在題名之外,副標目(第二關鍵字)在題名的左端。索引款目共2行,其格式如:雙重關鍵字索引兼有 KWIC及KWOC的優點,使用較為方便,但索引篇幅大,編印成本高。前例如編雙重關鍵字索引,可產生下列幾條索引款目:

關鍵字索引關鍵字索引
children
 maladjusted children/play therapy for 3000
 play therapy for maladjusted children/3000
 therapy for maladjusted children/play 3000
maladjusted
 children/play therapy for maladjusted 3000
 play therapy for maladjusted children/3000
 therapy for maladjusted children/play 3000
play
…………………………
單純關鍵字索引 純粹由若干關鍵字組成的索引。其索引款目格式是:一般從題名、文摘或正文中抽出1~5個關鍵字,將每一個關鍵字依次輪流移至款目的左端或左上方作為標目,將其餘關鍵字用作說明語。例如美國《化學文摘》中一篇題為“Acetylene crackingfrom heavy oil”的文獻(文獻地址為76733W ),可產生以下索引款目:

關鍵字索引關鍵字索引
acetylene
heavy oil cracking 76733W
cracking
heavy oil acetylene 76733W
heavy
oil cracking acetylene 76733W
單純關鍵字索引的製作較為簡單,它具有標引深度較大而索引篇幅較小的優點,但由於它不帶上下文,沒有語法結構,難於判斷索引款目的含義,查準率較低。
詞對式關鍵字索引 由一對關鍵字組成的索引。其原理與雙重關鍵字索引相似,只是不帶上下文。由於款目輪排時採用數學中的排列原理,因此又稱為輪排主題索引。1967年美國費城科學情報研究所(ISI)首創,最先用於編制《科學引文索引》的主題索引。格式如:如第一例編成詞對式關鍵字索引, 可以產生以下 6條款目(款目按標目的字順排列):

關鍵字索引關鍵字索引
children
maladjusted 3000
children
play therapy 3000
maladjusted
children 3000
maladjusted
play therapy 3000
play therapy
children 3000
play
maladjusted 3000
這種索引的性能與單純關鍵字索引相同,可用計算機自動編制,檢索也較為方便,但查全率和查準率都較低。

配圖

相關連線

相關搜尋

熱門詞條

聯絡我們