可搜尋PDF

可搜尋PDF(英文叫法:Searchable PDF )是帶即時搜尋功能的PDF。

可搜尋PDF簡介

相必大家用過精益掃瞄器後,都會解到一個詞,就是”可搜尋PDF“,那有人會問到底什麼是”可搜尋PDF"呢?“可搜尋PDF”與普通PDF格式有什麼區別呢?帶著以上疑問我們一起走進”可搜尋PDF“解密之旅。

簡而言之,“可搜尋PDF(英文叫法:Searchable PDF )”就是:帶即時搜尋功能的PDF。在深入了解 “可搜尋PDF”之前,先了解一下 PDF 檔案格式。所謂 PDF,其實是Portable Document Format的縮寫,意思是"方便攜帶的檔案格式",簡稱攜帶型檔案格式,它是美國 Adobe 公司所開發的電子檔案格式,它可把檔案的文本、格式、字型、顏色、解析度、連結及圖形圖像、聲音、動態影像等所有的信息封裝在一個特殊的整合檔案中再加以圖像化。 用PDF製作的電子書具有紙版書的質感和閱讀效果,可以“逼真地”展現原書的原貌,而顯示大小可任意調節,給讀者提供了個性化的閱讀方式。

可搜尋PDF,是一種更先進的 PDF 檔案格式,它不但包含了 PDF 檔案格式的所有優點,還增加了特別的關鍵字檢索功能,您不需要記住檔案名稱稱,也不必費心記錄任何章節與頁數,只要輸入關鍵字,不費吹灰之力,即可輕鬆正確的搜尋並定位目標,從而將包含此關鍵字的可搜尋PDF 檔案與標示關鍵字的頁面調出來,因而也被稱之為最先進的檔案格式。

可搜尋PDF原理

在我們了解了什麼是“可搜尋PDF”之後,必定想知道這種格式的工作原理是什麼?可搜尋PDF 如何完美達成圖文一致與內容搜尋的功能的?其實很簡單,通過以下內容我們可以清楚了解到原因。

可搜尋PDF格式中的每一個頁面,都是由圖像層與文字層所組成的。

可搜尋PDF 可搜尋PDF

圖像層:Image Layer,指的就是將紙張檔案掃描所得未經編輯的圖像,所以它能保留紙張文檔的原始樣貌,並採用高壓縮比的技術來保留與視覺原貌一致的特徵,可以在不破壞圖像原本清晰度的情況下,將檔案壓縮到最小,完全擺脫失真的機率。

文字層:Text Layer,則是相對應於圖像層的另一部份,能夠一一的與圖像層中的文字位置相互對應,讓使用者既可以讀取與圖像中的圖形與文字,又能運用文字層,直接對其中的內容進行檢索。

因此,只要利用可搜尋PDF的特性,將紙本檔案數位化成可搜尋PDF檔案,不但能兼顧視覺畫面,又能利用文字層來執行關鍵字搜尋。“快速”的保存檔案內容,“精準”的搜尋所需的檔案內容,“便利”的將數據內容再次利用,輕而易舉達到保存、管理、再利用的檔案管理3部曲。

可搜尋PDF的好處

只要將紙張檔案全部數位化成為可搜尋 PDF 格式,才能方便的保存於個人電腦,或是公司的資料庫、網路硬碟,所有的使用者不需要費心記住檔案的名稱與實際儲存路徑,只要利用關鍵字,通過作業系統自帶的搜尋功能,或者是網站上免費的軟體資源,如:Google Desktop,即可將您所需要的資料快速搜尋出來,讓檔案管理不再麻煩。

可搜尋PDF 生成

看了以上介紹,大家肯定想了解如何將現有的資料保存為可搜尋PDF格式呢?

目前製作 Searchable PDF 的方式有兩種:

方法一:利用市售的套裝軟體來轉換或二次轉檔成為 可搜尋PDF 檔案格式,如果要將電腦中原有的電子檔案,或是已經利用數位相機或是掃瞄器數位化的圖像檔案,如 JPG、Tiff…等圖像格式,另外轉換成可以被檢索的 可搜尋 PDF 檔案,需要通過專業的製作軟體來執行,例如:ABBYY FineReader、IRIS ReadIRIS 或 Adobe Acrobat 等軟體,這些軟體主要是利用光學文字識別(OCR)技術來達成轉換 Searchable PDF 格式的目的。但是,專業軟體價格昂貴,而且使用者需要學習複雜的軟體操作。

方法二:利用精益的可搜尋PDF數位化解決方案直接將紙張檔案轉成可搜尋PDF,完美的解決方案除了包含適合要求的掃瞄器硬體設備外,還要擁有識別當地語言能力的文字識別軟體(OCR)–DI Express。使用者只要利用一個按鍵,無論是報紙雜誌、賬單收據、書籍文選、公文等重要的紙張檔案,可立即數位化成 可搜尋PDF 檔案格式。所有的檔案掃描與轉換可搜尋PDF 格式的作業一氣呵成,輕鬆套用不必耗時學習,絕對是最聰明划算的選擇。

請特別留意 OCR 軟體的功能中,已經包含轉換可搜尋 PDF 的功能。大部分的 OCR 軟體,僅在專業版本中才提供可搜尋PDF 的製作功能。

相關詞條

相關搜尋

熱門詞條

聯絡我們