基本介紹
結構
一個真正的元搜尋引擎由三部分組成,即:檢索請求提交機制、檢索接口代理機制、檢索結果顯示機制。"請求提交"負責實現用戶"個性化"的檢索設定要求,包括調用哪些搜尋引擎、檢索時間限制、結果數量限制等。"接口代理"負責將用戶的檢索請求"翻譯"成滿足不同搜尋引擎"本地化"要求的格式。"結果顯示"負責所有元搜尋引擎檢索結果的去重、合併、輸出處理等。
元搜尋引擎的出現,對於那些需要連續地使用不同的搜尋引擎重複相同的檢索的人來說,是一個福音。使用元搜尋引擎同時對幾個搜尋引擎進行檢索,獲得分級編排的檢索。
分類
在可以檢索的目標搜尋引擎、檢索提問的處理方式以及如何編譯和顯示結果方面,元搜尋引擎有著很大的差異。有些元搜尋引擎一個接一個的搜尋目標搜尋引擎,另一些則同時進行搜尋,有些搜尋引擎將檢索提問轉變成目標搜尋引擎的提問語言,而有一些則原封不動的傳送給目標引擎。
按功能劃分,元搜尋引擎包括多線索式搜尋引擎和All-in-One式搜尋引擎;按運行方式的差異可分為線上搜尋引擎和桌面搜尋引擎。
前景
元搜尋引擎是為彌補傳統搜尋引擎的不足而出現的一種輔助檢索工具,有著傳統搜尋引擎所不具備的許多優勢。但是,元搜尋引擎依賴於資料庫選擇技術、文本選擇技術、查詢分派技術和結果綜合技術等。用戶界面的改進、調用策略的完善、返回信息的整合以及最終檢索結果的排序,仍然是未來元搜尋引擎研究的重點。
主要中文相關
.360 綜合搜尋(360 comprehensive search):360綜合搜尋,屬於元搜尋引擎,是搜尋引擎的一種,是通過一個統一的用戶界面幫助用戶在多個搜尋引擎中選擇和利用合適的(甚至是同時利用若干個)搜尋引擎來實現檢索操作,是對分布於網路的多種檢索工具的全局控制機制。發行時間:2012年8月16日
MEZW搜尋:一家聚合搜尋引擎網站,致力於為用戶提供準確、乾淨的網頁內容搜尋服務,其搜尋結果來自海內外不同內容渠道的聚合,登錄帳號後用戶可以設定禁止掉任何不希望看到的網站。
·搜魅網(someta):集合了百度、google、搜狗、雅虎多家主流搜尋引擎的結果,提供網頁、資訊、網址導航等聚合查詢。另外,搜魅網突破了元搜尋引擎沒有自己的技術的瓶頸,提供了網站查詢的功能。
·馬虎聚搜:集合了google和百度的搜尋結果,提供一些有用的熱點排行。
·佐意綜合搜尋(chinazss):佐意網提供的綜合搜尋,結合了Google\Baidu\yahoo\等知名搜尋引擎,更細分了不同的搜尋類別,如軟體搜尋,遊戲搜尋,視頻搜尋,新聞搜尋,網頁搜尋,地圖搜尋,音樂搜尋,企業搜尋等。看似頁面簡單,卻搜尋功能卻很強大。佐意綜合搜尋可以說是元搜尋中的一個典範。 該搜尋引擎還可直接查詢手機號碼歸屬地,IP查詢等。
·比比貓(bbmao):綜合了百度,谷歌,搜狐,雅虎,搜狗等搜尋引擎的搜尋結果,並建立了自動分類,是以前表現比較好的一款產品,但是現在網站已經打不開了,公司已經倒閉了。
元搜尋引擎(META Search Engine)一般都沒有自己網路機器人及資料庫,它們的搜尋結果是通過調用、控制和最佳化其它多個獨立搜尋引擎的搜尋結果並以統一的格式在同一界面集中顯示。
·抓蝦網聚搜 :就是將百度、Google兩家算法各異的搜尋巨頭的搜尋結果,去重,然後呈現到用戶面前。方便用戶使用。
通過抓蝦聚搜的搜尋框,還可以方便的進行下列查詢,例如:天氣預報查詢、手機歸屬地查詢、網頁計算器、 ip地址查詢、郵編區號查詢、實時匯率轉換、網站PR值、ALexa排名速查 、網站快速預覽、檢索糾正功能、字典查詢、詩詞查詢、成語詞典、百家姓速查、快遞單號查詢等等,致力快捷生活。
·萬緯搜尋:據說是最早的中文元搜尋引擎,還有學術論文以其作代表論述元搜尋引擎。但現在貌似不可用了,速度慢且不說,搜尋完成後, 出來一句話:共查到 N 條記錄符合字元串 X 本次取出 1 - 0 條 沒有結果,怎么玩!
·壹家搜 :速度慢,動不動就宕掉了;標題都顯示是“百度快照”。
·知合網的網頁搜尋 :速度較慢,這個知合網的網頁搜尋,我記得以前是綜合百度、Google搜尋結果的,但現在跟百度的結果完全相同。這樣的話,有什麼意義呢!
·MMGOOGLE圖片搜尋:MMGOOGLE圖片搜尋提供專門的圖片搜尋.原來功能還比較強大,現在就是Google搜尋結果的了.
·我要搜搜你 :首頁上介紹說“綜合了Baidu,Google,Yahoo的搜尋結果” “結果比他們好一些”,但隨意搜尋幾個詞,很明顯是比他們差很多。 搜“Google”,Baidu,Google,Yahoo排第一的都是Google的主站,而我要搜搜你排第一的是 下載 Google 桌面,這個結果僅僅在百度排第五,Google、Yahoo前十項中都沒有;真不知它是什麼算出來的。
·deyeb 社會化搜尋引擎 :上一篇文章《中文元搜尋引擎(歡迎補充)》發表後,bookye說“最知名的deyeb社會化搜尋,你怎么落下了呢”。使用deyeb 後,發現僅僅熱門詞有結果,稍微冷一些的詞,就無結果了。搜“李宇春”,有97個結果;搜“何潔”, 就只有一項指向百度貼吧_何潔吧。更別說普通的詞了,多數是無結果。deyeb不能算是搜尋引擎。
·北斗搜尋 :跟前面地比較,北斗搜尋現在無法使用了,當然也是最好的了。速度還可以;結果來自百度、搜狗、雅虎;左側有深入搜尋、相關搜尋; 縮略圖功能很cool;可以評價結果。
Jopee元搜尋: 唯一以.CN結尾,而且還正在運行著的元搜尋引擎。它提供的是各自獨立的搜尋,只是方便切換不同的搜尋引擎,以便於能找到更適合的結果。在搜尋結果排列方面,直接按來源引擎排列搜尋結果.所以不存在手動變動搜尋結果的操作。排名跟原來搜尋引擎有關。
國外搜尋引擎
MetaCrawler:提供涵蓋近2 0個主題的目錄檢索服務, 包括常規檢索、高級檢索、定製檢索、國家或地區的資源檢索等。其中, 高級檢索模式可實現搜尋引擎的選擇調用, 基於域名、地區或國家的檢索結果過濾, 最長檢索時間設定, 每頁可顯示的和允許每個搜尋引擎返回的檢索結果數量的設定, 檢索結果排序依據(包括相關度、域名、源搜尋引擎)設定等 Dogpile:它首先並行地調用Google、Yahoo、MSN、Ask Jeeves等4個源搜尋引擎, 如果沒有得到1 0 個以上的結果, 再調用另外的搜尋引擎。但Dogpile不提供可調用的源搜尋引擎列表,不支持對各個源搜尋引擎的自行指定和選擇。
Mamma是並行式元搜尋引擎,自稱為“搜尋引擎之母”。可同時調用7個最常用的獨立搜尋引擎, 並且可查詢網上商店、新聞、股票指數、圖像和聲音檔案等資源。其特點是檢索界面友好, 檢索選項豐富,主要包括可控制調用的獨立搜尋引擎、選擇使用短語檢索功能、設定檢索時間、設定每頁可顯示記錄數等。
Ixquick 最大優點是支持中文檢索。支持各種基本的和高級的檢索功能, 包括關鍵字檢索、短語檢索、截詞檢索、布爾邏輯檢索、概念檢索、自然語言檢索、指定欄位檢索、包含(+ )或排除(一)檢索等。
Clusty
Clusty將用戶搜尋的關鍵字到各大搜尋引擎查詢,然後比較返回的結果,根據比較排名生成一個列表。這樣的“元搜尋”方式可以幫助將最好的搜尋結果提升到頁面上部而將搜尋引擎的垃圾搜尋結果調整到底部去。Clusty不但能夠根據搜尋的關鍵字進行Tag匹配,按搜尋引擎索引,按域名分類等等功能,同時還在搜尋結果列表中可以選擇頁面內預覽的功能。
ZapMeta
ZapMeta是一個元搜尋引擎,這意味這著,用戶可以在同一個搜尋引擎上搜尋來自多個地區的多種信息。ZapMeta得到的搜尋結果通常是從AOL、谷歌、雅虎、Ask等網站篩選的。ZapMeta的頁面簡單而整潔,還可以直接在搜尋欄下的選項設定個人偏好。
Kartoo
Kartoo一個可視化搜尋引擎,利用FlashPlayer展示搜尋結果間的關係,也實現了信息的可視化表達、具有傳統搜尋引擎無法比擬的優勢。搜尋時,輸入相應關鍵字,它會找出與這些關鍵字相符和的網站,然後以flash的形式顯示這些網站及站點間的關係,你可以用擦除鍵添加鍵來擦除或添加某些搜尋的結果,也可以保存自己的搜尋結果及email給自己的好友,分享你的搜尋。
Mamma
Mamma是一個很好的,堅實的元搜尋引擎,提供快速和優秀的搜尋選項。目錄檢索結果Mamma從大約12個主要網際網路搜尋引擎和和有一些很好的額外的搜尋功能,是值得一試。Mamma的主頁非常簡潔,選項較少,可以一目了然。
Ixquick
Ixquick具有同樣元搜尋的特點,連線著搜尋引擎和網路用戶的信息橋樑。Ixquick是一個不保留搜尋歷史的搜尋引擎,這能確保用戶信息的安全,Ixquick會在48小時內刪除用戶搜尋的信息,甚至連政府也需要,也沒有什麼信息可以提供。
SurfWax
SurfWax有一個其它元搜尋引擎沒有的獨特功能,即點擊每條結果左邊的“網址撳鈕”圖示,可瀏覽該結果包括的任何頁面,並顯示搜尋語句在檔案中的位置。可以把搜尋結果和檔案存儲起來以備後用。
Yurnet
Yurnet在技術上被認為是一個元搜尋引擎,因為它編譯引擎的結果從幾個不同的搜尋中獲得。在搜尋關鍵字時,Yurnet會提供一個跳點到Web瀏覽。用戶還可以使用大約35種的不同搜尋去查詢。Yurnet會提供給你一個很好的搜尋體驗。