GOOGLE網頁搜尋

GOOGLE網頁搜尋

谷歌網頁搜尋(Googlewww.google.com)是一個搜尋引擎,由兩個史丹福大學博士生Larry Page與Sergey Brin於1998年9月發明,Google Inc. 於1999年創立。谷歌網頁搜尋技術,大部分在百度等搜尋引擎中也適用。同樣,這些搜尋技術是來源於傳統資料庫檢索技術。GOOGLE的“網頁快照”功能,能從GOOGLE伺服器里直接取出快取的網頁。

基本信息

簡介

谷歌網頁搜尋(Google,www.google.com)是一個搜尋引擎,由兩個史丹福大學博士生Larry Page與Sergey Brin於1998年9月發明,Google Inc. 於1999年創立。cache用來搜尋GOOGLE伺服器上某頁面的快取,這個功能同"網頁快照",通常用於查找某些已經被刪除的死連結網頁,相當於使用普通搜尋結果頁面中的"網頁快照"功能。

網路地址

中文網址:http://www.google.cn/
英文網址:http://www.google.com/

谷歌搜尋的意義

谷歌網頁搜尋技術,大部分在百度等搜尋引擎中也適用。同樣,這些搜尋技術是來源於傳統資料庫檢索技術,因而,對這部分的學習,能為後續章節的資料庫檢索奠定基礎,並能獲得直觀的認識。本部分結合套用實例的講解也能讓我們加深信息檢索對解決實際問題、提高搜尋效率的認知。
本節中一些實例中的括弧“【】”中的內容直接在谷歌搜尋框中輸入可查看效果,最快捷的方式是將實例的連結在新視窗中打開,既能看到輸入的檢索策略,也能直接看到搜尋效果。

搜尋語法與高級搜尋說明

谷歌網頁搜尋之高級搜尋需要注意的是,所有的搜尋語法和搜尋符號必須是半角狀態(即英文輸入模式)。很多搜尋語法也可以通過谷歌網頁搜尋之高級搜尋來實現(如圖2),在谷歌首頁點擊“高級”即可進入高級搜尋界面。

一般搜尋技術與實例

默認模糊搜尋、自動拆分短語

谷歌網頁搜尋谷歌網頁搜尋

同許多搜尋引擎一樣,當直接在搜尋框中輸入搜尋詞時,谷歌默認進行模糊搜尋,並能對長短語或語句進行自動拆分成小的詞進行搜尋。
實例:【市場研究報告】,自動拆分為市場研究、市場、研究等。

短語精確搜尋

給關鍵字加上半角引號實現精確搜尋。
實例:【"市場研究報告"】

通配符

谷歌的通配符是星號“*”,必須在精確搜尋符雙引號內部使用。用通配符代替關鍵字或短語中無法確定的字詞,實例:
搜尋市場調查研究報告、市場年度研究報告等內容時:【"市場*研究報告"】
搜尋歌詞:【"I be * waiting for you"】
搜尋詩句:【"解落*秋葉"】
搜尋另類說法,如“輕輕的我走了,正如我輕輕的來”的另類說法:【"*的我走了,正如我*的來"】
搜尋英文的多種形態,如comput、computing等:【"comput*"】

點號匹配任意字元

通配符星號“*”不一樣的是,點號“.”匹配的是字元,不是字、短語等內容。保留的字元有[、(、-等
搜尋有關中國的各種大全:【"大全.中國"】,或者不要精確搜尋的雙引號【大全.中國】百度支持不明顯。

布爾邏輯

布爾邏輯是許多檢索系統的基本檢索技術,在搜尋引擎中也一樣適用,在谷歌網頁搜尋中需要注意的是:谷歌和許多搜尋引擎一樣,多個詞見的邏輯關係默認的是邏輯與(空格)。當用邏輯算符的時候,詞與邏輯算符之間用需要空格分隔,包括後面講的各種語法,均要有空格。邏輯非是特例,即減號必須與對應的詞連在一起。對於複雜的邏輯關係,可用括弧分組。
邏輯與:【電子行業 AND 研究報告】,用空格和AND 以及小寫搜尋結果差別不大。此例是搜尋電子行業的研究報告。
邏輯或:【電子行業 AND 研究報告 AND (人才 | 風險)】此例是搜尋電子行業的人才或風險方面的研究報告。
邏輯非:【電子行業 AND 研究報告 AND (人才 | 風險) -2007】此例是搜尋電子行業的人才或風險方面的研究報告,但不要2007年的。

約束條件

加號“+”用於強制搜尋,即必須包含加號後的內容。一般與精確搜尋符一起套用,如:
【研究報告 +"學術信息資源開放目錄"】

同義詞

僅限於英文搜尋。一般來說,加~符號會比不加搜尋出來的多一些。總體來說效果不是很明顯。百度和谷歌都支持。
【~PC】能搜尋出Computer、windows等內容。

數字範圍

用兩個點號“..”表示一個數字範圍。一般套用於日期、貨幣、尺寸、重量、高度等範圍的搜尋。用作範圍時最好給一定的含義。百度不支持。
【奧運會 1980..2004】當我們搜尋奧運會的時候,特別是在2008年的時候搜尋這個詞,出現在搜尋結果前幾頁的幾乎全是2008年北京奧運會的相關信息,但是有人想了解進幾屆在其它地方主辦的奧運會的情況。實例中就是搜尋1980年到2004年間的奧運會信息。
【格力空調 2000..2800 元】搜尋價格區間。本例僅僅搜尋格力空調的價格在2000元到2800元之間的信息。
【格力空調 ..2800 元】2800元以下的。
【格力空調 2800.. 元】2800元以上的。

括弧分組

邏輯組配時分組,避免邏輯混亂。括弧“()”是分組符號。
【(格力空調 | 海爾空調 )元 2800..】2800元以上的格力空調或者海爾空調。

谷歌高級搜尋語法與實例

標題中搜尋

谷歌網頁搜尋谷歌網頁搜尋

通常標題是內容的高度概括,在標題中搜尋的結果準確率會更高。谷歌搜尋中限定搜尋網頁或文檔標題的語法是:intitle或allintitle。allintitle是intitle的變體,相當於在各個搜尋詞前加上intitle。二者差別不明顯,我們一般直接用intitle。
【intitle:市場研究報告】在標題中搜尋“市場研究報告”。

正文中搜尋

僅僅在網頁或文檔的正文部分搜尋。歌搜尋中限定搜尋網頁或文檔正文的語法是:intext或allintext。
【intext:市場研究報告】在正文中搜尋“市場研究報告”。 可以與在標題中搜尋的結果(搜尋結果條數、準確度)進行對比。

網址中搜尋

歌搜尋中限定搜尋網址的語法是:inurl。是In-系指令中最強大的一個,換句話說,這個高級指令能夠直接從網站的URL入手挖掘信息,只要略微了解普通網站的URL格式,就可以極具針對性地找到你所需要的資源--甚至隱藏內容。網站構建者通常將某一類信息集中在一個網站的目錄中,所以搜尋URL中的詞本身就是對某一方面內容的一個限定。如果在加上一定的詞進行組配,搜尋結果將更貼近需求。
搜尋圖片--【inurl:photo】,搜尋所有網路地址中包含“photo”的關鍵字的頁面結果。如果說Google圖象搜尋側重於展示圖片,inurl搜尋則讓你在看到圖片之前了解到頁面大致的文字內容,更方便判斷。利用這一指令,你往往能夠找到關鍵字的組圖內容(指令中的photo也可以替代為picture、image等) 。
搜尋音樂--【inurl:mp3 畢業生】,在所有網路地址中包含“mp3”的頁面中搜尋“畢業生”。這個時候返回的“畢業生”肯定是音樂,而不是關於“畢業生”的其它話題。Google中搜尋音樂的另一有效方式是MP3可以替換為wma/rm等。
搜尋軟體--【inurl:download qq】,直接查找QQ軟體的下載頁面。
搜尋電子論文--【inurl:eprint "Information Retrieval"】 搜尋有關Information Retrieval的電子論文(通常這類搜尋結果能直接下載全文)。
搜尋特定網站中的內容【inurl:lib.nit.net.cn 講座】搜尋http://lib.nit.net.cn 網站中有“講座”的內容,其中網路地址可以有目錄,如lib.nit.net.cn/dlib 。

錨鏈連結搜尋

在做網站中有時候用錨點來連結一個頁面中的其它部分內容,這樣方便瀏覽和定位。如本頁面上方的目錄導航,就是通過錨點連結來實現的,也就是說錨點連結的內容通常是網頁內容中重要的章節或內容的開始部分,因而對它們的搜尋也更能反映網頁的主題內容,提高搜尋結果的準確度。對於熟悉網頁製作的人來說,可以從網頁原始碼中查看有錨點的HTML代碼,如這就是一個錨鏈的連結:
網頁第一部分谷歌網頁搜尋在錨鏈連結中語法是:inanchor或allinanchor。搜尋範圍限制在頁面的連結錨點描述文本進行搜尋。
【inanchor:信息經濟學】搜尋網頁中有“信息經濟學”錨鏈連結的網頁。

文檔類型限定

谷歌網頁搜尋不僅僅能搜尋網頁,還能搜尋各種文檔,通過文檔類型限定只對文檔進行搜尋,從而不顯示頁面的內容。語法是:filetype。這個語法非常有用,我們在網上常常要找一些範文或參考資料的時候常用這個語法。filetype是根據檔案後綴搜尋特定檔案類型,比如支持的文檔有:pdf、ppt、doc、xls等;網頁檔案:htm、asp、php等。
【市場研究報告 filetype:doc】 搜尋有關市場研究報告的WORD文檔。

定義搜尋

谷歌網頁搜尋中搜尋定義的語法是:define。用於搜尋定義或解釋。在閱讀、學習、研究或撰寫論文中,遇到陌生的詞或縮寫,可以用該語法得到確切的定義或解釋。而且可以了解多種語言的定義情況。 【define:文獻】得到關於文獻的多個定義來源。

網頁相關信息搜尋

谷歌提供的網頁相關信息搜尋的語法是:info。通過這個語法能將網頁的快照信息、網頁連結情況、被連結情況和類似網頁的信息供選擇瀏覽。查看樣例:【info:lib.nit.net.cn】,info語法是其它幾個語法的集合:
cache:搜尋谷歌快取的頁面(快照信息)
【cache:lib.nit.net.cn】當前cache語法不支持谷歌中文,本處給的連結實例是在谷歌英文中搜尋的結果。用cache語法的一般情況是:當一個連結無法訪問時(或信息被禁止時);當信息已經被修改,想看以前的信息時。
related:搜尋與特定網頁相關的網站
【related:google.cn】搜尋的結果就是更多的搜尋引擎。related語法對於發現某一類信息非常有用,比如當你用related搜尋一個圖書館網址的時候會出來大量圖書館的網站,如【related:lib.nit.net.cn】;當搜尋某期刊網址的時候,能搜尋出大量給學科領域的相關期刊,如【related:www.lis.ac.cn】
link:搜尋所有連結到某個特定URL上的頁面
【link:lib.nit.net.cn】搜尋連結到寧波理工學院圖書館的頁面。做網站的人往往想知道是哪些網頁連結了該網站。也可用於發現某一個頁面(新聞、信息等)被什麼網頁引用(如部落格中)或收藏。其實,最好的搜尋策略應該是這樣:【link:lib.nit.net.cn -site:lib.nit.net.cn】,刪除自己連結自己的頁面。
site:搜尋範圍限制在某網站或頂級域名中。
【醫藥 site:edu.cn】搜尋我國教育科研網中關於“醫藥”的信息,比如醫藥院校或專業的信息等。這樣能排除很多醫藥領域的公司信息。
【site:lib.nit.net.cn】查看寧波理工學院圖書館的網頁被谷歌收錄(索引)的數量。比較不同圖書館(網站)在網路上的“大小”。
【服務 site:lib.nit.net.cn】搜尋寧波理工學院圖書館網站上的所有關於“服務”的頁面。URL可以帶路徑,現在搜尋該URL下的所有頁面。

混合使用搜尋技術

谷歌網頁搜尋谷歌網頁搜尋

在搜尋實踐中,往往是多種搜尋技術混合使用以滿足特定的信息需求,前面的一些實例中就有體現。但是,混合使用的時候也要注意一些問題。

混合搜尋實例

查找產業報告類的全文資料
當然,可以直接用【產業報告】搜尋,如果你掌握了一定的搜尋語法知識,你可以這樣搜尋:【產業報告 filetype:doc】,能搜尋到word格式的許多行業的產業報告文檔。
而且,你還可以近一步進行限定,搜尋僅2005年以來的相關內容:【產業報告 filetype:doc 2005..】。這樣搜尋到的信息資源並不遜色於專門的數據庫。
查找市場調查報告範文
與上例不同的是還用到了intitle進行限定,從而得到相對精確的搜尋結果。【intitle:市場調查報告 filetype:doc】
搜尋非教科網上關於web2.0的會議
【web2.0 會議 –inurl:edu.cn】
搜尋“輕輕的我走了,正如我輕輕的來”的另類說法,既然是另類說法,當然就不能包含“輕輕”。
【"*的我走了,正如我*的來" –輕輕】
混合使用intitle、site:【intitle:醫藥 site:edu.cn】
inurl限定:限定搜尋特定類別的信息。【"我和你" inurl:mp3】
搜尋特定網站內的文檔(一網打盡!)。【filetype:ppt site:lib.nit.net.cn】

不混合使用情況

不混合使用有抵消的搜尋:【藥品說明書 sitenet.cn –inurl:net】
不要重複使用同一語法結構【藥品說明書site:cn site:com】但是可以【藥品說明書 (site:cn | site:com)】
在混合使用語法時,不要用別名。如allintitle。
不要使用過多的語法將結果限制得特別狹窄,採取逐步增加限制的方法,一般不要一步到位。

有趣的谷歌套用

假日圖示

谷歌每逢節假日、紀念日或重大事件,會更改首頁圖示以示紀念。谷歌假日圖示從1999至今的連結:http://www.google.com/holidaylogos.html

隨機私人相片

隨著使用數位相機拍照的人越來越多,很多人也喜歡將照片發布到網路上,網路上也有很多分享照片的網站。因為數位相機排的照片都會產生默認的檔案名稱,比如我的數位相機默認的檔案名稱是這樣的模式:IMG_0295.JPG,很多人會象我一樣懶,往網路上傳照片或給朋友傳送照片的時候是不會重命名照片的檔案的。因而,我們可以通過類似的檔案名稱,在谷歌中搜尋出很多的照片。網路地址http://www.diddly.com/random/ 就是一個根據不同品牌、型號的數位相機隨機產生照片的檔案名稱,然後到谷哥中搜尋。
其實,我們可以通過谷歌搜尋語法,在中文版本(http://images.google.cn/ )中實現搜尋某一型號數位相機的照片,如:【"IMG_*.JPG" filetype:jpg】 說明:分號是短語搜尋符(或精確搜尋符),其中的星號是通配符filetype:jpg 是限定搜尋檔案的類型是JPG格式
還有更多的格式,如(搜尋時,多個#號用一個號*代替):
"dcp*.jpg" - Kodak, range of 0 to 4000
"dsc*.jpg" - Nikon, range of 0 to 4000
"dscn*.jpg" - Nikon, range of 0 to 4000
"mvc-*.jpg" - Sony Mavica
"mvc*.jpg" - Sony Mavica

重複輸入一個關鍵字多次

我們可以試一試,重複輸入一個關鍵字若干次,然後比較搜尋結果,如:“信息檢索 信息檢索 信息檢索”,你會發現搜尋結果數會變少,有時候也不一定會有太多變化。

10個單詞的限制

包括關鍵字和語法結構加在一起,超過這個限制的部分會被忽略。

手氣不錯

在谷歌首頁,有“手氣不錯”這個按鈕(如圖1中的標識1),當你輸入搜尋詞後,若按“手氣不錯”會直接得到谷歌認為最相關的網站,試一試“www”、“web”,或者你的名字、感興趣的字詞看看,都連結到什麼網站上去了。

計算數字

直接在谷歌網頁搜尋輸入框中輸入算式進行計算,除法是“/” ,乘法是“*”。用慣了網路的人,會覺得比掏出手機來按按鈕要爽。

最有“性格”的城市

谷歌實驗室中的趨勢搜尋。

更多谷歌套用

谷歌除了一些搜尋服務外,還有一些其它網路服務,點擊首頁的“更多”(如圖1中的標識3),等看到更多的谷歌服務內容。

特色

GOOGLE支持多達132種語言,包括簡體中文和繁體中文;
GOOGLE網站只提供搜尋引擎功能,沒有花里胡哨的累贅;
GOOGLE速度極快,據說有8000多台伺服器,200多條T3級寬頻;
GOOGLE的專利網頁級別技術PageRank能夠提供高命中率的搜尋結果;
GOOGLE的搜尋結果摘錄查詢網頁的部分具體內容,而不僅僅是網站簡介;
GOOGLE智慧型化的“手氣不錯”功能,提供可能最符合要求的網站;
GOOGLE的“網頁快照”功能,能從GOOGLE伺服器里直接取出快取的網頁。

主要功能解讀

基本搜尋:+,-,OR

谷歌網頁搜尋谷歌網頁搜尋

GOOGLE無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了。
示例:搜尋所有包含關鍵字“易筋經”和“吸星大法”的中文網頁
搜尋:“易筋經 吸星大法”
結果:已搜尋有關易筋經 吸星大法的中文(簡體)網頁。共約有726項查詢結果,這是第1-10項。搜尋用時0.13秒。
注意:文章中搜尋語法外面的引號僅起引用作用,不能帶入搜尋欄內。

GOOGLE用減號“-”表示邏輯“非”操作
示例:搜尋所有包含“易筋經”而不含“吸星大法”的中文網頁
搜尋:“易筋經 -吸星大法”
結果:已搜尋有關易筋經 -吸星大法的中文(簡體)網頁。共約有5,440項查詢結果,這是第1-10項。搜尋用時0.13秒。
注意:這裡的“+”和“-”號,是英文字元,而不是中文字元的“+”和“-”。此外,操作符與作用的關鍵字之間,不能有空格。比如“易筋經 - 吸星大法”,搜尋引擎將視為邏輯“與”操作,中間的“-”被忽略。
GOOGLE用大寫的“OR”表示邏輯“或”操作。但是,關鍵字為中文的或查詢似乎還有BUG,無法得到正確的查詢結果。
示例:搜尋包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網頁。
搜尋:“britney OR beatles”
結果:已搜尋有關britney OR beatles的中文(簡體)網頁。共約有14,600項查詢結果,這是第1-10項。搜尋用時0.08秒。
搜尋:“布蘭妮 OR 披頭士”
結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網頁。
注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次“與”查詢。
“+”和“-”的作用有的時候是相同的,都是為了縮小搜尋結果的範圍,提高查詢結果命中率
例:查閱天龍八部具體是哪八部。
分析:如果光用“天龍八部”做關鍵字,搜尋結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。
1.如果你知道八部中的某一部,比如阿修羅,增加“阿修羅”關鍵字,搜尋結果就只有995項,可以直接找到全部八部,“天龍八部 阿修羅”。
2.如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,查詢結果為1,010項,可以迅速找到需要的資料,“天龍八部 佛教 -金庸”。

輔助搜尋

通配符、大小寫、句子、忽略字元以及強制搜尋
GOOGLE不支持通配符,如“*”、“?”等,只能做精確查詢,關鍵字後面的“*”或者“?”會被忽略掉。
GOOGLE對英文字元大小寫不敏感,“GOD”和“god”搜尋的結果是一樣的。
GOOGLE的關鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。
示例:搜尋包含“long, long ago”字串的頁面。
搜尋:“"long, long ago"”
結果:已向英特網搜尋"long, long ago". 共約有28,300項查詢結果,這是第1-10項。搜尋用時0.28秒。
注意:和搜尋英文關鍵字串不同的是,GOOGLE對中文字串的處理並不十分完善。比如,搜尋“"啊,我的太陽"”,我們希望結果中含有這個句子,事實並非如此。查詢的很多結果,“啊”、“我的”、“太陽”等詞語是完全分開的,但又不是“啊我的 太陽”這樣的與查詢。顯然,GOOGLE對中文的支持尚有欠缺之處。

GOOGLE對一些網路上出現頻率極高的詞(主要是英文單詞),如“i”、“com”,以及一些符號如“*”、“.”等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法“+”。
示例:搜尋包含“Who am I ?”的網頁。如果用“"who am i ?"”,“Who”、“I”、“?”會被省略掉,搜尋將只用“am”作關鍵字,所以應該用強制搜尋。
搜尋:“"+who +am +i"”
結果:已向英特網搜尋"+who +am +i". 共約有362,000項查詢結果,這是第1-10項。搜尋用時0.30秒。
注意:英文符號(如問號,句號,逗號等)無法成為搜尋關鍵字,加強制也不行。

高級搜尋

site,link,inurl,allinurl,intitle,allintitle
“site”表示搜尋結果局限於某個具體網站或者網站頻道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某個域名,如“com.cn”、“com”等等。如果是要排除某網站或者域名範圍內的頁面,只需用“-網站/域名”。
示例:搜尋中文教育科研網站(edu.cn)上所有包含“金庸”的頁面。
搜尋:“金庸 site:edu.cn”
結果:已搜尋有關金庸 site:edu.cn的中文(簡體)網頁。共約有2,680項查詢結果,這是第1-10項 。搜尋用時0.31秒。
示例:搜尋包含“金庸”和“古龍”的中文新浪網站頁面,

搜尋:“金庸 古龍 site:sina.com.cn”
結果:已在sina.com.cn搜尋有關金庸 古龍的中文(簡體)網頁。共約有869項查詢結果,這是第1-10項。搜尋用時0.34秒。
注意:site後的冒號為英文字元,而且,冒號後不能有空格,否則,“site:”將被作為一個搜尋的關鍵字。此外,網站域名不能有“http”以及“www”前綴,也不能有任何“/”的目錄後綴;網站頻道則只局限於“頻道名.域名”方式,而不能是“域名/頻道名”方式。諸如“金庸 site:edu.sina.com.cn/1/”的語法是錯誤的。
“link”語法返回所有連結到某個URL地址的網頁。
示例:搜尋所有含指向華軍軟體園“www.newhua.com”連結的網頁
搜尋:“link:www.newhua.com”
結果:搜尋有連結到www.newhua.com的網頁。共約有695項查詢結果,這是第1-10項。搜尋用時0.23秒。
注意:“link”不能與其他語法相混合操作,所以“link:”後面即使有空格,也將被GOOGLE忽略。
inurl語法返回的網頁連結中包含第一個關鍵字,後面的關鍵字則出現在連結中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,於是,就可以用INURL語法找到這些相關資源連結,然後,用第二個關鍵字確定是否有某項具體資料。INURL語法和基本搜尋語法的最大區別在於,前者通常能提供非常精確的專題資料。
示例:查找MIDI曲“滄海一聲笑”。
搜尋:“inurl:midi 滄海一聲笑”
結果:已搜尋有關inurl:midi 滄海一聲笑的中文(簡體)網頁。共約有14項查詢結果,這是第1-10項。搜尋用時0.01秒。
示例:查找微軟網站上關於windows2000的安全課題資料。
搜尋:“inurl:security windows2000 site:microsoft.com”
結果:已在microsoft.com內搜尋有關 inurl:security windows2000的網頁。共約有198項查詢結果,這是第1-10項。搜尋用時0.37秒。
注意:“inurl:”後面不能有空格,GOOGLE也不對URL符號如“/”進行搜尋。GOOGLE對“cgi-bin/phf”中的“/”當成空格處理。
allinurl語法返回的網頁的連結中包含所有查詢關鍵字。這個查詢的對象只集中於網頁的連結字元串。
示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程式(這個腳本是不安全的),表現在連結中就是“域名/cgi-bin/phf”。
語法:“allinurl:"cgi-bin" phf +com”
搜尋:已向英特網搜尋allinurl:"cgi-bin" phf +com. 共約有40項查詢結果,這是第1-10項。搜尋用時0.06秒。
allintitle和intitle的用法類似於上面的allinurl和inurl,只是後者對URL進行查詢,而前者對網頁的標題欄進行查詢。網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。
示例:查找日本明星藤原紀香的照片集。
搜尋:“intitle:藤原紀香 寫真”
結果:已搜尋有關intitle:藤原紀香 寫真的中文(簡體)網頁。共約有284項查詢結果,這是第1-10項。搜尋用時0.03秒。
GOOGLE的罕用高級搜尋語法:related,cache,info
related用來搜尋結構內容方面相似的網頁。例:搜尋所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),“related:www.sina.com.cn/index.shtml”。
cache用來搜尋GOOGLE伺服器上某頁面的快取,這個功能同“網頁快照”,通常用於查找某些已經被刪除的死連結網頁,相當於使用普通搜尋結果頁面中的“網頁快照”功能。
info用來顯示與某連結相關的一系列搜尋,提供cache、link、related和完全包含該連結的網頁的功能。
示例:查找和新浪首頁相關的一些資訊。
搜尋:“info:www.sina.com.cn”
結果:有關www.sina.com.cn的網頁信息。
新浪首頁
北京站 上海站 廣東站. ... 遊戲世界, |, 影音娛樂, |, Club緣, |, 男
人女人, |, 論壇聊天, |, 時尚潮流, |, 文教育兒, |, 車行天下, |, 軟體下載....
Google 提供這個網址的信息: 查看Google網頁快照里www.sina.com.cn的存檔 尋找和www.sina.com.cn類似的網頁 尋找網頁有連結到www.sina.com.cn 尋找網頁包含有'www.sina.com.cn'

其他重要功能

目錄服務

如果不想搜尋網頁,而是想尋找某些專題網站,可以訪問GOOGLE的分類目錄“http://directory.google.com/”,中文目錄是“http://directory.google.com/Top/World/Chinese_Simplified/”。不過由於GOOGLE的目錄由志願者服務,而GOOGLE在國內名氣相對比較小,因此中文目錄下收錄站點很少。  

工具條

為了方便搜尋者,GOOGLE提供了工具條,集成於瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具條內輸入關鍵字進行搜尋。此外,工具條還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞組搜尋、高級搜尋和搜尋設定之間切換。欲安裝GOOGLE的工具條,可以訪問“http://toolbar.google.com/”,按頁面提示可以自動下載並安裝。

新聞組(USENET)搜尋

新聞組中有大量的有價值信息,DEJA一直是新聞組搜尋引擎中的佼佼者。2001年2月份,GOOGLE將DEJA收購併提供了所有DEJA的功能。現在,除了搜尋之外,GOOGLE還支持新聞組的WEB方式瀏覽和張貼功能。
輸入“http://groups.google.com/”後,便進入GOOGLE新聞組界面。可惜現在還沒有中文界面。因為新聞組中的帖子實在是多,所以我點擊“Advaced Groups Search”進入高級搜尋界http://groups.google.com/advanced_group_search。新聞組高級搜尋界面提供對關鍵字、新聞組、主題、作者、帖子序號、語言和發布日期的條件搜尋。其中作者項指作者發帖所用的唯一識別號電子信箱。比如要在alt.chinese.text內搜尋著名老牌網路寫手圖雅的帖子,可以用下列指令“group:alt.chinese.text author:[email protected]”。不過一般而言,我更推薦使用圖形搜尋界面,方便而且直觀。

搜尋結果翻譯

曾經為那些你不懂的法文、西班牙文頁面煩惱么?現在,GOOGLE支持一項搜尋結果翻譯功能,可以把非英文的搜尋結果翻譯成英文!!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,這是個偉大的改進。
不過,目前只能在英文狀態GOOGLE下實現這個功能。進入GOOGLE的設定頁面,http://www.google.com/preferences,有一個“BETA: Enable translation of search results into your interface language. ”的選項,把它選中,就OK了。

搜尋結果過濾

網路上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設定頁面,http://www.google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態下的GOOGLE尚沒有這個功能。

PDF文檔搜尋

很多人對GOOGLE尤其欣賞的一點就是它提供對PDF文檔內文的檢索。目前GOOGLE檢索的PDF文檔大約有2500萬左右。這真是太美妙了。PDF是ADOBE公司開發的電子文檔格式,現在已經成為網際網路的電子化出版標準。PDF文檔通常是一些圖文並茂的綜合性文檔,提供的資訊一般比較集中全面。
示例:搜尋關於電子商務(ECOMMERCE)的PDF文檔。
搜尋:“inurl:pdf ecommerce”
結果:已向英特網搜尋inurl:pdf ecommerce. 共約有19,200項查詢結果,這是第1-10項。搜尋用時0.11秒。
下面是某項搜尋結果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字檔 - 類似網頁
可以看到,GOOGLE在PDF檔前加上了[PDF]的標記,而且,GOOGLE把PDF檔案轉換成了文字檔,點擊“一般文字檔”,可以粗略的查看該PDF文檔的大致內容。當然,PDF原有的圖片以及格式是沒有了。

圖像文檔搜尋

GOOGLE提供了Internet上圖像檔案的搜尋功能!!目前該功能尚在B測試階段,但已經非常好用。訪問地址是“images.google.com”。你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如“britney spears”,也可以輸入描述圖像質量或者其他屬性的關鍵字,如“high quality”。
GOOGLE給出的搜尋結果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖像檔案名稱稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面連結,而下禎,則是該圖像所處的頁面。螢幕右上角有一個“Remove Frame”的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。GOOGLE還提供了對成人內容圖像的限制功能,可以讓搜尋者免受不必要的騷擾。
不過,非常遺憾的是,圖像搜尋功能還不支持中文。

搜尋技巧訓練

關鍵字的選擇在搜尋中起到決定性的作用,所有搜尋技巧中,關鍵字選擇是最基本也是最有效的。

例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。

分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜尋引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果了解目標信息的構成,用一些目標信息所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜尋關鍵字不一定就是目標信息的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。
搜尋:“酒 貴 賤 之”,OK,找到的第一條信息就是鏡花緣的這一段落:“先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...”
以上的關鍵字選擇技巧可以謂之“特定詞法”。

例二:“黃花閨女”一詞中“黃花”是什麼意思。

分析:“黃花閨女”是一個約定的俗語,如果只用“黃花閨女 黃花”做關鍵字,搜尋結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵字,約束搜尋結果。選擇什麼關鍵字好呢?備選的有“意思”、“含義”、“來歷”、“由來”、“典故”、“出典”、“淵源”等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字里,所以用諸如“來歷”、“由來”、“出典”等辭彙的機率更高一些。
搜尋:“黃花閨女 黃花 由來”,查到“黃花”原來出典於《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用“太平御覽 壽陽公主”做搜尋了。
以上的關鍵字選擇技巧可以謂之“近義詞法”。
例三:劉德華同志的胸圍是多少。
分析:首先聲明,這是把它作為搜尋案例而已,沒其他的意思。非常直接的搜尋是,“劉德華 胸圍”,但事實上,這么搜尋出來的結果,儘是一些諸如“劉德華取笑莫文蔚胸圍太小”之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關信息。OK,這樣就可以進一步的增加其他約束性關鍵字以縮小搜尋範圍。
搜尋:“劉德華 胸圍 身高”,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》里居然含有這樣關鍵字,阿泰“改編自劉德華《忘情水》的變態歪歌”、“用身高體重三圍和生日來加以編號”。好辦,把這部小說去掉,“劉德華胸圍 身高 -阿泰”,OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用“阿泰”而不用“第一次親密接觸”呢?這是因為小說的名字被轉載的時候可能有變動,但裡面角色的名字是不會變的。
以上的關鍵字選擇技巧可以謂之“相關詞法”。
其他常用搜尋個案
例一:找人

分析:一個人在網上揭示的資料通常有:姓名,網名,性別,年齡,畢業學校,工作單位,外號,住址,電話,信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要了解一下你多年沒見過的同學,那不妨用上述信息做關鍵字進行查詢,也許會有大的收穫。
例二:找軟體
分析一:最簡單的搜尋當然就是直接以軟體名稱以及版本號為關鍵字查詢。但是,僅僅有軟體名稱和目標網站,顯然還不行,因為搜尋到的可能是軟體的相關新聞。應該再增加一個關鍵字。考慮到下載頁面上常有“點擊此處下載”或者“download”的提示語,因此,可以增加“下載”或者“download”為關鍵字。
搜尋:“winzip 8.0 下載”
結果:已搜尋有關winzip 8.0 下載的中文(簡體)網頁。共約有6,670項查詢結果,這是第1-10項。搜尋用時0.22秒。
分析二:很多網站設有專門的下載目錄,而且就命名為“download”,因此,可以用INURL語法直接搜尋這些下載目錄。
搜尋:“winzip 8.0 inurl:download”
結果:已搜尋有關winzip 8.0 inurl:download的中文(簡體)網頁。共約有358項查詢結果,這是第1-10項。搜尋用時0.44秒。
在網際網路上隨意的下載軟體是不安全的,因為供下載的軟體有可能帶有病毒或者捆綁了木馬,所以,對下載網站作一個限定,是一個穩妥的思路。可以用SITE語法達到這個目的。
共享軟體下載完之後,使用的時候,軟體總跳出警示框,或者軟體的功能受到一定限制。由於中國的網民多是窮棒子,所以應該再找一個註冊碼。找註冊碼,除了軟體的名稱和版本號外,還需要有諸如“serial number”、“sn”、“序列號”等關鍵字。現在,來搜尋一下winzip8.0的註冊碼。
搜尋:“winzip 8.0 sn”
結果:已向英特網搜尋winzip 8.0 sn. 共約有777項查詢結果,這是第1-10項。搜尋用時0.30秒。
例三:找圖片
除了GOOGLE提供的專門圖片搜尋功能,還可以組合使用一些搜尋語法,達到圖片搜尋之目的。
分析一:專門的圖片集合,提供圖片的網站通常會把圖片放在某個專門目錄下,如“gallary”、“album”、“photo”、“image”等。這樣就可以使用INURL語法迅速找到這類目錄。現在,試著找找小甜甜布蘭妮的照片集。
搜尋:“"britney spears" inurl:photo”
結果:已向英特網搜尋"britney spears" inurl:photo. 共約有2,720項查詢結果,這是第1-10項。搜尋用時0.23秒。
分析二:提供圖片集合的網頁,在標題欄內通常會註明,這是誰誰的圖片集合。於是就可以用INTITLE語法找到這類網頁。
搜尋:“intitle:"britney spears" picture”
結果:已向英特網搜尋intitle:"britney spears" picture. 共約有317項查詢結果,這是第1-10項。搜尋用時0.40秒。
分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。於是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。
搜尋:“"britney spears" site:geocities.com”
結果:已在geocities.com內搜尋有關"britney spears"的網頁。共約有5,020項查詢結果,這是第1-10項。搜尋用時0.47秒。
例四:找MP3
分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。所以,可以用INURL語法迅速找到這類目錄。現在用這個辦法找找老歌“say you say me”。
搜尋:“"say you say me" inurl:mp3”
結果:已向英特網搜尋inurl:mp3 "say you say me". 共約有155項查詢結果,這是第1-10項。搜尋用時0.17秒。
分析二:也可以通過網頁標題,找到這類提供MP3的網頁。
搜尋:“"say you say me" intitle:mp3”
結果:已向英特網搜尋"say you say me" intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜尋用時0.73秒。
當然,如果你知道某個網站的下載速度快,而且樂曲全,就可以用SITE語法先到該網站上看看有沒有目標樂曲。
例五:找書
分析一:對我而言,常訪問的電子圖書館類網站就那么幾個,比如文藝類的“www.shuku.net”。於是可以用SITE語法很簡單的找到某本書(如果該網站上有的話)。比如,“舊唐書 site:shuku.net”,就可以馬上找到該書。如果沒有,通常別的網站上也很難找到。因此,找書的關鍵,是你了解一大批著名的圖書館網站。
分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對於迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的內容有印象的基礎上。比如如果了解堂吉訶德一書戰風車的大致內容,就可以用“吉訶德風車 桑喬”迅速找到該書。

GOOGLE搜尋FAQ

Q:如何全面的了解google.com?
A:查看網站相關頁面“http://www.google.com/about.html”。
Q:如何切換google.com的初始語言界面
A:點擊搜尋欄右邊的“使用偏好”(Preferences),選擇“界面語言”(Interface Language)中你期望的語言,點擊最下面的“設定使用偏好”(Save Preferences)按鈕。需要提醒的是,GOOGLE用cookie記錄這個偏好,所以如果你把瀏覽器的cookie功能關掉,就無法進行設定。
Q:如何設定每頁搜尋結果顯示數量?
A:同上,進入使用偏好,在該頁的“查看結果”(Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,默認是10項。
Q:搜尋到的連結無法打開怎么辦?
A:連結無法打開的原因很多,比如網站當機,或者ISP過濾等,可以點擊Google的“網頁快照”查看在GOOGLE伺服器上的網頁快取
Q:打開搜尋結果的連結,可是該頁面太大,很難找到一下子找到目的資料怎么辦?
A:直接打開“網頁快照”,GOOGLE會把關鍵字用不同顏色標記出來,很容易找到。

相關詞條

相關搜尋

熱門詞條

聯絡我們