補充材料

補充材料(Supplemental Result), 是Google 輔助索引的一部分。對輔助索引進行抓取的限制少於主要索引。例如,一個網址的參量可能使該網站無法被抓取到主要索引中,但仍可能被抓取到Google 的補充索引里。

根據Google 的說法,作為補充材料的網頁,只是一種輔助、補充的索引,並不作為主要索引。也就是說,這些網頁並非在Google 的主數據庫中,而是在輔助資料庫中。一般情況下,當我們在Google 上進行搜尋時,它展現給我們的結果是主資料庫中的網頁,並非輔助資料庫中的網頁。由此可以得出結論,作為補充材料的網頁,在Google 的表現會非常差。
根據一些搜尋引擎關注者的觀察,作為補充材料的網頁,被Google 爬蟲爬行的間隔時間非常長,很多時候幾個月、甚至半年都不會被Google 爬蟲造訪,嚴重影響網頁在Google 資料庫中的更新。同時,這些網頁的排名非常差,只有在搜尋結果很少的時候,才會被Google 列出來。
一般情況下,根本無法在搜尋結果里看見這些網頁。如果網頁被Google 列為補充材料,這對於網站來說是一件不幸的事情。被列為補充材料的網頁,在搜尋結果中的排名,都會表現非常差。如果網站本身的PR 值較高,情況會稍好一些。
是什麼原因造成了網頁被Google 認為補充材料呢?從Google 自己提供的信息中,我們看不到任何有價值的資料。主要原因可能是網頁的Head 部分的Description 書寫不規范造成的和網頁內容是複製的。
某位搜尋引擎關注者曾經有6 個相同主題的網站,這些網站都是用同一個資料庫生成的,其中有100 多個網頁的內容幾乎完全一樣,而且都是用XHTML+CSS 技術製作。在這些網站中,只有一個網站的所有網頁不是補充材料,其他的網站的頁面,除了首頁之外全部都是補充材料。因此懷疑補充材料是由於複製網頁造成的。
在複製網頁的情況下,補充材料是某一個特定的URL,而不是一個網頁或者一個檔案。比如說qyseo.net 和www.qyseo.net ,一般來說是同一個檔案,但是是兩個不同的URL。這兩個URL 有可能其中一個是正常網頁,另外一個卻是補充材料。
補充材料是針對特定的日期所抓取的網頁快照,也就是說即使是相同的URL,在Google 資料庫中也可能存在多個版本,其中一個版本是日期A 所抓取的新的內容,這個URL+這個特定的日期和網頁快照,可能是在正常的資料庫中。而另外一個日期B 所抓取的內容(同一個URL,比較老的內容),卻可能是在補充材料資料庫中。
在分析了不是補充材料的網站的網頁後,還發現只有這個網站的Description 書寫規範,Description 內容由成段的句子組成,與網頁的內容吻合; 而被作為補充材料的網頁,Description 內容書寫得都很不規範,都是將關鍵字堆砌幾遍。發現這個問題後,搜尋引擎關注者將其中某些網站網頁的Description 修改為規範的寫法,以期觀察。但是由於Google 幾個月都不更新這些頁面,無法觀察到結果。於是,搜尋引擎關注者又用同樣的資料庫,做了兩個網站,這兩個網站的內容與以前的網站幾乎完全相同,但是Description 採用規範的寫法。這兩個網站被Google 收錄後,所有網頁都不是補充材料。
由此,得出結論,Google 補充材料形成的原因是: 網頁的Description 寫法不規範。
補充材料對排名的影響
這個問題就比較複雜,要具體情況具體分析。像前面講的,同一個URL 可能出現在不同的資料庫中,新版本的URL 可能會出現在正常的主要關鍵字的搜尋中。但是在其他關鍵字搜尋中,它也可能出現在補充材料中。
如果你的網站有很多補充材料,有可能影響排名。但是如果這些補充材料都有一個相應的新的URL+日期+網頁快照版本,對排名的影響就不大。如果這些補充材料沒有新的版本,影響就比較大。
怎樣避免出現補充材料?
1. 網頁的Description 寫法不規範
解決網頁被Google 列為補充材料的主要方法,就是規範書寫Description 。不要在Description 里堆砌關鍵字,Description 的內容要與頁面的內容吻合; 保持合理的網站結構,確保每個頁面都有連線指向,並且連線不被埋藏得很深。
2. 有網址規範化問題。也就是帶有www 和沒有www 的兩個網址版本都在資料庫中,其中一個就有可能被標為補充材料。目前可以通過Google 提供的管理員工具來統一www 和無www 域名的網站。
3. 有時候已經被刪除的網頁,也就是實際上應該返回404 錯誤的URL,會被列為補充材料; 或者域名已經過期了,也有時會被標成補充材料。
4. 有時候站長在改動網頁之後,新舊內容的兩個版本的網頁都會出現在Google 索引中; 糟糕的是,其中一個會被標為補充材料。
5. 複製內容網頁。很多轉載或抄襲的內容會被標為補充材料。因為Google 也沒辦法判斷哪一個是原創的,所以有時候原創者也會遭殃。
6. 網頁上相同或相似的內容太多。比如導航系統占網頁內容比例比較大,而正文部分比較小。

相關詞條

熱門詞條

聯絡我們