類似網頁

類似網頁指的是Google並沒有解釋類似網頁是怎么得到的。有很多人做了一定的研究發現,類似網頁通常和連結及網站主題有關。

前言:

當你在Google中做任何一個關鍵字搜尋後,在Google給出的搜尋結果當中,你還會看到“網頁快照”(Cached)和“類似網頁”(Similar pages)兩個選擇。
網頁快照就是存在Google資料庫中的所列網頁的文字內容,也就是上一次Google蜘蛛所抓取的網頁內容。
類似網頁指的是什麼呢?到目前為止,Google並沒有解釋類似網頁是怎么得到的。有很多人做了一定的研究發現,類似網頁通常和連結及網站主題有關。
如果你點擊類似網頁的話,你會發現列出的所謂類似網頁,有的時候沒有很明顯的規律。比如說大部分認為,類似網頁是會列出你連結出去的其他網頁,或者連結到你的其他網頁。
但是有的時候,在類似網頁當中所列出的網頁或者網站,既沒有連結到你的網站,你也沒有連結到那個網站。兩者之間沒有直接的關係,也不屬於同一個企業,有的時候甚至不是同一個行業。在一些極端的情況下,兩個網站可能一點都不類似。
那么,類似網頁是根據什麼條件或算法所得出的呢?進一步的觀察會發現,類似網頁當中所列出的這些網址,往往是和你自己的網站被第三者所共同引用的其他網站。

類似網頁是根據什麼條件或算法所得出

舉例來說,你自己的網站是A,有一個第三方網站B,在他的網站B上提到了你的網站A,在同一個網頁B上也提到了另一個網站C,那么對Google來說,你的網站A和網站C也構成了相關性。雖然A和C之間沒有直接的聯繫。
那么這對你的搜尋引擎最佳化有什麼影響呢?最重要的是,當你尋求連結或者買連結的時候,要注意你所要得到的連結網站B,除了連向你以外,還連向哪些其他網站。這些網站構成了在你的網站周圍的一個社區,這些社區會形成一個共同的主題,你的網站也就屬於這個共同主題。
比如說,如果你的網站是關於計算機,那么你從某一個大型網站上買連結,而這個大型網站還賣連結給某食品批發網站。那么對Google來說,你的網站主題就會 偏離你實際上的主題,也就是計算機。如果這種連結很多的話,就有可能影響你的以計算機為關鍵字的搜尋引擎結果。這是你所能控制的部分,也就是在尋找或者購 買連結的時候。
那么有一部分是你不能控制的,比如說其他網站因為喜歡你的網站而連結向你。這是你沒辦法控制的,實際上是你應該高興的。但是如果這位站長也連向和你的網站完全不相關的網站,怎么辦呢?
從邏輯上來說,如果這種連結太多的話,也會影響你的排名。但從另外一個角度看,很難想像這種連結大量存在。因為一般的站長也不會毫無邏輯的在他的網頁上放一大堆無用的連結。
這種雜亂無章的沒有主題的連結,通常只會在買連結的時候才會出現。

補充材料:

在Google搜尋結果中除了列出網頁的網頁快照,類似網頁以外,有時候Google還會把網頁標誌為補充材料。
到目前為止,Google並沒有太多信息告訴大家補充材料是怎么定義的。在Google自己的網站管理員指南中所給的官方信息是這樣寫的:
補充網站是Google輔助索引的一部分。對輔助索引進行抓取的限制少於主要索引。例如,一個網址的參量可能使該網站無法被抓取到主要索引中,但仍可能被抓取到我們的補充索引里。
將網站包括其中的索引是完全自動的,沒有任何方式可以選擇或更改您網站的索引。請放心,包含網站的索引不會影響該網站的PageRank。
實際的情況是,被標為補充材料的網頁在Google搜尋結果中一般都會被排在普通網頁的後面,所以通常是找不到的。除非關鍵字是比較長,並且比較具體的時候,補充材料才會出現。
被標為補充材料的網頁是在單獨的資料庫(補充索引)里,不是主索引資料庫,在補充索引里的網頁被爬行的次數會減少,網頁快照的日期也通常都是很舊的。
如果你的網站有很多網頁被標為補充材料,在絕大部分情況下都不是什麼好事。因為只有在普通結果不夠的時候,被標為補充材料的網頁才會出現在搜尋結果中,自然對網頁的排名有很大影響。
被標為補充材料的網頁,通常有下面幾種情況:
第一:有網址規範化問題。也就是帶有www和沒有www的兩個網址版本都在資料庫中,那么其中一個就有可能被標為補充材料。
第二:有時候已經被刪除的網頁,也就是實際上應該返回404錯誤的URL,會被列為補充材料。或者域名已經過期了,也有時會被標成補充材料。
第三:有時候站長在改動網頁之後,新舊內容的兩個版本的網頁都會出現在Google索引中。而糟糕的是,其中一個會被標為補充材料。
第四:複製內容網頁。很多轉載或抄襲的內容會被標為補充材料。因為Google也沒辦法判斷哪一個是原創的,所以有時候原創者也會遭殃。
第五:網頁上相同或相似的內容太多。比如導航系統占網頁內容比例比較大,而正文部分比較小。

相關詞條

熱門詞條

聯絡我們