DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> 重復內容:起因和解決方法
重復內容:起因和解決方法
編輯:SEO優化集錦     

像谷歌等搜索引擎有一個問題。他們稱之為“重復內容”。你的內容展示在網站各個不同頁面,他們不知道該展示那個地址。尤其是當人們鏈接到你所有的不同版本的內容時,這個重復內容會更嚴重。這篇文章旨在讓你了解造成重復內容的不同原因,然後找出各個的解決之道。

重復內容原因

1、誤解URL概念

2、session ID‘s

3、URL 跟蹤參數

4、內容搜刮&內容聚合

5、參數順序

6、評論分頁

7、打印頁面

8、www vs. 無www

概念上的解決方法 “canonical”標簽

1、識別重復內容

2、谷歌網站管理員工具

3、搜索指令查詢title

解決重復內容的實踐操作

1、避免重復內容

2、301重定向

4、使用rel=“canonical”標簽

5、鏈接鏈向原始內容

總結:重復內容是可以解決的也應該解決

你可以把重復內容比作你站在你一個十字路口,道路標志上有兩個不同方向都指向同一個目的地,究竟該走哪一條路?更有甚者在當你的目的地不一樣時,情況會更糟糕。作為一個讀者,不會管內容從哪裡來,但是搜索引擎不得不挑選一個展示在搜索結果中,因為他們不想把同樣的內容展示兩次。

比方說,關於關鍵詞X的內容展示在http://www.example.com/keyword-x/這個URL上,同樣的內容也出現在http://www.example.com/article-category/keyword-x/上,這種情況可不是虛構的哦,在很多cms系統中都存在這個問題。比如你的文章已經被一些網友收藏轉載了,一些人鏈向你的第一個URL,一些人鏈向你的第二個URL。這時重復內容問題就來啦。如果所有關於這個關鍵字的鏈接都指向一個URL的話,關鍵詞在首頁的幾率也會高很多。

重復內容起因

有很多因素可以導致重復內容。絕大部分都是技術上的,一個人決定把同樣的內容放在兩個不同的地方,並不指出原始出處這種情況不是很常見,絕大部分人都會覺得不舒服。技術上的理由也是很充分。它產生的絕大部分原因是程序員沒有站在浏覽器或者用戶角度,也沒管搜索引擎蜘蛛,只是按照程序員的思維。假設之前提到的那篇文章它出現在http://www.example.com/keyword-x/ 和 http://www.example.com/article-category/keyword-x/? 如果你問程序員,他會說它是僅出現一次啊。

誤解URL的概念

那麼程序員都瘋了嗎?不,沒有,他只是再說另一種語言。你看到的整個網站可能都是數據庫驅動的。在那個數據庫裡面,只有一篇文章,網站程序允許數據庫中的一篇文章可以通過不同的URL訪問得到。因為在程序員眼裡,唯一的標志是數據庫中的文章只有唯一的ID,而不是URL。對於搜索引擎,URL才是一篇文章的唯一識別符。如果你這樣跟你的程序員說,他才會意思到問題原因,接著他會像與我共事的大部分程序員一樣,想搜索引擎愚蠢在哪裡以及為什麼他不能解決這個問題。如此他又走向另一個錯誤的思維。

Session ID

你常想著去追蹤你的訪問者的軌跡,比如存儲他們在購物車購買的物品。要做到這一點,你必須給他們一個session(會話)。一個session會話基本上是訪客在你網站所做的簡短歷史,可能包含內容比如購物車裡面的物品。為了保持訪客從點擊一個網頁到另一個網頁的會話session,需要存儲子某個地方。最常見的解決方法是cookies,然而搜索引擎通常不會存儲cookies。

在這一點上發生了什麼,一些網站系統在URL中使用session ID來返回。在這一點上每個網站上的內部鏈接都會被追加上session ID,而session ID又是唯一的,這樣產生了新的URL,因此重復內容產生了。

使用追蹤和排序的URL參數

另一個引起重復內容的原因是URL參數的使用,雖然參數不會改變頁面內容,比如在跟蹤鏈接裡面。你會看到 http://www.example.com/keyword-x/ 和 http://www.example.com/keyword-x/?source=rss等對搜索引擎來說都不是同樣的URL。後者可能是允許你跟蹤來源,它可能會使你的排名變得有點困難,一個非常不好的負面效果。

這個不僅適用於跟蹤參數,它還適用每一個你加在URL後面的參數不會改變你網頁上的實際內容。涉及到參數會改變網頁上產品的順序或者展示另外一個sidebar這些都會導致重復內容。

內容搜刮和內容聚合

雖然引起重復內容的絕大部分原因在於你自己,或者至少是你網站的過失,有時是其他網站有沒有經你同意使用你的內容。他們並不總是鏈向你的原始內容,搜索引擎也不知道就會不得不處理你的同樣文章的另外版本。

你的網站越來越流行,遇到的搜刮也越來越多,問題也會越來越嚴重。

參數順序

另一個較常見的原因就是cms不會使用簡潔干淨的URL,而是使用比如 /?id=1&cat=2,這裡的ID指示文章,cat指示分類。在大部分的建站系統中,這個URL /?cat=2&id=1 也將會渲染同樣的內容,但是對搜索引擎來說他們就是完全不同的。

評論分頁

在wordpress系統或者其他程序裡面會有一個評論分頁的選項。這將會導致文章內容在 文章本身的URL 還有文章的URL+/comment-page-1/, /comment-page-2/ 等的重復。

打印頁面

如果你的cms會產打印頁面而且從你的文章頁面還有鏈接,在絕大部分情況下谷歌會發現這些頁面,除非你特別阻止他們。谷歌該展示那一個版本?一個有廣告和周邊內容的頁面或者一個只有你文章的頁面。

WWW vs. non-WWW

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved