【京東】巧用robots避免蜘蛛黑洞

DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO高級教程 >> 【京東】巧用robots避免蜘蛛黑洞

【京東】巧用robots避免蜘蛛黑洞

編輯：SEO高級教程

對於百度搜索引擎來說，蜘蛛黑洞特指網站通過極低的成本制造出大量參數過多，及內容雷同但具體參數不同的動態URL ，就像一個無限循環的“黑洞”將spider困住，Baiduspider浪費了大量資源抓取的卻是無效網頁。
比如很多網站都有篩選功能，通過篩選功能產生的網頁經常會被搜索引擎大量抓取，而這其中很大一部分檢索價值不高，如“500-1000之間價格的租房”，首先網站（包括現實中）上基本沒有相關資源，其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取，只能是占用網站寶貴的抓取配額。那麼該如何避免這種情況呢？
我們以北京某團購網站為例，看看該網站是如何利用robots巧妙避免這種蜘蛛黑洞的：

對於普通的篩選結果頁，該網站選擇使用靜態鏈接，如：http://bj.XXXXX.com/category/zizhucan/weigongcun
同樣是條件篩選結果頁，當用戶選擇不同排序條件後，會生成帶有不同參數的動態鏈接，而且即使是同一種排序條件（如：都是按銷量降序排列），生成的參數也都是不同的。如：http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

對於該團購網【京東商城】來說，只讓搜索引擎抓取篩選結果頁就可以了，而各種帶參數的結果排序頁面則通過robots規則拒絕提供給搜索引擎。

QQ圖片20141017103720.jpg
robots.txt的文件用法中有這樣一條規則：Disallow: /*?* ，即禁止搜索引擎訪問網站中所有的動態頁面。該網站恰是通過這種方式，對Baiduspider優先展示高質量頁面、屏蔽了低質量頁面，為Baiduspider提供了更友好的網站結構，避免了黑洞的形成。

SEO高級教程

seo新手必看超級完整詳細的SEO優化方案: 雖然做SEO的站長，誰也不可能精通SEO網站優化排名的每一個細節，即使百度工作人員，也不
【廣安SEO】談原創: 這段時間老師問我，為什麼我復制了多個URL中去檢測網站的收錄，確沒有看到收錄的情況。其實做SE
seo經驗分享之代碼精簡: 昨天晚上斷網了，很悲催！於是乎，就想到了一個命題，斷網的Seo能干什麼？雖然感覺很不切合實際

DIV CSS 佈局教程網

相關文章