DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> 教你正確識別百度蜘蛛中的偽蜘蛛
教你正確識別百度蜘蛛中的偽蜘蛛
編輯:SEO優化集錦     

查看網站log日志來分析蜘蛛的抓取情況是我們SEO工作者必須要掌握的,但是特別要注意一些百度蜘蛛,這些蜘蛛在我們看來是沒有哪些不尋常的,但是它們的有些卻是一些偽蜘蛛,那麼該要如何去識別這些偽蜘蛛呢?

何為“偽蜘蛛”,顧名思義就是假蜘蛛,所以我們稱非正常抓取網頁的百度蜘蛛都是一些偽蜘蛛。

大家都知道的是站長工具在查看網站信息後,就會出現“偽蜘蛛”的IP。現在的站長工具IP地址為“117.28.255.42”,通常我們看到以"117"開頭的IP地址的百度蜘蛛都是偽蜘蛛,所以大家可以直接忽視了。想要識別時,直接使用命令行工具輸入指令“tracert IP地址”,出現的結果如下圖示:

站長工具百度蜘蛛

而今天還要介紹一種“偽蜘蛛”,這種蜘蛛同樣也是百度官方的,但是卻是以不建立網頁索引為目的的蜘蛛。這類蜘蛛只是為了匹配網頁內容才來抓取我們的網頁的,是不建立任何的索引的。所以這些百度蜘蛛我們也說它們是偽蜘蛛。

這些蜘蛛在cmd命令行工具tracert IP地址時,是看不出任何奇怪的現象的,和普通的百度蜘蛛沒有什麼兩樣。如下圖:

百度聯盟蜘蛛

其實我們再回頭看一下這個百度蜘蛛的IP地址,會發現這些IP和正常的IP是一樣的,同樣都是以“123”開頭的,筆者的網站就曾出現過很多類似蜘蛛,所以就是說通過tracert命令也是不能完全的說明這個IP就是真的百度蜘蛛的。

這樣一來,除了聯盟蜘蛛大家要注意以外,也要注意百度廣告蜘蛛等偽蜘蛛的IP。

綜上所述,通過tracert命令查詢出來的蜘蛛只能查看非百度官方的蜘蛛,而對於百度內部的一些蜘蛛(譬如百度聯盟)還得我們手工去認識它並識別它到底是不是真正的能夠建立索引的百度蜘蛛。 

本文原創自http://www.45fan.com,轉載需注明出處。

注:相關網站建設技巧閱讀請移步到建站教程頻道。

收藏本文

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved