DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> SEO掃盲:Baiduspider,Robot是什麼?
SEO掃盲:Baiduspider,Robot是什麼?
編輯:SEO優化集錦     

編者按,如果你是一位新手站長,不明白什麼是Robot,不知道如何查看網站日志?不用怕,這篇SEO掃盲文章教你如何查看網站日志。

Robot英文直譯是機器人,在搜索引擎優化SEO中,我們經常翻譯為:探測器。

有時,你會碰到crawler(爬行器),spider(蜘蛛),都是探測器之一,只是叫法不同。

SEO中常說的這個探測器(Robot)是什麼?

搜索引擎用來抓取網頁的工具。它是一個軟件或者說一系列自動程序(顯然,不是一部機器)。

不同的搜索引擎給他們自己的探測器(Robot)起不同的名字。

谷歌:googlebot 百度:baiduspider MSN:MSNbot Yahoo:Slurp (yahoo家的這位比較特殊,沒有帶“姓”,並且用的是一個擬聲詞。Slurp,中文理解是機器人吃東西時發出的啧啧的聲音)

關於Robot,需要關心的主要是Robots.txt,以及網站日志中包含的以上幾個名字。

百度用於抓取網頁的程序叫做Baiduspider – 百度蜘蛛,我們查看網站被百度抓取的情況主要是分析,網站日志裡百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態碼。

查看日志的方式:

通過FTP,在網站根目錄找到一個日志文件,文件名一般包含log,下載解壓裡面的記事本,這即是網站的日志,記錄了網站被訪問和操作的情況。

因為各個服務器和主機的情況不同,不同的主機日志功能記錄的內容不同,有的甚至沒有日志功能。

日志內容如下:

61.135.168.22 – - [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1″ 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”

分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 這個頁面。

200 代表成功抓取。

8450 代表抓取了8450個字節。

如果你的日志裡格式不是如此,則代表日志格式設置不同。

很多日志裡可以看到 200 0 0和200 0 64 則都代表正常抓取。

抓取頻率是通過查看每日的日志裡百度蜘蛛抓取次數來獲知。抓取頻率並沒有一個規范的時間表或頻率數字,我們一般通過多日的日志對比來判斷。當然,我們希望百度蜘蛛每日抓取的次數越多越好。

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved