DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> 網站優化:為何網站不被收錄?
網站優化:為何網站不被收錄?
編輯:SEO優化集錦     

網站優化過程中收錄一直是一個不管是菜鳥還是老鳥都非常揪心的問題,收錄盡管與網站排名沒有直接關系,但是排名與收錄的的關系總所周知,隨著百度算法的不斷更新,百度對於收錄的准則也越來越高,如何做好收錄成了不管是站長還是企業都非常關心的一個問題,接下來就來談談網站為什麼不收錄的問題。

一、是否知道這個頁面的存在

對頁面進行收錄當然首先就必須要知道有這個頁面,蜘蛛都不知道這個頁面,談何收錄?這一點主要分為2大類:搜索引擎找不到網頁入口和不讓搜索引擎抓取。

1.搜索引擎找不到網頁入口

很多時候不是你更新了文章搜索引擎就要來抓取收錄的,要怎麼讓蜘蛛知道你的更新呢?除了有規律的更新,可以向百度站長平台主動提交URL或者是提交站點地圖,也可以讓搜索引擎被動收集,這就是通過外鏈讓蜘蛛知道你的網頁,還有很多時候蜘蛛來到了你的網站,卻找不到你更新的鏈接,因為網站的鏈接結構做得太復雜或是內鏈結構差,以致搜索引擎在抓取時間類不會爬到網站深處的頁面,這也造成蜘蛛不知道該頁面的存在。所以不管怎麼樣,第一步我們要保證頁面能被蜘蛛看到,關於這一點可以通過查看網站日志來判斷蜘蛛是否來訪過。

2.不讓搜索引擎抓取

很多網站有意無意的直接在robots文件屏蔽了百度或網站部分頁面,卻整天在找原因為什麼蜘蛛不來抓取我的頁面,這能怪百度嗎?你都不讓別人進門了,百度是怎麼收錄你的網頁?所以有必要時常去檢查一下網站robots文件是否正常。

二、是否可以正常的抓取

好了,蜘蛛發現了這個頁面,也有權利抓取這個頁面了,那能否正常抓取就是一個很大的問題,我們都知道蜘蛛抓取這個頁面要從域名到DNS服務器再到網站空間,所以其中任何一個環節出現問題,蜘蛛都不能正常的抓取,首先域名需要備案,然後域名解析要正常,如果解析出現問題,域名是不能訪問網站ip地址的,這個時候網站打不開,蜘蛛抓取不了頁面。

在有就是經常提到的空間服務器了,服務器長期打不開那肯定是抓取不了的,這個大家都知道。並且如果服務器比較卡或者不穩定,就會影響蜘蛛的抓取,蜘蛛不能很好的去抓取頁面或由於加載慢只抓取到網頁一半,這就很大程度上影響了網站的收錄。具體可以看《草根站長做SEO,如何選擇域名和空間

三、是否達到收錄標准

很多人覺得蜘蛛抓取就代表著收錄,其實這是錯誤的,蜘蛛訪問網站抓取頁面並不代表就要收錄你的網頁,頁面被抓取後要進行對比篩選,符合要求的才會被收錄,為什麼有的頁面會被收錄後又被吐出來?就是因為蜘蛛在不停的過濾,這個我們先不談。既然是符合要求才會收錄,那收錄標准到底是什麼呢?

1.行業不同標准也不同

這個是顯而易見的,新聞類網站肯定比一般企業站容易收錄,而對於醫療、博彩、成人用品等網站,標准肯定是更加嚴格,所以對於不同的行業,百度給予的收錄標准也是不一樣的。

2.不同的網站標准不同

百度有一個優先抓取的原則,對於絕大多數用戶喜歡,權重高的網站收錄得要快,就像新浪網、騰訊網收錄得肯定要比一般網站要快,為什麼?因為信任,這類網站本身就有其嚴格的過濾系統,在此類網站公布的內容百度基本是直接抓了就收,搜索引擎是互聯網與用戶的橋梁,它的目的就是給用戶提供有價值的內容,你能為它提供良好的內容,它當然也會對你更好,這是互利的。所以搜索引擎不是做慈善,你的網站能給它什麼?

3.主體收錄標准

百度有一個收錄標准值,對頁面進行評分,滿足評分收錄,否則扔掉。這個在百度網站綜合得分算法一文中已經說過了,主要是從頁面基礎、站內、站外、用戶四個方面進行評分,感興趣的可以看一看,這裡就簡單談一談網站頁面的內容,

(1)頁面字數建議是在500-800字,內容健康良好,信息豐富;

(2)受眾多:文章要有一定得用戶需求,也即用戶檢索需求的大小;

(3)時效性:寫最新的東西用戶和搜索引擎都喜歡

(4)稀缺性:稀缺主要是描述頁面在互聯網中的獨特性。稀缺不等於無重復,只有對於大量完全無增益的重復頁面,我們才應該認為其稀缺度較低。 

四、是否有干淨的域名

剛說了百度的收錄標准,其實這一點也屬於一個特別的標准,域名不干淨同樣是影響網站收錄的一個重要原因,這個不干淨我們分為2種情況。第一種就是域名在購買之前就有人用過了,不僅使用了而且還是用廢了,這樣的域名背景就是不干淨,這就相當於以前如果你去考警察,如果家裡是黑幫世家,那肯定是會影響你的,這和百度的收錄是一個道理,嚴重的甚至域名直接作廢。

另一種情況是我們經常說的降權,網站被降權這段時間是百度的一個審核期,網站的內容就算滿足了上面所說的3點也可能收錄慢或者是不收錄,這個就需要我們堅持了。有恆心,能再次獲得百度的信賴就會收錄正常。

五、是否達到收錄最大限度

等級不同的網站總收錄的最大限度不同,日收錄限制也不同。在新浪上更新1萬篇文章可能會收錄90%,但是如果在你的企業站更新1w篇文章可能是只會收錄幾十篇。這就是因為新浪的等級比你的高。等級不等於權重,權重只是等級的一個部分,等級是網站的重要程度,就像我們一個網站中不同頁面的重要程度不一樣,而在整個互聯網不同網站的重要程度也不一樣。所以中小型網站不要為了有大量的收錄不斷的去大量更新文章,這樣的做法是錯誤的。不同的行業的更新的頻率和數量是不一樣,娛樂新聞行業可能需要幾分鐘更新一次,但是小型企業站可以幾天或者幾周更新一次都沒有關系。

同時不同網站總收錄最大限度也不一樣,一個中小型新站目前的權重是1或者沒有權重,那麼它的收錄限制維持在幾十、幾百到一千的數量。如果你發現不管你怎麼更新做原創高質量的內容收錄也上不去,可能就是因為網站權重處於一個階段達到了收錄限制,所以收錄不可能上去。就好比家裡的貓長得再大食量也沒有豬多,所以豬分配的食物就自然要比貓多了,如果網站要突破這個收錄的限制就要在權重上上升一個等級。

好了,就寫到這了,我們不建議刻意的去提升收錄,因為收錄不等於排名,收錄也不會直接影響到網站排名,網站根據行業需求和用戶需求有規律的更新就可以了,用戶在進入你的網站之後不需要再進入其它網站補腦了,這說明你的網站內容滿足了用戶所有的需求。歡迎關注新浪微博:木木seo博客。

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved