DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> 不懂搜索引擎原理的 seoer們 就是在裸奔
不懂搜索引擎原理的 seoer們 就是在裸奔
編輯:SEO優化集錦     

搜索引擎原理

站長最長說的一句口頭禅就是:不懂搜索引擎原理的seoer就是在裸奔!

根據上圖解釋的搜索引擎工作原理,筆者要一步一步為大家解釋,講解。進行完整的seo基礎知識普及。

1、www:我們的互聯網,一個巨大的、復雜的體系;

2、搜集器:這個我們站長們就都熟悉了,我們對它的俗稱也就是蜘蛛,爬蟲,而他的工作任務就是訪問頁面,抓取頁面,並下載頁面;

3、控制器:蜘蛛下載下來的傳給控制器,功能就是調度,比如公交集團的調度室,來控制發車時間,目的地,主要來控制蜘蛛的抓取間隔,以及派最近的蜘蛛去抓取,我們做SEO的可以想到,空間位置對SEO優化是有利的;

4、原始數據庫:存取網頁的數據庫,就是原始數據庫。存進去就是為了下一步的工作,以及提供百度快照,我們會發現,跟MD5值一樣的URL是不重復的,有的URL有了,但標題就是沒有,只有通過URL這個組件來找到,因為這個沒有通過索引數據庫來建立索引。原始數據庫主要功能是存入和讀取的速度,以及存取的空間,會通過壓縮,以及為後面提供服務。網頁數據庫調度程序將蜘蛛抓取回來的網頁,進行簡單的分析過後,也就是提取了URL,簡直的過濾鏡像後存入數據當中,那麼在他的數據當中,是沒有建立索引的;

5、網頁分析模板:這一塊非常重要,seo優化的垃圾網頁、鏡像網頁的過濾,網頁的權重計算全部都集中在這一塊。稱之為網頁權重算法,幾百個都不止;

6、索引器:把有價值的網頁存入到索引數據庫,目的就是查詢的速度更加的快。把有價值的網頁轉換另外一個表現形式,把網頁轉換為關鍵詞。叫做正排索引,這樣做就是為了便利,網頁有多少個,關鍵詞有多少個。幾百萬個頁面和幾百萬個詞哪一個便利一些。倒排索引把關鍵詞轉換為網頁,把排名的條件都存取在這個裡面,已經形成一高效存儲結構,把很多的排名因素作為一個項存儲在這個裡面,一個詞在多少個網頁出現(一個網頁很多個關鍵詞組成的,把網頁變成關鍵詞這麼一個對列過程叫做正排索引。建議索引的原因:為了便利,提高效率。一個詞在多少個網頁中出現,把詞變成網頁這麼一個對列過程叫做倒排索引。搜索結果就是在倒排數據庫簡直的獲取數據,把很多的排名因素作為一個項,存儲在這個裡面);

7、索引數據庫:將來用於排名的數據。關鍵詞數量,關鍵詞位置,網頁大小,關鍵詞特征標簽,指向這個網頁(內鏈,外鏈,錨文本),用戶體驗這些數據全部都存取在這個裡面,提供給檢索器。為什麼百度這麼快,就是百度直接在索引數據庫中提供數據,而不是直接訪問WWW。也就是預處理工作;

8、檢索器:將用戶查詢的詞,進行分詞,再進行排序,通過用業內接口把結果返回給用戶。負責切詞,分詞,查詢,根據排名因素進行數據排序;

9、用戶接口:將查詢記錄,IP,時間,點擊的URL,以及URL位置,上一次跟下一次點擊的間隔時間存入到用戶行為日志數據庫當中。就是百度的那個框,一個用戶的接口;

10、用戶行為日志數據庫:搜索引擎的重點,SEO工具和刷排名的軟件都是從這個裡面得出來的。用戶使用搜索引擎的過程,和動作;

11、日志分析器:通過用戶行為日志數據庫進行不斷的分析,把這些行為記錄存儲到索引器當中,這些行為會影響排名。也就是我們所說的惡意點擊,或是一夜排名。(如果通過關鍵找不到,那麼會直接搜索域名,這些都將會記入到用戶行為數據庫當中);

12、詞庫:網頁分析模塊中日志分析器會發現最新的詞匯存入到詞庫當中,通過詞庫進行分詞,網頁分析模塊基於詞庫的。

聲明:本文由 崔恆斌 原創編譯,轉載請注明出自:http://www.0513haian.com/seo-knowledge/112.html

注:相關網站建設技巧閱讀請移步到建站教程頻道。

收藏本文

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved