JavaScript 上萬關鍵字瞬間匹配實現代碼

DIV+CSS佈局教程網 >> 網頁腳本 >> JavaScript入門知識 >> 關於JavaScript >> JavaScript 上萬關鍵字瞬間匹配實現代碼

編輯：關於JavaScript

提到關鍵字搜索，首先聯想到的無非就是使用一些indexOf，replace之類的字符函數，最多加上一些正則表達式而已.實現起來雖然很簡單，但是這背後的效率問題可曾仔細考慮過？例如論壇中的關鍵字過濾，一般情況下需過濾的關鍵字數量及檢測的文本長度都不大，所以這一瞬間的過程沒有太多值得關注的地方。但若關鍵字數量不在是屈指可數，而是有成千上萬，並且待檢測的文本也是一長篇大論，結果可不再是那麼樂觀了。大家都知道，每多一個關鍵字，就要增加一次全文的檢索，最終花費的時間將遠遠超出可接受的范圍內。

既然考慮的是那種極端的關鍵字搜索，通常的逐個遍歷搜索顯然是行不通的。如今用的是JavaScript，若不使用Hash表實在是太對不起這門語言了。有著對表特天獨厚的支持，不妨就拿出少量的空間來換取大量的時間吧。

先看個例子，比如有如下的關鍵字: foo1，foo2，bar1，bar2，既然要用空間換時間，因此搜索之前先將他們預處理。前面提到了JS靈活又高效的表，顯而易見，使用樹的結構是最有優勢的。即使不明白，也沒關系，最終實現結構正如如下的代碼，熟悉JSON同樣很親切：

復制代碼代碼如下:
var Root =
{
    f:
    {
        o:
        {
            o:
            {
: true,
: true
            }
        }
    },
    b:
    {
        a:
        {
             r:
            {
: true,
: true
            }
        }
    }
};

這一層層的結構正如一棵樹，每個字符便是樹的一個分枝，到了最後一個字符便是樹葉，不再有新的節點。
此時你應該明白了，只要對文章的每個字沿著這棵樹往下搜就是了。能到達樹葉的，就說明當前字符就是關鍵字的一個；中途尋找不到對應枝干的，當然就不是關鍵字。

例如foo1，順著Root結構向下訪問，最終到達Root['f']['o']['o']['1']，即完成了一次匹配。之後跳過foo1的長度，繼續往後檢索。

因此，整篇文章只需一次檢索，即可找出每個關鍵字的位置。
由於JS的hash表性能非常高，所以所謂的尋找枝干也就非常的快了。因為JS的靈活性，實現此效果的代碼同樣很簡短。

事實上可以發現，關鍵字的數量與搜索的時間並沒太多的關系，那僅僅影響了樹的寬度而已，只有文章的長度才是決定搜索的時間。

來一次極限測試：
關鍵字：成語全集(19830條)
內容：誅仙全集.txt (1659219字)
用時：935ms
(Chrome26 / i3-2312的CPU)
160萬字的文章，匹配2萬個關鍵字，還不到1秒的時間。可見，充分利用JavaScript的靈活性，仍能發揮很大的潛力。

上一頁:20行代碼實現的一個CSS覆蓋率測試腳本
下一頁:從數據結構的角度分析 for each in 比 for in 快的多

關於JavaScript

js enter鍵激發事件實例代碼: 如下所示：document.onkeydown = function (e) { if (
JS簡單操作select和dropdownlist實例教程: 本文實例講述了JS簡單操作select和dropdownlist的方法。分享給大家供大家參考。具體實
正則表達式的高級技巧8個常用的概念: 網頁制作poluoluo文章簡介：正則表達式高級技巧背後的關鍵概念. 正則表達

JavaScript基礎知識 JSON基礎正則表達式關於JavaScript JavaScript技巧 jQuery入門知識 AJAX入門 JavaScript綜合知識

DIV CSS 佈局教程網

相關文章