DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> JavaScript入門知識 >> 關於JavaScript >> 深入理解JavaScript中的並行處理
深入理解JavaScript中的並行處理
編輯:關於JavaScript     

前言

為什麼說多線程如此重要?這是個值得思考的問題。一直以來,派生線程以一種優雅的方式實現了對同一個進程中任務的劃分。操作系統負責分配每個線程的時間片,具有高優先級並且任務繁重的線程將分配到更多的時間片,而低優先級空閒的線程只能分到較少的時間片。

雖然多線程如此重要,但JavaScript卻並沒有多線程的能力。幸運的是,隨著 Web Worker 的普及,我們終於可以在後台線程來處理資源密集型的計算了。而不好的方面是,目前制定的標准只適用於當前的生態系統,這有時候就比較尴尬了。如果你了解其他從一開始就支持多線程的語言的話,你可能會發現很多的限制,遠非僅僅是實例化一個新線程,然後你操控這個實例就能實現多線程。

這篇文章主要來介紹 Web Worker,包括什麼時候使用,該怎麼使用,它有什麼奇怪的特性,會介紹在 Webpack 中如何使用它,還有可能遇到的一些坑。

一、Web Workers

Web Worker 可能是在 JavaScript 中唯一可以真正實現多線程的方法了。我們需要按照下面的方式創建 worker :

const worker = newWorker("worker.js");

上面就定義了一個 Worker 實例,然後你可以通過 postMessage 與 worker 通信,就像和 iFrame 通信一樣,只不過不存在跨域的問題,不需要驗證跨域。

worker.postMessage(num);

在 worker 代碼中,你需要監聽這些事件:

onmessage = (e) => {
 // e.data will contain the value passed
};

這種方式是雙向的,所以你也可以從 worker 中 postMessage 給我們的主程序。

在 worker 代碼中:

postMessage(result);

在主程序中:

worker.onmessage = (e) => {}

這就是 worker 最基本的用法。

異常處理

在你的 worker 代碼中,有很多種方式來處理異常,比如你可以 catch 之後通過 postMessage 傳遞,這樣可能需要多些一些代碼,但是確實最有效也最安全的。

另一種方式是用 onerror 事件,這種方式可以捕捉所有未處理的異常,並且交給調用方來決定如何處理。調用方式很簡單:

worker.onerror = (e) => {};

為了調試方便,異常對象中還有一些額外的字段比如:filenamelinenocolno.

回收

將不需要的 worker 回收是非常重要的,worker 會生成真正的操作系統線程,如果你發現與很多 worker 線程同時運行,你可以通過很簡單的殺掉浏覽器進程。

你有兩種方式殺掉 worker 進程:在 worker 裡和在 worker 外。我認為最好的處理 worker 生命周期的地方是在主頁面裡,但這也要取決於你代碼的具體情況。

殺掉一個 worker 實例,在外部可以直接調用 terminate()方法,這種方法可以立即殺掉它,釋放所有它正在使用的資源,如果它正在運行,也會立即終止。

如果你想要讓 worker 自己去管理它的生命周期,可以直接在 worker 代碼中調用stop()方法。

不管使用哪種方法,worker 都會停止,銷毀所有資源。

如果你想使用一種“一次性”的 worker,比如需要做一些復雜運算之後就不再使用了,也要確保在 onerror 事件中去銷毀它們,這樣有利於規避一些難以發現的問題。

worker.onerror = (e) => {
 worker.terminate();
 reject(e);
};
worker.onmessage = (e) => {
 worker.terminate();
 resolve(e.data);
}

二、行內 Workers

有些時候將 worker 代碼寫到一個外部文件可能會使原本簡單的問題變得復雜,幸運的是,workers 也可以用一個 Blob 來初始化。

寫一個行內 worker ,參考如下代碼段:

<!-- http://stackoverflow.com/a/6454685/2032154 -->
<script id="worker" type="javascript/worker">
 // Put your worker code here
</script>
const code = URL.createObjectURL(new Blob([
 document.getElementById("worker").textContent
]));
const worker = new Worker(code);

這樣你就創建了一個全局的 ObjectURL,但別忘了當不需要的時候要銷毀它:

worker.terminate();
URL.revokeObjectURL(code);

三、Workers 嵌套

理論上,你可以嵌套使用 worker,就像在主線程中定義一個 worker 一樣。這裡有一個簡單的 例子。但是不幸的是在 Chrome 中一直存在一個 bug ,讓我們不能愉快的玩耍,或許以後這個 bug 會修復,但是目前來說還是沒有太多進展,所以你最好不要使用。

數據傳遞

在 worker 數據傳遞的過程中有些需要注意的邊緣情況。你可以傳遞數值,字符串,數組,也可以傳遞序列化/反序列化的對象。然而,你卻不應該依賴序列化來保持數據結構,實際上,postMessage 用到了一種 數據克隆算法,它會生成一些額外的屬性比如 RegExps 和 Blobs 以及一些循環引用。

這就是說,你需要將你要傳遞的數據最小化。你不可以傳遞 functions ,即使是支持的類型也會有一些限制,這些也很容易產生一些難以發現的 bug。如果你將你的 API 定義為只傳遞字符串,數值,數組和對象的話,那你可能會避過這些問題。

循環引用

如果你有一個很復雜的對象,那麼裡面很可能存在循環引用,這時如果你將它序列化成 JSON,你將會得到一個 TypeError: Converting circular structure to JSON.

let a = {};
let b = {a};
a.b = b;
JSON.stringify({a,b}); // Error

然而你可以在 postMessage 中放心的使用,從而你就可以在 worker 中使用。

Transferable objects

為了防止同時修改同一變量的場景,你傳遞給 postMessage 的所有變量都會復制一份,這樣確保了你多個線程不會修改同一個變量。但如果你想要傳一個非常大的數據的話,你就會發現復制操作是很慢的。比如,如果你在做一些圖片相關的運算,你可能會傳遞整個圖片信息,就可能會遇到復制性能的瓶頸。

好在有 transferable object ,用 transfer 來代替 copy,比如ArrayBuffer 是transferable對象,而我們可以把任何類型的對象放在 ArrayBuffer 中。

如果你 transfer 一個對象,之前擁有它的線程被鎖定權限,它確保了數據沒有復制之前,不會被同時修改。

這時 postMessage 的代碼段就有點尴尬了:

const ab = new ArrayBuffer(100);
console.log(ab.byteLength); // 100
worker.postMessage(ab, [ab]);
console.log(ab.byteLength); // 0

確保在 postMessage 中傳遞第二個參數,否則數據將會被復制。

const ab = new ArrayBuffer(100);
console.log(ab.byteLength); // 100
worker.postMessage(ab);
console.log(ab.byteLength); // 100

四、Webpack

在 Webpack 中使用 Web worker 時,你需要用 worker-loader。將它添加到 package.json 中的 devDependencies,然後運行 npm install,就可以了。

用到 worker 時,只需要 require 它。

const workerCode = require("worker!./worker.js");
...
const worker = new workerCode();

這樣就初始化了 worker,然後就像上面講的一樣使用 worker。

如果需要使用行內 worker,你需要傳遞 inline 參數給 loader。

const workerCode = require("worker?inline!./worker.js");
...
const worker = new workerCode();

在 worker 中你也可以 import 模塊。

import fibonacci from "./fibonacci.js";
...
const result = fibonacci(num);

缺點

在 Webpack 中使用 worker 很簡單,但是在使用時也有一些坑值得你注意。

首先,無法將代碼共用部分提取出來。如果你的 worker 中依賴一段共用代碼,你只能把代碼添加到 worker 中,不管其他地方是否也用到同樣的代碼。而且如果你多個 worker 要用同樣的庫,你也需要在每個 worker 中引入它們。

你可能會想如果你不用 worker-loader,然後用CommonsChunkPlugin指定一個新的入口,可能會解決這個問題。但是不幸的是 worker 不像是浏覽器 window ,一些 feature 不可用,所以一些代碼必須要引入。

同時,用行內 worker 也不會解決問題,共用的代碼依然會出現在多個地方。

第二點缺點是,行內 worker 可能會導致 ObjectURLs內存洩露.它們被創建出來以後就不會被釋放。這雖然不是一個大問題,但是如果你有很多“一次性” worker 的話,就會影響性能。

綜上所述,我個人建議是使用標准的 worker,注意在 worker 中引入了什麼。還要注意使用緩存。

五、IFrames Web worker

IFrames Web worker 和 IFrame 很像,而且印象中 IFrame 也可以實現多線程。但是 IFrame 存在一些不是線程安全 API,比如 DOM 相關,浏覽器不能為他們生成新的線程,參考這裡.

在 IFrame 跨域中,很多 API 它都沒有權限,也只能通過 postMessage,就像 Web Worker 一樣。理論上,浏覽器可以在不同的線程中運行 IFrame,也就可以用 IFrame 實現多線程。

但是實際並非如此,它還是單線程的,浏覽器不會給它們額外的線程。

總結

Web Worker 解決了 JavaScript 一直以來的大難題,盡管它的語法有些奇怪而且有很多限制,但是它卻可以真真正正的解決問題。從另外一方面來講,它也還是個嬰兒,某些方面還不是很成熟,不能讓我們完全依賴,所以這個技術普及還有一段距離,目前適用場景也比較局限。所以說,如果你需要做多線程,不要再等待其他的什麼技術,學習 web worker 的邊緣問題,避開它的坑,你就可以很好的提高用戶體驗。以上就是這篇文章的全部內容,希望對大家能有所幫助。

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved