Node.js中使用Buffer編碼、解碼二進制數據詳解

DIV+CSS佈局教程網 >> 網頁腳本 >> JavaScript入門知識 >> 關於JavaScript >> Node.js中使用Buffer編碼、解碼二進制數據詳解

編輯：關於JavaScript

JavaScript很擅長處理字符串，但是因為它最初的設計是用來處理HTML文檔，因此它並不太擅長處理二進制數據。JavaScript沒有byte類型，沒有結構化的類型（structured types），甚至沒有字節數組，只有數字和字符串。（原文：JavaScript doesn't have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.）

因為Node基於JavaScript，它自然可以處理類似HTTP這樣的文本協議，但是你也可以用它來跟數據庫交互，處理圖片或文件上傳等，可以想象，如果僅僅用字符串來做這些事得有多困難。早些時候，Node通過將byte編碼成文本字符來處理二進制數據，但這種方式後來被證明並不可行，既浪費資源，又緩慢，又不靈活，而且難以維護。

Node有一個二進制緩沖實現Buffer，這個偽類（pseudo-class）提供了一系列處理二進制數據的API，簡化了那些需要處理二進制數據的任務。緩沖的長度由字節數據的長度決定，而且你可以隨機的設置和獲取緩沖內的字節數據。

注意：Buffer類有一個特殊的地方，緩沖內的字節數據所占用的內存不是分配在JavaScrp

It VM內存堆上的，也就是說這些對象不會被JavaScript的垃圾回收算法處理，取而代之的是一個不會被修改的永久內存地址，這也避免了因緩沖內容的內存復制所造成的CPU浪費。

創建緩沖

你可以用一個UTF-8字符串創建緩沖，像這樣：
復制代碼代碼如下:
var buf = new Buffer(‘Hello World!');

也可以用指定編碼的字符串創建緩沖：
復制代碼代碼如下:
var buf = new Buffer('8b76fde713ce', 'base64');

可接受的字符編碼和標識如下：

1.ascii——ASCI，僅適用於ASCII字符集。
2.utf8——UTF-8，這種可變寬編碼適用於Unicode字符集的任何字符，它已經成了Web世界的首選編碼，也是Node的默認編碼類型。
3.base64——Base64，這種編碼基於64個可打印ASCII字符來表示二進制數據，Base64通常用於在字符文檔內嵌入可以被轉化成字符串的二進制數據，在需要時又可以完整無損的轉換回原來的二進制格式。

如果沒有數據來初始化緩沖，可以用指定的容量大小來創建一個空緩沖：
復制代碼代碼如下:
var buf = new Buffer(1024); // 創建一個1024字節的緩沖

獲取和設置緩沖數據

創建或接收一個緩沖對象後，你可能要查看或者修改它的內容，可以通過[]操作符來訪問緩沖的某個字節：
復制代碼代碼如下:
var buf = new Buffer('my buffer content');
// 訪問緩沖內第10個字節
console.log(buf[10]); // -> 99

注意：當你（使用緩沖容量大小來）創建一個已初始化的緩沖時，一定要注意，緩沖的數據並沒有被初始化成0，而是隨機數據。

復制代碼代碼如下:
var buf = new Buffer(1024);

console.log(buf[100]); // -> 5 (某個隨機值)

你可以這樣修改緩沖裡任何位置的數據：

復制代碼代碼如下:
buf[99] = 125; // 把第100個字節的值設置為125

注意：在某些情況下，一些緩沖操作並不會產生錯誤，比如：

1.緩沖內的字節最大值為255，如果某個字節被賦予大於256的數字，將會用256對其取模，然後將結果賦給這個字節。
2.如果將緩沖的某個字節賦值為256，它的實際值將會是0（譯者注：其實跟第一條重復，256%256=0）
3.如果用浮點數給緩沖內某個字節賦值，比如100.7，實際值將會是浮點數的整數部分——100
4.如果你嘗試給一個超出緩沖容量的位置賦值，賦值操作將會失敗，緩沖不做任何修改。

你可以用length屬性獲取緩沖的長度：
復制代碼代碼如下:
var buf = new Buffer(100);

console.log(buf.length); // -> 100

還可以使用緩沖長度迭代緩沖的內容，來讀取或設置每個字節：

復制代碼代碼如下:
var buf = new Buffer(100);

for(var i = 0; i < buf.length; i++) {

buf[i] = i;

}

上面代碼新建了一個包含100個字節的緩沖，並從0到99設置了緩沖內每個字節。

切分緩沖數據

一旦創建或者接收了一個緩沖，你可能需要提取緩沖數據的一部分，可以通過指定起始位置來切分現有的緩沖，從而創建另外一個較小的緩沖：
復制代碼代碼如下:
var buffer = new Buffer("this is the content of my buffer");

var smallerBuffer = buffer.slice(8, 19);

console.log(smallerBuffer.toString()); // -> "the content"

注意，當切分一個緩沖的時候並沒有新的內存被分配或復制，新的緩沖使用父緩沖的內存，它只是父緩沖某段數據（由起始位置指定）的引用。這段話含有幾個意思。

首先，如果你的程序修改了父緩沖的內容，這些修改也會影響相關的子緩沖，因為父緩沖和子緩沖是不同的JavaScript對象，因此很容易忽略這個問題，並導致一些潛在的bug。

其次，當你用這種方式從父緩沖創建一個較小的子緩沖時，父緩沖對象在操作結束後依然會被保留，並不會被垃圾回收，如果不注意的話，很容易會造成內存洩露。

注意：如果你擔心因此產生內存洩露問題，你可以使用copy方法來替代slice操作，下面將會介紹copy。

復制緩沖數據

你可以像這樣用copy將緩沖的一部分復制到另外一個緩沖：
復制代碼代碼如下:
var buffer1 = new Buffer("this is the content of my buffer");

var buffer2 = new Buffer(11);

var targetStart = 0;

var sourceStart = 8;

var sourceEnd = 19;

buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd);

console.log(buffer2.toString()); // -> "the content"

上面代碼，復制源緩沖的第9到20個字節到目標緩沖的開始位置。

解碼緩沖數據

緩沖數據可以這樣轉換成一個UTF-8字符串：
復制代碼代碼如下:
var str = buf.toString();

還可以通過指定編碼類型來將緩沖數據解碼成任何編碼類型的數據。比如，你想把一個緩沖解碼成base64字符串，可以這麼做：

復制代碼代碼如下:
var b64Str = buf.toString("base64");

使用toString函數，你還可以把一個UTF-8字符串轉碼成base64字符串：
復制代碼代碼如下:
var utf8String = 'my string';

var buf = new Buffer(utf8String);

var base64String = buf.toString('base64')

小結

有時候，你不得不跟二進制數據打交道，但是原生JavaScript又沒有明確的方式來做這件事，於是Node提供了Buffer類，封裝了一些針對連續內存塊的操作。你可以在兩個緩沖之間切分或復制內存數據。

你也可以把一個緩沖轉換成某種編碼的字符串，或者反過來，把一個字符串轉化成緩沖，來訪問或處理每個bit。

上一頁:Node.js中創建和管理外部進程詳解
下一頁:Node.js文件操作詳解

關於JavaScript

關於JavaScript中事件綁定的方法總結: 最近收集了一些關於JavaScript綁定事件的方法，匯總了一下，不全面，但是，希望便於以後自己查看
輕松掌握JavaScript裝飾者模式: 在傳統的面向對象語言中，給對象添加功能常常使用繼承的方式，但繼承的方式會帶來問題：當父類改變時，他的
JavaScript DOM節點操作方法總結: 節點類型主要有三種：元素節點，屬性節點和文本節點。而對DOM的主要也就是圍繞元素節點和屬性節點的增刪

JavaScript基礎知識 JSON基礎正則表達式關於JavaScript JavaScript技巧 jQuery入門知識 AJAX入門 JavaScript綜合知識

DIV CSS 佈局教程網

相關文章