DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> 基於事件剖析的SAX模型分析
基於事件剖析的SAX模型分析
編輯:XML詳解     

SAX2解析器讀XML文檔,然後產生基於特殊符號的事件。SAX2解析器實際上並不為該文檔在內存中創建一棵樹結構,它序列的一個文檔的內容並產生相關的事件。

比如,當你進行基於事件的編程的時候,你可以創建函數來響應用戶定義的事件(比如OnClick事件)。在利用SAX進行編程的時候,需要注意的是,是解析器而不是用戶產生事件。

比如考慮下面一個簡單的文檔。

<?XML version="1.0"?>

<parts>

<part>TurboWidget</part>

</parts>

當SAX2在這個文檔的時候,它產生如下的一系列的事件:

StartDocument( )

StartElement( "parts" )

StartElement( "part" )

Characters( "TurboWidget" )

EndElement( "part" )

EndElement( "parts" )

EndDocument( )

可以把SAX2看成是一個有拉特點(PUSH)的解析器,SAX2產生事件,然後你可以自己去些事件。實際上,當SAX2在解析一個文檔的時候,SAXXMLReader讀該文檔並產生一系列的事件,你可以選擇一些事件進行。

創建一個應用SAX的應用程序框架

SAX2產生的事件包括如下的種類:

¨ 和XML文檔內容相關的事件(ISAXContentHandler)

¨ 和DTD相關的事件(ISAXDTDHandler)

¨ 出現錯誤時發生的事件(ISAXErrorHandler)

為了這些事件,你需要實現一個相關的類,該類需要包含一些方法來相關的事件。你必須對你想要的事件實現相關的。如果你不想某一個事件的話,只需要簡單的忽略它就可以。在實際應用中,我們首先要繼承這些接口,用C++我們可以創建一個類,在這個類的方法中,我們可以告訴應用程序在接收到一個事件的時候如何進行。下面是建立一個基於SAX的應用的基本步驟:

1. 創建頭文件當使用SAX2的時候,我們需要用到動態連接庫MSXML.DLL,為了使用MSXML中包含的SAX2接口,你必須在程序的頭文件(一般在stdafx.h中)中包含下列的代碼:

#import raw_interfaces_only

using namespace MSXML2;

2. 建立具體的操作(handler)類,SAX2主要定義了三個基本的操作類,它們分別是ISAXContentHandler,ISAXDTDHandler和ISAXErrorHandler。

ISAXContentHandler是用來SAX2解析器對文檔內容進行解析時所產生的消息的,ISAXXMLReader通過方法putContentHandler來注冊這個實例。而ISAXDTDHandler是用來和DTD相關的基本的消息的,ISAXXMLReader通過方法putDTDHandler來注冊這個實例。ISAXErrorHandler提供了對在解析過程中遇到錯誤時產生的錯誤事件的,ISAXXMLReader通過方法putErrorHandler來注冊這個實例

因為這三個類都是用來對事件進行的,並且需要在接口ISAXXMLReader中進行注冊。但是它們的基本使用方法類似,所以我們這裡只詳細描述對接口ISAXContentHandler 的操作。

ISAXContentHandler接口接收關於文檔的內容變化的事件,這是實現SAX應用所需要的最重要的接口,如果應用在遇到基本的解析事件的時候需要被通知的話,ISAXXMLReader通過方法putContentHandler來注冊這個實例,然後ISAXXMLReader就使用這個實例來報告基於文檔的事件,比如元素的開始,元素的結束和相關的字符串數據等等。ISAXContentHandler 包括了很多的方法:比如startDocument,endDocument,startElement,endElement等等。實際上它包含了好接個startXXX和endXXX對來建立不同的信息集合的抽象。比如startDocument方法在文檔信息開始的時候被調用,而在startDocument以後被調用的方法就被認為是文檔信息項(item)的子項。在文檔信息內容結束的時候endDocument就被調用,表示文檔信息的結束。 實際上是SAX2在解析文檔的時候,當處於文檔某一位置的時候,會激發相應的方法,比如當一個文檔開始的時候,就會激發startDocument方法,在實際實現的時候,我們可以在我們繼承ISAXContentHandler類的實現類中,重載該方法,實現我們自己想要的。我們可以把這些方法看成是ISAXContentHandler接口提供給我們的。需要注意的是事件被的順序和信息在文檔中的位置是一致的。

同時需要注意的是,如果我們需要在我們的應用中對這些消息進行的話,我們就要繼承這些消息的類,比如我們只需要對文檔內容進行,而忽略對DTD和解析過程中錯誤(Error)的,那麼我們只需要創建一個新的類,該類繼承ISAXContentHandler接口,因為ISAXContentHandler中定義了很多的事件方法,而事實上我們只需要對我們所關心事件的方法進行重載,對我們不關心的事件可以簡單的忽略它。

比如我們只關心startElement和endElement事件,而且我們假設我們建立的類的名稱為CXMLContentDeal,我們的類就可以如下面所示:

class CXMLContentDeal : public ISAXContentHandler

{

public:

CXMLContentDeal();

virtual CXMLContentDeal ();

virtual HRESULT STDMETHODCALLTYPE startElement(

/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,

/* [in] */ int cchNamespaceUri,

/* [in] */ wchar_t __RPC_FAR *pwchLocalName,

/* [in] */ int cchLocalName,

/* [in] */ wchar_t __RPC_FAR *pwchRawName,

/* [in] */ int cchRawName,

/* [in] */ ISAXAttributes __RPC_FAR *pAttributes);

virtual HRESULT STDMETHODCALLTYPE endElement(

/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,

/* [in] */ int cchNamespaceUri,

/* [in] */ wchar_t __RPC_FAR *pwchLocalName,

/* [in] */ int cchLocalName,

/* [in] */ wchar_t __RPC_FAR *pwchRawName,

/* [in] */ int cchRawName);

}

然後我們可以重載方法startElement和endElement來進行和應用相關的特殊的。

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved