DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> 基於事件解析的SAX模型分析
基於事件解析的SAX模型分析
編輯:XML詳解     
SAX2解析器讀XML文檔,然後產生基於特殊符號的事件。SAX2解析器實際上並不為該文檔在內存中創建一棵樹結構,它序列的處理一個文檔的內容並產生相關的事件。

  比如,當你進行基於事件的編程的時候,你可以創建函數來響應用戶定義的事件(比如OnClick事件)。在利用SAX進行編程的時候,需要注意的是,是解析器而不是用戶產生事件。

  比如考慮下面一個簡單的文檔。

  <?XML version="1.0"?>
  <parts>
  <part>TurboWidget</part>
  </parts>

  當SAX2在處理這個文檔的時候,它產生如下的一系列的事件:

  StartDocument( )
  StartElement( "parts" )
  StartElement( "part" )
  Characters( "TurboWidget" )
  EndElement( "part" )
  EndElement( "parts" )
  EndDocument( )

  可以把SAX2看成是一個有拉特點(PUSH)的解析器,SAX2產生事件,然後你可以自己去處理些事件。實際上,當SAX2在解析一個文檔的時候,SAXXMLReader讀該文檔並產生一系列的事件,你可以選擇一些事件進行處理。

  創建一個應用SAX的應用程序框架

  SAX2產生的事件包括如下的種類:

  ¨ 和XML文檔內容相關的事件(ISAXContentHandler)

  ¨ 和DTD相關的事件(ISAXDTDHandler)

  ¨ 出現錯誤時發生的事件(ISAXErrorHandler)

  為了處理這些事件,你需要實現一個相關的處理類,該處理類需要包含一些方法來處理相關的事件。你必須對你想要處理的事件實現相關的處理。如果你不想處理某一個事件的話,只需要簡單的忽略它就可以。在實際應用中,我們首先要繼承這些接口,用C++我們可以創建一個類,在這個類的方法中,我們可以告訴應用程序在接收到一個事件的時候如何進行處理。下面是建立一個基於SAX的應用的基本步驟:

  1. 創建頭文件當使用SAX2的時候,我們需要用到動態連接庫MSXML.DLL,為了使用MSXML中包含的SAX2接口,你必須在程序的頭文件(一般在stdafx.h中)中包含下列的代碼:

  #import raw_interfaces_only
using namespace MSXML2;

  2. 建立具體的操作(handler)類,SAX2主要定義了三個基本的操作類,它們分別是ISAXContentHandler,ISAXDTDHandler和ISAXErrorHandler。

  ISAXContentHandler是用來處理SAX2解析器對文檔內容進行解析時所產生的消息的,ISAXXMLReader通過方法putContentHandler來注冊這個實例。而ISAXDTDHandler是用來處理和DTD相關的基本的消息的,ISAXXMLReader通過方法putDTDHandler來注冊這個實例。ISAXErrorHandler提供了對在解析過程中遇到錯誤時產生的錯誤事件的處理,ISAXXMLReader通過方法putErrorHandler來注冊這個實例

  因為這三個類都是用來對事件進行處理的,並且需要在接口ISAXXMLReader中進行注冊。但是它們的基本使用方法類似,所以我們這裡只詳細描述對接口ISAXContentHandler 的操作。

  ISAXContentHandler接口接收關於文檔的內容變化的事件,這是實現SAX應用所需要的最重要的接口,如果應用在遇到基本的解析事件的時候需要被通知的話,ISAXXMLReader通過方法putContentHandler來注冊這個實例,然後ISAXXMLReader就使用這個實例來報告基於文檔的事件,比如元素的開始,元素的結束和相關的字符串數據等等。ISAXContentHandler 包括了很多的方法:比如startDocument,endDocument,startElement,endElement等等。實際上它包含了好接個startXXX和endXXX對來建立不同的信息集合的抽象。比如startDocument方法在文檔信息開始的時候被調用,而在startDocument以後被調用的方法就被認為是文檔信息項(item)的子項。在文檔信息內容結束的時候endDocument就被調用,表示文檔信息的結束。 實際上是SAX2在解析文檔的時候,當處於文檔某一位置的時候,會激發相應的方法,比如當一個文檔開始的時候,就會激發startDocument方法,在實際實現的時候,我們可以在我們繼承ISAXContentHandler類的實現類中,重載該方法,實現我們自己想要的處理。我們可以把這些方法看成是ISAXContentHandler接口提供給我們的。需要注意的是事件被處理的順序和信息在文檔中的位置是一致的。

  同時需要注意的是,如果我們需要在我們的應用中對這些消息進行處理的話,我們就要繼承處理這些消息的類,比如我們只需要對文檔內容進行處理,而忽略對DTD和解析過程中錯誤(Error)的處理,那麼我們只需要創建一個新的類,該類繼承ISAXContentHandler接口,因為ISAXContentHandler中定義了很多的事件處理方法,而事實上我們只需要對我們所關心事件的處理方法進行重載,對我們不關心的事件可以簡單的忽略它。
比如我們只關心startElement和endElement事件,而且我們假設我們建立的類的名稱為CXMLContentDeal,我們的類就可以如下面所示:

  class CXMLContentDeal : public ISAXContentHandler
   {
    public:
     CXMLContentDeal();
     virtual CXMLContentDeal ();
      virtual HRESULT STDMETHODCALLTYPE startElement(

       /* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
       /* [in] */ int cchNamespaceUri,
       /* [in] */ wchar_t __RPC_FAR *pwchLocalName,
       /* [in] */ int cchLocalName,
       /* [in] */ wchar_t __RPC_FAR *pwchRawName,
       /* [in] */ int cchRawName,
       /* [in] */ ISAXAttributes __RPC_FAR *pAttributes);
      virtual HRESULT STDMETHODCALLTYPE endElement(
       /* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
       /* [in] */ int cchNamespaceUri,
       /* [in] */ wchar_t __RPC_FAR *pwchLocalName,
       /* [in] */ int cchLocalName,
       /* [in] */ wchar_t __RPC_FAR *pwchRawName,
       /* [in] */ int cchRawName);
    }


  然後我們可以重載方法startElement和endElement來進行和應用相關的特殊的處理。

  3. 通過接口ISAXXMLReader創建一個解析器。XMLReader是SAX應用實現的主要的接口,XMLReader的作用是這樣的。首先,XML的開發人員使用這個接口來注冊他們對其他SAX接口的實現(比如ContentHandler,DTDHandler,ErrorHandler等等),另外,XMLREADER通過setFeature和setProperty兩個方法來配置SAX解析器的行為,最後,XMLReader封裝了解析的功能。示例代碼如下:
ISAXXMLReader* pRdr = NULL;
   HRESULT hr = CoCreateInstance(
      __uuidof(SAXXMLReader),
      NULL,
      CLSCTX_ALL,
      __uuidof(ISAXXMLReader),
      (void **)&pRdr);
  4. 創建相應的事件(handler)處理類,這裡不妨假設我們只處理和文檔內容相關的事件。示例代碼如下:

  CXMLContentDeal * pMc = new CXMLContentDeal();

  注意這裡CXMLContentDeal是繼承接口ISAXContentHandler的類。

  5.在解析器中注冊事件處理類,示例代碼如下:

   hr = pRdr->putContentHandler(pMc);

  6.開始進行文檔的解析,示例代碼如下

   hr = pRdr->parseURL(URL); file://這裡的URL是指一個具體XML文檔的位置

  7.釋放解析器對象

   pRdr->Release();

  以上就是基於SAX的應用程序的框架結構,我們可以看到,實際的事件處理是在我們的繼承類CXMLContentDeal中實現的,在我們這個示例代碼中,每當文檔中一個新的元素開始的時候,都會激活方法startElement,每當一個元素結束的時候,都會激活方法endElement。我們可以在startElement和endElement中寫入和應用相關的特定的代碼。

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved