DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> XML入門常見問題(4)
XML入門常見問題(4)
編輯:XML詳解     
 在 XML 對象模型中如何處理空白字符?

  有些時候,XML 對象模型將顯示包含空白字符的 TEXT 節點。空白字符被截斷後,多半會帶來一些混亂。例如下面的 XML 例子:

  
   ]>
  Smith
  John
 

  生成下列樹:

  
   Processing Instruction: XML
  DocType: person
  ELEMENT: person
  TEXT:
  ELEMENT: lastname
  TEXT:
  ELEMENT: firstname
  TEXT: 

  
  名字和姓氏兩邊是只包含空白字符的 TEXT 節點,因為“person”元素的內容模型是 MIXED;它包含 #PCDATA 關鍵字。MIXED 內容模型指定元素之間可以有文本存在。因此,下面的內容也是正確的:

  
   My last name is Smith and my first name is
  John

  
  結果是類似於下面的樹:

  
   ELEMENT: person
  TEXT: My last name is
  ELEMENT: lastname
  TEXT: and my first name is
  ELEMENT: firstname
  TEXT: 

  
  如果沒有單詞“is”之後和 之前的空白字符,以及 之後和單詞“and”之前的空白字符,那麼句子便無法理解。因此,對於 MIXED 內容模型來說,文字組合、空白字符和元素都是相關的。對於非 MIXED 內容模型來說則不是這樣。

  要使只有空白字符的 TEXT 節點消失,請從“person”元素聲明中刪除 #PCDATA 關鍵字:

  結果是下面清晰的樹:

  
   Processing Instruction: XML
  DocType: person
  ELEMENT: person
  ELEMENT: lastname
  ELEMENT: firstname

 XML 聲明做什麼?

  XML 聲明必須列在 XML 文檔的頂部:

  它指定下面的項目:

  該文檔是 XML 文檔。在丟失或者還沒有指定 MIME 類型時 MIME 探測器可以用它來檢測文件是否為類型 text/XML。
  文檔符合 XML 1.0 規范。在以後 XML 有其他版本時這一點很重要。
  文檔字符編碼。編碼屬性是可選的,默認為 UTF-8。
  注意:XML 聲明必須在 XML 文檔的第一行,因此下面的 XML 文件:

  產生下面的分析錯誤:

  無效的 XML 聲明。
  行 0000002:  
  位置 0000007: ------^
  注意:XML 聲明是可選的。如果需要在頂部指定注釋或者處理指令,那麼請不要放入 XML 聲明。但是,默認的編碼將為 UTF-8。

  如何以可讀格式打印我的 XML 文檔?

  在用 DOM 從零開始構造文檔以產生 XML 文件時,任何內容都在一行上,相互之間沒有空格。這是默認的行為。

  構造在 Internet Explorer 5 中的默認 XSL 樣式表,以可讀格式顯示和打印 XML 文檔。例如,如果已經安裝了 IE5,請嘗試查看 nospace.XML 文件。浏覽器中應該顯示下面的樹:

  -
  -
  XYZ
  12.56

  在 XML 中沒有插入空白字符。

  打印可讀 XML 是非常有趣的,特別是有定義不同類型內容模型的 DTD 時。例如,在混合內容模型 (#PCDATA) 下不能插入空格,因為它可能改變內容的含義。比如請考慮下面的 XML:

  Elephant
  這最好不輸出為:

  E
  lephant
  因為單詞邊界不再正確。

  所有這些都使自動化打印成為問題。如果不需要打印可讀 XML,那麼可以使用 DOM 在適當的位置插入空白字符作為文本節點。

如何在 DTD 中使用名稱空間? 要在 DTD 中使用名稱空間,請在使用它的元素的 ATTLIST 聲明中聲明它,如下所示:

  名稱空間類型必須為 #FIXED。屬性的名稱空間也是這樣:

  名稱空間和 XML 架構
  DTD 和 XML 架構不能混合。例如,下面的

  
   xmlns:x CDATA #FIXED "x-schema:myschema.XML"

  
  將不導致使用在 myschema.xml 中定義的架構定義。對 DTD 和 XML 架構的使用是互斥的。

  如何在 Visual Basic 中使用 XMLDSO?

  使用下面的 XML 作為例子:

  
   Mark Hanson
  206 765 4583
  Jane Smith
  425 808 1111 

  
  可以按如下方式綁定到 ADO 記錄集:

  創建新的 VB 6.0 項目。

  添加對 Microsoft ActiveX Data Objects 2.1 或更高版本、Microsoft Data Adapter Library 和 Microsoft XML 2.0 版的引用。

  用下面的代碼將 XML 數據加載到 XML DSO 控件中:

  
   Dim dso As New XMLDSOControl
  Dim doc As IXMLDOMDocument
  Set doc = dso.XMLDocument
  doc.Load ("d:\test.XML")

  用下面的代碼將 DSO 映射到使用 DataAdapter 的新記錄集對象中:

  
   Dim da As New DataAdapter
  Set da.Object = dso
  Dim rs As New ADODB.Recordset
  Set rs.DataSource = da

  
  訪問數據:

  
   MsgBox rs.FIElds("name").Value

  結果顯示字符串“Mark Hanson”
  如何在 Java 中使用 XML DOM?

 必須已經安裝 MSXML.DLL 的 IE5 版本。在 Visual J++ 6.0 中,從項目菜單選擇添加 COM 包裝程序,然後從 COM 對象列表中選擇“Microsoft XML 1.0”。該操作將把所需的 Java 包裝程序構造到稱為“msXML”的新軟件包中。這些預先構造的 Java 包裝程序也可以下載。類可以按如下方法使用:

  
   import com.ms.com.*;
  import msXML.*;
  public class Class1
  {
  public static void main (String[] args)
  {
  DOMDocument doc = new DOMDocument();
  doc.load(new Variant("file://d:/samples/ot.xml"));
  System.out.println("Loaded " + doc.getDocumentElement().getNodeName());
  }
  }

  代碼示例將從 sun religion 示例中加載 3.8MB 測試文件“ot.XML”。Variant 類用於包裝 Win32 VARIANT 基本類型。

  因為在每次檢索節點時實際上都獲得了新的包裝程序,因此不能在節點上使用指針比較。因此,不要使用下面的代碼,

  
   IXMLDOMNode root1 = doc.getDocumentElement();
  IXMLDOMNode root2 = doc.getDocumentElement();
  if (root1 == root2)...

  而要使用下面的代碼:

  
   if (ComLib.isEqualUnknown(root1, root2)) ....

  .class 包裝程序的總大小大約為 160KB。但是,為了與 W3C 規范完全符合,應該只使用 IXMLDOM* 包裝程序。下面的類是舊的 IE 4.0 XML 接口,可以從 msXML 文件夾中刪除它們:

  
   IXMLAttribute*,
  IXMLDocument*, XMLDocument*
  IXMLElement*,
  IXMLError*,
  IXMLElementCollection*,
  tagXMLEMEM_TYPE*
  _XML_error* 

 這使大小減少為 147KB。同時還可以刪除下面的項目:

  
   DOMFreeThreadedDocument
  在 Java 應用程序中從多個線程訪問 XML 文檔。
  XMLHttpRequest
  用 XML DAV HTTP 擴展與服務器通信。
  IXTLRuntime
  定義 XSL 樣式表腳本對象。
  XMLDSOControl
  綁定到 Html 頁面中的 XML 數據。
  XMLDOMDocumentEvents
  在分析過程中返回回調。 

  這可以將大小減少到 116KB。要使它更小,請考慮 DOM 本身有兩層的事實:核心層包括:

  
   DOMDocument, IXMLDOMDocument
  IXMLDOMNode*
  IXMLDOMNodeList*
  IXMLDOMNamedNodeMap*
  IXMLDOMDocumentFragment*
  IXMLDOMImplementation
  IXMLDOMParseError 

  
  和用戶可能需要保留的 DTD 信息:

  
   IXMLDOMDocumentType
  IXMLDOMEntity
  IXMLDOMNotation 

  
  XML 文檔中的所有節點類型都是 IXMLDOMNode,它提供全部功能,但是存在每種節點類型的更高級別的包裝程序。因此,如果修改 DOMDocument 包裝程序並將這些特定類型更改為使用 IXMLDOMNode,那麼所有下面的接口都可以刪除:

  
   IXMLDOMAttribute
  IXMLDOMCDATASection
  IXMLDOMCharacterData
  IXMLDOMComment
  IXMLDOMElement
  IXMLDOMProcessingInstruction
  IXMLDOMEntityReference
  IXMLDOMText
 

  刪除這些將使大小減少到 61KB。但是,對 IXMLDOMElement 來說,getAttribute 和 setAttribute 方法都是有用的。否則需要使用:

  
   IXMLDOMNode.getAttributes().setNamedItem(...)

 

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved