DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> DB2 pureXML引發的回顧與反思
DB2 pureXML引發的回顧與反思
編輯:XML詳解     

內容提要:

  DB2 pureXML功能部件允許您將格式良好的 XML 文檔以分層結構的形式存儲在具有 XML 數據類型的表列中。通過將 XML 數據存儲在 XML 列中,數據可保持其本機分層結構形式,而不是將其作為文本存儲或映射為其他數據模型。因為 pureXML 數據存儲已完全集成,所以可利用現有 DB2數據服務器功能來訪問和管理存儲的 XML 數據。將 XML 數據以其本機分層結構形式來存儲可以使 XML 的搜索、檢索和更新效率更高。XQuery、SQL 或上述二者的組合可用於查詢和更新 XML 數據。返回 XML 數據或采用 XML 自變量的 SQL 函數(稱為 SQL/XML 函數)還能根據從數據庫中檢索的值來構造或發布 XML 數據。

  簡介

  許多年以來在數據庫技術領域很少有重大的技術創新能夠引起人們對整個數據庫發展歷程的回顧與反思。2006年DB2 9中推出的pureXML技術對過去數十年來關系型數據庫的最基本的數據組織方式進行了重大的創新,第一次讓我們對數據庫的歷史以及過去支撐其發展壯大的理論基礎和外部挑戰從新的角度進行審視。

  今天我們很少去回顧數據庫的歷史,對於絕大多數IT技術人員,數據庫等同於關系型數據庫,數據則和表緊密聯系。E-R模型幾乎是我們描述世界的唯一方式, SQL語言是數據庫信息訪問處理的唯一手段。關系型數據庫已經成為了一種宗教式的信仰,數據相關的所有理論問題似乎都已經解決。

  然而歷史的發展總是在我們不經意間產生轉折,所有重大技術的產生及發展都有其生存的土壤。40年前數據庫的誕生並不是關系型數據庫,第一代的數據庫第一次實現了數據管理與應用邏輯的分離,采用層次結構來描述數據,是層次型數據庫(IMS)。第二代數據庫奠基於上世紀70年代E.F Codd博士提出的關系型理論以及SQL語言的發明。實現了數據建模和數據操作處理的標准化,關系型數據庫在其後的20多年的時間取得了長足的發展,得到了廣泛的應用。技術的演進主要集中在性能、擴展性和安全性等方面的提升,其基本的理論框架和技術理念並沒有大的變化。

 與之相反,在過去的20多年時間裡,IT產業發生了重大的變化和一系列技術及理念的創新。數據庫所生存的外部土壤隨著Internet以及在網絡環境下IT系統互連互通相互協作的趨勢,對信息管理技術提出了新的挑戰。概括而言,有以下難以回避的重要問題:

  多樣化的世界-信息的復雜性

  今天信息的復雜性與關系型數據庫理論產生的時代已不可同日而語,信息的結構日益復雜,隨著個性化服務等需求增長,信息的多樣性和差異性都大大增加了。而關系型理論在管理信息復雜性方面的不足日益明顯。E-R模型本質上是一個二維的模型,通過一系列的二維關系的組合來描述復雜實體對象,每個表所代表的所有實體在建模設計時沒有差異性,即使只有一個實體所擁有的屬性,也必須為其建立一個字段。因而在很多系統中,我們經常可以看到一張表有數百個字段,而對於每條記錄,大多數字段都是空的。如果這種個體間的差異性不是僅僅表現在屬性上,而且涉及到結構和關系,則需要為有差異的實體建立不同的表和對應關系。因而今天的許多業務系統往往需要幾千張表,甚至數萬張表。數據庫的結構變十分復雜,數據庫中的信息變得難以理解。

  多種信息應用方式-信息的可理解性

  從某種意義上而言,今天業務系統數據庫的信息是業務系統運行的副產物。數據庫為支撐特定業務應用的運行而設計,數據庫中的數據也只被單一系統使用,所以很少考慮這些信息是否易於理解。然而,今天越來越多的系統需要相互協作、共享信息。信息的可讀性,能否易於理解變得日益重要。關系型數據庫在此方面存在較大不足,表中的數據不能自我描述,表於表之間的關系在數據中不能直接清晰地體現。從而使得很多系統即使把表結構開放,其他應用依然難以理解數據的關系和含義.需求及業務的變化-信息的靈活性


 

隨著IT系統進入社會生活的各個方面,信息不僅日益復雜,而且其需求內容和結構隨著時間的推移也不斷地產生變化.現實世界要求信息技術具有越來越高的靈活性和適應性.關系型數據理論所采用的是一種固定的建模方式,任何關系和屬性一旦定義,就是國定的,難以隨著需求的變化進行靈活的調整.  

DB2 pureXML引發的回顧與反思

  XML作為一種數據格式在上世紀90年代中期出現,一開始其主要的目的應用於系統間數據的交換.為便於數據交換,其設計包含了幾個主要的特點.首先是采用自描述的標簽式數據描述方式,數據本身描述自己的含義,從而使數據的可讀性大大提高,十分易於人或程序理解.另外XML采用層次型(樹型)的方式組織數據,通過層次關系體現出數據與數據之間的關系.層次模型能夠比較清晰地描述復雜對象,另外十分靈活易於擴展.經過近10年的發展,XML已經成為數據交換的事實標准,國際上形成了很多行業性的XML技術標准,對信息技術產生的很大的影響.

  雖然XML設計之初主要應用於數據交換,但這種新型的數據組織方式卻在信息管理領域應對信息的復雜性、可理解性和靈活性的挑戰開啟了新的道路,迎合了技術發展的方向和潮流。同時XML也模糊了傳統上結構化數據和非結構化數據的嚴格分界線,對20余年來關系型數據庫理論基礎產生沖擊。人們反思數據究竟應該是關系的還是層次化的,是單一的表格關系還是多樣化的對象?

  於此同時,在過去10余年中另外一個重要的技術也對IT產生了重要的影響,這就是面向對象的技術。 對象技術鼓勵設計者使用對象而不是表來思考數據,在面向對象的設計思想中,數據也是以對象的形式存在,層次結構是數據對象的最直接、最自然的體現。而關系型數據庫的理論與面向對象的思想並不匹配,E-R模型中沒有對象的概念,在關系型數據庫中實現對象的嵌套、對象的多樣性很不直觀,需要很大的代價。在關系理論中,數據應該被組織成規范的表——也就是數據應該按唯一的方式組織,使得程序員能夠消除冗余,確保數據變化的一致性。這種設計技術的引入確保了關系表中的數據是一組獨立的、通過鍵相關的數據。這種技術來自集合論的數學理論,但問題是集合論不能表達數據之間所有的關系和結構。

以規范的方式存儲數據常常要求程序員在存入數據庫之前分解對象,並且重新組織數據,但要使用它是,在使用SQL查詢(多重連接)。就像在車庫中存儲車時,你把它的門、椅子、輪子等等分別卸下來存放。這不僅消耗資源,而且沒有任何意義。  

DB2 pureXML引發的回顧與反思

  今天在應用領域,軟件開發已經廣泛采用了面向對象的設計思想和技術。而面向對象的數據庫技術卻遲遲未被市場接受。對象數據庫出現時,關系型數據庫供應商已經積聚了巨大的動力,並占領了大量市場份額。在標准的SQL接口下,訪問關系型數據庫的面向對象程序很容易寫。相反,多數早期的對象數據完全不提供SQL 接口,不適合任何查詢應用程序。

  XML技術的出現,以及相關國際標准的制定(如Xquery, SQL/XML)為數據庫引入面向對象的技術提供了新的動力。現實外部世界的技術挑戰,XML、面向對象技術與標准的成熟為新一代數據庫的創新提供了條件。那麼未來會是怎樣呢?迎接新的技術變革我們准備好了嗎?  

DB2 pureXML引發的回顧與反思

  今天,關系數據庫推動各種規模的公司發展業務。盡管這些數據庫是受歡迎而且重要的,但從長遠來看,它們根本無法與用 XML 表示的半結構化(和分層)內容相比。我們無法忽略過去20年來業界在關系型數據庫上的巨大投入,企業在關系數據和關系數據庫管理系統 (RDBMS) 方面的投資高達萬億美元,因此簡單地將 RDBMS 替換成純 XML 存儲的做法並不可取。我們更無法回避的新技術的潮流和巨大價值。世界即可以是關系的也可以是層次的,兩種技術各自有其優勢和局限性,因而容納關系型和層次型兩類模型的混合數據庫就成為數據庫發展的必然選擇.  

DB2 pureXML引發的回顧與反思


 

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved