pureXML的技术应用及展望
pureXML技术及混合型数据库的出现,超越了关系型数据库固有的局限性,为数据库的应用及开发开辟了新的领域。其意义不仅仅是提供了一种存储XML数据的更有效的方式,可用于广泛使用XML数据的各类领域,同时由于pureXML所代表的层次型数据组织方式,使得我们有了两种关系型和层次型两种数据建模的方法,即使是对于传统非XML的关系型数据,在某些情况下将传统关系型的数据转化为层次型存储也将带来巨大的业务价值。
从对现有XML数据管理的应用看,pureXML技术的价值是非常明显的。如在书籍出版领域,W3C已经制定了各类数据的规范,今天很多这个领域的数据就是以XML的形式存在。但是如何提供有效的存储方式,以及准确高效的数据查询方式却始终是关系型数据库的一个挑战。以图书为例,任何书籍的信息有部分结构化的成分,但是书籍内容的差异性太大,很难用一种统一的结构化的体系进行描述。另一方面,基于各类书籍文章的结构,提供精确地信息查询和搜索又有重要的应用价值。传统关系型数据库很难对书籍XML数据建模,更难以提供准确的查询和搜索。往往只能用全文检索的模式提供一些简单的功能。而采用pureXML技术,任何书籍XML信息可以直接存储在数据库中,无需复杂建模。由于XML的自描述能力,一旦数据以XML对象存储,就可以提供精确地查询和搜索。举个简单例子,对于一本300页的书,全文检索只能返回其中是否有你查询的内容,无法准确定位在哪一章、哪一节、哪一页,其实用性很弱。而通过pureXML的Xquery进行查询,可以准确定位到最细的粒度,而且可对指定范围进行搜索。
在XML广泛使用的信息交换领域,pureXML 能够很大程度上地降低数据模型设计的复杂性。无需将XML每个数据项的信息都映射到关系型表的字段上,减少了很多不必要的加工处理过程。另外XML所具有的扩展性和灵活性的优势可得到充分的发挥。数据层的存储模式不再与数据交换本身的内容是紧密耦合的关系。基于pureXML可设计相对通用的数据交换的存储模式,而且可以方便地适应数据标准的调整和变化。这一点在很多监管类报表信息收集(如XBRL)上有重要的应用价值。
即使对于不涉及任何XML数据的应用,pureXML所代表的层次型数据结构和面向对象的设计方式,也可对关系型数据库的设计方式提供重要的补充。比如对于复杂对象的结构的建模,层次型的模型比关系型有明显的优势。以电子病历为例,下面为关系型建模的样例:
