技术开发 频道

★使用 DB2 9 pureXML管理ODF和Microsoft Office 2007文档


【IT168技术文档】 

   
【聆听IT专家讲座,了解如何降低数据管理成本,更有机会获得限量蓝牙耳机!】

    【了解更多数据管理产品信息。】

简介

桌面文档有什么新变化?如果您一直在关注 Microsoft Windows® 社区,那么您会发现变化实在太大了。 Microsoft 为 MS Office 2007 产品引入了一种新格式,这种格式可以在内部利用 XML。 之前,可以在 MS Office 应用程序之间交换数据;但是,MS Office 2007 和 Windows Vista® 允许企业踏入数据孤岛,而在以前,这些数据难以使用和再利用(re-purpose,即将用于某一目的的数据用于另一个目的)。虽然 Microsoft 正在推动这个概念,但 OpenOffice 应用程序已经实现了 ODF,并从市场早已认可的 XML 优点中受益。

让我们来看一个典型的桌面应用程序问题。假设有这样一家公司,它的市场部门正在计划召开一个会议。 他们要求预期的演讲者在一份 MS Word 模板文档中提交提议,然后,文档内容被用于以下任务:

  • 审核提议
  • 向成功提交提议的可能的演讲者发送电子邮件
  • 将相关信息发布到会议网站上
  • 通过会议或公司的一个新提要(ATOM/RSS)发布内容

按照传统做法,市场人员从 Word 文档中剪切文本,并将信息粘贴到不同的系统中,这种做法很费时。 如果保留文档原有格式,而为特定任务提取相关信息,则可以节省不少时间和精力。通过 XQuery 就可以做到这一点,而且只需很少的代码。

在本文中,我们将简要地回顾 MS Office 应用程序使用的一些旧的文档数据交换方法。然后,我们将查看新的格式,并讨论如何交换和再利用这种新格式。我们将使用 Zend Core for IBM、PHP、PDO 和 XQuery 等跨平台技术 —— 这些工具都可以与 DB2 结合使用。

这种技巧可以成为内容管理和文档管理解决方案中很有价值的一部分。希望您阅读本文之后发现,通过使用 IBM DB2 pureXML™ 特性,使用和再利用 ODF 和 MS Office 2007 文档不再是难事。这并不需要很多的代码,所以这个解决方案很容易实现。然后,您可能希望索引这些 Office 2007 文档,以进一步利用 pureXML 混合存储特性。

桌面应用程序和 XML 概述

本文主要关注 OpenOffice 默认格式 ODF 和 MS Office 2007 格式。您应该清楚,这里谈到的概念并不局限于这些格式和供应商。实际上,您会发现,很多供应商都提供了 ODF,包括 Google Applications、KOffice 和 StarOffice。值得注意的是,Microsoft 有一个用于使用和导入 ODF 格式的转换器 “插件”,并且有一个兼容包,可以用旧版本的 Office 打开和保存 MS Office 2007 文件格式。而且,Lotus Notes 和 Corel 也有 ODF 格式方面的计划。

Wikipedia 提供了有关 ODF 格式及其在桌面应用程序中的使用的讨论,并提供了关于 ODF 的支持者的信息。

所需资源

虽然可以下载 Apache 2.0、PHP Version 5.21 或更高版本、DB2 Express-C 和 DB2 extensions for PHP,但是下载和安装 Zend Core for IBM 是更好的选择。安装程序会彻底配置适合 PHP 和 DB2 的环境。安装程序应该包括 DB2 Express-C 9.1.2 的下载链接。可能需要调整配置,以添加 ZIP 支持,这一点我们在后面会讨论到。

老式的文档数据交换

Windows 操作系统上的数据应用程序编程接口(API)从 Data Access Objects (DAO) 开始。它们经历了从 DAO(不是 Dead On Arrival)到 Remote Data Objects (RDO),再到 Open Database Connectivity (ODBC) 的过程。向 ODBC 的转变意义重大,被认为数据访问的一个里程碑。它实现了一种通用的方式,使开发人员对一种 API 编码,而不必考虑数据库的类型。通过使用 ODBC,可以借助 Mail Merge 之类的程序将关系数据导入到 MS Office 应用程序中。

Object Linking and Embedding Data Base (OLE/DB) 支持不同数据源的数据交换,然而它的引入只是使市场感到困惑。对于 MS Office 生产率工具,这意味着文档之间可以相互嵌套。实际上,当将一个电子表格粘贴到一个演示文稿中时,就是如此。然而,OLE/DB 是只用于 Windows 的解决方案。使用这些技术分解文档并不容易,并且这个过程难以自动化。

0
相关文章