【IT168技术文档】
有时您会处于这样一种境地,即所使用的办公套件具有 500,000 种特性 却无一符合自己的需要。无论办公套件中加入了多少特性,我们总会发现一些重复的工作令人头痛不已,如果这些乏味的工作能够自动完成的话,那么将省下许多麻烦。
比如说,OpenOffice.org 能生成对索引的引用。敲击几次键盘便可以生成数千条引用。但是当您想要删除它们时,情况又是如何呢?答案是您只能一条一条地删除它们。这样一来,如果想要更改编入索引的关键字,那么您会发现这是一个痛苦的过程。
您自己可能还会想到一些其他的例子。根据所使用的办公套件,您也许可以使用 StarOffice Basic 或 Microsoft® Visual Basic® for Applications (VBA) 采用编程的方法解决一些问题。但如果您对编程一窍不通,或者您知道如何编程但是却发现这样做更加费时费力,那又该如何是好呢?
得益于日趋流行的 XML 文档格式,您也许不用编程便可以迅速解决问题,当然这要取决于问题的类型。使用一些已有的 XML 知识,比如通用 XML 扩展(如名称空间)和基于 XML 的通用文件格式(如可扩展超文本标记语言 [XHTML] 和可缩放矢量图形[SVG]),您可以在短时间内对文档进行大量的修改,而这在办公套件中却不是那么容易实现的。在这一方面,OpenOffice.org 中的 ODF 就特别方便好用,因此在本文的示例中我将主要使用 OpenOffice 格式。
ODF 的好处就是极具简单性。这种格式在 OpenOffice.org 中使用,它由一个简单的 Java™ Archive File (JAR) 文件构成,这个 JAR 文件是一个压缩 (.zip) 文件,其中包含一个清单。这个压缩文件中包含一系列 XML 文件,分别对文档的各个不同部分进行了说明。
看看一个 OpenOffice.org 文档的例子。使用 OpenOffice.org 创建一个新文本文档。键入 Hello world!,然后保存并关闭文档。确保文件保存为开放文档文本 (ODT) 格式(使用 .odt 扩展名)。
同样,OpenOffice.org 文本文档基本都是压缩文件。因此要取出某个文件,大多数人都会采用如下这个最简单的方法:
- 复制一个文档副本(以使原始文件不被损害)。
- 使用 .zip 扩展名重命名该副本。
- 使用喜好的压缩工具(比如说 unzip、WinZip 或 Microsoft Windows® Explorer)解压这个压缩文件。
解压压缩文件时,文件中应该大致包含如下内容:
- Configurations2 (directory)
- META-INF (directory)
- Thumbnails (directory)
- content.xml
- meta.xml
- mimetype
- settings.xml
- styles.xml
这些目录中并没有包含任何可能需要编辑的内容。事实上,目前惟一令我困扰的就是 表 1 中所描述的文件。
| File | Description |
| content.xml | 包含所有的文档文本以及索引标记、样式信息的链接等等。该文件是文档的主体。 |
| meta.xml | 包含文件元数据,比如说作者和文档标题。 |
| styles.xml | 定义文本的格式,比如字体的更改、段落方向、页面样式等等。如果您对 Web 设计比较熟悉,那么您就知道 styles.xml 功能等同于 CSS 样式表。ODF 会尽可能地保持样式与内容分离,因此 content.xml 文件中不会混入任何此类信息的说明。最多是含有一些从内容到样式的链接。 |
| Thumbnails/thumbnail.png | 提供文档第一个页面的缩略图。 |