技术开发 频道

处理OpenOffice.org基于XML的文档格式


掌握 XML

    正如一些设计相当良好的 XML 格式,文档文件并不是特别难于理解。XML 标记所使用的名字往往不言自明,因此我们可以大致猜出它们的意思。(当然,如果您不乐于猜测,那么可以阅读 ODF 文档。请参阅 参考资料 获得更多信息。)表 2 提供了一些示例。

表 2. XML 标记
Tag Description
<office:document-content> 根标记。注意,所有的 XML 名称空间(包括 office)都定义在这个标记中。
<office:font-face-decls> 包含文档中所使用的字体。
<office:automatic-styles> 包含最基本的样式。styles.xml 文件对这些样式作出了详细说明。
<office:body> 包含文档的主体。
<text:p> 对应于 HTML 中的 <p> 标记,出现在整个段落的两侧。
<text:span> 对应于 HTML 中的 <span> 标记,允许我们为段落了某些特定的部分指定样式。
<text:alphabetical-index-mark>、
<text:alphabetical-index-mark-start> 和
<text:alphabetical-index-mark-end>
标识索引条目。

简单的更改

    如果尚未作好准备工作,请先解压压缩文件中的 content.xml 文件并在喜好的文本编辑器中打开。然后就可以开始尝试这个简单的实验了,它会让您找到编辑的感觉。在文档接近结束的地方,您会发现如下这行代码:

<text:p text:style-name="Standard">Hello world!</text:p>

    将它改为如下内容:

<text:p text:style-name="Standard">Goodbye cruel world!</text:p>

    接着保存修改的文件。保存好之后,使用新副本更新压缩文件并将其扩展名重命名为 ODT。现在使用 OpenOffice.org 重新打开该文件。您会发现文件中除了有一处文本经过修改之外,其它地方都是与原文件一样的。

    如果一切运行无误,则可以直接跳到 下一节。然而,如果文档无法正确打开,那么您需要检查如下三个地方:

1、确保没有破坏 XML 文件。

    如果您误删了一个结束标记,键入的标记名不正确或者多打了一个小于号 (<),则有可能遇到这种问题。这也许是编辑过程中最常见的问题,我们应当要保证原文件的安全可靠。

2、确保是将 XML 文件作为纯文本保存的(即 8-bit Unicode Transformation Format [UTF-8] 格式)。

    如果使用的是简单文本编辑器,那么是不应该出现问题的。但是,如果您选择使用 OpenOffice.org(或者其他的富文本编辑器,比如说 Microsoft Office WordPad、Microsoft Office Word 或 WordPerfect),请确保所保存的文档格式没有保留其格式。如果确实如此,那么可以使用 Save as type > Text document 项来保存 XML 文件。

3、确保没有修改压缩。

    我不知道最新版的 OpenOffice.org 中是否依然存在此问题,但是有时我以不同于原压缩文件的压缩等级重新压缩文件时会遇到此问题。这时,OpenOffice.org 就会不太确定如何解释该文件。如果此问题依然存在,可以通过更新已有压缩文件的方法(而不是创建一个新的压缩文件)来避免此问题。

0
相关文章