技术开发 频道

SQL Server 2005全文检索技术


【IT168 技术文档】

    4. 设计全文检索的统一视图

    4.1设计统一的全文检索结果Schema 

    如果要实现统一的检索视图,第一步要从后端统一检索结果的Schema。笔者这里设计一个简易的Schema,另外预留一个扩展字段,作为各种信息的扩展需要。设计上该扩展字段最好设计为XML类型,因为一方面它是可以进一步扩展的,另一方面它也是结构良好的,可以通过Xpath的索引快速查询。Schema如下:

 

图6:一个统一的查询结果Schema

    说明如下。 

    URL:定义信息的来源。 

    Title:定义检索到的信息的Title(文章标题、数据信息的说明内容)。 

    DocumentType:定义检索结果的文档类型。

    Content:定义包括关键字的一个相关的句子内容。 

    InventoryDate:定义该检索内容的入库登记时间。 

    Extension:扩展信息。 

    例如,如果您的全文检索系统是面向采购的,那么这个Extensionn您可以用来保存联系人的各种信息。设计上首先可以定义该字段的XSD,然后通过这个XSD对输入的数据进行验证,下面是笔者给出的一个示例XSD和示例Extension内容。


图6:联系人的示例XSD和一个示例的数据

URL Title Doc
Type
Content Inventory
Date
Extension
Http://
www.ViT.com
Full-text

Data
Definition
Language
PDF Microsoft SQL Server 2005 introduces new Transact-SQL data definition language (DDL) statements for creating, implementing, and managing full-text catalogs and indexes. The following is a list of the new Full-Text Search DDL statements. 2006-10-10

0
相关文章