技术开发 频道

使用SQL Server 2008管理非结构化数据

  2.1 对于非结构化数据的挑战

  当新的非结构化数据的类型在不断增加的同时,数字内容带来了很多好处和商业机遇,但是它同时还带来了一些针对需要合并这些非结构化数据源到计算机应用程序和服务中去的系统架构师、管理员和应用程序开发人员的挑战。

  存储非结构化数据的挑战

  要考虑的第一个挑战,同时也可能是最明显的挑战,就是非结构化数据的大量存储。你值得拥有一个使你可以灵活地满足存储非关系数据、同时将成本和管理费用降低到最小的特定需求的系统。当你计划存储非结构化数据时你要考虑的主要问题包括:

  · 存储你的非结构化数据的成本,不只是包括硬件成本,还包括管理成本。

  · 非结构化数据的物理存储位置,例如文件服务器和网络附加存储(NAS)设备。

  · 管理持久力和存档政策。

  · 将非结构化数据文件和相关联的关系数据集成起来,并维护结构化数据源和非结构化数据源间的事务一致性。

  · 将与维护关系数据和非结构化数据相关的管理费用降低到最小。

  · 性能和可扩展性。.

  · 保护非结构化数据,并确保相关的关系数据的一致性。

  · 非结构化数据的可用性和可恢复性。

  使用非结构化数据的挑战

  还有关于存储非结构化数据的相关问题,你必须考虑数据将怎样被你公司的应用程序使用。一些具有代表性的要考虑的事项包括:

  · 在建立使用结构化数据和非结构化数据的应用程序时遇到的开发挑战包括编写代码来创建、提取、更新和删除非结构化数据,并维护相关联的关系数据源和非结构化数据源间的事务一致性。

  · 索引和搜索非结构化数据。

  · 显式提取可用的元数据(例如从表格区域或文件属性),并将它显示给用户。

  · 将文档内容转换为可以搜索和查询的格式(例如,转换音频文件到文本形式,从而可以被数据库查询或纯文本引擎检索到。)

0
相关文章