技术开发 频道

通过SQL Server 2008管理非结构化数据

非结构化数据的商业动力

大多数公司依赖于存储在数据库中的关键业务数据,并在存储和操作这些数据的数据管理系统和应用上投入很大。然而,日渐增长的业务产生了大量的数字图片、文档视频和其它多媒体格式的非关系和非结构化数据——这些新的数据格式迅速成为正式或非正式的商业流程的关键组成部分,它们与现有的商业应用程序集成在一起,遵守管理要求,或者简单的提供更加丰富的用户体验。

例如,在下面这些商业情景中:

一个保险公司需要存储政策文档并在索赔过程中获取这些文档。
一个在线零售商需要存储用于在电子商城中显示其产品的视频胶片。
一个电话系统需要保存语音信息的音频流以便进行远程传送。
一个广播台需要制作一个在其网站上用于下载并可以搜索的广播库。
一个法律实践需要以图片形式存储文档,并需要很容易的获取与一个单独的客户端或例子相关的文档。
一个建筑合伙企业需要存储和提取数字格式的计划和其相关联的客户端数据。
一个图书馆需要转换并存档大量文件并对内容进行分类,以便在数字搜索工具中进行检索和使用。

这些是全球商业中使用非结构化数据的一些例子;并且随着数字内容的创建越来越容易,公司也在寻找新的方式来使用这些数字内容来改进或扩展其商业能力。

非结构化数据面临的挑战

新的非结构化数据的类型在不断增加的同时,数字内容也带来了很多好处和商业机遇,但它同时还带来了一些针对那些需要合并这些非结构化数据源到计算机应用程序和服务中去的系统架构师、管理员和应用程序开发人员的挑战。
存储非结构化数据的挑战

要考虑的第一个挑战,同时也可能是最明显的挑战,就是非结构化数据的大量存储。你需要拥有一个可以灵活满足存储非关系型数据、同时将成本和管理费用降至最低的系统。当你计划存储非结构化数据时,要考虑的主要问题包括:

存储非结构化数据的成本,不只是包括硬件成本,还包括管理成本。

非结构化数据的物理存储位置,例如文件服务器和网络附属存储(NAS)设备。

管理持久力和存档政策。

将非结构化数据文件和相关联的关系型数据集成起来,并维护结构化数据源和非结构化数据源间的事务一致性。

将与维护关系型数据和非结构化数据相关的管理费用降低到最小。

性能和可扩展性。

保护非结构化数据,并确保相关的关系型数据的一致性。

非结构化数据的可用性和可恢复性。

使用非结构化数据的挑战

关于存储非结构化数据的相关问题,你必须考虑数据将怎样被你的应用程序使用。一些具有代表性的要考虑的事项包括:

在建立使用结构化数据和非结构化数据的应用程序时,遇到的开发挑战包括编写代码来创建、提取、更新和删除非结构化数据,并

维护相关联的关系型数据源和非结构化数据源间的事务一致性。

索引和搜索非结构化数据。

显式提取可用的元数据(例如从表格区域或文件属性),并将它显示给用户。

将文档内容转换为可以搜索和查询的格式(例如,转换音频文件到文本形式,从而可以被数据库查询或纯文本引擎检索到。)

在SQL Server 2008中非结构化数据的目标
非结构化数据面临的相关挑战反应了那些开始为数字内容建立解决方案的公司所关注的一些常见情况:

管理多个不同的平台来处理关系型数据和非关系型数据,从而导致不必要的复杂性。

这些分散的数据存储对于开发人员来说增加了复杂度,并对于经理来说提高了部署难度。

对于开发人员和数据库管理员来说,在这些不同的数据类型中缺少可以使用的服务。

SQL Server 2008旨在解决这些问题,通过:

降低管理不同数据类型的成本。

简化使用关系型数据和非关系型数据的应用程序的开发工作。

将现在只用于关系型数据的功能扩展到非关系型数据。
 

0
相关文章