技术开发 频道

SQL Server 2008集成服务的事件探查器

  【IT168 技术文档】关键性能指示器和数据挖掘预测的可靠性完全取决于数据的有效性。尽管有效数据对于做出商业决策的重要性日益增强,但确保数据有效性的难度也在不断加大。数据正在源源不断地从各种系统和源流入您的企业和大量用户。

  很难定义数据质量的度量标准,因为它们针对于特定的域或应用程序。定义数据质量的一个常用方法是数据事件探查。

  数据配置文件是有关数据的汇总统计的集合,可能包含下列内容:

  • 用户表中的行数。

  • State 列中非重复值的数量。

  • Zip 列中空值或缺少值的数量。

  • City 列中的值的分布情况。

  • Zip 列中 State 列的函数依赖关系的强度,即对于给定的 zip 值,此状态应始终不变。

  在此演示中,我们假设贵公司对客户端信息有特定的数据质量要求。如下所示。

  a. 每个客户端必须是唯一可识别的客户端,且不能包括任何重复内容

  b. 人口统计信息不得为空

  c. 城市应包含相应的国家地区代码组合

  步骤

  启动服务器(使用 Hyper-V)

  注意:由于某些虚拟机配置和实验环境设置,很可能不需要您启动 Hyper-V Manager即可启动实验环境。在某些实验环境中,也不要求您登录到虚拟机,因为此配置可能已预设或保存。

  1. 从Start菜单启动 Hyper-V Manager。

  2. 右键选择 Bin07_SQL2008HOLS,然后单击Start。

  3. 再双击Bin07_SQL2008HOLS,打开虚拟机窗口。

  4. 您可以按Ctrl+Alt+Break将虚拟机切换到全屏显示。若要将虚拟机切换回窗口显示,则再次按下Ctrl+Alt+Break。

  5. 使用密码 pass@word1 以Student 身份登录

  在 Business Intelligence Development Studio 中启动 SSIS 解决方案。

  解决方案资源管理器是 Microsoft 中的一个组件,您可以用来查看和管理项目。 6. 单击Start | All Programs | Microsoft SQL Server 2008。右键单击 SQL Business Intelligence Development Studio,然后选择Run as Administrator。在出现提示时单击Continue。

  7. 单击File | New Project,然后从商业智能项目类型中在 Visual Studio 安装的模板下选择 Integration Services Project。

  8. 在New Project对话框的Solution Name文本框中键入 SSISAdvancedLAB 作为解决方案名称

  9. 将Location更改为:C:\SSISHOLS\SSIS。

  10. 单击OK

  11. 在Solution Explorer中,单击 SSIS Packages,然后将 package.dtsx 文件重命名为 DataProfile.dtsx

  12. 在对话框中单击Yes可将包对象重命名。

  数据配置文件任务

  13. Control Flow 设计器

  14. Data Profiling task是从顶部开始第 10 个任务。

0
相关文章