【IT168 技术文档】因为贵企业在其交易系统顶部构建分析和商业智能系统,所以您可能已经注意到关键性能指示器和数据挖掘预测的可靠性完全取决于数据的有效性。尽管有效数据对于做出商业决策的重要性日益增强,但确保数据有效性的难度也在不断加大。数据正在源源不断地从各种系统和源流入您的企业和大量用户。
很难定义数据质量的度量标准,因为它们针对于特定的域或应用程序。定义数据质量的一个常用方法是数据事件探查。
数据配置文件是有关数据的汇总统计的集合,可能包含下列内容:
• 用户表中的行数。
• State 列中非重复值的数量。
• Zip 列中空值或缺少值的数量。
• City 列中的值的分布情况。
• Zip 列中 State 列的函数依赖关系的强度,即对于给定的 zip 值,此状态应始终不变。
1.启动服务器(使用 Hyper-V)。
注意:由于某些虚拟机配置和实验环境设置,很可能不需要您启动 Hyper-V Manager即可启动实验环境。在某些实验环境中,也不要求您登录到虚拟机,因为此配置可能已预设或保存。
(1)从Start菜单启动 Hyper-V Manager。
(2)右键选择 Bin07_SQL2008HOLS,然后单击Start。
(3)再双击Bin07_SQL2008HOLS,打开虚拟机窗口。
(4)您可以按Ctrl+Alt+Break将虚拟机切换到全屏显示。若要将虚拟机切换回窗口显示,则再次按下Ctrl+Alt+Break。
(5)使用密码 pass@word1 以Student 身份登录
2.在 Business Intelligence Development Studio 中启动 SSIS 解决方案。
解决方案资源管理器是 Microsoft 中的一个组件,您可以用来查看和管理项目。
(1)单击Start | All Programs | Microsoft SQL Server 2008。右键单击 SQL Business Intelligence Development Studio,然后选择Run as Administrator。在出现提示时单击Continue。
(2)单击File | New Project,然后从商业智能项目类型中在 Visual Studio 安装的模板下选择 Integration Services Project。
(3)在New Project对话框的Solution Name文本框中键入 SSISAdvancedLAB 作为解决方案名称
(4)将Location更改为:C:\SSISHOLS\SSIS。
(5)单击OK
(6)在Solution Explorer中,单击 SSIS Packages,然后将 package.dtsx 文件重命名为 DataProfile.dtsx
(7)在对话框中单击Yes可将包对象重命名。
3.数据配置文件任务
(1)Control Flow 设计器
(2)Data Profiling task是从顶部开始第 10 个任务。