【IT168 技术文档】
在SQL Server 2008中提供的数据挖掘套件中,通过挖掘模型查看器,我们可以查看每个数据挖掘算法模型,以下我们将对SQL Server 2008中的每个数据挖掘算法模型的查看流程进行讨论比较。
1.查看决策树模型
在查看决策树挖掘模型时,系统提供了“决策树”, “依赖关系网络”和“挖掘图例”三个选项卡。
“决策树”选项卡可以查看每个可预测属性生成的一个单独的树。如图1所示

图1
在图1中显示的“直方图条数”表示在树的直方图中显示的状态数。各种状态按使用频率高低自左到右显示在直方图中;如果选择显示的状态数少于属性的状态总数,则使用频率最低的状态将集中以灰色显示。“显示级别滑块”可以调整树中的滑块数。“默认扩展”可以设置模型中所有树的默认显示级别数。
“依赖关系网络”选项卡显示了模型中输入属性和可预测属性之间的依赖关系。如图2所示。

图2
在图2中,查看器左侧的滑块可以筛选依赖关系强度相联系的作用。向下拉动滑块,可以显示最强连接。查看器底部的图表中不同颜色代码所代表不同的依赖关系类型。
“挖掘图例”选项卡可以显示节点中可预测属性的状态划分的事例的数目,各种事例的概率,以及包含可预测属性的各种状态数目的直方图。如图3所示。

图3
2.查看贝叶斯模型
在查看贝叶斯模型时,系统提供了“依赖关系网络”,“属性配置文件”,“属性特征”,“属性对比”四个选项卡。
“依赖关系网络”选项卡显示模型中输入属性和可预测属性之间的依赖关系。如图4所示。

图4
在图4中,我们可以调整左侧的滑块可以筛选与依赖关系强度的联系。查看器底部的图表中的不同颜色代表不同的依赖关系类型。
“属性配置文件”选项卡在网格中显示为直方图。如图5所示。

图5
在图5中,可以调整“可预测”框中的可预测属性来与模型中的其他属性进行比较。调整“直方图条数”来更改直方图中显示的状态数。
“属性特征”选项卡将显示与所选属性的选定事例相关联的属性的状态,属性按重要性进行排列。如图6所示。

图6
“属性对比”选项卡通过选择一个可预测属性以及它两个状态,可以列出数据集中的其他状态,以及选中状态的可预测属性值的程度。如图7所示。

图7