技术开发 频道

SQL Server 2008挖掘模型查看器

  【IT168 技术文档】

  在SQL Server 2008中提供的数据挖掘套件中,通过挖掘模型查看器,我们可以查看每个数据挖掘算法模型,以下我们将对SQL Server 2008中的每个数据挖掘算法模型的查看流程进行讨论比较。

  1.查看决策树模型

  在查看决策树挖掘模型时,系统提供了“决策树”, “依赖关系网络”和“挖掘图例”三个选项卡。

  “决策树”选项卡可以查看每个可预测属性生成的一个单独的树。如图1所示

  图1

  在图1中显示的“直方图条数”表示在树的直方图中显示的状态数。各种状态按使用频率高低自左到右显示在直方图中;如果选择显示的状态数少于属性的状态总数,则使用频率最低的状态将集中以灰色显示。“显示级别滑块”可以调整树中的滑块数。“默认扩展”可以设置模型中所有树的默认显示级别数。

  “依赖关系网络”选项卡显示了模型中输入属性和可预测属性之间的依赖关系。如图2所示。

  图2

  在图2中,查看器左侧的滑块可以筛选依赖关系强度相联系的作用。向下拉动滑块,可以显示最强连接。查看器底部的图表中不同颜色代码所代表不同的依赖关系类型。

  “挖掘图例”选项卡可以显示节点中可预测属性的状态划分的事例的数目,各种事例的概率,以及包含可预测属性的各种状态数目的直方图。如图3所示。

  图3

  2.查看贝叶斯模型

  在查看贝叶斯模型时,系统提供了“依赖关系网络”,“属性配置文件”,“属性特征”,“属性对比”四个选项卡。

  “依赖关系网络”选项卡显示模型中输入属性和可预测属性之间的依赖关系。如图4所示。

  图4

  在图4中,我们可以调整左侧的滑块可以筛选与依赖关系强度的联系。查看器底部的图表中的不同颜色代表不同的依赖关系类型。

  “属性配置文件”选项卡在网格中显示为直方图。如图5所示。

  图5

  在图5中,可以调整“可预测”框中的可预测属性来与模型中的其他属性进行比较。调整“直方图条数”来更改直方图中显示的状态数。

  “属性特征”选项卡将显示与所选属性的选定事例相关联的属性的状态,属性按重要性进行排列。如图6所示。

  图6

  “属性对比”选项卡通过选择一个可预测属性以及它两个状态,可以列出数据集中的其他状态,以及选中状态的可预测属性值的程度。如图7所示。

  图7

  3.查看关联规则模型

  在查看关联规则模型时,系统提供了“项集”,“规则”以及“依赖关系网络”三个选项卡。

  “规则”选项卡显示关联规则算法发现的规则。如图8所示。

  图8

  在图8中,“最小概率”说明出现规则的最小可能性,“最低重要性”来度量规则的最低用途,并以此来筛选规则。

  “项集”选项卡显示被关联规则模型识别经常出现在一起的项集的集合。如图9所示。

  图9

  在图9中可以使用“最低支持”和“最小项集大小”来筛选满足条件的规则。“筛选项集”还可以显示以前使用过的筛选器的列表。

  “依赖关系网络”选项卡可以查看与规则确定的项之间的关联,左侧的滑块可以调整规则的概率关联。如图10所示。

  图10

  4. 查看聚类模型

  在查看聚类模型时,系统提供了“分类关系图”,“分类剖面图”,“分类特征”以及“分类对比”四个选项卡。

  “分类关系图”选项卡可以显示挖掘模型中的所有分类。如图11所示。

  图11

  在图11中,两个分类间的连线的明暗程度表示分类间的相似程度。

  “分类剖面图”选项卡提供模型中的算法创建的分类的总体视图。“直方图条”可以控制直方图条中可见的图条数。如图12所示。

  图12

  “分类特征”选项卡可以通过选择的分类,可以检查特定分类组成特征。“变量”列显示分类所包含的属性。“值”列显示所包含属性的特征。“概率”列显示所包含属性的概率。如图13所示。

  图13

  “分类对比”选项卡可以比较两个分类的属性。通过在分类1和分类2两个列表中选择要比较的属性。属性预测的蓝色条表示属性状态所倾向的分类,条越长表示属性的状态越倾向于该分类。如图14所示。

  图14

  5.查看时序聚类模型

  在查看“时序聚类模型”时,系统提供了“分类关系图”,“分类剖面图”,“分类特征”,“分类对比”,“状态转换”五个选项卡。

  与聚类模型相同,“分类关系图”选项卡显示挖掘模型中的全部分类,分类间连线的明暗度显示了分类的相似程度。可以通过分类右侧的滑块来调整分类间显示的连线数。如图15所示。

  图15

  与聚类模型相同,“分类剖面图”选项卡提供了模型中的算法创建的分类的总体视图。通过“直方图条数”可以控制直方图中可见的图条数。如图16所示。

  图16

  与聚类模型相同,“分类特征”选项卡可以通过选择的分类,可以检查特定分类组成特征。“变量”列显示分类所包含的属性。“值”列显示所包含属性的特征。“概率”列显示所包含属性的概率。如图17所示。

  图17

  与聚类模型相同,“分类对比”选项卡可以比较两个分类的属性。通过在分类1和分类2两个列表中选择要比较的属性。属性预测的蓝色条表示属性状态所倾向的分类,条越长表示属性的状态越倾向于该分类。如图18所示。

  图18

  “状态转换”选项卡通过选中一个分类,可以在选中的分类中浏览序列状态之间的转换。可以通过左侧的滑块来筛选节点边缘。节点代表序列状态,箭头代表状态间的转换。如图19所示。

  图19

  6.查看时间序列模型

  在查看时间序列模型时,系统提供了“图表”和“模型”两个选项卡。

  “图表”选项卡通过创建一个图形来预测属性在一段时间内的行为,还显示五个未来预测的值。如图20所示。

  图20

  “模型”选项卡把以完成的模型显示为树,如果有多个事例序列,时序模型会为每个模型生成单独的树。如图21所示。

  图21

  7.查看线形回归模型

  在查看线形回归模型时,系统提供了“决策树”,“依赖关系网络”两个选项卡。

  线形回归模型基于决策树模型,“决策树”选项卡可以查看每个可预测属性生成的一个单独的树。与决策树模型相同,“直方图条数”表示在树的直方图中显示的状态数。各种状态按使用频率高低自左到右显示在直方图中;如果选择显示的状态数少于属性的状态总数,则使用频率最低的状态将集中以灰色显示。“显示级别滑块”可以调整树中的滑块数。“默认扩展”可以设置模型中所有树的默认显示级别数。如图22所示。

  图22

  与决策树模型相同,“依赖关系网络”选项卡显示了模型中输入属性和可预测属性之间的依赖关系。查看器左侧的滑块可以筛选依赖关系强度相联系的作用。向下拉动滑块,可以显示最强连接。查看器底部的图表中不同颜色代码所代表不同的依赖关系类型。如图23所示。

  图23

  8.查看逻辑回归模型

  查看逻辑回归模型时,系统提供了“输入”,“输出”和“变量”三个选项卡。“输入”选项卡用来选择作为输入属性和属性值。“输出”选项卡指定要使用输出的属性。“变量”选项卡包含属性,值以及状态倾向。如图24所示。

  图24

  9.查看神经网络模型

  与逻辑回归模型类似,系统提供了“输入”,“输出”和“变量”三个选项卡。“输入”选项卡用来选择作为输入属性和属性值。“输出”选项卡指定要使用输出的属性。“变量”选项卡包含属性,值以及状态倾向。如图25所示。

  图25

0
相关文章