【IT168 技术文档】在对数据挖掘模型创建查询时,可以创建内容查询,也可创建预测查询。内容查询提供有关在分析过程中发现的规则和项集的详细信息,预测查询使用在数据中发现的关联来做出预测。对于关联模型来说,预测通常基于规则且可用来给出建议,而内容查询通常用于浏览项集之间的关系。此外,还可检索有关模型的元数据。
查找有关模型的信息
所有挖掘模型都公开算法根据标准化架构(即挖掘模型架构行集)所了解的内容。可以使用建数据挖掘扩展插件 (DMX) 语句或 Analysis Services 存储过程来对挖掘模型架构行集创建查询。在 SQL Server 2008 中,还可使用类似 SQL 的语法,直接将架构行集作为系统表来查询。
示例查询 1:使用 DMX 获取模型元数据
以下查询返回有关关联模型 Association 的基本元数据,例如模型名称、存储模型的数据库以及模型中子节点的数目。此查询使用 DMX 内容查询从模型的父节点中检索元数据:
NODE_SUPPORT, [CHILDREN_CARDINALITY], NODE_DESCRIPTION
FROM Association.CONTENT
WHERE NODE_TYPE = 1
注意:必须将列名 CHILDREN_CARDINALITY 括在括号中,以便将它与同名的 MDX 保留关键字区分开来。
示例结果:
Association Test
MODEL_NAME
Association
NODE_CAPTION
Association Rules Model
NODE_SUPPORT
14879
CHILDREN_CARDINALITY
942
NODE_DESCRIPTION
Association Rules Model; ITEMSET_COUNT=679; RULE_COUNT=263; MIN_SUPPORT=14; MAX_SUPPORT=4334; MIN_ITEMSET_SIZE=0; MAX_ITEMSET_SIZE=3; MIN_PROBABILITY=0.400390625; MAX_PROBABILITY=1; MIN_LIFT=0.14309369632511; MAX_LIFT=1.95758227647523
示例查询 2:从架构行集中获取其他元数据
通过查询数据挖掘架构行集,可以找到在 DMX 内容查询中返回的相同信息。不过,架构行集还提供其他一些列,例如上次处理模型的日期、挖掘结构和用作可预测属性的列的名称。
MINING_STRUCTURE, LAST_PROCESSED
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Association'示例结果:
AdventureWorks DW
MODEL_NAME
Association
SERVICE_NAME
Association Rules Model
PREDICTION_ENTITY
v Assoc Seq Line Items
MINING_STRUCTURE
Association
LAST_PROCESSED
9/29/2007 10:21:24 PM
示例查询 3:检索模型的原始参数
以下查询返回一个列,该列包含有关创建模型时使用的参数设置的详细信息。
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Association'示例结果:
查找有关规则和项集的信息
关联模型有两个常见用途:查找有关常见项集的信息以及提取有关特定规则和项集的详细信息。例如,您可能希望提取评为当前特别受关注的规则的列表,或创建最常见项集的列表。您可以使用 DMX 内容查询来检索此类信息,也可使用 Microsoft 关联查看器浏览该信息。