技术开发 频道

数据挖掘逻辑体系结构的建模标志

  【IT168 技术文档】可以在 SQL Server 2008 Analysis Services (SSAS) 中使用建模标志为数据挖掘算法提供有关事例表中所定义数据的附加信息。该算法可以使用此附加信息生成更精确的数据挖掘模型。

  您可以使用数据挖掘扩展插件 (DMX) 通过编程定义建模标志,或者可以在 Business Intelligence Development Studio 内的数据挖掘设计器中定义它们。有关如何定义这些标志的详细信息,请参阅挖掘模型列。

  某些建模标志是在挖掘结构级别定义的,而其他标志则是在挖掘模型列级别定义的。例如,可以将 NOT NULL 建模标志与挖掘结构列一起使用。您可以在挖掘模型列上定义其他建模标志。

  下面的列表介绍了 Analysis Services 中支持的建模标志。有关特定算法支持的建模标志的信息,请参阅有关此算法的技术参考主题。

  NOT NULL
  指示属性列的值永远不应包含 Null 值。如果 Analysis Services 在模型定型过程中发现该属性列的值为 Null 值,则将出现错误。

  MODEL_EXISTENCE_ONLY
  指示该列将被视为具有两种状态:Missing 和 Existing。如果该值为 NULL,将被视为缺少。

  注意:
  缺少是算法所使用的一种特殊状态,不同于列中文本值“缺少”。有关详细信息,请参阅缺少值(Analysis Services – 数据挖掘)。
 
  此建模标志的典型用法是用于指示以下情况中的属性:NULL 状态具有隐含意义;NOT NULL 状态的显式值可能不与列中有任意值时一样重要。例如,如果某个合同永远不会签署,则 [DateContractSigned] 列可能为 NULL,但如果该合同已签署,则 [DateContractSigned] 列为 NOT NULL。因此,如果模型的目的是用来预测合同是否会被签署,则可以使用 MODEL_EXISTENCE_ONLY 标志来忽略 NOT NULL 事例中的准确日期值,仅在值为 Missing 或 Existing 的事例之间进行区分。

  REGRESSOR
  属性的存在比属型列值更重要。该标志是在挖掘模型列中定义的。

  注意:
  除了这些 Analysis Services 预定义的标志外,第三方插件还可能有它们自己的建模标志。
 
  

0
相关文章