技术开发 频道

数据挖掘逻辑体系结构的嵌套表

  【IT168 技术文档】在SQL Server 2008 Analysis Services (SSAS) 中,数据必须作为包含在事例表中的一系列事例提供给数据挖掘算法。但并非所有的事例都可以用一行数据来说明。例如,一个事例可能派生自两个表:其中一个表包含客户信息,而另一个表包含客户采购信息。客户信息表中的一位客户可能在客户采购表中有多个采购项目,在这种情况下,很难使用单个行来说明该数据。Analysis Services 提供了一种用来处理这些事例的独特方法,即使用“嵌套表”。下图将阐释嵌套表的概念。

 


  在此关系图中,第一个表(父表)包含客户的信息,并且为每位客户关联了一个唯一标识符。第二个表(子表)包含每位客户的采购信息。子表中的采购信息又通过唯一标识符 CustomerKey 列与父表关联。关系图中的第三个表显示了这两个表的结合。

  嵌套表作为特殊列显示在事例表中,该列的数据类型为 TABLE。对于任何特定事例行,此列均包含从子表中选出的、与父表相关的行。

  嵌套表中的数据可用于预测和/或输入。例如,一个模型中可能有两个嵌套表列:一个嵌套表列可能包含客户已购买的产品列表,而另一个嵌套表列则包含有关该客户的兴趣爱好的信息,这些信息可能从调查获得。在这种情况下,您可以使用客户的兴趣爱好作为输入,以分析购买行为并预测可能购买的产品。

0
相关文章