技术开发 频道

数据挖掘物理体系结构的处理结构和模型

  【IT168 技术文档】数据挖掘对象在处理之前只是一个空容器。“处理”数据挖掘模型也称为“定型”。

  处理挖掘结构: 挖掘结构从列绑定和使用情况元数据定义的外部数据源获取数据,并读取此数据。挖掘结构将完全读取此数据,然后对这些数据进行分析以提取各种统计信息。Analysis Services 在本地缓存中存储数据的简洁表示形式,此形式适合于由数据挖掘算法进行分析。处理模型之后,您可以保留或删除此缓存。默认情况下,将存储此缓存。有关详细信息,请参阅如何处理挖掘结构。

  处理挖掘模型: 挖掘模型在处理之前为空,仅包含定义。若要处理挖掘模型,必须已处理该模型所基于的挖掘结构。挖掘模型从挖掘结构缓存获取数据,应用该模型上已创建的任何筛选器,然后传递通过算法设置的数据以检测模式。处理模型之后,该模型仅存储处理的结果,而不会存储数据自身。有关详细信息,请参阅如何处理挖掘模型。

  下图说明了处理挖掘结构和挖掘模型时的数据流。

 


  处理数据时,源中的数据传输到挖掘结构,并在磁盘上保存为一种新的压缩格式。并不会处理数据源中的每个列,而仅处理绑定定义的挖掘结构所包含的列。

  处理模型时,模型不会直接从数据源读取数据,而从挖掘结构获取数据摘要。如果对模型定义了任何筛选器,则将应用该筛选器以限制在模型中使用的数据。因此,即使此关系图中的模型基于相同的数据挖掘结构和数据源,每个模型使用的数据仍可能不相同,进而导致每个模型生成完全不同的模式。

   查看处理结果
  在处理“挖掘结构”之后,此挖掘结构包含数据的简洁表示形式,以用于统计分析。如果尚未清除缓存,则可以用以下几种方式访问此缓存中的数据:

  针对模型创建数据挖掘扩展插件 (DMX) 查询,并钻取到结构中。

  基于结构浏览模型,并使用用户界面中的其中一个选项钻取到结构事例。有关详细信息,请参阅查看数据挖掘模型或如何从挖掘模型钻取到事例数据。

   在处理“挖掘模型”之后,该模型仅包含从分析得出的模式,以及缓存定型数据的模型结果的映射。您可以浏览或查询模型结果(称为“模型内容”),也可以查询模型和结构事例(如果已缓存)。

  每个挖掘模型的模型内容取决于创建该模型时所使用的算法。例如,如果一个模型是聚类分析模型,而另一个模型是决策树模型,即使这两个模型使用完全相同的数据,其模型内容也大不相同。

0
相关文章