技术开发 频道

IBM SPSS Modeler EA 实例应用分析

  双击 EA 的输出节点,我们会得到上文提到过的 EA 输出节点页面。这里,我已经在节点中进行了相应的配置,如下图所示:

IBM SPSS Modeler EA 实例应用分析
▲EA 输出节点窗口

  源标记默认值为 TEST,但是如果需要,你可以点击下拉菜单创建新的,自己根据需要命名的源标记。这里的源标记相当于我们平时用的数据库中的表格。实体类型是存储库中的特征集。 选择不同的实体类型,下面表格中可以映射的功能就会自动有区别。我们有 4 种已建好的不同实体类型供您使用。但是如果有特别的用处,可以拉下拉菜单创建新的特征。唯一键,是个非常关键的选项,用来记录数据里的独一数据,要避免使用比如性别或者姓这种大量重复的值。

  如果你的数据里没有这样一条独一的数据,可以用 derive 节点生成一个 ID 排序,在这里可以用这个 ID 来当唯一键。

  此窗口最下面的表格是映射表。通过此表,我们可以把每个输入字段映射到储存库中的相应特征里。如果所选实体类型不存在适合的特征,您可以创建新的特征。

  在设置全部完成以后,点击运行键。 如下图:

IBM SPSS Modeler EA 实例应用分析
▲EA 输出运行图

  如上图所示,当源节点和输出节点之间的连接线变成绿色的。而前端又跳出一个执行窗口的时候,输出就在正常运作中。根据数据的大小,执行时间会有所不同。

  运行完成后,执行窗口会自动关掉,我们现在通过把 EA 的源节点和 Modeler 的输出表格节点连接到一起(如下图所示)并在 EA 源节点里面挑选正确的实体储存库,来看一下输出后的被处理的信息是什么样的。

IBM SPSS Modeler EA 实例应用分析
▲EA 导出图

  双击源节点,选择实体储存库,如下图:

IBM SPSS Modeler EA 实例应用分析
▲EA 节点窗口

  鼠标单击右边的下拉菜单。所有已经建好的存储库将在这个列表中显示。我们在这里选我们之前输出数据的 TEST 储存库。选择了需要的实体储存库以后,下面的表里就会显示所有的源记录。在这里,用鼠标点方形的选择栏就可以。列表会显示存储库里所有的源记录表,我们可以根据实际需要单选或者多选用于分析。此外,在选择了所需的存储库以后,数据记录也会自动更新。单击确定键跳出窗口。

  现在回到刚才建好的数据流。单击表格输出结点确认选择,按右键选择运行,生成的表格预览如下:

IBM SPSS Modeler EA 实例应用分析
▲ 预览数据

  经过 EA 输出结点处理的数据已经和我们原始的输入数据大不相同了(源数据,请参考第 3 页)。源数据有 28 列,而现数据只有 3 列:$EA-ID,$EA-SRC, $EA-KEY。Entity Analytics 在把数据源的数据读取到存储库后,自动对她进行了分析,并为每个记录添加一个名为 $EA-ID 的标识符字段。根据身份识别,ENTITY ANALYTICS 自动给这条数据分配的一个号码。如果 EA 软件认为这两条数据是同一个人,将会分配相同的 $EA-ID 给这条数据。$EA-SRC 反映了数据源的名称 .$EA-KEY 则是按照顺序给他们分配的数据库新 ID。下面我们来举个简单的例子帮助大家更好地理解这个问题。如果我们有下面几条数据。

0
相关文章