之前谈到过在sql server中对用户的购买记录做过关联分析,数据来源是来自sql server数据库,但有的时候,数据源来自于其他文件,比如excel文件,这时候要想对数据作分析(这里指的是利用sql server BI工具)就需要把我们的excel数据表导入到sql server中,只有这样,在我们创建数据源的时候,才能够从数据库中获取数据源,因此本文着重介绍如何从数据库中导入excel表格,仍然采用截图的方式,方便读者理解与操作。
首先,对于excel数据表内容想了解下,这些数据将会作为创建决策树的训练数据源buy_train.xlsx,如图所示:
这些数据是不同客户对电脑的购买情况,我们的目的是针对这些信息对我们的新的数据进行预测,新客户是否会购买电脑,因此,测试数据buy_test.xlsx如下:
好了现在把这些数据导入到excel中,作为建立挖掘结构所需要的数据源。
打开如下窗口:
在"ML_DM"处单击鼠标右键,选择“任务"→"导入数据",出现如下界面:
进入下一步:
注意上面的excel版本,要选对。
也可以编辑里面的字段属性,点击"编辑映射",出现如下界面:
在这里,不改了,采取默认。
然后刷新数据库,便能够查看到导入的数据表。
同样的道理,把测试数据导入进来,注意,由于我是用的是office 2013excel,而sql server2008 r2最高版本是excel 2007,当时在一个文件夹下存放了两张表,tree_train.xlsx和tree_test.xlsx,但是死活只能选择一张表,因此最后我把两者表用两个文件夹放,一个文件夹放tree_train.xlsx,另一个文件夹放tree_test.xlsx,这样用同样的方法再把测试数据tree_test.xlsx导入进来,最后这两份数据被成功导入到数据库中,如图:
可能方法有点笨,但是问题还是解决了,该方法仅供参考,数据源成功导入后,下次直接进行决策树的构建。