【实验目的】

利用Kettle自定义常量数据流查询计算器”“ Microsoft Excel 输出组件,实现参照表清理数据。

【实验原理】

利用流查询将对比参照表和源数据,再利用计算器计算出相似度

【实验步骤】

一、创建转换

1.点击,在下拉菜单中点击选择,这样创建了一个转换文件。我们点击,重命名该转换文件,保存在某个指定的路径。

数据预处理之文件转换kettle:使用参照表清理数据

2.我们在新建的转换文件上开始可视化编程。需要的组件如下图所示。选择好组件好,按下图所示连接好组件。主要组件为“自定义常量数据”,“流查询”,“计算器”“ Microsoft Excel 输出”,组件支持自定义命名。

数据预处理之文件转换kettle:使用参照表清理数据

二、可视化编程

1. “自定义常量数据”的配置:

数据预处理之文件转换kettle:使用参照表清理数据

 数据预处理之文件转换kettle:使用参照表清理数据

 2.“流查询”的配置:

数据预处理之文件转换kettle:使用参照表清理数据

 3.“自定义常量数据 2”的配置:

数据预处理之文件转换kettle:使用参照表清理数据

 数据预处理之文件转换kettle:使用参照表清理数据

 4.“计算器”配置:

数据预处理之文件转换kettle:使用参照表清理数据

 5.“Microsoft Excel 输出”配置:

数据预处理之文件转换kettle:使用参照表清理数据

 数据预处理之文件转换kettle:使用参照表清理数据

三.运行程序:

点击开始运行程序,在弹出的对话框中,选择运行该程序。

数据预处理之文件转换kettle:使用参照表清理数据

 运行结果:

数据预处理之文件转换kettle:使用参照表清理数据

 

 

四.实验结果

输入数据

(1) 源数据.

数据预处理之文件转换kettle:使用参照表清理数据

 参照表:

数据预处理之文件转换kettle:使用参照表清理数据

 

输出数据:

“Microsoft Excel 输出”输出数据:

数据预处理之文件转换kettle:使用参照表清理数据

 

相关文章:

  • 2021-12-13
  • 2021-10-07
  • 2021-08-31
  • 2021-09-23
  • 2021-10-17
  • 2021-10-10
  • 2021-05-27
  • 2021-12-15
猜你喜欢
  • 2021-04-29
  • 2021-08-04
  • 2021-06-18
  • 2021-08-08
  • 2022-01-15
  • 2021-06-04
  • 2022-01-05
相关资源
相似解决方案