1. excel输入

excel输入可以有两种方式①是csv;②是xls。由于xls的行数不够,所以我一般用的csv输入

需要注意的点是:

①:注意数据输入的长度和格式,例如:日期格式·百分率·数据类型等等
2. 两个excel数据重合

①:要想两个excel根据一定的主键将数据组合在一起就需要用到kettle的“排序记录”“记录集连接”

利用kettle解决excel数据量过大卡顿问题

利用kettle解决excel数据量过大卡顿问题

需要注意的是:
a. 两个excel都要接排序记录,并且排序的字段也就是两个excel相关联的主键,顺序须选择一致,也就是升序或者降序

b. 关于记录集中匹配模式含义:

left outer:保留左边主键去匹配右边,删除右边剩下的

right outer:保留右边主键去匹配左边,删除左边剩下的

inner outer:保留主键相同部分

full outer:全部留下,如果左右两边主键没有的,就以null值填充

3. 删除字段和修改字段名字

kettle的“字段”组件可以实现这个功能,但需要注意的是如果选择“选择和修改”的话,不需要改名的字段也需要写上,否则kettle会以为你删除了那些字段

利用kettle解决excel数据量过大卡顿问题
4. kettle使用公式
kettle可以使用大部分excel的公式,但需要注意的是:

①:excel筛选字段用的是“”;kettle用的是[]

②:excel公式中用,号的地方,kettle用的是;号
利用kettle解决excel数据量过大卡顿问题
5. kettle可以输出excel,但是需要填写其中的信息,例如:保存位置、获取字段等等。

相关文章: