【问题标题】:Talend import, transform a raw file and export to CSVTalend 导入、转换原始文件并导出为 CSV
【发布时间】:2019-02-07 00:44:43
【问题描述】:

我的数据包含 600 万行。没有文件扩展名。想通过添加由 4 个字段组合而成的“UPC”列将其导出到 csv。 输入格式:

the raw file

CSV 格式要求的输出格式

transformed raw file

UPC = SY + GE + VEND + 项目

用 Excel 打开它,但由于它超过 600 万行,它被截断为 100 万行。 我对 talend 的架构有疑问,因为没有分隔符。

【问题讨论】:

  • 嗨!欢迎来到 SO。您可以使用 tFileInputPositional 读取文件,然后在完成转换后使用 tFileOutputDelimited 输出。如果您需要更多帮助,请展示您已经尝试过的内容,您更有可能获得所需的帮助。
  • 效果很好。谢谢 :)

标签: excel schema transformation talend


【解决方案1】:

首先手动创建一个元数据列(如果你导入文件,因为它是一个巨大的文件,talend 会挂掉)。因此,在元数据中创建列名(验证第一个快照)。完成后,将元数据拖动为 tFileInputDelimited 并确保提供分隔符作为空格(验证第二个快照)。在 tmap 中创建新端口并根据需要连接列 SY + GE + VEND + ITEM 并将其传递给 tFileOutputDelimited 您应该在其中提供分隔符为 , 。如果您遇到任何问题,请告诉我。

谢谢

【讨论】:

  • 由于存在空间分布不均匀的问题,因此该方法存在错误。谢谢你的回答。在我遇到的另一个问题中使用了这个。
猜你喜欢
  • 1970-01-01
  • 2011-04-16
  • 1970-01-01
  • 2018-12-01
  • 2018-02-08
  • 1970-01-01
  • 2020-05-05
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多