【问题标题】:Talend filter from two input files来自两个输入文件的 Talend 过滤器
【发布时间】:2019-01-17 23:55:05
【问题描述】:

我有两个数据文件(分隔文件): - 第一个包含 3 列,ID、num_phone、trafic_etl:sim 卡可能是 3g、4g 或其他。 - 第二个包含 1 列 num_phone_4g :sim 卡必须是 4g。


问题是,我想用 4g sim 卡(第二个文件)填充一个 oracle 表,总共有 0 个 trafic_etl,知道第一个文件可能有多个相同的 num_phone 行。

我确实通过将文件存储在表中来使用 sql 语句执行此操作。 但我必须做的是使用 talend,而且我是这个工具的新手。


提前致谢。

两个文件的图片:File2 File1

【问题讨论】:

  • 能否提供这两个文件的样本数据?
  • 当然,我用两个图像文件编辑了问题。
  • @iMezouar 当然,我用两个图像文件编辑了这个问题。

标签: talend business-intelligence


【解决方案1】:

这是使用此示例数据的解决方案。

*File 1*
num_phone;trafic_etl;annee;mois;jour
123456;111111;2018;Juillet;20
123457;222222;2018;Juillet;20
123458;0;2018;Juillet;20
123456;333333;2018;Juillet;20
123457;444444;2018;Juillet;20
123458;0;2018;Juillet;20

*File 2*
num_phone_4g
123456
123457
123458
123459

预期的输出是 123458(因为它总共有 0 个流量)和 123459(因为它不在文件 1 中;我不知道这在您的用例中是否可行)。

我按电话号码汇总 file2 的数据,以获得每个电话号码的总流量(假设日期不重要)。然后我使用这个聚合数据作为对 file2 的查找。在tMap_1 中,电话号码上的两个流之间存在连接,我只输出 file2 中总流量为空或为零的行。

让我知道我的假设是否正确。如果不是,我会更新我的答案。

【讨论】:

    猜你喜欢
    • 2012-03-09
    • 2021-10-01
    • 2017-11-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多