【问题标题】:How to extract a subset from a CSV file using NiFi如何使用 NiFi 从 CSV 文件中提取子集
【发布时间】:2018-09-14 18:50:38
【问题描述】:

我有一个包含 100 多列的 csv 文件,我只想提取特定的 60 列作为子集(列名 + 其值)。我知道我们可以使用提取文本处理器。 谁能告诉我要写什么正则表达式?例如,从给定的快照中说,我只希望 NiFi 提取“BMS_sw_micro”、“BMU_Dbc_Dbg_Micro”、“BMU_Dbc_Fia_Micro”列,即仅提取“F、L、O”列。

非常感谢任何帮助!

【问题讨论】:

  • 如果你提供CSV文本搜索会更好,截图不给我们机会。
  • 因为它是一个CSV文件,你可以计算你想要的coloumn之前的逗号数量,并将其构建到RegEx中。
  • @PoulBak 谢谢你的建议。你能通过一个例子告诉我如何写那个正则表达式吗?我不知道如何编写 RegEx 以提取特定列。谢谢!
  • 举一个 CSV 文本示例和您要匹配的文本。
  • @PoulBak 可以说,通过查看我附加的上述快照,我只想提取列 'F' 和 'O' ,即 "BMS_sw_micro" 和 "BMU_Dbc_Fia_Micro" 。如何为这种情况编写正则表达式?谢谢

标签: regex etl apache-nifi data-extraction


【解决方案1】:

请参阅我对this SO question 对有关选择 CSV 列的相关问题的回答。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-05-18
    • 1970-01-01
    • 2012-07-23
    • 1970-01-01
    • 1970-01-01
    • 2020-12-01
    • 1970-01-01
    • 2021-09-22
    相关资源
    最近更新 更多