【发布时间】:2018-09-14 18:50:38
【问题描述】:
我有一个包含 100 多列的 csv 文件,我只想提取特定的 60 列作为子集(列名 + 其值)。我知道我们可以使用提取文本处理器。 谁能告诉我要写什么正则表达式?例如,从给定的快照中说,我只希望 NiFi 提取“BMS_sw_micro”、“BMU_Dbc_Dbg_Micro”、“BMU_Dbc_Fia_Micro”列,即仅提取“F、L、O”列。
非常感谢任何帮助!
【问题讨论】:
-
如果你提供CSV文本搜索会更好,截图不给我们机会。
-
因为它是一个CSV文件,你可以计算你想要的coloumn之前的逗号数量,并将其构建到RegEx中。
-
@PoulBak 谢谢你的建议。你能通过一个例子告诉我如何写那个正则表达式吗?我不知道如何编写 RegEx 以提取特定列。谢谢!
-
举一个 CSV 文本示例和您要匹配的文本。
-
@PoulBak 可以说,通过查看我附加的上述快照,我只想提取列 'F' 和 'O' ,即 "BMS_sw_micro" 和 "BMU_Dbc_Fia_Micro" 。如何为这种情况编写正则表达式?谢谢
标签: regex etl apache-nifi data-extraction