【问题标题】:Reg ex searching of csv file,正则表达式搜索 csv 文件,
【发布时间】:2014-03-20 15:57:09
【问题描述】:

我有一项艰巨的任务要做,将电压数据从记录的 .csv 格式文件中分离出来。

13/03/2014 18:48,71.556671,71.651062,71.639755,72.130692,71.961441,72.646423,72.262756,72.334511,7.812012

我是 RegExpressions 的新手,如何反复从第 10 列获取数据? 我有超过 10,000,000 个文件要减少,平均到 32,000 个文件供 exel 绘制。非常欢迎任何建议,尝试使用 PowerGrep 来加快速度。

【问题讨论】:

  • 您绝对不想为此使用正则表达式。使用带有适当 CSV 解析器的编程语言。
  • 例如,您可以使用 R。 R 具有读取 CSV 数据的功能和处理大量数据的能力。 stackoverflow.com/questions/10805295/…

标签: regex


【解决方案1】:

我不会说正则表达式是 的工具,但这里是:

(?:[^,]*,){9}([^,]*)

即九个非逗号“列”,以逗号分隔,然后捕获第 1 组中的第十个。

例如将它与 Perl 单行代码一起使用:

perl -ne 'chomp; /(?:[^,]*,){9}([^,]*)/ and print "$1\n"'

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-30
    • 1970-01-01
    • 2016-12-25
    相关资源
    最近更新 更多