【问题标题】:Replace multiple underscore with space or new line on paragraph using regex [duplicate]使用正则表达式在段落中用空格或换行替换多个下划线[重复]
【发布时间】:2020-09-28 06:09:21
【问题描述】:

您好,我有一个从网站上抓取的数据,我想清理它的段落,但我不知道如何删除多个下划线并将其替换为空格或新行。

这是我使用cheerio.js 抓取的示例段落

The future of mobile gameplay is War Games!_______________________________________ATTENTION ALL PLAYERS! We’d love to hear your feedback to help us improve the game. To leave feedback visit here.

那我希望是这样的。

The future of mobile gameplay is War Games!
ATTENTION ALL PLAYERS! We’d love to hear your feedback to help us improve the game. To leave feedback visit here.

【问题讨论】:

    标签: javascript regex string


    【解决方案1】:

    const text = "The future of mobile gameplay is War Games!_______________________________________ATTENTION ALL PLAYERS! We’d love to hear your feedback to help us improve the game. To leave feedback visit here.";
    
    let newstr = text.replace(/\_+/i, "\n");
    console.log(newstr);

    \_+ 部分将匹配一个或多个“_”并将所有内容替换为换行符。

    【讨论】:

    • 我可以对此提出后续问题吗?我怎样才能将这个 '\n' 添加到那个正则表达式中。
    • 好答案。顺便说一句,下划线不是正则表达式中的特殊字符,您不需要用反斜杠对其进行分隔。 i 选项也将是不必要的。考虑到句子包含多个下划线序列的情况,添加g 选项可能会更好。干杯。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2011-07-18
    • 1970-01-01
    • 2016-02-26
    • 2013-08-15
    • 2011-07-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多