如何使用正则表达式简洁处理一篇文章中出现的若干敏感词汇,将出现的敏感词汇使用下划线连接?

敏感词汇可能有多组,每组出现的次数也是随机的。

比如这样一篇文章

博客园有很多好的博文。

假设敏感词汇博客园、博客。

处理之后

博_客_园有很多好的博_文。

正则表达式为我们提供了便捷的方法。

Regex.Replace(input, rules,new MatchEvaluator(delegate(Match m){
   if (string.IsNullOrEmpty(m.Value) || 
    m.Value.ToCharArray().Length == 0) return string.Empty;
   return string.Join("_", m.Value.ToCharArray());
}));

第一个参数是检索的文章。

第二个参数是匹配规则,同时支持多种查找,中间使用|。如博客园|文章。

第三个是一个自定义方法,用于处理匹配到数据。

在上例中,rules:博客园|文章

delegate会执行两次。第一次匹配到的是博客园,第二次是文章。

 

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-12-24
  • 2021-08-05
  • 2021-11-20
  • 2022-12-23
  • 2022-12-23
  • 2021-09-30
相关资源
相似解决方案