【问题标题】:Regex.Split on specific charactersRegex.Split 特定字符
【发布时间】:2015-07-27 19:28:12
【问题描述】:

我正在尝试在任何 Non Word Characters (\W) 上拆分字符串,包括 spaces包括以下字符:._$。我也在尝试保留任何Regex.Split的分隔符除了spaces

我该怎么做?我读过很多问题,但这没有意义。这是我最新的代码:

string[] result = Regex.Split (source, @"(\W[^(.|_|#|$)])");

编辑:

这里是一个例子

      using System.Text;

我想要:

using _ System.Text _ ;

(当前)结果是:

__using_System.Text_;_

【问题讨论】:

  • 你需要用 `\` 转义它们。
  • 请包含一个示例输入和输出。

标签: c# regex regex-negation


【解决方案1】:

您可以使用以下 .NET 特定的 [\W-[._$#\s]])|\s+ 正则表达式并利用 C# LINQ 删除空数组项:

var txt = "      using System.Text;";
var splts = Regex.Split(txt, @"([\W-[._$#\s]])|\s+").Where(s => s != String.Empty).ToArray(); 

输出:

正则表达式 - [\W-[._$#\s]])|\s+ - 使用 character class subtraction 比环视更有效,因为它利用了 .NET 正则表达式引擎的所有优化。 [\W-[._$#\s]] 表示._$#whitespace 之外的任何非单词字符。

【讨论】:

  • @WillandM:没有办法摆脱那些 NULL 匹配,这就是为什么从Split 结果中删除空数组/列表/集合成员是现实生活中的解决方案。
【解决方案2】:
(?!\.|#|_|\$|\s)(\W)|\s+

试试这个。lookahead 将确保它不会被这些字符分割。

【讨论】:

  • 有效,但blank spaces 仍包括在内,delimiters 不包括在结果中
  • 谢谢,分隔符现在包含在结果中,但blank spaces 仍然包含。有什么办法可以从我的结果中排除这一点?
  • @WillandM 试试(?!\.|#|_|\$)\s*((?!\s)\W)\s*|\s+
  • 好的,也许我可以解决这个问题,因为它是一个空白空间,我可以从外部排除它。也感谢您向我了解该工具
  • @vks:负前瞻在这里效率不高,因为 .NET 中存在类减法。对于 JavaScript,这将是唯一的方法,但它不是 .NET 风格。刚刚在regexhero 上测试过,你的慢了 24%。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-09-30
  • 2013-03-18
  • 2021-03-02
相关资源
最近更新 更多