【问题标题】:match word if not inside other word如果不在其他单词中,则匹配单词
【发布时间】:2010-09-18 22:08:53
【问题描述】:

thecompletestring 必须匹配 complete
thecompletelystring 不能匹配 complete
theuncompletestring 不能匹配 complete
theuncompletelystring 不能匹配 complete

我尝试了单词边界,但它们在 URL 中不起作用。

我在一个数组中有一个单词列表,一个单词,一个项目。

如果单词不在另一个单词中,如何匹配?

【问题讨论】:

  • 您的 url 中是否所有字典单词都可以使用,或者您是否有一组有限的单词可供选择?
  • 任何英文单词都可以在 URL 中
  • 你不仅不能用正则表达式做到这一点,而且我还参加了关于解析 Sanskit 的研究报告,这很困难,因为它显然是没有空格的。不过,那是使用语法来消除字数限制的歧义,这可能比您想做的要多。
  • 另见stackoverflow.com/questions/405433/… 词缀和后缀分析

标签: regex


【解决方案1】:

这不能用正则表达式来完成。要成功区分这些情况,您需要编写一些能理解英语的内容。显然,要正确地做到这一点并不容易。

为了非常接近,您可以使用一个单词字典,看看是否可以将字符串拆分为该字典中的单词,并将您要查找的单词作为单词之一。这不会解释拼写错误或误解或两个单词意外被视为一个单词。为此,您将需要真正能说人类语言的东西。

【讨论】:

    猜你喜欢
    • 2021-10-29
    • 1970-01-01
    • 1970-01-01
    • 2016-12-06
    • 1970-01-01
    • 2018-07-12
    • 1970-01-01
    • 2021-10-11
    • 2017-10-27
    相关资源
    最近更新 更多