【问题标题】:Using regexp to find a word [closed]使用正则表达式查找单词[关闭]
【发布时间】:2012-12-12 06:57:34
【问题描述】:

我有一条推文,我需要查找主题标签的内容。如何使用正则表达式隔离并保存以“#”开头并以“”结尾的所有内容?我正在使用 MatLab。

【问题讨论】:

  • 我通读了 regexp 命令的帮助文件,找到了 matchstart 和 matchend 命令,但我不确定如何实现它们,或者它们是否是正确的使用方法。跨度>
  • @all:有时,有些用户真的不知道从哪里开始。与其他人不同,这个问题实际上非常清楚 - 如何使用正则表达式查找主题标签,并且用户(在 cmets 中)告诉我们他们做了 RTFM。因此,我投票重新提出问题。

标签: regex matlab


【解决方案1】:

如果您不熟悉正则表达式,使用起来可能会很困难。

这是查找主题标签的一种方法:

tweet = 'it is fun to post on #stackoverflow, really';
regexp(tweet,'#(\w+)','tokens','once')
ans = 
    'stackoverflow'

#(\w+) 是做什么的?我们用\w 查找“单词”字符(没有空格,没有标点符号),并指定我们至少需要其中一个+。这个词必须以# 开头。我们使用括号来指示我们想要返回的部分,以及选项tokens 以便它返回匹配项(我不在乎主题标签在推文中的位置)。我设置了选项once,以便regexp 只查找一个主题标签;如果您希望推文中有多个主题标签,请不要这样做,但请注意输出将是一个字符串元胞数组。

【讨论】:

    猜你喜欢
    • 2023-03-25
    • 1970-01-01
    • 1970-01-01
    • 2012-10-17
    • 1970-01-01
    • 2021-12-30
    • 2022-08-18
    相关资源
    最近更新 更多