【问题标题】:Regex to print lines and count the words正则表达式打印行并计算单词
【发布时间】:2021-11-26 21:23:51
【问题描述】:

所以我以下面的列表为例。

   text = ['Hi my name is Jackson. Hello. Hello my name is Sofia.',   'Hi Sofia, Hello!',   'hello Jackson',   'hi',   'hi, Hello123', 'hi', 'Helllo, HeLlo']

还有下面的代码

def func(y):    
    counter = 0
    for x in text:
        z = '\b{y}\b'
        if z in text:
          print(x)
          counter +=1 
        return counter

x 应该是 [Hh]hello 而counter是次数。

期望的输出:

函数(你好)

'嗨,我的名字是杰克逊。你好。你好,我的名字是索菲亚。'

'嗨,索菲亚,你好!'

'你好杰克逊'

计数器 = 4

有什么想法吗?

【问题讨论】:

  • 不,我不知道您要做什么或遇到了什么问题。
  • 您是在问“如何测试字符串是否包含 'hello' 或 'Hello'”“如何计算列表中匹配条件的项目”?
  • 这里有一堆错别字。
  • 您必须实际使用re 模块。 z in text 永远找不到 \bhello\b。试试re.search
  • 请澄清您的具体问题或提供其他详细信息以准确突出您的需求。正如目前所写的那样,很难准确地说出你在问什么。

标签: python python-3.x regex


【解决方案1】:

这里有很多小问题和错别字:

  • 要在字符串中使用变量,请使用 f 字符串 fr'\b{y}\b'。注意 r 是为了使 \b 成为单词边界,而不是 BACKSPACE 字符
  • 要测试字符串中是否存在正则表达式匹配,请使用re.search,而不是in
  • 您的数据假定您需要不区分大小写的匹配,请使用 re.I 标志
  • 注意func 中当前测试的字符串是x,而不是test
  • 在循环外定义模式,因为它是静态的(您甚至可以使用re.compile
  • 修复return 行上的缩进

这是解决方法:

import re
text = ['Hi my name is Jackson. Hello. Hello my name is Sofia.',   'Hi Sofia, Hello!',   'hello Jackson',   'hi',   'hi, Hello123', 'hi', 'Helllo, HeLlo']
def func(y):    
    counter = 0
    z = fr'\b{y}\b'
    for x in text:
        if re.search(z, x, flags=re.I):
            print(x)
            counter +=1 
    return counter

print(func('[Hh]ello'))

请参阅Python demo。输出:

Hi my name is Jackson. Hello. Hello my name is Sofia.
Hi Sofia, Hello!
hello Jackson
Helllo, HeLlo
4

【讨论】:

  • 您好,很好的解决方案,但无论如何都要执行 func(hello) 或 func(Hello) 并达到相同的结果,我该如何自动化 re?
  • @bot2 定义一个变量hello 并传递给func,见demore 不是自动化的,它是用来用正则表达式搜索/替换/分割文本。
  • 对不起,我的错误,我的意思是像一个字符串'hello'
  • @bot2 请分享您的演示链接并指出确切的问题。
  • 国旗代表re.I是什么意思?
猜你喜欢
  • 1970-01-01
  • 2015-09-01
  • 2017-07-14
  • 1970-01-01
  • 2015-12-21
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多