【问题标题】:Python Regex/Beautiful Soup Wild CardPython 正则表达式/美汤通配符
【发布时间】:2015-04-12 19:37:26
【问题描述】:

很抱歉,如果这个问题已经在别处得到解答,我找不到确切的方法,而且我对 BeautifulSoup 的正则表达式不是最有经验的。

基本上,我有这几行代码。

finder = re.compile('div_\w\w\w_basic')
for soup_ in soup.find_all("div", {"id" : finder}):

这给了我所有出现“div_###_basic”的div标签。现在,我想将结果保存在字典中,以便键是 ### 的任何内容, 数据就是我要抓取的信息。

感谢任何帮助,谢谢!

【问题讨论】:

    标签: python regex beautifulsoup regex-negation


    【解决方案1】:

    没关系,我发现了我的问题。万一其他人碰到它,

    finder = re.compile('div_(\w\w\w)_basic')
    print re.findall(finder, str(soup))
    for soup_ in soup.find_all("div", {"id" : finder}):
    

    这让我在一个点得到部分字符串,在另一个点得到完整字符串。再一次,我很确定这不是最好的方法,但它很实用。

    【讨论】:

    • 我猜你也可以使用finder = re.compile('div_(\w{3})_basic')
    猜你喜欢
    • 1970-01-01
    • 2018-09-21
    • 2013-06-29
    • 2012-05-05
    • 1970-01-01
    • 2022-11-04
    • 1970-01-01
    • 2013-04-09
    相关资源
    最近更新 更多