【发布时间】:2020-11-22 04:08:50
【问题描述】:
我无法使用正则表达式让 BeautifulSoup 正常工作。我已经测试了正则表达式,它似乎可以工作,但 BeautifulSoup 仍然返回 None。
我要查找的代码示例
body class="page-template-default page page-id-1864
我的代码:
element = soup.find(text=re.compile(r"((body class).*.(page-id-\d+))"))
我也尝试了以下,它仍然返回 None
element = soup.find(text=re.compile(r"(body class)"))
我可以确认该部分是response.content的一部分
【问题讨论】:
-
页面可能是动态加载的,请分享网址
-
我认为这不是问题,因为内容在 response.content 中。我想获得的内容可以在任何 Wordpress 网站上找到。例如crimestoppervic.com.au
-
text=搜索特定文本。你确定这就是你想要的吗? -
是的。我想将文本从正文类获取到页面 ID(根据正则表达式)
-
这里会发生什么?
标签: python-3.x regex beautifulsoup