【发布时间】:2014-08-22 09:56:28
【问题描述】:
我正在使用以下代码尝试搜索 data-bhc=
之后的文本但我也想将变量 new_deal 排除在 data-bhc 之后。在这种情况下,new_deal 变量可以是这样的文本:“deal:statler-grill-4”
当我不尝试排除变量时,此正则表达式有效。
例如:
'<figure class=\"deal-card deal-list-tile deal-tile deal-tile-standard\" data-bhc="(.+?)"'
但是当我这样做时,我的语法会强制我的搜索不返回任何内容。什么是愚蠢的错误?
regex = "<figure class=\"deal-card deal-list-tile deal-tile deal-tile-standard\" data-bhc=" + "^(?!" + re.escape(new_deal) + ").*"
pattern = re.compile(regex)
info = re.search(pattern,htmltext)
print info.groups()
【问题讨论】:
-
这个问题很有道理。他们需要一个正则表达式来匹配一个模式,其中负前瞻取决于字符串变量
new_deal的值。
标签: python regex search python-3.x web-scraping