【发布时间】:2013-01-17 03:26:48
【问题描述】:
我目前正在从事一个项目,我希望在该项目中允许在大量 HTML 文件中/上进行正则表达式搜索。
首先确定我感兴趣的文件后,我现在想突出显示找到的关键字!
使用 BeautifulSoup 我可以确定找到我的关键字的节点。我要做的一件事是改变整个父母的颜色。
但是,我还想在我找到的关键字周围添加我自己的 -标签。
使用 BFSoup 提供的 find() 函数确定位置等没什么大不了的。但是在常规文本周围添加我的标签似乎是不可能的?
# match = keyword found by another regex
# node = the node I found using the soup.find(text=myRE)
node.parent.setString(node.replace(match, "<myspan>"+match+"</myspan>"))
这样我只添加文本而不是适当的标签,因为文档不是新解析的,我希望避免这种情况!
我希望我的问题变得有点清楚:)
【问题讨论】:
标签: python html insert tags beautifulsoup