【发布时间】:2018-07-18 20:00:51
【问题描述】:
我正在尝试检测包含 HTML 标记 <p><strong class="title"> </strong></p> 以及标记 "shared" OR "amenities" 内的某些单词的字符串,并将单词 "shared" 附加到出现在该标记之后的所有逗号分隔的子字符串中。有没有简单的方法来实现这一点?
输入示例:
</strong></p> swimming pool, barbecue <hr /> <p><strong class="title">SHARED CLUB AMENITIES</strong></p> beach, tennis courts <hr /> <p><strong class="title">
示例输出:
swimming pool, barbecue, beach shared, tennis courts shared
【问题讨论】:
-
先行建议 - 不要使用正则表达式解析 HTML;)
-
@liborm 你在那个评论上打败了我.....
标签: python regex string beautifulsoup