【发布时间】:2020-05-17 04:03:25
【问题描述】:
如何提取 html 文件示例的特定部分 https://patents.google.com/patent/EP1208209A1/en?oq=medicinal+chemistry
到目前为止,我使用 beautifulsoup 来获取不带所有标签的 html 文本版本。但我希望我的代码只读取上述文件的声明部分。
【问题讨论】:
-
向我们展示您已有的代码并告诉我们您在查找该部分时遇到了什么问题!
标签: python html parsing beautifulsoup extraction