【发布时间】:2013-08-11 15:03:36
【问题描述】:
我尝试使用 BeautifulSoup4 来解析从 http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 检索到的 html 如果我打印出结果汤,它会像这样结束:
kZXI9IjAi"/></form></body></html>
在原始 html 中搜索最后一个字符 9IjaI,我发现它位于一个巨大的视图状态的中间。 BeautifulSoup 似乎对此有疑问。任何提示我可能做错了什么或如何解析这样的页面?
【问题讨论】:
标签: python html-parsing beautifulsoup