【发布时间】:2021-12-18 00:24:40
【问题描述】:
首先,我想scrape从java脚本加载的这个表,我只想scrape特定的数据行,例如基于基金缩写或搜索库对此,但我的基本脚本运行不正常。请帮忙
from bs4 import BeautifulSoup
from requests_html import HTMLSession
session = HTMLSession()
url = 'https://www.publicmutual.com.my/Our-Products/UT-Fund-Prices'
r = session.get(url)
r.html.render()
soup=BeautifulSoup(r.html.html,'html.parser')
table = soup.find('table', attrs={'class':'fundtable col-sm-12'})
print(table)
我如何进行这项工作并抓取根据基金名称或基金缩写列仅显示我想要的某些行?
【问题讨论】:
-
是汤问题还是渲染问题?
-
对此不太确定,我该如何检查这种情况?
-
使用浏览器复制粘贴源代码并保存为文件,然后解析
-
我可以使用表的给定类名从源代码中删除文件。
-
使用
selenium
标签: javascript python beautifulsoup