【发布时间】:2019-07-15 14:41:15
【问题描述】:
我正在尝试使用 Python 抓取网站。我已经能够成功地抓取它,但是预期的结果并没有得到。我认为这与网页的 JavaScript 有关。
我的代码如下:
driver.get(
"https://my website")
soup=BeautifulSoup(driver.page_source,'lxml')
all_text = soup.text
ct = all_text.replace('\n', ' ')
cl_text = ct.replace('\t', ' ')
cln_text_t = cl_text.replace('\r', ' ')
cln_text = re.sub(' +', ' ', cln_text_t)
print(cln_text)
它没有提供网站详细信息,而是提供了以下数据。知道我该如何解决这个问题吗?
html, body {height:100%;margin:0;} You have to enable javascript in your browser to use an application built with Vaadin.........
【问题讨论】:
-
您能否分享您正在尝试的 url 或 html 并提及您的预期输出
-
您是否尝试过预期的条件来等待您的元素出现?
标签: python-3.x selenium-webdriver beautifulsoup