【发布时间】:2019-03-29 01:06:13
【问题描述】:
我想在 htm 的 JS 中声明 var;。 但是没有id,元素。我怎样才能得到这些数据?
因为没有地址,只有var name,不知道怎么弄
网站 HTML:
<script type="text/javascript">
var imgInfoData = 'data which i want to crawl'
</script>
我的python代码:
#set url
HOMEPAGE = "https://land.naver.com/info/complexGallery.nhn?newComplex=Y&startImage=Y&rletNo=102235"
#open web
driver = webdriver.Firefox()
driver.wait = WebDriverWait(driver, 2)
driver.get(HOMEPAGE)
#try to get text from html
time.sleep(1)
WebDriverWait(driver, 3).until(EC.presence_of_element_located((By.XPATH, '//script["var"]'))).text
【问题讨论】:
-
你不能用beautifulsoup之类的东西吗? crummy.com/software/BeautifulSoup/bs4/doc公共库废网
-
我可以从普通的 HTML 中获取数据。但在这种情况下,我不知道如何抓取数据,我也无法在 beautifulsoup 中找到方法。 T.T
-
stackoverflow.com/questions/38547569/… 我相信您应该能够在美丽的汤中找到脚本标签,然后通过任何类型的 javascript 解析器运行所有这些代码以找到这些变量。解析应该是常用的套路
-
我不建议使用正则表达式来解析车削语言。请用别的东西。 commandcenter.blogspot.com/2011/08/…softwareengineering.stackexchange.com/questions/223634/…
标签: javascript python selenium selenium-webdriver web-crawler