【发布时间】:2020-07-07 20:27:37
【问题描述】:
拜托,我希望你给我一些关于项目的方向,因为我迷路了,真的不知道从哪里开始。
我是 Python 的新手,但我已经编写了一个网页抓取脚本来从一些网站获取一些信息,使用 lxml 和 xpath 通过 HTML DOM 获取数据。
但现在,客户向我提出了挑战……
这个网站正在使用我必须获取数据的框架=(我不知道如何处理......
更复杂的是,该网站需要登录:(
如果有人可以帮助我提供一些信息,比如我必须从哪里开始?
是否可以从将数据显示到框架中的网站获取数据?
这是网址:https://www.bulkshared.com/online-ordering
我想将脚本指向“Pantry”部分,但 url 不显示路径 =(
你推荐我哪种脚本?我想使用 Python,但我必须使用 BS 吗? Xpath?硒?
有人可以捐出你的一小部分时间来帮助我吗?
非常感谢你们的时间,伙计们!
【问题讨论】:
-
Pantry部分在哪里?你忘了告诉那个网站需要登录! -
是的,对不起...我忘了...如果网站需要登录,是否可以执行网页抓取脚本?
-
所以你想抓取标题、描述和价格,是吗?
-
是的,哥们...关键是我不知道如何将脚本指向正确的方向,因为网站没有显示 url 地址...就像你记得的那样我...该网站需要登录 :( 你认为最好的方法是使用 Selenium 吗?
-
欢迎您。很高兴为您提供帮助
标签: python web xpath web-scraping beautifulsoup