【发布时间】:2021-04-22 16:11:25
【问题描述】:
早上好, 我目前正在尝试使用 Python selenium 下载 Instagram 帖子的某个字段。具体来说,我正在尝试下载图片的标题(描述)(例如,在下图中,该部分将以文本“Thanks @lolap .....”开头,一直到标签。
我尝试了以下代码,但它似乎不起作用(它立即引发异常):
caption = driver.findElement(By.xpath("/html/body/div[3]/div[2]/div/article/div[2]/div[1]/ul/div/li/div/div/div[2]/span/text()")) #get all the caption text in a String
感谢您的帮助。
【问题讨论】:
-
什么不起作用?你有例外吗?一个空列表?它返回什么?
-
我建议使用 css 选择器而不是完整路径。它可能会更强大
-
顺便说一句,您要分析的帖子的地址是什么?
-
感谢您的所有回答,我不是专门分析帖子,所以一个帖子可能是:“instagram.com/p/CN-WqM_lDBG”上面的代码引发了异常。
-
CSS 会怎么样,@Nephanth?我似乎无法正确...
标签: python selenium instagram screen-scraping