【问题标题】:R, rvest and selectorGadget on FacebookFacebook 上的 R、rvest 和 selectorGadget
【发布时间】:2015-12-18 12:10:22
【问题描述】:

我在 Facebook 上遇到了 rvest 问题。我之前已经用 R 抓取了很多东西,所以我了解例如 html_nodes 是如何工作的。我总是使用 SelectorGadget 并且一切正常。这一次,SelectorGadget 不能在 Facebook 网站上运行,所以我必须处理 html。

假设我有这个网站https://www.facebook.com/avanti/posts/1017920341583065,我想提取文章标题('Karnawałowe stylizacje F&F')。我该怎么做?

到目前为止我已经尝试过:

library("rvest")

link_fb <- "http://www.fb.com/103052579736517_1017920341583065"

html_strony <- read_html(link_fb)
html_text(html_nodes(html_strony, "mbs _6m6"))

但它不起作用。如果有任何帮助,我将不胜感激。

PS 我必须有这个标题,而不是在点击链接之后,因为那里可能会有所不同。

【问题讨论】:

  • 我现在看到 SelectorGadget 可以在 Chrome 上运行(我之前只在 Firefox 上测试过)。但不幸的是,即使是 SelectorGadget 也帮不上忙……
  • 如果我的回答适合你,你可以确认一下

标签: html r facebook web-scraping rvest


【解决方案1】:

我认为你应该使用 Facebook API 从 Facebook 下载内容和信息:Rfacebook R 包和 Facebook API:https://developers.facebook.com/ 您可以使用 httr 包编写自己的 R-Facebook-API 连接。祝你好运

【讨论】:

  • 马尔辛!我按照您的建议做了,并且设法获得了有关该站点的一些信息。除了我需要的信息(图片上的这个标题)之外的所有内容......您能否提出一些更详细的说明?
  • 我认为这可能是不可能的,因为这不是一个独立的文本,而是一个嵌入的图像。那里没有单独的文字。
  • 是的,我就是这么想的……我唯一的希望是可以在这个网站的纯 html 中看到这个标题。无论如何,谢谢。
猜你喜欢
  • 2021-05-31
  • 2021-05-05
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-03-03
  • 2020-04-19
  • 1970-01-01
  • 2018-03-15
相关资源
最近更新 更多