Facebook 上的 R、rvest 和 selectorGadget答案

【问题标题】：R, rvest and selectorGadget on FacebookFacebook 上的 R、rvest 和 selectorGadget
【发布时间】：2015-12-18 12:10:22
【问题描述】：

我在 Facebook 上遇到了 rvest 问题。我之前已经用 R 抓取了很多东西，所以我了解例如 html_nodes 是如何工作的。我总是使用 SelectorGadget 并且一切正常。这一次，SelectorGadget 不能在 Facebook 网站上运行，所以我必须处理 html。

假设我有这个网站https://www.facebook.com/avanti/posts/1017920341583065，我想提取文章标题（'Karnawałowe stylizacje F&F'）。我该怎么做？

到目前为止我已经尝试过：

library("rvest")

link_fb <- "http://www.fb.com/103052579736517_1017920341583065"

html_strony <- read_html(link_fb)
html_text(html_nodes(html_strony, "mbs _6m6"))

但它不起作用。如果有任何帮助，我将不胜感激。

PS 我必须有这个标题，而不是在点击链接之后，因为那里可能会有所不同。

【问题讨论】：

我现在看到 SelectorGadget 可以在 Chrome 上运行（我之前只在 Firefox 上测试过）。但不幸的是，即使是 SelectorGadget 也帮不上忙……
如果我的回答适合你，你可以确认一下

标签： html r facebook web-scraping rvest

【解决方案1】：

我认为你应该使用 Facebook API 从 Facebook 下载内容和信息：Rfacebook R 包和 Facebook API：https://developers.facebook.com/ 您可以使用 httr 包编写自己的 R-Facebook-API 连接。祝你好运

【讨论】：

马尔辛！我按照您的建议做了，并且设法获得了有关该站点的一些信息。除了我需要的信息（图片上的这个标题）之外的所有内容......您能否提出一些更详细的说明？
我认为这可能是不可能的，因为这不是一个独立的文本，而是一个嵌入的图像。那里没有单独的文字。
是的，我就是这么想的……我唯一的希望是可以在这个网站的纯 html 中看到这个标题。无论如何，谢谢。