【发布时间】:2015-12-18 12:10:22
【问题描述】:
我在 Facebook 上遇到了 rvest 问题。我之前已经用 R 抓取了很多东西,所以我了解例如 html_nodes 是如何工作的。我总是使用 SelectorGadget 并且一切正常。这一次,SelectorGadget 不能在 Facebook 网站上运行,所以我必须处理 html。
假设我有这个网站https://www.facebook.com/avanti/posts/1017920341583065,我想提取文章标题('Karnawałowe stylizacje F&F')。我该怎么做?
到目前为止我已经尝试过:
library("rvest")
link_fb <- "http://www.fb.com/103052579736517_1017920341583065"
html_strony <- read_html(link_fb)
html_text(html_nodes(html_strony, "mbs _6m6"))
但它不起作用。如果有任何帮助,我将不胜感激。
PS 我必须有这个标题,而不是在点击链接之后,因为那里可能会有所不同。
【问题讨论】:
-
我现在看到 SelectorGadget 可以在 Chrome 上运行(我之前只在 Firefox 上测试过)。但不幸的是,即使是 SelectorGadget 也帮不上忙……
-
如果我的回答适合你,你可以确认一下
标签: html r facebook web-scraping rvest