【发布时间】:2019-07-30 09:09:07
【问题描述】:
我正在使用 rvest 来抓取一些博客文章的 cmets 以及这些 cmets 所属的文章/博客文章的所属标题。 抓取本身效果很好,但现在我想将博客文章的标题和 cmets 分配给一个数据框。 当然,大部分博文都有多个 cmets,所以应该是这样的:
title_of_articleA comment1
title_of_articleA comment2
title_of_articleA comment3
title_of_articleA comment4
title_of_articleB comment1
title_of_articleB comment2
基本上这样我以后可以很容易地看到哪些 cmets 属于哪个帖子。
然而,我的问题是我目前有两个长度不同的列表(一个用于标题,另一个用于 cmets)。 在我可以使用 unlist() 并将它们组合之前,我需要以某种方式复制每个子列表 A 的元素,以匹配 B 的相关子列表中的项目数。
listA<-list("title_of_article 1", "title of article 2")
listB<-list(c("comment 1" ,"comment 2", "comment 3", "comment 4"), c("comment 1", "comment2"))
我可以使用 sapply(listB, length) 来接收我需要多少元素的指示符,但是我如何使用该信息告诉 ListA 相应地复制它的项目?
【问题讨论】: