【发布时间】:2019-07-22 13:55:07
【问题描述】:
我有一个如下的数据框:
data.frame(title="Title", bk=c("Book 1", "Book 1", "Book 3"), ch=c("Chapter 1", "Chapter 2", "Chapter 1"))
title bk ch
1 Title Book 1 Chapter 1
2 Title Book 1 Chapter 2
3 Title Book 3 Chapter 1
如何根据下面的 cumsum 索引重复每个观察:
id=c(1,1,1,2,2,3,3,3,3)
所以数据框可以以这样的方式扩展,以容纳生成 cumsum 索引的源向量?
title bk ch source_vector
1 Title Book 1 Chapter 1 ...
1 Title Book 1 Chapter 1
1 Title Book 1 Chapter 1
2 Title Book 1 Chapter 2
2 Title Book 1 Chapter 2
3 Title Book 3 Chapter 1
3 Title Book 3 Chapter 1
3 Title Book 3 Chapter 1
3 Title Book 3 Chapter 1
【问题讨论】:
-
你想如何使用
id?还是您只想将content中的每个单词分隔为单独的行? -
原始数据是中文文本,我去掉了
str_split的标点符号。 -
@akrun 对我来说看起来一样(分隔的词 == 组的长度)但由于不确定,我重新打开了
-
@Sotos 我认为这与您标记的不同。从那边的答案中我不需要知道什么。
-
我重新打开了,但我仍然看不到你想要完成什么