【发布时间】:2016-08-31 06:46:17
【问题描述】:
sample1 = read.csv("pirate.csv")
sample1[,7]
[1] >>xyz>>hello>>mate 1
[2] >>xyz>>hello>>mate 2
[3] >>xyz>>mate 3
[4] >>xyz>>mate 4
[5] >>xyz>>hello>>mate 5
[6] >>xyz>>hello>>mate 6
我必须提取并创建一个数组,其中包含最后一个 >> 之后的所有单词。
如何做到这一点?
另外,如何从以下字符串中提取不同变量中的 (a) o qwerty、(b) mate1 和 (c) pirate1
p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1'
谢谢
【问题讨论】:
-
为什么会有
r标签。r和 excel 中都需要它吗? -
是的,我必须以矢量形式从 excel 文件中提取一列到 r
-
参见
read.csv参数标题和 nrows。这应该让你开始阅读。关于这个有很多关于 SO 的问题。 -
您要始终提取最后一个单词还是只提取 'ahoy' 之后的单词?
-
这不是最后一个单词或 ahoy 之后的单词...我的动机是提取字符串中的特定单词,例如从字符串“>>hello1>>hola1>>ahoy 中提取“stuff data” xyz 东西数据 mate1"
标签: regex r text-mining extraction