【发布时间】:2018-02-21 04:40:39
【问题描述】:
我正在研究 R 中的一个项目(在 TED_Talks 数据集上)。我有一个数据框,其中有一列称为“标签”,其中包含一个类似
的字符“游戏、性别、性、女权主义、教育、文化”。
问题是,整行被读取为单个字符。
我希望输出是一个包含单独单词的向量。例如:
“游戏”、“性别”、“性”、“女权主义”、“教育”、“文化”
所以我可以对标签做进一步的分析。
【问题讨论】:
-
如果你的项目是在 R 语言中的,为什么要用“python”标记问题?你的问题到底是什么?
-
我的要求完全不同。我不想将列拆分为单独的列。我正在尝试拆分单词。“游戏,性别,性别,女权主义,教育,文化”以分隔单词:“游戏”,“性别”,“性”,“女权主义”,“教育”,“文化”并存储他们在同一列。我想对所有列做这个操作。
-
@JulapalliHarish 我重新提出了这个问题。那么您是否要将单词保留在同一列中但作为字符向量?试试
df$new_col <- strsplit(df$old_col, ",")[[1]] -
基本上你需要这样做stackoverflow.com/questions/43877172/…但是对于多列。
-
因为是一列,所以会这样读。仅当您想将其分成不同的列时。或者在列中嵌套单词