【问题标题】:Splitting a character into separate words in R [closed]在R中将字符拆分为单独的单词[关闭]
【发布时间】:2018-02-21 04:40:39
【问题描述】:

我正在研究 R 中的一个项目(在 TED_Talks 数据集上)。我有一个数据框,其中有一列称为“标签”,其中包含一个类似

的字符

“游戏、性别、性、女权主义、教育、文化”。

问题是,整行被读取为单个字符。

我希望输出是一个包含单独单词的向量。例如:

“游戏”、“性别”、“性”、“女权主义”、“教育”、“文化”

所以我可以对标签做进一步的分析。

【问题讨论】:

  • 如果你的项目是在 R 语言中的,为什么要用“python”标记问题?你的问题到底是什么?
  • 我的要求完全不同。我不想将列拆分为单独的列。我正在尝试拆分单词。“游戏,性别,性别,女权主义,教育,文化”以分隔单词:“游戏”,“性别”,“性”,“女权主义”,“教育”,“文化”并存储他们在同一列。我想对所有列做这个操作。
  • @JulapalliHarish 我重新提出了这个问题。那么您是否要将单词保留在同一列中但作为字符向量?试试df$new_col <- strsplit(df$old_col, ",")[[1]]
  • 基本上你需要这样做stackoverflow.com/questions/43877172/…但是对于多列。
  • 因为是一列,所以会这样读。仅当您想将其分成不同的列时。或者在列中嵌套单词

标签: r regex nlp stringr


【解决方案1】:

您可以简单地执行以下操作: 假设您的条目在对象 a 中,并且您想将最终结果分配给对象 b:

a <- "gaming,gender,sex,feminism,education,culture"
b <- unlist(strsplit(a, "[,]"))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多