【问题标题】:Remove all underscores in a column of dataframe删除数据框列中的所有下划线
【发布时间】:2019-04-02 11:33:44
【问题描述】:

我有一个如下所示的数据框:

     Year   Country
[1,]  2008  Dortmund_Germany       
[2,]  2009  Ames_Iowa_USA
[3,]  2011  Rennes_France    

我想删除第二列中的所有下划线 (_)。我用 gsub 尝试过,但它没有为我提供合适的结果。最聪明的方法是什么?

【问题讨论】:

  • @Sotos sub 似乎适用于因子列,至少输出看起来正确。
  • @TimBiegeleisen 是的,当我在因子上运行它并工作时,我立即删除了评论。这通常是导致我在这里误导的问题。

标签: r gsub


【解决方案1】:

你试过了吗:

df$Country <- gsub("_", "", df$Country)

上述方法应该有效,即使Country 是一个因素。

【讨论】:

  • 为什么要使用正则表达式? df$Country &lt;- gsub("_", "", df$Country, fixed=TRUE)
  • @WiktorStribiżew 现在我知道你看了gsub 标签。也许我以后会避免使用这个标签。
  • 感谢它成功了,我犯了一个小但重大的错误!
猜你喜欢
  • 2020-02-24
  • 1970-01-01
  • 1970-01-01
  • 2022-08-12
  • 2023-03-19
  • 1970-01-01
  • 2016-08-26
  • 2017-03-23
  • 1970-01-01
相关资源
最近更新 更多