【问题标题】:Replacing values in a particular column in a CSV file using R使用 R 替换 CSV 文件中特定列中的值
【发布时间】:2015-11-07 23:06:20
【问题描述】:

我正在将一个数据集加载到 R 中,并对名为“收入”的列执行一些操作。这是我的代码:

CustomerAnalysis <-read.csv(file="C:\\Users\\Hemanth\\Desktop\\509\\Marketing-Customer-Value-Analysis.csv", header=TRUE)
attach(CustomerAnalysis)
GenderSummary <- summary(Gender)
GenderSummary


Income
Income[Income==0] <- NA

Income[Income <= 29999] <- "Low"
Income[Income > 29999 & Income <= 69999 ] <- "Medium"
Income[Income > 70000] <- "High"

我正在尝试将“收入”分为“低”、“中”和“高”。它工作正常,直到“低”和“中”,当谈到“高”时,它将“收入”列中的所有值替换为“高”,NA 值除外。

在“低”之后:

在“中等”之后:

在“高”之后变成这样:

我不知道怎么了。请帮忙。谢谢。

【问题讨论】:

  • 生成数据样本,否则无法回答
  • 只是为了让您了解“低”出了什么问题> 70000 [1] TRUE
  • 它不适用于您的代码,因为您将 Income 转换为字符类 Income[Income &lt;= 29999] &lt;- "Low"

标签: r csv


【解决方案1】:

我能够解决它。我将“高”语句更改为:

Income[Income >= 70000 & Income != "Low" & Income != "Medium" ] <- "High"

它奏效了。

我不明白为什么它没有早点工作。有什么想法吗?

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-03-05
    • 1970-01-01
    • 2018-06-05
    • 2016-08-21
    • 1970-01-01
    相关资源
    最近更新 更多