【问题标题】:Normalize by Group按组标准化
【发布时间】:2020-07-02 04:42:09
【问题描述】:

我正在尝试按项目规范强度代码

例如

ID    Item    StrengthCode
7     A       1
7     A       5
7     A       7
8     B       1
8     B       3
9     A       5
9     A       3

我需要实现的是这样的:

ID    Item    StrengthCode    Nor
7     A       1    0.14
7     A       5    0.71
7     A       7    1
8     B       1    0.34
8     B       3    1
9     A       5    0.71
9     A       3    0.42

我试过这段代码,但我卡住了....如果你能帮助我会很棒!!!

normalit <- function(m){(m - min(m))/(max(m)-min(m))}

Tbl.Test <- Tbl.3.1 %>%
  group_by(ID, Item) %>%
  mutate(Nor = normalit(StregthCode))

我收到此错误:

强制引入的警告消息 NA

【问题讨论】:

  • 我没有得到相同的结果,但该函数适用于您发布的示例数据
  • @Seb 你有没有最大值和最小值重合的组?
  • df$StrengthCode 是一个因素吗?

标签: r dplyr normalize


【解决方案1】:

您想要的输出看起来像您想要的那样:

df <- read.table(header=TRUE, text=
'ID    Item    StrengthCode
7     A       1
7     A       5
7     A       7
8     B       1
8     B       3
9     A       5
9     A       3')
df$Nor <- ave(df$StrengthCode, df$Item, FUN=function(x) x/max(x)) 
df
# > df
#   ID Item StrengthCode       Nor
# 1  7    A            1 0.1428571
# 2  7    A            5 0.7142857
# 3  7    A            7 1.0000000
# 4  8    B            1 0.3333333
# 5  8    B            3 1.0000000
# 6  9    A            5 0.7142857
# 7  9    A            3 0.4285714

使用dplyr,您可以这样做(感谢 Sotos 的评论+代码):

library("dplyr")
(df %>% group_by(Item) %>% mutate(Nor = StrengthCode/max(StrengthCode))) 
# > (df %>% group_by(Item) %>% mutate(Nor = StrengthCode/max(StrengthCode)))
# Source: local data frame [7 x 4]
# Groups: Item [2]
# 
#      ID   Item StrengthCode       Nor
#   <int> <fctr>        <int>     <dbl>
# 1     7      A            1 0.1428571
# 2     7      A            5 0.7142857
# 3     7      A            7 1.0000000
# 4     8      B            1 0.3333333
# 5     8      B            3 1.0000000
# 6     9      A            5 0.7142857
# 7     9      A            3 0.4285714

【讨论】:

  • 好收获。您还应该添加dplyr 以应对OP 的请求(df %&gt;% group_by(ID, Item) %&gt;% mutate(new = StrengthCode/max(StrengthCode))
  • hmm...这很奇怪,然后按项目分组,而不是 ID
  • 确实...星期五总是犯这些错误的好日子:p
  • 伙计...你真棒!!! TKS!!拯救了我的星期五,现在我可以去参加派对了,哈哈!
  • @jogo 知道如果使用mutate_at 会如何改变,从而使每个特征都标准化吗?
【解决方案2】:

data.table也很容易做到。

library(data.table)
setDT(df)[, Nor := StrengthCode / max(StrengthCode), by = Item]

【讨论】:

    猜你喜欢
    • 2015-01-13
    • 1970-01-01
    • 2022-09-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-03-24
    • 2018-08-06
    相关资源
    最近更新 更多