【发布时间】:2022-11-09 02:37:10
【问题描述】:
我想在应用机器学习方法之前标准化我的所有变量。但是,据我了解,虚拟变量永远不应该标准化。 输入以下代码后,r 标准化了我所有的变量,甚至是二进制变量。我怎样才能避免这种情况发生?
#standardize all non-categorical variables to have mean zero and a standard deviation of one
df_standardized <- df %>% mutate(across(where(is.numeric), scale))
我检查了我的数据类型是“int”,而不是数字。 预先感谢您的帮助。
【问题讨论】:
标签: r dataframe scale data-cleaning standardized