【发布时间】:2021-06-22 02:42:41
【问题描述】:
在我的dataset 中,我有一个二进制Target(0 或1)变量和8 个特征:nchar、rtc、Tmean、week_day、hour、ntags、 nlinks 和 nex。 week_day 是一个因素,而其他因素是数字。我建立了一个决策树分类器,但我的问题涉及特征缩放:
library(caTools)
set.seed(123)
split = sample.split(dataset$Target, SplitRatio = 0.75)
training_set = subset(dataset, split == TRUE)
test_set = subset(dataset, split == FALSE)
# Feature Scaling
training_set[-c(2,4)] = scale(training_set[-c(2,4)])
test_set[-c(2,4)] = scale(test_set[-c(2,4)])
模型返回 Tmean=-0.057 和 ntags=2 是两个分裂点。如何恢复这两个特征的原始值,即scale()进行缩放操作之前变量假定的值。
【问题讨论】:
标签: r feature-scaling