【发布时间】:2017-07-16 17:36:15
【问题描述】:
总的来说,我对 r 和机器学习还很陌生,我正在尝试使用一些数据来训练几个不同的模型。训练数据集由包括目标在内的 75 个变量的 4650 个观测值组成。使用虚拟变量,我猜(自己没有预处理)总变量达到 130 左右。目标是具有 3 个级别的有序因子。使用嘎嘎声,训练一棵树需要 1-2 秒,训练随机森林需要 45-55 秒,使用 svm 大约需要 30 秒。但是使用带有插入符号的 nnet 包,我为神经网络模型运行了以下代码:
nnet_grid<-expand.grid(.decay = c(.1, .01), .size = c(20, 30, 40, 50))
nnetfit<-caret::train(OUTPUT ~ ., data=hdtrain, method="nnet",
maxit = 10000, tuneGrid = nnet_grid, MaxNWts=10000)
现在已经超过 36 小时,并且仍在运行。这种时间是预期的吗?我在具有 8gb 内存的 i7-2720QM @ 2.2GHz 上运行它。
【问题讨论】:
-
您可能希望将
trControl参数更改为重采样默认值以外的值。请参阅?trainControl了解更多详细信息,特别是您可能需要调整前几个参数。 -
不,有问题。但我建议在 python 中使用 TensorFlow 或 Theano 来构建神经网络模型。
标签: r machine-learning neural-network