【发布时间】:2017-02-25 17:31:32
【问题描述】:
我一直在使用 CNTK 迭代训练一些模型,每次迭代后用新集合替换数据,然后运行另一轮训练课程。 .DNN 文件在 CNTK 本身(运行 Train 命令)以及使用 Microsoft.Research.CNTK.CpuEval-mkl nuget 包从 C# 进行 CPU 评估时都可以正常加载。
模型的评估现在花费了足够长的时间,我决定切换到 C# 的 GPU 库 CNTK.GPU。但是,当尝试在我的代码中加载模型时,出现以下异常:
Prediction output operand's shape [7 x 1] is incompatible with label operand's shap [7] for the CrossEntropyWithSoftmax operation
at CNTK.Function.LoadModel(String modelFile)
知道如何加载模型吗?如果我必须更改 CNTK 文件以更新拓扑,我可以这样做,但我不想放弃我在当前模型上取得的进展。
编辑:这是我用来构建网络的 CNTK 文件的部分。我基本上采用了一些示例代码并对其进行了更改以适合我的需要。
SimpleNetworkBuilder = {
layerSizes=84:5000*5:7
trainingCriterion="CrossEntropyWithSoftmax"
evalCriterion="ErrorPrediction"
layerTypes="RectifiedLinear"
initValueScale=1.0
uniformInit=true
needPrior=true
addDropoutNodes=true
}
【问题讨论】:
-
感谢您报告问题。我们正在调查。
-
如果有帮助,我添加了用于创建网络的代码。