【发布时间】:2019-10-15 07:23:09
【问题描述】:
我正在尝试使用 VW 执行迭代测试。
理想情况下,我能够:
- 训练并保存模型 initial_model.vw(我已经对此进行了测试,它可以工作)
- 加载此模型,向其中添加其他数据,然后再次保存(到 new_model.vw)
- 使用此新模型进行第一个模型无法进行的预测,以证明迭代训练已成功。
我发现一个人也在尝试这样做 (how to retrain the model for sequence of files in vowpal wabbit),但是当我运行我的代码并尝试使用其他数据重新训练时,它似乎覆盖了旧数据而不是添加到它。
这是我正在使用的代码的基本大纲:
- 初始训练和保存:
vw initial_data.txt -b 26 --learning_rate 1.5 --passes 10 --
probabilities --loss_function=logistic --oaa 80 --save_resume --kill_cache
--cache_file a.cache -f initial_model.vw
- 使用新数据进行再训练:
vw new_data.txt -b 26 --learning_rate 1.5 --
passes 10 -i initial_model.vw --probabilities --loss_function=logistic --
oaa 80 --save_resume --kill_cache --cache_file a.cache -f new_model.vw
我知道这不足以重现我正在做的事情,但我只想知道我的论点是否有任何问题,以及这是否应该在理论上有效。当我使用我的再训练模型进行预测时,它只对包含在新数据中的测试用例准确,而不是原始训练文件中涵盖的任何内容。感谢您的帮助!
【问题讨论】:
标签: vowpalwabbit