【发布时间】:2015-05-30 11:28:49
【问题描述】:
我想用 VW 来训练这些数据:
-1 | word1 word2
1 | word1 word3 word1
...等
如您所见,“word1”在第二个示例中重复了两次。
VW 文档说 VW 的默认行为是自动将“:1”添加到每个令牌,例如第一个示例:
-1 |单词1:1 单词2:1
我的问题是:在第二个示例中我必须做什么?
- 选项 #1:将其转换如下:
1 | word1:2 word3
- 选项 #2:保持“原样”:
1 | word1 word3 word1
(在这种情况下,我认为会发生一些碰撞)
【问题讨论】:
标签: text vowpalwabbit