【发布时间】:2013-07-25 18:28:45
【问题描述】:
这是一个纯粹的编程问题。我有一个单词数组。单词后面有不同长度的停顿(大部分为零)。每个单词也有一个确定性分数。我想从前瞻窗口中选择最佳的单词跨度。
- 总体确定性越低越好(或者说确定性的第 33 个百分位数越低越好)。
- 边缘的停顿时间越长越好(有一个严格的最小值)。
- 会有一个最佳长度(例如 5 秒)。离它越近越好。最小和最大长度会有硬性限制。
注意,这是在 JavaScript 中,所以我不能使用支持向量机或类似的东西。 :-) 对于性能方面的考虑,可能会在 2 分钟长度的窗口(250 字左右)上每分钟计算一次。
对感兴趣的人的第二个好处:这是选择自动语音识别生成的单词范围用于手动转录(主动学习)。
你会如何处理这个问题?
【问题讨论】:
-
首先,您需要确定一种可比较的方法来衡量不同因素的“更好”程度,以便您可以计算出因素组合的值。您需要为每个因素提供一个公式,为该因素提供与最佳目标相关的值。
标签: javascript algorithm constraint-programming