【发布时间】:2008-09-26 14:18:50
【问题描述】:
将多组数字与目标组进行比较以确定哪些数字最“相似”的算法是什么?
此算法的一个用途是将今天的每小时天气预报与历史天气记录进行比较,以找出天气相似的一天。
两个集合的相似度有点主观,所以算法真的只需要区分好匹配和坏匹配。我们有很多历史数据,所以我想通过自动丢弃不接近的集合并尝试将“最佳”匹配项放在顶部来尝试缩小用户需要查看的天数列表。
编辑: 理想情况下,算法的结果将与使用不同数据集的结果相当。例如,使用Niles 建议的均方误差会产生很好的结果,但是比较温度时生成的数字无法与其他数据(例如风速或降水)生成的数字进行比较,因为数据的规模不同.一些非天气数据非常大,所以均方误差算法产生的数字是几十万,而使用温度产生的数字是几十或几百。
【问题讨论】:
-
我实际上有类似的用途,我希望能从中得到一些好的答案。
标签: algorithm statistics