【发布时间】:2012-06-04 10:10:24
【问题描述】:
我正在用 ruby 脚本解析一个大型 CSV 文件,需要从一些搜索键中找到最接近的标题匹配项。搜索键可能是一个或多个值,并且这些值可能不完全匹配,如下所示(应该接近)
search_keys = ["big", "bear"]
包含我需要搜索的数据的大型数组,只想在title 列上搜索:
array = [
["id", "title", "code", "description"],
["1", "once upon a time", "3241", "a classic story"],
["2", "a big bad wolf", "4235", "a little scary"],
["3", "three big bears", "2626", "a heart warmer"]
]
在这种情况下,我希望它返回行 ["3", "three big bears", "2626", "a heart warmer"],因为这是与我的搜索键最接近的匹配项。
我希望它从给定的搜索键中返回最接近的匹配项。
我可以使用任何助手/库/宝石吗?以前有人这样做过吗??
【问题讨论】:
-
您确定匹配的指标是什么?
-
我在想标题字符串
.including?关键字,递归所有关键字,然后得到最高命中行或类似的东西