【发布时间】:2010-01-28 03:12:15
【问题描述】:
我正在编写用户和搜索引擎之间的桥梁,而不是搜索引擎。我的部分附加价值将是推断查询的意图。跟踪号、股票代码或地址的意图相当明显。如果我可以对查询进行分类,那么我可以决定用户是否甚至需要查看搜索结果。当然,如果我不能,那么他们会看到搜索结果。我目前正在设计这个推理引擎。
我正在写一个解析器;它应该接受任何给定的令牌并为其分配一个类别。下面是一些理论上的英文例子:
- “denver”是 USCITY 和 PLACENAME
- “aapl”是纳斯达克符号和股票代码
- “555 555 5555”是美国电话号码
我知道这些情况很可能都需要具体处理,但我不确定从哪里开始。
理想情况下,我会得到一些简单的东西,例如:
queryCategory = magicCategoryFinder( query )
>print queryCategory
>"SOMECATEGORY or a list"
【问题讨论】:
-
你能编辑这个以包含一个实际的问题吗?
-
让我想起了 Wolfram Alpha 锣表演...
-
艺术:你对这其中的哪一部分有问题?
-
已编辑。克里斯 - 我正在努力解决的部分是分类部分。蛮力解决方案(大量查找)似乎不太理想。也许这是唯一的解决方案 - 在大量先前分类的数据中查找每个标记。