【发布时间】:2018-01-27 14:48:25
【问题描述】:
如果我有一个包含数十万个标签/关键字的 MySQL 表,以及用户提供的任意大小的文本,那么从这段文本中提取所有关键字的最有效方法是什么(关键字可以是一个或多个单词)存在于数据库表中?
我正在寻找一种有效的算法/策略。
例如,请考虑以下随机段落:“8 月 21 日是美国大日食,这是自 1979 年以来第一次触及美国大陆的日全食,也是自 Reddit 创建以来的第一次。我们需要您的帮助来收集关于为了科学,动物对日食有何反应!???? 了解如何在 cmets 中提供帮助。”
考虑到“八月”、“美国大日食”、“日食”、“美国”、“科学!”都是数据库表中现有的标签,我需要一种方法来有效地从数据库中返回所有标签。
任何建议都会有所帮助。
【问题讨论】:
标签: mysql database algorithm optimization