【发布时间】:2017-03-01 18:16:04
【问题描述】:
我正在寻找有关如何执行我的想法的一些指导。 我会有一份包含配料名称、设备清单和烹饪方法的食谱。我要做的是把烹饪方法简化为动作动词、食材名称和设备名称。
- 例如:
- 材料:鸡蛋、胡椒粉、盐
- 设备:水壶
- 方法: 1. 将鸡蛋打入壶中。
- 加入胡椒和盐
输出将存储在列表中。 输出: 1. 裂纹,鸡蛋,水壶 2. 加入胡椒粉,水罐 3. 加盐,水罐
【问题讨论】:
标签: nlp
我正在寻找有关如何执行我的想法的一些指导。 我会有一份包含配料名称、设备清单和烹饪方法的食谱。我要做的是把烹饪方法简化为动作动词、食材名称和设备名称。
输出将存储在列表中。 输出: 1. 裂纹,鸡蛋,水壶 2. 加入胡椒粉,水罐 3. 加盐,水罐
【问题讨论】:
标签: nlp
使用 NLP,您可以用词性标记整个文本。标记整个文本后,您知道ingredients 和equipments 始终是名词,而“动作动词”是动词。现在你可以把你的问题分成三个部分
在1中你可以取所有名词,并使用word frequency来创建一个“设备和成分词包”。这种技术背后的基本原理是,这些词更有可能被频繁使用,因为它们是问题域的一部分。然后,您可以使用数据挖掘来区分彼此,例如亲和力分析。
在2中,您可以解析一堆食谱,提取所有动词并获取最常用的动词。创建一个“动词袋”并使用词干将它们置于不定式或基本形式中。例如“cutting”和“cutted”应该和“cut”一样。有了这个种子(你的动词包),你可以在你的食谱中使用正则表达式来扫描这些动词。
在3中你需要找到一个句型。也许你会发现不止一个
这是一个很好的起点,应该会给您一些想法。结合 NLP 和数据挖掘/机器学习,更深入地了解您的数据
【讨论】: