【发布时间】:2016-05-05 03:41:23
【问题描述】:
给定一个文档,我想执行以下操作:
- 使用预先存在的主题创建摘要
在第一个场景中,文档以统一的方式整齐地组织。 例如,大多数维基百科电影文章都有以下子主题(例如:https://en.wikipedia.org/wiki/Between_Us_(2012_film))
- 情节
- 演员表
- 接待处
- 其他可选主题
在第二种情况下,文档包含与上述相同的信息;但是,文档没有干净的组织。文档可能使用相同或相似的语言,但组织方式不同。
在这两种情况下,鉴于子主题,我想从文档中提取此信息。
有没有我可以使用的机器学习/自然语言处理策略/算法?算法的组合很好。大部分工作的算法也很好。
更新:看起来我想要的是信息提取。
【问题讨论】:
标签: algorithm machine-learning nlp artificial-intelligence information-extraction