【发布时间】:2016-05-13 00:09:33
【问题描述】:
我有一个包含几十万份法律文件(主要来自欧盟)的语料库——法律、评论、法庭文件等。我正在尝试通过算法来理解它们。
我已经对已知的关系(时间、这个-改变-那个等)进行了建模。但在单文档级别,我希望我有更好的工具来快速理解。我对想法持开放态度,但这里有一个更具体的问题:
例如:是否有 NLP 方法来确定文档的相关/有争议的部分而不是样板文件?最近泄露的 TTIP 论文有数千页的数据表,但那里的一句话可能会毁掉一个行业。
我过去曾尝试过 google 的新 Parsey McParface 和其他 NLP 解决方案,但虽然它们的效果令人印象深刻,但我不确定它们在分离含义方面有多好。
【问题讨论】:
标签: nlp stanford-nlp parsey-mcparseface syntaxnet