1.几个词拼起来是不是一个单位:
Constituency parising则是把所有的 几个词拼起来是一个单位的 组成的单位 都抽出来。
特别的每一个词都是一个单位(constituent)
单位可以组合起来成为更大的单位:
2.chart-based:
模型判断:
是单位吗?
是哪一类的词性。
3.我们这里合并两个单位时,只把其当做一个二叉树来合并。
因此和分词一样,到底哪两个进行合并才是最有可能的。
需要一定程度上的穷举。
穷举的样例输入classifier得到一个分数。
优化:CKY算法。
4.
5.上述模型:那一时刻,遇到什么,应该采取怎样的措施,是一个问题。
使用RNN Grammer来解决。
整个模型相当于是一个简单的分类任务。
6.Tree to sequence(把一个树状的结构表示成一个seq)
比如从上到下,从左往右。
然后进行seq2seq的训练。
而且我们可以发现:seq2seq和RNN grammar得到的序列结果是一样的!