Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation

（pages 317–327，July, 2018. Association for Computational Linguistics）

1. Baseline BiLSTM

Baseline BiLSTM由两个LSTM组成，一个从左到右，一个从右到左。

对于从左到右的：输入一串词，初始状态 Sentence-State LSTM for Text Representation(论文笔记） , 经过下面的步骤反复操作，每次消耗一个词，得到.

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记） : 词 ;

Sentence-State LSTM for Text Representation(论文笔记） : 输入门，输出门，遗忘门，真实的输入；

Sentence-State LSTM for Text Representation(论文笔记） : 模型参数；

Sentence-State LSTM for Text Representation(论文笔记） : sigmoid 函数

对于从右到左的：和从左到右的类似，只不过初始是 Sentence-State LSTM for Text Representation(论文笔记） ,输入是 ,输出是

最后BiLSTM用 Sentence-State LSTM for Text Representation(论文笔记）来表示词的隐藏向量，同时用来表示这个句子的最终状态。

2. Sentence-State LSTM

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM 简称S-LSTM:

在一个时步 t 里，可以表示成 Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记） : 词的子状态，：句子的子状态。

初始状态 Sentence-State LSTM for Text Representation(论文笔记） , 设置,其中是一个参数。

如上图每次计算，经如下步骤，由 Sentence-State LSTM for Text Representation(论文笔记）得到，

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记） : 一个文本窗的隐藏矩阵

Sentence-State LSTM for Text Representation(论文笔记）：门

Sentence-State LSTM for Text Representation(论文笔记） : 模型参数；

Sentence-State LSTM for Text Representation(论文笔记） : sigmoid 函数

Sentence-State LSTM for Text Representation(论文笔记）经下面步骤由计算得到：

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记）：控制门

Sentence-State LSTM for Text Representation(论文笔记） : 输出门

Sentence-State LSTM for Text Representation(论文笔记） : 模型参数；

和BiLSTM的对比：

BiLSTM 中用了一个状态表示从开始到当前词

S-LSTM中用了一个结构性的状态表示整个句子，因为g 所以 Sentence-State LSTM for Text Representation(论文笔记）包含更多的信息

文本窗的大小：

文本窗的大小可以控制和相邻词的信息交换度。当文本窗的大小为2时 Sentence-State LSTM for Text Representation(论文笔记）

更多的句子级节点：

可以考虑加不止一个g

3. Task settings

1 分类： Sentence-State LSTM for Text Representation(论文笔记） y 是标注类别的概率分布

2 句子标注：每一个 Sentence-State LSTM for Text Representation(论文笔记）可以表示相应词的特征

可加 attention: Sentence-State LSTM for Text Representation(论文笔记）

可加 CRF: Sentence-State LSTM for Text Representation(论文笔记）

Experiments

加了<s> </s>的句子更好一些

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记）

Sentence-State LSTM for Text Representation(论文笔记）

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode