斯坦福cs224课程笔记

CS224N: Natural Language Processing with Deep Learning

课程主页：CS224n: Natural Language Processing with Deep Learning

http://web.stanford.edu/class/cs224n/syllabus.html

Lecture 6: Dependency Parsing

Lecture 7: Tensorflow Tutorial

Lecture 8: RNN

vanishing gradient：initialization + Relu

exploding gradient：clipping trick

beam search

bidirectional RNN：双向rnn

Lecture 9: Fancy Recurrent Neural Networks for Machine Translation

MT：machine translation

机器翻译原始模型：

斯坦福cs224课程笔记

斯坦福cs224课程笔记

改进：

Encoder和Decoder使用不同的W，不再共享
解码过程，最后一个时刻的c，要传送给decoder的每个时刻的ht和yt;

同时，当前时刻的输出yt也要传给下一时刻的ht+1和yt+1

因此，encoder的ht取决于c、ht-1、yt-1

斯坦福cs224课程笔记

斯坦福cs224课程笔记

斯坦福cs224课程笔记

deep RNN with multiple layers
bidirectional encoder
把输入序列反转

Lecture 10: Midterm recap

SGD：

斯坦福cs224课程笔记

Lecture 11: machine translation and models with attention

相比于传统机器翻译，NMT的优点：

斯坦福cs224课程笔记

Attention

斯坦福cs224课程笔记

斯坦福cs224课程笔记

斯坦福cs224课程笔记

斯坦福cs224课程笔记

Global VS Local：

斯坦福cs224课程笔记

Beam Search

https://zhuanlan.zhihu.com/p/28048246

- 只用在test阶段，train和valid不用；

- 用在seq2seq生成模型中 decode阶段，要使生成序列的概率最大，取每个时刻上概率最大不可行；

- 贪心的思想；在每个时刻，对每个已有序列，对词典中所有的词计算概率，取概率最大的前k个序列；

- 结果不一定是全局最优；

斯坦福cs224课程笔记

斯坦福cs224课程笔记

greedy search：贪婪地选取当前最可能的那个单词

斯坦福cs224课程笔记

解决Large-vocab问题

（下一讲最后）

vocab太大，每次预测概率时求softmax太耗时

解决办法：

斯坦福cs224课程笔记

1.segment data：

斯坦福cs224课程笔记

2.Select candidate words

斯坦福cs224课程笔记

斯坦福cs224课程笔记

Lecture 12: Further topics in Neural Machine Translation and Recurrent Models

斯坦福cs224课程笔记

LSTM

斯坦福cs224课程笔记

Lecture 13: End-to-end models for Speech Processing

Lecture 14：Convolutional Neural Networks (for NLP)

斯坦福cs224课程笔记

Lecture 15：Tree Recursive Neural Networks and Constituency Parsing

treeRNN

Lecture 16：Coreference Resolution

指代消解

Lecture 17：Dynamic Neural Networks for Question Answering

斯坦福cs224课程笔记

Lecture 18：Issues in NLP and Possible Architectures for NLP

Lecture 19：Tackling the Limits of Deep Learning for NLP

相关文章：

2021-08-03
2022-01-08
2021-04-29
2022-01-03
2021-12-12
2021-12-16
2021-04-05
2022-12-23

猜你喜欢

2021-12-25
2021-07-27
2021-07-03
2021-06-17
2021-04-03
2021-06-18
2021-07-26

相关资源

下载 2023-04-03
下载 2022-12-21
下载 2021-06-06
下载 2023-01-31

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode