论文笔记：Pervasive Attention: 2D Convolutional Neural Networks for Sequence-to-Sequence Prediction

Pervasive Attention: 2D Convolutional Neural Networks for Sequence-to-Sequence Prediction

深度学习中的attention机制：
https://blog.csdn.net/guohao_zhang/article/details/79540014

机器翻译 RNN encoder-decoder
https://cloud.tencent.com/developer/news/158749

DenseNet
https://blog.csdn.net/u014380165/article/details/75142664

使用DenseNET

输入为：
3D stf f大小是目标单词向量和原单词向量的结合
中间网络
输出
由于三维feature，因此要二维折叠，也就是将s折叠起来，这样可以达到目标向量t，折叠方法用pool。
折叠之后使用matrix E ∈ R|V|×fL 预测 output vocabulary V，得到

pi是词典v中的第i个。

相关文章：

2021-04-25
2021-04-01
2021-04-02
2022-01-01
2021-08-24
2021-12-09
2022-01-21
2021-04-21

猜你喜欢

2019-11-17
2020-03-13
2021-10-24
2021-10-15
2021-10-05
2021-12-31
2021-07-27

相关资源

下载 2022-12-23
下载 2023-01-31
下载 2023-01-27

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode