报名 | 如何突破Decoder性能瓶颈？英伟达专家揭秘FasterTransformer2.0的原理与应用 –NLP公开课

AI资讯2年前 (2023)发布 AI工具箱

自从 “Attention is All You Need” 在2017年提出以来，Transformer已成为 NLP 领域中非常热门的深度学习网络架构。但是在推理部署阶段，其计算性能往往难以满足在线业务对于低延迟和高吞吐的要求。

在英伟达开源的FasterTransformer 1.0版本中，针对BERT中的 Transformer Encoder进行了优化和加速，经过高度优化之后，降低了用户使用transformer编码的时延。

在解决了Encoder性能问题之后，英伟达将重点放到了同样重要的Transformer Decoder推理上。

因此，英伟达推出了FasterTransformer 2.0版本，提供针对解码器进行高度优化的transformer layer。同时，还提供了优化过后的整个翻译流程，满足想要在翻译场景中大幅降低时延的用户们。

那么，FasterTransformer 2.0背后的优化原理是什么？如何针对decoder和decoding进行优化？

4月9日，英伟达x量子位将举办一场线上公开课，英伟达GPU计算专家、FasterTransformer 2.0 开发者之一的薛博阳老师将为大家详细讲解，欢迎大家报名，与薛老师一起探讨和交流。

课程安排

主题：FasterTransformer 2.0 的原理与应用

时间：2020年4月9日（周四），20:00-21:30

环节：讲解+问答

课程内容：

FasterTransformer 2.0 新增加功能介绍
如何针对decoder和decoding进行优化
如何使用decoder和decoding
Decoder和decoding能够带来什么样的加速效果

嘉宾介绍

薛博阳，NVIDIA GPU 计算专家，拥有多年GPU开发经验和深度学习开发经验。曾参与计算机视觉、游戏人工智能等项目开发。FasterTransformer 2.0 开发者之一，目前主要负责 FasterTransformer 2.0 的进一步的优化。

报名方式

点击链接注册（https://info.nvidia.com/312648-reg.html），直播前将给您注册使用的邮箱发送直播链接，后续将发送直播回放、PPT资料。

也欢迎大家加入直播交流群，添加量子位小助手（qbitbot12），并备注“英伟达”即可。

— 完 —

量子位 QbitAI · 头条号签约作者

关注我们，第一时间获知前沿科技动态

“

# AI资讯

文章版权归作者所有，未经允许请勿转载。

一键“通用”变“专用”，数牍软硬协同隐私计算产品正式发布

AI工具箱

527

中科院用普通电脑追上量子优越性，几小时搞定原本要一万年的计算

AI工具箱

387

谷歌量子计算突破登Nature封面，200秒顶超算10000年，川普之女：美国实现量子霸权

AI工具箱

446

黑客版“最强大脑”来袭！GeekPwn 2021安全极客大赛全球招募

AI工具箱

393

叶杰平入选、华人占4成，2020年ACM杰出科学家榜单出炉

AI工具箱

370

逆转衰老！“70岁”小鼠经过数月治疗，肾脏皮肤血液细胞重返“年轻态”

AI工具箱

396

暂无评论

暂无评论...

报名 | 如何突破Decoder性能瓶颈？英伟达专家揭秘FasterTransformer2.0的原理与应用 –NLP公开课

课程安排

嘉宾介绍

报名方式

问什么都答“为了杀美国人”：用SQuAD训练的模型，简单攻击一下就暴走了

不只有BERT！盘点2018年NLP令人激动的10大想法

相关文章

暂无评论