大模型时代语音AI模型的训练、优化与应用

免费报名中

8070 人关注

时间 2023-12-19 19:30 ~ 12-21 21:00

地址线上活动

活动由 NVIDIA 和 DataFun 主办

大会倒计时：

天

时

分

秒

免费报名中

8070 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动介绍

AI大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就，语音AI（Speech AI）技术已经广泛应用在数字人、实时翻译、语音搜索、客户服务应答等多个业务场景， NVIDIA 也在不断通过业界领先的技术帮助企业能够快速部署定制化AI智能语音端到端流程。本次在线研讨会由 DataFun 社区联合 NVIDIA 主办，来自 NVIDIA 的技术专家，将着重为您介绍如何有针对性地在语音模型的训练、推理、部署等方面进行加速和优化，内容涵盖以下话题：

💥 如何在 NEMO 框架下快速进行包含 ASR、NLP 和 TTS 全流程语音训任务练

💥 如何利用 NVIDIA Riva 这一强大的基于深度学习的 SDK 快速部署企业级中文语音AI服务并进行优化加速

💥 如何利用 TensorRT-LLM 和 TensorRT + Triton 对 ASR 大模型和流式 TTS 进行加速优化

同时，来自小米新一代 Kaldi 项目团队的技术专家，也会分享“新一代 Kaldi 中基于 GPU 的语音识别实践”的经验分享。

另外，本次直播我们一共准备了10个 NVIDIA 定制积木，12月19日、12月21日晚上，在直播间互动抽奖即可免费领取。

NVIDIA定制积木.jpg

报名参会立即赠送 DataFun 独家专题电子书《模型推理与部署》（报名后进活动群-->从群公告处领取）。

image (1).png

活动日程

2023-12-19

2023-12-21

2023-12-19

19:30-20:10

在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练

🍀演讲提纲：

NVIDIA NeMo 是一个针对 ASR, NLP, TTS的训练工具框架。它内部集成业界最新的模型结构，高效的 LLM 模型并行训练方法，方便开发者快速开发对话式AI 应用。通过本次演讲，您将收获以下内容：

1、了解 NeMo 中新增加的模型结构

2、了解 NeMo Megatron 对 LLM 的训练优化

3、了解 NeMo 中的 TTS 模型支持

嘉宾

齐家兴

NVIDIA 解决方案架构师

2023-12-19

20:10-21:00

利用 NVIDIA Riva 快速部署企业级中文语音AI 服务并进行优化加速

🍀演讲提纲：

NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容：

1、了解 Riva 中文语音识别新增功能

2、了解 Riva 构建中文语音合成流程

3、学习如何使用 Riva quick start 快速搭建语音服务

嘉宾

丁文

NVIDIA 解决方案架构师

2023-12-21

19:30-20:10

利用 NVIDIA 最新推出的 TensorRT-LLM，以及 Triton 推理服务器优化、部署和高效运行语音模型

🍀演讲提纲：

1、GPU 优化智能语音任务进展概览

2、基于 TensorRT-LLM 加速 ASR 大模型

3、基于 TensorRT + Triton 的流式 TTS 优化方案

嘉宾

刘川

NVIDIA 解决方案架构经理

2023-12-21

20:10-21:00

新一代 Kaldi 团队的最新进展

🍀演讲提纲：

1、新一代 Kaldi 项目介绍

2、新一代 Kaldi 项目最新进展

3、新一代 Kaldi 中基于 GPU 的语音识别实践

嘉宾

杨笑宇

小米新一代 Kaldi 项目核心开发成员

在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练

齐家兴

NVIDIA 解决方案架构师

德国亚琛工业大学博士，目前于英伟达企业解决方案部门担任高级架构师，多年来从事自然语言处理和语音识别等方向研究，助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是英伟达 NeMo，Riva 语音识别训练推理平台的中文模型开发者之一。

利用 NVIDIA Riva 快速部署企业级中文语音AI 服务并进行优化加速

丁文

NVIDIA 解决方案架构师

毕业于上海交通大学，导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门，主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA，负责 Riva 中文 ASR 模型迭代，中文 ASR 模型 GPU 部署方案落地与优化等。

利用 NVIDIA 最新推出的 TensorRT-LLM，以及 Triton 推理服务器优化、部署和高效运行语音模型

刘川

NVIDIA 解决方案架构经理

毕业于南京大学，目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人，对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。

新一代 Kaldi 团队的最新进展

杨笑宇

小米新一代 Kaldi 项目核心开发成员

硕士毕业于剑桥大学，导师为Phil Woodland教授，主要研究方向为语音识别。

活动主办方

本活动由百格活动提供技术支持