在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

NVIDIA英伟达企业解决方案 2023-12-15 618

AI 大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI（Speech AI）技术已经广泛应用在数字人、实时翻译、语音搜索、客户服务应答等多个业务场景， NVIDIA 也在不断通过业界领先的技术，帮助企业能够快速部署定制化 AI 智能语音端到端流程。

2023 年 12 月 19 日和 21 日晚间，来自 NVIDIA 和 Kaldi 项目的技术专家将做客 Datafun 社区直播间，为您介绍如何有针对性的在语音模型的训练、推理、部署全流程中进行加速和优化，内容精彩纷呈干货满满，不要错过！

2023 年 12 月 19 日 19:30 – 21:10

在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练

NVIDIA NeMo 是一个针对 ASR、NLP、TTS 的训练工具框架。它内部集成业界最新的模型结构，高效的 LLM 模型并行训练方法，方便开发者快速开发对话式 AI 应用。通过本次演讲，您将收获以下内容：

演讲嘉宾：

齐家兴，NVIDIA 解决方案架构师

德国亚琛工业大学博士，目前于 NVIDIA 企业解决方案部门担任高级架构师，多年来从事自然语言处理和语音识别等方向研究，助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是 NVIDIA NeMo，Riva 语音识别训练推理平台的中文模型开发者之一。

利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速

NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容：

演讲嘉宾：

丁文，NVIDIA 解决方案架构师

毕业于上海交通大学，导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门，主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA，负责 Riva 中文 ASR 模型迭代，中文 ASR 模型 GPU 部署方案落地与优化等。

2023 年 12 月 21 日 19:30 – 21:10

利用 NVIDIA 最新推出的 TensorRT-LLM，以及 Triton 推理服务器优化、部署和高效运行语音模型

演讲嘉宾：

刘川，NVIDIA 解决方案架构经理

毕业于南京大学，目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人，对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。

新一代 Kaldi 团队的最新进展

新一代 Kaldi 项目介绍、新一代 Kaldi 项目最新进展，以及新一代 Kaldi 中基于 GPU 的语音识别实践。

演讲嘉宾：

杨笑宇

小米公司新一代 Kaldi 项目（Daniel Povey 团队）核心开发成员。硕士毕业于剑桥大学，导师为 Phil Woodland 教授。主要研究方向为语音识别。

参与有奖！

所有注册并参加本次线上研讨会的开发者，均有机会在直播期间赢取 NVIDIA 限量版积木。

点击“阅读原文”或识别上方二维码，访问 Datafun 社区直播间报名参与活动注册，并参加本次线上研讨会。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行，线上大会也将同期开放。扫描下方海报二维码，立即注册 GTC 大会。

原文标题：在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

打开APP阅读更多精彩内容