AI 大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI(Speech AI)技术已经广泛应用在数字人、实时翻译、语音搜索、客户服务应答等多个业务场景, NVIDIA 也在不断通过业界领先的技术,帮助企业能够快速部署定制化 AI 智能语音端到端流程。
2023 年 12 月 19 日和 21 日晚间,来自 NVIDIA 和 Kaldi 项目的技术专家将做客 Datafun 社区直播间,为您介绍如何有针对性的在语音模型的训练、推理、部署全流程中进行加速和优化,内容精彩纷呈干货满满,不要错过!
2023 年 12 月 19 日 19:30 – 21:10
//
在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练
NVIDIA NeMo 是一个针对 ASR、NLP、TTS 的训练工具框架。它内部集成业界最新的模型结构,高效的 LLM 模型并行训练方法,方便开发者快速开发对话式 AI 应用。通过本次演讲,您将收获以下内容:
了解 NeMo 中新增加的模型结构。
了解 NeMo Megatron 对 LLM 的训练优化。
了解 NeMo 中的 TTS 模型支持。
演讲嘉宾:
齐家兴,NVIDIA 解决方案架构师
德国亚琛工业大学博士,目前于 NVIDIA 企业解决方案部门担任高级架构师,多年来从事自然语言处理和语音识别等方向研究,助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是 NVIDIA NeMo,Riva 语音识别训练推理平台的中文模型开发者之一。
//
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容:
了解 Riva 中文语音识别新增功能。
了解 Riva 构建中文语音合成流程。
如何使用 Riva quick start 快速搭建语音服务。
演讲嘉宾:
丁文,NVIDIA 解决方案架构师
毕业于上海交通大学,导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门,主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA,负责 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地与优化等。
2023 年 12 月 21 日 19:30 – 21:10
//
利用 NVIDIA 最新推出的 TensorRT-LLM,以及 Triton 推理服务器优化、部署和高效运行语音模型
GPU 优化智能语音任务进展概览。
基于 TensorRT-LLM 加速 ASR 大模型。
基于 TensorRT + Triton 的流式 TTS 优化方案。
演讲嘉宾:
刘川,NVIDIA 解决方案架构经理
毕业于南京大学,目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人,对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。
//
新一代 Kaldi 团队的最新进展
新一代 Kaldi 项目介绍、新一代 Kaldi 项目最新进展,以及新一代 Kaldi 中基于 GPU 的语音识别实践。
演讲嘉宾:
杨笑宇
小米公司新一代 Kaldi 项目(Daniel Povey 团队)核心开发成员。硕士毕业于剑桥大学,导师为 Phil Woodland 教授。主要研究方向为语音识别。
参与有奖!
所有注册并参加本次线上研讨会的开发者,均有机会在直播期间赢取 NVIDIA 限量版积木。
点击“阅读原文”或识别上方二维码,访问 Datafun 社区直播间报名参与活动注册,并参加本次线上研讨会。
GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会。
原文标题:在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !