0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用Riva和NeMo Megatron构建语音AI

星星科技指导员 来源:NVIDIA 作者:About Siddharth Sharm 2022-03-31 15:49 次阅读

上周, NVIDIA GTC 2022 宣布了对 Riva 的重大更新。 Riva 是一个用于构建语音 AI 应用程序的 SDK ,以及一个付费的 Riva 企业产品。 NeMo Megatron 是一个用于训练大型语言模型的框架,它的几项关键更新也已宣布。

Riva 2.0 通用性

Riva 为跨多种语言的实时自动语音识别( ASR )和文本到语音( TTS )技能提供了世界级的准确性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行业领导者。 ai 在客户服务中心应用程序、转录和虚拟助理中使用 Riva 。

最新的 Riva 版本包括:

ASR 有多种语言:英语、西班牙语、德语、俄语和普通话。

高质量的 TTS 语音可定制独特的语音字体。

使用 TAO Toolkit 或 NVIDIA NeMo 进行特定于领域的定制,在口音、领域和国家特定术语方面具有无与伦比的准确性。

支持在云端、 prem 和嵌入式平台上运行。

Riva-Controllable-TTS-Demo-GTC-Spring.gif

Riva-Controllable-TTS-Demo-GTC-Spring.gif

图 1:NVIDIA Riva 可控文本到语音使得使用 SSML 标签可以轻松调整音调和速度。

手机上尝试 Riva 自动语音识别 Riva 产品页面 。

Defined.ai 与 NVIDIA 合作,为希望购买跨语言、域和录音类型的语音培训和验证数据的企业提供一个顺畅的工作流程。可在 此处 中找到针对 NVIDIA 开发人员的 DefinedCrowd 数据集示例。

下载 RIVA ,它是免费的NVIDIA 开发人员的成员从 NGC 免费。

Riva 企业

NVIDIA 还推出了 Riva Enterprise ,这是一款付费产品,面向在NVIDIA 专家的业务标准支持下大规模部署 Riva 的企业。

好处包括:

在任何云和 prem 平台上不受限制地使用 ASR 和 TTS 服务。

在当地营业时间与NVIDIA 人工智能专家联系,获取有关配置和性能的指导。

为维护控制和升级计划提供长期支持。

优先访问新版本和功能。

Riva Enterprise 在 NVIDIA Launchpad 上提供免费试用版,供企业评估并制作应用程序原型。

Riva launchpad 上的 Enterprise 包括引导实验室,用于:

与实时语音 AI API 交互。

将语音 AI 功能添加到对话 AI 应用程序中。

在自定义数据上微调语音 AI 管道以获得更高的准确性。

申请 用于您的 Riva 企业试用。

通过 对话人工智能解谜 GTC 课程了解有关如何构建、优化和部署语音 AI 应用程序的更多信息

NeMo Megatron

NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,这是一个培训大型语言模型( LLM )的框架,其参数高达数万亿。基于 Megatron paper 的创新, NeMo Megatron 的研究机构和企业可以培训任何 LLM ,以实现融合。 NeMo Megatron 提供数据预处理、并行(数据、张量和管道)、编排和调度,以及自动精度自适应。

它包括经过彻底测试的配方、流行的 LLM 架构实现,以及组织快速开始 LLM 之旅所需的工具。

瑞典,法学博士。 com 、 Naver 和佛罗里达大学是 Nvidia 技术的早期采用者,用于建立大型语言模型。

最新版本包括:

Hyperparameter tuning tool 会根据客户需求和基础设施限制自动创建配方。

T5 和 mT5 车型的参考配方。

支持在云上培训 LLM ,从 Azure 开始。

分布式数据预处理脚本,缩短端到端培训时间。

关于作者

About Siddharth Sharma:

Siddharth Sharma 是NVIDIA 加速计算的高级技术营销经理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的产品营销经理,与汽车和航空航天公司密切合作,采用基于模型的设计来创建控制软件。

About Gordana Neskovic:

Gordana Neskovic 是AI/DL产品营销团队的成员,负责 NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor担任过各种产品营销、数据科学家、AI架构师和工程职位。她拥有博士学位。圣塔 Clara 大学,塞尔维亚贝尔格莱德大学电气工程硕士和学士学位。

About Sirisha Rella:

Sirisha Rella 是 NVIDIA 的技术产品营销经理,专注于计算机视觉、语音和基于语言的深度学习应用。 Sirisha 获得了密苏里大学堪萨斯城分校的计算机科学硕士学位,是国家科学基金会大学习中心的研究生助理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4990

    浏览量

    103107
  • AI
    AI
    +关注

    关注

    87

    文章

    30947

    浏览量

    269197
收藏 人收藏

    评论

    相关推荐

    AI潮流下的办公“神器”选择,沸蛇AI语音鼠标真正实现效率翻倍

    年终临近,各种考核、汇报、总结也随之而来,忙上天的白领们不得闲暇。事实上,许多流程化、模板化的工作并非困难模式,只是处理起来比较费时,这个时候AI就可以帮上忙。沸蛇AI语音鼠标就是一款能够帮助办公
    的头像 发表于 12-04 11:38 245次阅读
    <b class='flag-5'>AI</b>潮流下的办公“神器”选择,沸蛇<b class='flag-5'>AI</b><b class='flag-5'>语音</b>鼠标真正实现效率翻倍

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 312次阅读

    AI项目管理平台怎么

    AI项目管理平台是一种集成了项目管理工具、AI开发环境和数据分析能力的综合性平台。接下来,AI部落小编为您梳理AI项目管理平台怎么
    的头像 发表于 11-13 09:38 217次阅读

    AI云平台怎么构建

    构建AI云平台是一个复杂而系统的过程,涉及多个环节和技术栈。从准备工作到最终的部署运行,每一步都需要精心设计和实现。
    的头像 发表于 10-11 10:52 194次阅读

    NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 AI

    NVIDIA AI Enterprise 平台中的 NIM 微服务与 NeMo 框架构建和运行他们的 AI 应用,创建数据驱动型 AI
    发表于 08-28 10:10 220次阅读
    NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 <b class='flag-5'>AI</b>

    基于瑞萨电子Reality AI Tools工具的语音反欺骗应用示例

    探索使用瑞萨电子硬件和AI软件平台的Reality AI Tools语音反欺骗应用示例。
    的头像 发表于 08-20 15:13 480次阅读
    基于瑞萨电子Reality <b class='flag-5'>AI</b> Tools工具的<b class='flag-5'>语音</b>反欺骗应用示例

    Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同发布了一款全新的领先语言模型Mistral NeMo 12B。开发者可以轻松定制和部署该模型,令其适用于支持聊天机器人、多语言任务、编码和摘要的企业应用。
    的头像 发表于 07-27 11:04 671次阅读

    应用NVIDIA Spectrum-X网络构建新型主权AI

    法国云服务提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPU和 Spectrum-X 以太网网络平台 构建区域性 GPU 集群,为用户提供 AI 按需服务业
    的头像 发表于 07-26 18:58 1184次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对,来构建“超级模型” NVIDIA AI
    发表于 07-24 09:39 715次阅读
    NVIDIA <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 Llama 3.1 生成式 <b class='flag-5'>AI</b> 模型

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 编辑 视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能
    发表于 06-18 17:33

    英特尔助力京东云CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东云CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 546次阅读
    英特尔助力京东云<b class='flag-5'>用</b>CPU加速<b class='flag-5'>AI</b>推理,以大模型<b class='flag-5'>构建</b>数智化供应链

    USB AI话务语音降噪音频方案

    USB AI话务语音降噪音频方案
    的头像 发表于 04-25 18:16 616次阅读
    USB <b class='flag-5'>AI</b>话务<b class='flag-5'>语音</b>降噪音频方案

    基于NVIDIA Megatron Core的MOE LLM实现和训练优化

    本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型(LLM)实现与训练优化上的创新工作。
    的头像 发表于 03-22 09:50 787次阅读
    基于NVIDIA <b class='flag-5'>Megatron</b> Core的MOE LLM实现和训练优化

    AI语音与机器视觉开发应用系统

    一、简介 AI语音与机器视觉开发应用系统是一款集成AI语音、机器视觉、深度学习基础、嵌入式Linux于一体的高端教学科研实验平台。 整个教学平台由实验箱高性能嵌入式主板够成,高性能嵌入
    的头像 发表于 01-26 11:24 414次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>语音</b>与机器视觉开发应用系统

    AI如何助力我们构建更智能的空间?利用AI构建智能空间的5种方式

    当下业界都聚焦于生成式 AI 如何推动未来变革,但我们也不妨回顾一下过去的一年,AI 如何助力我们构建更智能的空间。
    的头像 发表于 01-24 18:19 1084次阅读