0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力提供多样、灵活的模型选择

NVIDIA英伟达 来源:NVIDIA英伟达 2024-09-09 09:19 次阅读

案例简介

在本案例中,Dify 以模型中立以及开源生态的优势,为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器产品,为 Dify.AI 提供了灵活多样的模型集成选择,专业、高效的模型接入方式让开发者用户能够构建丰富的 AI 应用场景。

AI 应用面临落地挑战

随着 AI 应用场景的不断丰富,Dify 在 AI 应用的落地方面面临了几个关键挑战,这些挑战成为了采用 NVIDIA 产品和技术的主要驱动力:

复杂应用场景需要多个模型结合使用:随着越来越丰富的 AI 应用情景探索,越来越多的企业都期望能灵活使用当前最先进的闭源或开源模型,来定制落地方案,以获得模型在不同情境下的能力表现、成本、性能等方面的最佳组合结果。

大模型的性能和稳定性风险:⼤模型的训练和推理对算力、算法、数据都有很高要求,如果选型不当或优化不足,可能影响应⽤的性能和稳定性。

数据安全和隐私保护风险:企业在落地 AI 应用时,出于对敏感场景应用和企业数据安全的考虑,会更倾向本地部署推理框架来运行他们的本地模型。

NVIDIA 助力提供多样、灵活的模型选择

Dify 平台与数百种专有/开源模型以及数十种推理提供商、自托管解决方案无缝集成,包括 LLM 推理框架、Rerank 模型、Embedding 模型等类型,允许用户根据其具体场景需要,随时切换/使用不同的模型能力。其中,Dify 集成了 API Catalog、NVIDIA NIM 和 Triton 推理服务器开源软件产品作为可选模型平台之一,具体作用如下所述:

提供丰富的预训练模型,满足多样化需求

API Catalog 提供了大量针对NVIDIA GPU优化的预训练模型,涵盖了 LLM、Embedding、Rerank 和 Vision 多个种类。它主要用于评估和测试,提供一个统一的接口,可以测试各种模型,节省开发成本。API Catalog 会持续更新最新的模型,帮助 Dify 用户加速前期的测试和评估,并为之后的量产部署做好铺垫,加速 AI 应用的开发和落地。

简化部署流程,加速生成式 AI 模型上线

NVIDIA NIM 将 AI 模型打包为容器化微服务,开发者只需几行代码即可完成部署,部署时间可从数周缩短到数分钟。这种简化的部署流程可以显著加速生成式 AI 模型的上线,使企业能够快速将模型集成到 Dify 的 AI 工作流中,实现 AI 应用落地。

优化推理性能,提供高效稳定的 AI 服务

Triton 推理服务器提供了一个优化和标准化的平台,用于部署和执行来自多种深度学习机器学习框架的 AI 模型。它适用于通用的 AI 推理工作负载,为开发者在 Dify 平台上编排 AI 应用提供高效稳定的模型服务。

灵活调用模型,适应不同场景需求

通过 Triton 推理服务器和 NVIDIA NIM 完成模型部署后,用户可以在 Dify 平台中轻松调用所需的模型。只需在模型设置中填写 Server URL、Model Name 等凭据,即可根据具体的场景需求,随时切换或使用不同的模型能力。这种灵活的模型调用方式可以帮助企业快速适应不断变化的业务需求,提高 AI 应用的适应性和可扩展性。

加入 NVIDIA Inception,

融入全球开发者社区生态

Dify 不仅与 NVIDIA 在模型层面实现了深度集成,其还于 2024 年 4 月入选了NVIDIA Inception 初创加速计划。Dify 也受邀参加了 NVIDIA 初创加速计划最新开启的系列技术加速营,获得了与众多 AI 创新者、行业客户、生态上下游企业交流合作和极大的市场曝光机会。

加入 NVIDIA 初创加速计划对 Dify 来说,标志着一个新的里程碑,Dify 将借助 NVIDIA 的影响力链接全球开发者,在其领先技术的助力下,不断突破,打造更繁荣的生态和产品。

Dify 创始人兼 CEO 张路宇表示:“Dify 成立的第一天,就定位是一个面向全球开发者用户的产品,我们希望接入全球领先的大模型,共创 AI 解决方案,为不同行业落地 AI 的企业、AI 创新者们提供开箱即用的 LLM 应用开发平台,这也是我们首选 NVIDIA 的原因。在全球的客户生态、开发者生态经营上,NVIDIA 毋庸置疑是我们最好的选择。”

繁荣的开源社区生态,

加速 AI 创新应用落地

Dify 团队成立于 2023 年 3 月,同年 5 月发布 Dify.AI 第一个版本并开源。基于 LLMOps 及后端即服务的理念,为企业提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,致力于打造⼀个开放的 LLM 应⽤开发平台,降低 LLM 应⽤程序的开发和部署复杂性,帮助应⽤开发者更快地搭建和运营⽣产级的⽣成式 AI 应⽤。

Dify 在开源社区受到全球开发者的关注和喜爱,在短短一年的时间内,stars 数已超过 36,000+,达到数十万次下载量,多次登榜 GitHub 全球趋势榜单。GitHub stars 已超越知名 AI Infra 产品如 LlamaIndex、flowise 等,仅次于 LangChain。面向需要探索 AI 应用创新、AI 应用落地业务的开发者或企业客户,Dify 提供成熟的应用开发工具平台,加速 AI 落地业务的过程。

截至 2024 年 4 月,Dify.AI 已经服务了十余家 500 强企业和数十家上市公司。全球领先企业选择 Dify 作为 LLM App Stack,标杆客户覆盖汽车、先进制造、消费、半导体、医药等行业,如理想汽车、研华股份、百胜中国、PanasonicAdvantech、安克创新、得到等。Dify.AI 同时也吸引了全球范围内关注 LLM 应用技术的创业者和服务商,他们可以基于 NVIDIA 的资源和生态,利用 Dify 作为开发工具,创造出更多创新性 AI 产品和服务,带来更多生态合作的空间。

NVIDIA 初创加速计划

Dify.AI是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。 NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构、创业孵化器、创业加速器、行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣、技术支持、市场宣传、融资对接、业务推荐等一系列服务,加速创业公司的发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103035
  • AI
    AI
    +关注

    关注

    87

    文章

    30851

    浏览量

    269028
  • 大模型
    +关注

    关注

    2

    文章

    2442

    浏览量

    2692

原文标题:初创加速计划 | NVIDIA 赋能 Dify.AI,加速企业 AI 应用落地

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 开发了一个全新的生成式 AI 模型。利用输入的文本和音频,该模型可以创作出包含任意的音乐、人声和声音组合的作品。
    的头像 发表于 11-27 11:29 351次阅读

    NVIDIA Isaac Sim满足模型多样化训练需求

    光轮智能借助 NVIDIA Isaac Sim,通过 3D 生成与建模技术构建高度逼真的虚拟场景,将现实世界的复杂场景抽象并转化为高质量的训练数据源,从而更有效地满足模型多样化训练需求。 AI
    的头像 发表于 11-23 14:55 542次阅读

    NVIDIA AI助力初创企业为心理治疗师提供AI工具

    NVIDIA AI 助力初创企业为心理治疗师提供 AI 工具,以此来优化和提升心理健康服务水平,为人们的心理健康保驾护航。
    的头像 发表于 11-19 16:03 215次阅读

    NVIDIA助力Amdocs打造生成式AI智能体

    正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型(LLM)和领域适配模型的解决方案。该公司还在使用
    的头像 发表于 11-19 14:48 340次阅读

    NVIDIA NIM助力企业高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等厂商的开源 Kubernetes 平台集成了 NVIDIA NIM,将允许用户通过 API 调用来大规模地部署大语言模型
    的头像 发表于 10-10 09:49 395次阅读

    NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

    Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式 AI
    的头像 发表于 09-06 14:59 313次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B<b class='flag-5'>模型</b>帮助开发者生成合成训练数据

    NVIDIA Modulus助力风阻预测模型实现

    NVIDIA 与百度飞桨双方技术团队通过在数据、算法、模型等多个方面的合作,共同打造了一款适用于车辆空气动力学数值模拟的 3D 高精度汽车风阻预测模型——DNNFluid-Car。经过训练
    的头像 发表于 08-23 17:10 890次阅读

    NVIDIA提供一套服务、模型以及计算平台 加速人形机器人发展

    的发展,NVIDIA 于今日宣布,为全球领先的机器人制造商、AI 模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。 整套产品包括用于机器人仿真
    的头像 发表于 07-31 10:41 660次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务,以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的 NVIDIA
    发表于 07-24 09:39 709次阅读
    <b class='flag-5'>NVIDIA</b> AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI <b class='flag-5'>模型</b>

    NVIDIA Omniverse 将为全新 OpenPBR 材质模型提供原生支持

    、组合、模拟和协作的可扩展框架和生态系统,OpenUSD 使开发者能够构建可互操作的 3D 工作流,开启了工业数字化的新时代。 此外,NVIDIA Omniverse 还将为全新 OpenPBR 材质模型
    的头像 发表于 06-14 11:23 632次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse 将为全新 OpenPBR 材质<b class='flag-5'>模型</b><b class='flag-5'>提供</b>原生支持

    NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

    Enterprise-IGX软件现已在NVIDIA IGX平台上正式可用,以满足工业边缘对实时 AI 计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业级软件和支持来加快开发
    的头像 发表于 06-04 10:21 505次阅读

    英伟达推出AI模型推理服务NVIDIA NIM

    英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程,为全球的2800万英伟达开发者提供前所未有的便利。
    的头像 发表于 06-04 09:15 679次阅读

    NVIDIA与Google DeepMind合作推动大语言模型创新

    支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。
    的头像 发表于 05-16 09:44 450次阅读

    【大语言模型:原理与工程实践】大语言模型的应用

    输出的关键词或短语。对于任何输入,大语言模型都会根据提示词提供相应的输出。例如,“天空是”就是一个提示词,引导模型输出关于天空的描述。提示词的完善度和信息量直接影响模型输出的质量和是否
    发表于 05-07 17:21

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVID
    的头像 发表于 04-28 10:36 563次阅读