0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思分享:智能引擎中所的AI引擎技术分析

454398 来源:Xilinx技术社区 作者:Olivier Tremois 2020-10-11 11:14 次阅读

作者:Olivier Tremois(AI 引擎工具市场营销部门)和 Florent Werbrouck(赛灵思技术支持产品应用工程师

Versal ACAP 简介

Versal 自适应计算加速平台 (ACAP) 是基于 TSMC 7nm FinFET 工艺技术构建的最新一代赛灵思器件。它利用高带宽片上网络 (NoC) 将代表处理器系统 (PS) 的标量引擎、代表可编程逻辑 (PL) 的自适应引擎与智能引擎有机结合在一起。

本文将着重介绍智能引擎中所包含的 AI 引擎。

赛灵思 AI 引擎简介

在部分赛灵思 Versal ACAP 中包含了 AI 引擎。这些 AI 引擎可排列组合为一组与内存、数据流和级联接口相连的二维AI 引擎拼块阵列。在当前 ACAP 器件(例如,VC1902 器件)上,此阵列最多可包含 400 个拼块。此阵列中还包含AI 引擎接口(位于最后一行),以便于阵列中的其它器件(PS、PL 和 NoC)进行交互。

AI 引擎接口包含PL 和 NoC 接口拼块以及配置拼块。从 PL 到 AI 引擎阵列的连接是使用 AXI4-Stream 接口通过 PL 和 NoC 接口拼块来实现的。从 NoC 到 AI 引擎阵列的连接是使用 AXI4 存储器映射接口通过 NoC 接口拼块来实现的。

有趣的是,从中可以看到,只有在 NoC 到 AI 引擎拼块之间才存在 AXI4 存储器映射直接通信通道,在 AI 引擎拼块到 NoC 之间却并不存在。

注:PL 和 NoC 接口拼块的精确数量因器件而异。《Versal 架构和产品数据手册:简介》(DS950) 中罗列了 AI 引擎阵列的大小。
https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-...

AI 引擎拼块架构

现在,我们来详细了解下此阵列,看看 AI 引擎拼块的内部。

每个 AI 引擎拼块都包含:

  • 1 个拼块互连模块,用于处理 AXI4-Stream 和存储器映射 AXI4 输入/输出
  • 1 个存储器模块,其中包含 32 KB 数据内存,细分为 8 个内存 bank、1 个内存接口、DMA 和各种锁定。
  • 1 个 AI 引擎

AI 引擎可访问全部 4 个方向中的多达 4 个内存模块(作为 1 个连续存储器块)。这意味着除了拼块本地的内存,AI 引擎还可以访问 3 个相邻拼块的本地内存(除非拼块位于阵列边缘)。

  • 北侧内存模块
  • 南侧内存模块
  • 东侧或西侧内存模块(取决于 AI 引擎和内存模块所在的行和相对布局)。

AI 引擎架构

AI 引擎属于高度优化的处理器,包含下列主要特色:

  • 32 位标量 RISC 处理器(名为 Scalar Unit)
  • 1 个 512b SIMD 矢量单元(可提供矢量定点/整数单元)和 1 个单精度浮点 (SPFP) 矢量单元
  • 3 个地址生成器单元 (AGU)
  • 超长指令字 (VLIW) 功能
  • 3 个数据内存端口(2 个负载端口,1 个存储端口)
  • 直接流传输接口(2 个输入流,2 个输出流)

AI 引擎阵列编程

AI 引擎拼块按 10 或 100 为单位组成阵列。创建嵌入多项指令的单一程序用于指定并行性将是一项冗长且近乎不可能的任务。因此 AI 引擎阵列模型编程与 Kahn 处理网络 (Kahn Process Networks) 之间的共通之处在于自主计算进程通过通信边缘实现彼此互连,从而生成处理网络。

(请参阅 https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf )

在 AI 引擎框架中,Graph 边缘是缓存和数据流,而计算进程则被称为内核。在Graph中,内核经过例化,彼此相连并连接到设计其余部分(NoC 或 PL)。

编程流程分为 2 个阶段:

单内核编程:

内核用于描述特定计算进程。每个内核都将在单一 AI 引擎拼块上运行。但请注意,多个内核可在同一个 AI 引擎拼块上运行,并共享处理时间。任意 C/C++ 代码均可用于对 AI 引擎进行编程。标量处理器将处理大部分代码。如果您的目标是设计高性能内核,那么应考虑采用矢量处理器,它使用称为内部函数的专用函数。这些函数专用于 AI 引擎的矢量处理器,支持您从 AI 引擎中发掘出巨大的处理性能。赛灵思将提供预构建内核(包含在库内),以供用户在其定制 Graph 中使用。

Graph 编程:

赛灵思将提供 C++ 框架以从内核创建Graph。此框架包含 Graph 节点和连接声明。这些节点可包含在 AI 引擎阵列内或可编程逻辑(HLS 内核)中。为了完全掌握内核位置,将有一系列方法可用来约束布局(内核、缓存、系统内存等)。Graph 将例化并使用缓存和数据流将内核连接在一起。它还将描述 AI 引擎阵列与其它ACAP 器件(PL 或 DDR)之间的双向往来数据传输。

赛灵思将提供预构建 Graph(包含在库内),以供用户在其应用中使用。

在运行时以及仿真期间,AI 引擎应用由 PS 进行控制。

赛灵思将根据应用的操作系统提供多种 API,如下所述。

  • Xilinx Run Time (XRT) 和 OpenCL,适用于 Linux 应用
  • 裸机驱动程序

编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 赛灵思
    +关注

    关注

    32

    文章

    1794

    浏览量

    131262
  • AI
    AI
    +关注

    关注

    87

    文章

    30823

    浏览量

    268975
  • 可编程逻辑
    +关注

    关注

    7

    文章

    515

    浏览量

    44083
收藏 人收藏

    评论

    相关推荐

    中科创达携手火山引擎开启AI智能座舱新体验

    12月18日至19日,"2024火山引擎FORCE原动力大会·冬"在上海隆重召开。中科创达作为火山引擎的重要生态合作伙伴受邀参与此次盛会,并在会上展示了与火山引擎共创的端云结合 AI
    的头像 发表于 12-19 15:45 173次阅读

    虹软ArcMuse计算技术引擎全面升级

    经过半年多的潜心研发和技术攻关,虹软ArcMuse计算技术引擎迎来全面升级,实现多项关键技术突破。升级内容涵盖高清视频生成、AI模特图高精度
    的头像 发表于 12-11 17:34 320次阅读

    使用 AMD Versal AI 引擎释放 DSP 计算的潜力

    “Versal AI 引擎可以在降低功耗预算的情况下提高 DSP 计算密度,”高级产品营销经理 Udayan Sinha 表示。这种效率使 Versal AI 引擎能够在严格的功耗预算
    的头像 发表于 11-29 14:07 477次阅读

    使用AMD Versal AI引擎加速高性能DSP应用

    AMD Versal AI 引擎使您能够扩展数字信号处理( DSP )算力与面向未来的设计,从而适应当前和下一代计算密集型 DSP 应用。借助 Versal AI 引擎,客户能以更低的
    的头像 发表于 11-20 16:35 325次阅读

    英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

    AI 技术的推动下,企业 IT 管理正经历一场革命。日前,火山引擎飞连新品发布会成功举办。英特尔受邀参与此次活动,并在会上展示了新一代英特尔凌动 x7000 系列处理器等产品,与火山引擎
    的头像 发表于 11-14 17:17 530次阅读

    AI模型市场分析

    随着人工智能技术的快速发展,AI模型已成为全球科技竞争的新高地、未来产业的新赛道以及经济发展的新引擎。下面,AI部落小编分析了当前
    的头像 发表于 11-01 09:51 153次阅读

    火山引擎推出豆包·视频生成模型

    在近期举办的2024火山引擎AI创新巡展上,火山引擎总裁谭待隆重推出了豆包·视频生成模型,这一举措标志着火山引擎在视频内容生成领域迈出了重要一步。豆包模型凭借其独特的
    的头像 发表于 09-25 14:11 296次阅读

    AI引擎机器学习阵列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在凭借 AI 引擎机器学习 ( ML ) 架构来提供突破性的 AI
    的头像 发表于 09-18 09:16 393次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>机器学习阵列指南

    蚂蚁数科发布新一代融合AI风控引擎“AIR Engine”

    在数字化浪潮的推动下,金融科技领域的风控技术正迎来新的突破。近日,蚂蚁数科旗下的蚁盾风控团队正式发布了新一代融合AI风控引擎——“AIR Engine(AIFUSERiskEngine)”,该
    的头像 发表于 06-26 18:20 1239次阅读

    火山引擎携手OPPO、vivo等成立智能终端大模型联盟

    在字节跳动2024年春季火山引擎Force原动力大会上,火山引擎携手OPPO、vivo、荣耀、小米、三星及华硕等业界翘楚,正式宣布成立智能终端大模型联盟。这一联盟的成立,旨在共同推动大模型技术
    的头像 发表于 05-16 10:25 525次阅读

    勒科技新型高性能800G硅光引擎即将亮相OFC 2024

    南通勒光电科技有限公司(简称“勒科技”)在近日重磅推出了专为AI集群和数据中心设计的新一代产品——新型高性能800G硅光引擎。这款备受瞩目的创新产品即将在盛大的2024年度光纤通信
    的头像 发表于 03-22 10:07 872次阅读

    勒科技联合剑桥科技发布新型800G硅光引擎

    南通勒光电科技有限公司,业界简称“勒科技”,近日正式揭晓了其专为AI集群和数据中心量身打造的新一代产品——高性能800G硅光引擎。这款创新产品即将在美国圣地亚哥的年度盛事——202
    的头像 发表于 03-22 10:00 933次阅读

    开放原子开源大赛—基于OpenHarmony的团结引擎应用开发正式启动!

    “基于OpenHarmony的团结引擎应用开发”是开放原子全球开源大赛下开设的新兴及应用题之一,本次题旨在鼓励更多开发者基于Ope
    发表于 03-13 10:45

    恩智浦发布新一代智能语音技术组合的语音识别引擎

    恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Intent引擎,以及您如何在应用中使用它。
    的头像 发表于 01-26 09:15 757次阅读
    恩智浦发布新一代<b class='flag-5'>智能</b>语音<b class='flag-5'>技术</b>组合的语音识别<b class='flag-5'>引擎</b>

    AI引擎内核与计算图编程指南

    电子发烧友网站提供《AI引擎内核与计算图编程指南.pdf》资料免费下载
    发表于 01-03 10:50 0次下载
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>内核与计算图编程指南