0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

光子张量处理器—迸发5G机器学习新活力

电子设计 来源:电子设计 作者:电子设计 2020-12-25 15:14 次阅读

翻译自——EEtimes

近期,一种用光子张量处理器代替GPU来进行机器学习神经网络计算的新方法表明,在处理光学数据传输的性能上可以提高2-3阶。这也表明光子处理器具有增强电子系统的潜力,并可能在5G网络边缘设备中表现强劲。

美国乔治华盛顿大学电子和计算机工程系的Mario Miscuglio和Volker Sorger在《应用物理评论杂志》上发表了一篇论文,题为《基于光子的处理单元使更复杂的机器学习成为可能》。

在他们的方法中,光子张量核并行执行矩阵乘法,这提高了深度学习的速度和效率。在机器学习中,神经网络被训练来学习如何在不可见的数据上执行无监督的决策和分类任务。一旦神经网络对数据进行了训练,它就可以产生一种推断,从而对对象和模式进行识别和分类,并在数据中找到一个特征。

光子TPU并行存储和处理数据,具有电光互连的特点,可以有效地读写光存储器,并与其他架构进行接口

作者之一Mario Miscuglio表示:“我们发现集成了高效光存储的集成光子平台可以获得与张量处理单元相同的操作,但它们只消耗一小部分的功率,并具有更高的吞吐量,如果经过适当的训练,可以用于以光速进行推理。”

大多数神经网络旨在模仿人类大脑的多层相互连接的神经元。表示这些网络的一种有效方法是将矩阵和向量相乘的复合函数。这种表示方式允许通过专门用于向量化操作(如矩阵乘法)的架构来执行并行操作。

(a)光子张量核(PTC)由一个16点积引擎组成,内在独立地逐列逐行逐点乘法和累加。点积引擎执行两个向量之间的乘法。输入矩阵的第i行由由高速(如马赫-曾德尔)调制器调制的波分复用信号给出。通过适当设置核矩阵的权值状态,将核矩阵的第j列加载到光子存储器中。利用光-物质与相变存储器的相互作用,利用微环谐振器(MRR)对输入信号进行频谱滤波,并采用看似量子化的电吸收方案进行加权。(例如调幅),从而执行按元素进行的乘法。使用光检测器将元素式乘法非相干求和,这相当于MAC操作(Dij)。

任务越智能化,预测精度就越高,网络就越复杂。这样的网络需要更大的计算量和更大的处理能力。当前适合于深度学习的数字处理器,如图形处理单元(GPU)或张量处理单元(TPU),由于所需的功率以及处理器和存储器之间电子数据的缓慢传输,在执行更复杂、更精确的操作方面受到了限制。

研究人员表明,他们的TPU性能可以比电子TPU高出2-3个数量级。对于计算节点分布式网络和在网络边缘(如5G)执行高吞吐量智能任务的引擎来说,光子可能是一个理想的匹配。在网络边缘,数据信号可能已经以来自监控摄像机、光学传感器和其他来源的光子的形式存在。

Miscuglio:“光子专用处理器可以节省大量的能源,提高响应时间并减少数据中心的流量。”对于终端用户来说,这意味着处理数据的速度要快得多,因为数据的很大一部分是预处理的,这意味着只需要将其余部分数据发送到云或数据中心。

光与电的较量

本文给出了利用光路完成机器学习任务的实例。在大多数神经网络(NNs)中,每一个神经元和每一层,以及网络的互连,都是训练网络的关键。根据训练,在其连通层中,神经网络强烈依赖于向量矩阵的数学运算,其中输入数据和权重的大矩阵根据训练相乘。复杂的、多层的深层神经网络需要大量的带宽和低延迟,以满足执行大矩阵乘法所需的大量操作,而不牺牲效率和速度。

那么如何有效地将这些矩阵相乘呢?对于通用处理器,矩阵操作在需要连续访问缓存内存的情况下串行进行,从而产生冯·诺依曼瓶颈[1]。而GPU和TPU等特殊的架构,有助于减少这些冯·诺依曼瓶颈的影响,使一些有效的机器学习模型成为可能。

CPU相比,GPU和TPU意义重大,但是当用它们来实现深度神经网络对大型2维数据集(如图像)执行推断时,可能会耗电,并且需要更长的计算运行时间(大于几十毫秒)。对于不那么复杂的推理任务来说,更小的矩阵乘法仍然受到不可忽略的延迟挑战,主要是由于各种内存层次的访问开销和GPU中执行每条指令的延迟。

作者建议,在这种情况下,有必要探索和重新研发当前逻辑计算平台的操作范式,在这种逻辑计算平台中,矩阵代数依赖于对内存的连续访问。在这方面,光的波动性质和相关的固有操作,如干涉和衍射,可以在提高计算吞吐量和同时降低神经形态平台的功耗方面发挥重要作用。

他们建议未来的技术应该在其随时间变化的输入信号所在的领域执行计算任务,并利用其内在的物理操作。在这个观点中,光子是计算节点分布式网络和在网络边缘(如5G)对大数据执行智能任务的引擎的理想匹配,其中数据信号可能已经以光子的形式存在(如监控摄像头、光学传感器等),从而预先过滤和智能调节允许向下游流向数据中心和云系统的数据流量。

在这里,他们探索了利用光子张量核(PTC)的方法,该方法能够与训练好的核进行一次性的4乘4矩阵的(非迭代的)和完全被动的乘法和积累。换句话说,一旦NN被训练,权重被存储在一个4位的多层光子存储器中,直接在芯片上实现,而不需要额外的电光威廉希尔官方网站 或芯片外DRAM。该光子存储器具有低损耗、相变、纳米光子威廉希尔官方网站 的特点,其基础是将G2Sb2Se5的导线沉积在一个平面波导上,可以使用电热开关进行更新,并且可以完全通过光学读取。电热开关是由夹住相变存储器(PCM)导线的钨加热电极实现。

作者表示,这项工作代表了实现并行存储数据和处理的光子张量处理器的第一种方法,与提供实时分析的最先进的硬件加速器相比,它可以将相乘累积(MAC)操作的数量提高几个数量级,同时显著降低功耗和延迟。

与依赖逻辑门的数字电子学不同,在集成光子学中,乘法、积累和更一般的线性代数运算可以固有地、非迭代地执行,得益于信号的电磁特性和有效的光物质相互作用所提供的内在并行性。在这方面,集成光子学是一个理想的平台,映射特定的复杂操作一对一到硬件,在某些情况下算法,实现时间复杂度。


审核编辑:符乾江


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30894

    浏览量

    269085
  • ML
    ML
    +关注

    关注

    0

    文章

    149

    浏览量

    34657
  • 5G
    5G
    +关注

    关注

    1354

    文章

    48454

    浏览量

    564243
收藏 人收藏

    评论

    相关推荐

    RK3568国产处理器 + TensorFlow框架的张量创建实验案例分享

    一、实验目的 本节视频的目的是了解张量定义、了解张量的表示形式、并学习基于TensorFlow框架的张量创建方法。 二、实验原理. 张量定义
    发表于 12-03 14:43

    5G路由5G CPE还傻傻分不清?一文带你了解!

    5G CPE(Customer Premise Equipment)即5G客户前置设备,是一种5G终端设备。5G路由是一个将
    的头像 发表于 11-13 16:32 895次阅读
    <b class='flag-5'>5G</b>路由<b class='flag-5'>器</b>和<b class='flag-5'>5G</b> CPE还傻傻分不清?一文带你了解!

    5G边缘计算网关的实际应用及其优势

    随着全球5G技术的蓬勃发展,边缘计算网关技术逐渐成为行业热门焦点,为工业物联网、智能交通及智慧城市建设等诸多领域注入了全新的活力与无限可能。凭借实时高效的数据处理与极低的连接延迟,5G
    的头像 发表于 07-26 16:57 2265次阅读

    嵌入式设备中的4G/5G模块管理

    /5G模块管理复杂多样,不同品牌和型号的模块各有其独特的配置和上网流程,这不仅增加了用户的学习成本,也导致了网络稳定性难以保障的问题。 为了帮助用户解决这一问题,飞凌嵌入式精心打造了 4G/
    发表于 07-13 16:45

    易为芯光电5G射频线焊接

    5G射频
    jf_87022464
    发布于 :2024年06月17日 10:34:31

    请问Lierda 5G EVK具体支持哪些linux系统?

    Lierda 5G EVK这款产品的开发驱动适用于Ubantu 18.04或者centos吗,ARM架构的主机,接这个调驱动麻不麻烦
    发表于 06-04 07:50

    请问mx880 5G数据终端可以设置优先5G网络吗?

    固件版本固件版本5G_DTU master 1.2.5 当地5G网络夜里会关闭, 设置lte➕nr 或者nul➕nr,夜里自动跳转4G 网络, 白天有5G 网络时候不能自动切回来,得手
    发表于 06-04 06:25

    谷歌Tensor G5处理器将由台积电生产

    近日,关于谷歌新一代智能手机Pixel 10系列将搭载自研处理器Tensor G5的传闻得到了进一步证实。据外媒报道,谷歌Tensor G5处理器的样品运输清单已被曝光,尽管清单中并未
    的头像 发表于 05-29 11:03 574次阅读

    联发科 天玑1200双5G处理器 _ 智能模块

    处理器模块
    jf_87063710
    发布于 :2024年05月25日 14:24:15

    XY6853 5G 智能模块

    5G智能模块
    jf_87063710
    发布于 :2024年05月06日 09:35:10

    单北斗定位5G终端V2 Pro版发布:5G国产芯+单位对讲防爆终端#北斗定位终端

    5G终端
    顶坚北斗防爆手机
    发布于 :2024年03月26日 10:41:26

    美格智能联合罗德与施瓦茨完成5G RedCap模组SRM813Q验证,推动5G轻量化全面商用

    全球5G发展进入下半场,5G RedCap以其低成本、低功耗的特性成为行业焦点。近日,中国移动携手合作伙伴率先完成全球最大规模、最全场景、最全产业的RedCap现网规模试验,推动首批芯片、终端具备
    发表于 02-27 11:31

    一加Nord N30 SE 5G发布,搭载天玑6020处理器

    据一加官网站透露,Nord N30 SE 5G 将配备一块面积达 6.72 英寸的高清 LCD 显示屏,搭载联发科天玑 6020 处理器、4GB 运行内存及 128GB 储存空间,拥有 5000mAh 大容量电池,并支持 33W 高效快速充电,官方表示可在 30 分钟内将
    的头像 发表于 01-30 11:50 1213次阅读

    AMD发布全新Ryzen 8000G系列台式机处理器

    AMD最近发布了全新的Ryzen 8000G系列台式机处理器,这个系列包括Ryzen 7 8700G、Ryzen 5 8600G、Ryzen
    的头像 发表于 01-09 15:31 1069次阅读

    5G 外置天线

    提供了高效率/高增益,其特点是底座上带有旋转接头的柔性塑料表面结构。它们也易于安装,具有可定制的电缆长度和连接选项,以满足您的特定需求。 这些天线实现了LTE、4G5G网络之间的无缝过渡,是工业
    发表于 01-02 11:58