0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MCM正在潜移默化地改变芯片设计

21克888 来源:电子发烧友网 作者:凯扬 2022-05-09 08:32 次阅读

芯片模块(MCM)技术的应用在半导体业界已经不是什么新鲜事了,但随着Chiplet、2.5D/3D封装技术日趋火热,MCM正在渗透进更多的芯片设计中,无论是GPU、光模块还是AI芯片,都在慢慢引入这类封装技术。

MCM GPU成为趋势

以去年AMD发布的首个MCM GPU Instinct MI250X为例,这款GPU集成了两个GPU Chiplet和128GB的超大HBM2e内存,在算力和带宽上都做到了极致,实现了383TFLOPS(FP16)和3.2TB/s的可怕成绩,无疑是专注AI的各大超算中心梦寐以求的加速器了。同样,英特尔也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

虽然MCM已经由AMD和英特尔两家GPU厂商开始推进了,但目前来看英伟达的动作比较小,虽然有相关的研究,但还未拿出商用的MCM产品。不过以上都是面向HPC/AI市场的GPU,消费级的GPU是否也会迎来MCM的GPU呢?据现在的传闻,AMD极有可能在下一代RDNA3架构的高端GPU中用上MCM。

但消费级应用与HPC/AI应用又属于截然不同的场景,后者使用多个GPU跑负载是很常见的情况。但消费场景中多GPU已经相当少见了,在兼容性上肯定会大打折扣,所以迈出这一步很可能会带来一定的风险。

IP公司眼中的MCM

MCM不仅为GPU公司带来了更多设计灵活性,也让一众IP公司找到了新的商业模式。比如IP公司Credo就提供混合信号DSP IP,用于客户的ASIC设计,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。随着数据中心的网络架构慢慢趋向于400G以上,芯片连接性的要求也在逐步升高。为此,Credo在去年底推出了全新的3.2Tbps BlueJay重定时器chiplet,通过64通道56Gbps PAM4 LR的DSP,提供了强大的系统级连接性。

BlueJay Chiplet / Credo

BlueJay虽然只是以台积电28nm工艺打造,但保证了性能和功耗的要求,与其先进工艺方案Nutcracker相比也降低了成本。此外,由于BlueJay与主机端MCM中SoC核心的通信是通过超低功耗的BoW D2D接口实现的,其接口已经针对台积电的CoWoS封装技术做了优化。这种将SerDes功能从片上(on-die)转向片外(off-chip)的做法,显著增加了ASIC的可使用面积,设计者可以将这一部分多出来的面积用于实现更高的计算性能。

AI在MCM上的创新

同样,AI也在MCM上找到了新的解决方案。我们已经看到了大的机器学习模型通过训练大数据在多个领域展示了惊人的成果,比如计算机视觉语音识别和自然语言处理等。为了减少机器学习加速器的成本,业界引入了不少设计创新,其中之一就是MCM。

Coral TPU / 谷歌

英伟达的Simba,谷歌的TPU,都用到了MCM的设计。谷歌的Coral TPU是一个用于边缘端的机器学习推理加速器,在极小的占用面积下可以实现4 TOPS(INT8)的峰值性能,能效比可达2 TOPS/W。英伟达的Simba同样是一个用于推理的芯片,但规模比谷歌的Coral更大,整个MCM由36个Chiplet组成,每个都能实现4 TOPS的峰值性能,将整个芯片算力提升至最高128 TOPS,能效比更是高达6.1 TOPS/W。

一来在设计上,设计小芯片的难度比一整块芯片要低,二来小芯片由于面积较小,生产良率也更高。这都证明了这种方案既可以减少设计和生产成本,也能达到与单个大芯片近似的性能与能效。

但正如我们上文提到的MCM GPU兼容问题一样,机器学习中MCM也并非毫无痛点。由于MCM中单个Chiplet的内存远比单个大芯片要小,所以大型机器学习模型的训练与推理都需要将矢量计算的数据流图在Chiplet上进行划分。多芯片进行划分就是为了将运算分配给Chiplet,从而将某个性能指标最大化,比如说吞吐量。但与单芯片不一样,MCM中小芯片的数量以及神经网络的节点数量增加,都会让搜索空间成指数级增长,从而降低效率,更不用说因为MCM的硬件特性,可用的划分方案并不多。所以这种划分的质量,直接影响到了MCM芯片设计的优化。

为了解决这个问题,谷歌的研究员们开发了一种深度强化学习的划分方案,同时利用一个约束求解器来专门解决MCM封装的机器学习模型划分问题。他们的方案可以通过预训练来普及到未知的输入图,通过对生产级BERT模型的硬件评估,他们得到了超过随机搜索和模拟退火等现有方案5%以上的吞吐量。更重要的是,这种方案具备极佳的迁移学习性能,使用预训练的模型可以有效提升样本效率,将搜索时间从3个小时减少到了9分钟。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50812

    浏览量

    423579
  • 芯片设计
    +关注

    关注

    15

    文章

    1019

    浏览量

    54895
  • MCM
    MCM
    +关注

    关注

    1

    文章

    67

    浏览量

    22347
收藏 人收藏

    评论

    相关推荐

    正在使用的芯片停产,而您又不想改变PCB布局时,该怎么办?

    我们的一位客户遇到了一个棘手的问题,正在使用的芯片停产,而客户又不想改变PCB布局,找到瑞苏盈科,要求我们为停产的键盘编码器IC开发一种无须更换的替代品。面临的挑战如何用无须改动的替代品取代已停产
    的头像 发表于 10-25 08:03 199次阅读
    <b class='flag-5'>正在</b>使用的<b class='flag-5'>芯片</b>停产,而您又不想<b class='flag-5'>改变</b>PCB布局时,该怎么办?

    芯片封装是什么?芯片封装中芯片环氧胶的应用有哪些?

    通过导线连接芯片与外部威廉希尔官方网站 ,实现信号传输,并帮助散热。封装层次:零级封装:芯片互连,连接芯片焊区与封装。一级封装(SCM/MCM):单或多芯片
    的头像 发表于 09-20 10:15 435次阅读
    <b class='flag-5'>芯片</b>封装是什么?<b class='flag-5'>芯片</b>封装中<b class='flag-5'>芯片</b>环氧胶的应用有哪些?

    请问固定增益芯片是否意味着不能通过改变外围参数来改变增益?

    固定增益芯片是否意味着我不能通过改变外围参数来改变增益?
    发表于 09-11 07:13

    Tidal正在改变其音频格式

    对于发烧友来说,大新闻是:Tidal正在改变其音频格式。从7月24日开始,Tidal将放弃对Master Quality Authenticated(MQA)和360 Reality Audio格式
    的头像 发表于 06-24 16:51 598次阅读

    联发科正在开发Arm架构Windows PC芯片

    据权威媒体援引三位知情人士的消息报道,联发科正在紧锣密鼓地开发一款基于Arm架构的个人电脑芯片。这款芯片将成为推动Windows操作系统在新型电脑设备上运行的重要力量。
    的头像 发表于 06-13 09:16 718次阅读

    N8900蓝牙音乐芯片,打造宝宝舒适睡眠环境

    ,不仅有助于宝宝更快地进入梦乡,还能在潜移默化中培养他们的音乐素养。一直以来,做母亲的都知道利用摇篮使孩子尽快入睡。美国俄亥俄州大学的研究人员发现,摇晃还有益于婴儿
    的头像 发表于 05-13 17:12 325次阅读
    N8900蓝牙音乐<b class='flag-5'>芯片</b>,打造宝宝舒适睡眠环境

    N8900蓝牙音乐芯片,打造宝宝舒适睡眠环境

    ,不仅有助于宝宝更快地进入梦乡,还能在潜移默化中培养他们的音乐素养。 首先,让我们聚焦N8900蓝牙音乐芯片的功能特点。 这款芯片拥有32位CPU和DSP硬件解码,能够高效处理音频信号,确保音乐播放的流畅性和音质的高保真。 同时
    的头像 发表于 05-13 11:47 485次阅读

    苹果正在研发全新数据中心AI芯片

    苹果正在秘密研发一款全新的数据中心AI芯片,这一项目在公司内部被称为“ACDC”,并且已经经过了数年的精心筹备。据华尔街日报的知情人士透露,这款芯片的设计目标是为了优化苹果数据中心服务器运行人工智能软件的能力。
    的头像 发表于 05-08 09:40 420次阅读

    一颗改变了世界的芯片

    英特尔突破性的8008微处理器于50多年前首次生产。这是英特尔的第一个8位微处理器,也是您现在可能正在使用的x86处理器系列的祖先。我找不到8008的好的Die照片,所以我打开了一颗并拍了一些详细
    的头像 发表于 04-20 08:10 914次阅读
    一颗<b class='flag-5'>改变</b>了世界的<b class='flag-5'>芯片</b>

    RFID技术为桥牌竞技项目注入新活力

    打桥牌需要双方遵守严格的一整套公开、公平的规则,伙伴间必需保持高度的默契与合作精神,对人们特别是青少年遵纪守法、品德陶冶、身心修养,起着极为良好的潜移默化作用。由于桥牌对玩家的思维能力、记忆力、沟通
    的头像 发表于 03-22 13:40 301次阅读
    RFID技术为桥牌竞技项目注入新活力

    国家推出“以旧换新” 拉动家电行业市场增长

    新的一轮家电以旧换新以高技术、能耗、排放等标准为牵引,元器件厂商们如何迎接挑战?   经过疫情这三年,我国的经济形势出现巨大挑战,人们的消费习惯也被潜移默化地被影响着,消费热情难以提高。再加上近几年
    的头像 发表于 03-06 13:55 568次阅读

    AI时代,传统HDD硬盘的出路是什么?

    电子发烧友网报道(文/周凯扬)随着存储技术的进一步发展,以及大家对于存储性能的看法发生了潜移默化改变,HDD硬盘似乎在慢慢淡出普通消费者的视野。而AI的加速更是让这一趋势变得更为明显,闪存带来
    的头像 发表于 02-19 00:00 3579次阅读

    AI PC时代正在向我们走来

    AI无处不在,充满未知和期待的AI PC时代正在向我们走来,我们的生活和工作方式即将发生改变
    的头像 发表于 01-19 09:49 615次阅读

    畅行智驾智能驾驶域控解决方案RazorDCX Pantanal获阶段性进展

    近年来,智能驾驶渗透率持续攀高,智驾功能从各方面提升了用户的驾驶体验,同时在安全、兼容性、成本方面起到积极作用,用户的驾驶习惯正被潜移默化改变
    的头像 发表于 01-11 09:58 916次阅读

    Verisium如何提高调试效率和验证吞吐量呢?

    半导体对各行各业都有着潜移默化的影响,其重要性不言而喻。
    的头像 发表于 01-05 13:54 1006次阅读
    Verisium如何提高调试效率和验证吞吐量呢?