PowerVR与神经网络加速器

处理器/DSP

892人已加入

描述

近来,如果你对神经网络有所关注,那么你一定会发现神经网络的市场如日中天。实际上,机器学习和深度学习已经成为了人人所熟知的技术。如果你还对此很陌生,那么你可以看看我的另一篇博客,里面对相关概念进行了详细的解释。

Imagination的PowerVR Series2NX集成了神经网络专用处理器,相信这必定使其性能提高一个量级。

最近,一家竞争企业宣称,他们新一代的SoC芯片组将不仅包含CPU、GPU而且将包含一个神经网络加速器NPU。我们非常支持这一做法,并且相信在不久的将来,这将成为移动设备的标配。这家企业称新一代产品是“超高速”的,当单独使用NPU处理器时,一分钟可以处理1832幅图像,当NPU、GPU、CPU联用,一分钟可以处理的图片数是2005,该公司宣称该速度是同类产品的5倍。

为了验证该结果,我们使用类似的测试程序,在MediaTek X30上进行了测试,MediaTek X30中配备了我们的7XT+系列GPU(GT7400+)。测试结果显示,图片的处理速度大概是每秒30幅,相当于每分钟1800幅,这个速度和竞争对手所宣称的新神经网络加速器速度相差无几,仅仅慢了1.8%

这仅仅是当下的成果,在未来,我们的8XT系列,在相同的运行频率下FLOPS将提高50%,在性能上将着实是一个大幅度的提升。

目前,我们的GPU的处理速度是1800幅/分钟,那么再来看看我们的2NX系列神经网络加速器,这种加速器单核的性能是2048 MACs/cycle,这样每分钟可以处理的图片将是42000幅,粗略计算,这个速度比竞争者提高了2233%。

竞争对手声称,在神经网络图像识别上,他们的GPU比CPU快四倍,而且他们的新硬件解决方案将比CPU快25倍。下图给出了相关的对比数据。此外,下图还给出了使用PowerVR Series 7XT和PowerVR Series 2NX NNA的对比数据。正如你所看到的那样,目前我们的GPU可以与其性能相抗衡,而我们带有神经网络加速器的硬件是其速度的583倍,实在是令人难以置信。

神经网络加速器

我们所关注的不仅仅是性能,在功耗上,Series2NX也具有很大的优势。Series2NX针对神经网络进行了专门的优化。通过灵活bit速率技术的支持,其功耗将大幅度低于传统的GPU。

在芯片的物理尺寸上,Series2NX也更胜一筹。Series2NX的硅面积非常小。当需要获得更高的神经网络性能时,制造商可以选取一个GPU来满足他们的需求,如Series8XT甚至更新的Series9XE或9XM,然后选取Series2NX与之相匹配,这样搭配后在硅面积上我们依然优于竞争对手的解决方案。

结论

我们的消费者有很多种选择,比如在构建SoC时,可以选择单GPU解决方案,这在处理AI和相关的图形任务时将具有和竞争者相类似的性能。

然而,神经网络市场发展迅速,如果没有超乎寻常的性能,商家将无法提供最具有竞争力的产品。当应用程序使用更为复杂的神经网络时,PowerVR Series2NX NNA将为我们的客户提供更高的性能,这将使开发人员以更小的功耗和带宽,创建真正的下一代产品。

当然,如果想要获得一个真正的前沿解决方案,那么强大、高效且高度可扩展的PowerVR 2NX无疑是市场上唯一的解决方案。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分