处理器/DSP
ARM公司Cortex A15核心
目前,智能手机已经向四核心靠拢,但同样是四核,手机性能却是千差万别。从去年就开始崭露头角的高通Krait系列架构四核外,ARM家族的Cortex A15也正式登上四核的历史舞台。例如三星的Exynos 5 Octa、NVIDIA 的Tegra 4均采用Cortex A15架构。同时,智能移动设备iPad3的处理器传言也会用上全新的ARM Cortex A15架构处理器。虽然苹果iPad3处理器较A5X还是A6,使用Cortex-A15架构可能性非常大。我们可以从TI、三星、高通发布的产品对于Cortex A15架构做整体水平全面的了解。
ARM Cortex-A15 架构示意图
Cortex-A15核心,与Cortex-A9一样,同样基于ARMv7-A架构,定位上是Cortex-A9的替代品,但架构上有较大变化,对多核心的效率和管理上有重要意义。而在浮点运算单元上,也有升级。我们简单来看看Cortex-A15的变化。
ARM Cortex-A9 架构示意图
ARM Cortex-A9 工作流程示意图
首先,我们看到ARM公司官方提供的两张处理器的原理架构图。我们发现,在Cortex-A9处理器的工作流程中,多核心中断控制与分配是放在最后一层的,而在Cortex-A15中,这一部分的工作是放在核心运算之前的。在NVIDIA的Tegra3技术文档中曾经谈到,Android下,多核心在不同核心运行于不同频率时,整体效率会受到最低频率的核心的限制,所以Tegra3在多核心的控制管理上有所优化。也许这与ARM Cortex-A9多核心原始设计有关。而在Cortex-A15上,架构上有了很大变化,也许多核心处理的效率会更高。
从浮点运算单元来看,Cortex-A15核心每个核心内建VFPv4浮点单元。VFPv4是Vector Floating-Point version 4,而在Cortex-A9上是Version 3,Cortex-A8是Version 2。此次VFPv4是ARM处理器的浮点运算首次完全支持IEEE 754标准。在以往,ARM处理器的浮点运算性能一直是短板,尤其是在ARMv7之前,此次VFPv4会对浮点运算带来怎样改进?
除此之外,Cortex-A15的缓存管理也略有改进。每个核心将都分别具有32KB的数据与指令L1 Cache,L2 Cache二级缓存被多个核心共享,目前官方提供数据支持512KB、1MB、2MB、4MB等标准,二级缓存的控制机制延迟要比Cortex-A9时有所进步。
最后,Cortex-A15从设计之初并不仅仅定位于移动设备,它支持40bit Large Physical Address Extensions, LPAE,内存寻址高达1TB,同时,它开始完全支持硬件虚拟化。这些应用,甚至瞄准的是多颗ARM处理器打造的高性能运算平台。
TI、三星、高通的Cortex A-15核心产品
TI OMAP5系列:OMAP 5430/5432是号称业界首款Cortex-A15核心的产品。TI公司在2011年底发布了OMAP5 SoC芯片的详细架构示意图,并大概公布了相关效能,我们从OMAP5来看看Cortex-A15的表现。
TI OMAP 5430处理器架构示意图
TI OMAP 5430/5432主要参数
OMAP 5430与5432在大体架构上没有区别,只是封装尺寸,外部I/O因为定位不同稍有不同。OMAP 5430仍然定位于智能手机、平板电脑等,而OMAP 5432可能偏重于尺寸稍大一些的设备,例如类似笔记本电脑的产品。所以,我们先来看一张OMAP 5430的架构图。从架构图中,我们看到,它使用了两个Cortex-A15核心,最高频率可达2GHz。为了保证低负荷下系统更低功耗,OMAP 5430还使用了两个Cortex-M4核心。在视频、2D图像部分,都有专门DSP单元负责,电源管理与音频管理模块与OMAP4系列没有不同。在周边I/O模块上,各种全新的标准一应俱全。SD3.0、eMMC存储接口,SATA 2.0接口[为SSD设计],USB 3.0 OTG接口,USB2.0接口,HDMI 1.4a标准等等。当然,OMAP5430还搭配了PowerVR SGX544图形处理单元,这要比之前OMAP4系列有不小的提升。
TI OMAP5 平台性能示意图
TI还大概描述了OMAP5系列和Cortex-A15的效能提升,同时在2012年1月展示了使用OMAP5的成品设备。大体来说,28nm工艺制造的Cortex-A15与40nm工艺的Cortex-A9相比,单线程运算效能提升1.5倍,浮点运算性能提升1.6倍。全新的多核心管理架构让它的多核心处理分配更为智能,可按需分配[Cortex-A9明显更低效]。另外,TI在OMAP 5上使用SmartReflex 3能源管理技术,它可以使OMAP 5处理器在达到与指定OMAP 4处理器一样性能的情况下,只需要OMAP 4处理器60%的能耗。换个角度,如果用OMAP 4所需的同样能耗,那么OMAP 5 只需要60%的时间就可以完成所需要做的工作。
TI没有更多介绍OMAP 5中PowerVR SGX544的性能,但除去运行频率带来的差异不可估计外,我们知道SONY PS Vita上使用的是PowerVR SGX543 MP4+[同样是四核心],而苹果A5处理器使用的是PowerVR SGX543MP2,前者为4个核心,后者为2个核心。相对OMAP4系列[除去4470外]的PowerVR SGX540,性能有5倍提升[官方数据]。
三星 Exynos 5250:2011年11月30日,三星发布Exynos 5250处理器,它同样使用Cortex-A15双核心,不过使用的是32nm High-k工艺生产。从三星提供的数字来看,2.0GHz的双核心Exynos 5250的运算性能可以达到1.5GHz Cortex-A9核心处理器的两倍,效能显然有很大提高。Exynos 5250还支持EDP接口,支持DispalyPort的输出,最高支持2560x1600的分辨率,同时支持3D立体输出,至于图形单元的具体性能,官方消息中没有透露。
高通Snapdragon S4:高通公司同样在2011年底发布了Snapdragon的S4平台,在即将开幕的MWC 2012上,使用S4平台的高通手机就会展出。国外网站AnandTech在21日刚刚发布了,S4平台的性能测试。Snapdragon S4平台,同样使用Cortex-A15架构,不同高通命名为"Krait",芯片组代号MSM8960,它采用28nm工艺制造,双核心运行主频1.5GHz。显示单元从Adreno 220升级至Adreno 225。从测试结果来看,与高通S3平台,即MSM8260/8660相比,单线程Linpac浮点运算性能提升1倍,多线程浮点运算性能提升120%。不要忘记MSM8260只是VFPv2浮点单元,即ARMv7-A架构,Cortex-A8核心的改进版本,所以测试结果领先的幅度较大。从SunSpider的JAVA性能测试来看,S4平台性能提升54%,比iPhone 4S即苹果A5核心,性能提升46%。BrowserMar的成绩,较S3平台提升23.5%。Adreno225的3D性能,相比Adreno,也有100%左右的提升。
从TI的OMAP 5系列,三星的Exynos 5250,高通Snapdragon S4,我们已经可以看到Cortex-A15核心以及采用该核心新一代产品的大致性能。无论从半导体制造工艺、核心架构更新、图形单元的同步升级等各个方面,在性能上都有明显提升。而从相对细致一些的TI的官方数据来看,它的能耗也有所降低,效能提升十分明显。
全部0条评论
快来发表一下你的评论吧 !