完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
ARM11是ARMv6体系结构的第一个实现,ARM11微结构的设计目的是为了高性能,而实现这一目的流水线是关键。ARM11微结构的流水线与以前的ARM核不同,它包含8级流水,使贯通率比以前的核提高40%。
单指令发射 ARM11微结构的流水线是标量的(SCALAR),即每次只发射一条指令(单发射)。有些流水线结构可以同时发射多条指令,例如,可以同时向ALU和MAC流水线发射指令。理论上,多发射微结构会有更高的效能,但实践上,多发射微结构无疑会增加前段指令译码级的复杂程度,因为需要更多的逻辑来处理指令相关(DEPENDENCY),这将使处理器的面积和功耗变得更大。 分支预测 分支指令通常是条件指令,它们在跳到新指令前需要进行一些条件的测试。由于条件指令译码需要的条件码要三四个周期后才可能有结果,分支有可能引起流水线的延迟。但分支预测将会有助于避免这种延迟。ARM11微结构使用两种技术来预测分支。首先,动态的预测器使用历史记录来判断分支是最频繁发生,还是最不频繁发生。 动态预测器是一个64个分录,4状态(StronglyTaken,WeaklyTaken,StronglynotTaken,WeaklynotTaken)的分支目标地址缓存(BTAC)。表格大小足够保持最近的分支情况,分支预测就基于以前的结果。其次,如果动态的分支预测器没有发现记录,就使用静态的分支算法。很简单,静态预测检查分支是向前跳转还是向后跳转。假如是向后跳转,就假定它是一个循环,预测该分支发生,假如是向前跳转,就预测该分支不发生。通过使用动态和静态的分支预测,ARM11微结构中分支指令中的85%被正确预测。 存储器访问 ARM11微结构存储器系统的提高之一就是非阻塞(NON-BLOCKING)和缺失命中(HIT-UNDER-MISS)操作。当指令取的数据不在缓存中时,一般处理器的流水线会停止下来,但ARM11则进行非阻塞操作,缓存开始读取缺失的数据,而流水线可以继续执行下一指令(NON-BLOCKING),并且允许该指令读取缓存中的数据(HIT-UNDER-MISS)。 并行流水线 尽管流水线是单发射的,在流水线的后端还是使用了三个并行部件结构,ALU,MAC(乘加),LS(存取)。LS流水线是专门用于处理存取操作指令。把数据的存取操作与数据算术操作的藕合性分隔开来可以更有效的处理执行指令。在流水线中包含LS部件的ARM11微结构中,ALU或者MAC指令不会由于LS指令的等待而停止下来。这也使得编译工具有更大的自由度通过重新安排代码来提高性能。为使并行流水线获得更大的效能,ARM11微结构使用了乱序完成(OUT-OF-ORDERCOMPLEtiON)。 64位数据路径 对于目前的许多应用来说,由于成本与功耗的问题,真64位处理器并不十分必要。ARM11微结构在局部合理使用64位结构,通过32位的成本来实现64位的性能。ARM11微结构在处理器整数部件与缓存之间,整数部件与协处理器之间使用了64位数据总线。64位的路径可以在一个周期内从缓存中读取两条指令,允许每周期传送两个ARM寄存器的数据。这使得许多数据移动操作与数据加工操作变得更为高性能。 浮点处理 ARM11微结构支持浮点处理。ARM11微结构产品线将浮点处理单元作为一个选项。这可以方便发展商根据需求需用合适的产品。 |
|
相关推荐
|
|
你正在撰写答案
如果你是对答案或其他答案精选点评或询问,请使用“评论”功能。
迅为RK3568开发板EMMC镜像导出打包update.img
403 浏览 0 评论
飞凌嵌入式-ELFBOARD 硬件知识分享-ELF 2电源威廉希尔官方网站 讲解
1004 浏览 0 评论
1713 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-mfgtools烧录流程介绍之烧写所需镜像
1511 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-mfgtools烧录流程之烧写方法
956 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-26 11:46 , Processed in 0.581942 second(s), Total 70, Slave 54 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (威廉希尔官方网站 图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号