面向TTA架构ASIP设计的深度神经网络优化论文免费下载

消耗积分:0 | 格式:rar | 大小:10.68 MB | 2019-11-22

分享资料个

　　近年来，依托电子芯片技术的发展，神经网络的结构被设计得更深更大，以应对更加复杂和抽象的场景。随之而来的问题是深府神经网络在训练和推理都依托大规模的浮点运算实现，对存储资源的占用和设备功耗的需求产生了很高的需求。基于传输触发架构（TransportTriggered Architecture，TTA）的专用指令集处理器（ApplicationSpecific Instruction Set Processor，ASIP）既能够提供专用集成威廉希尔官方网站级别的高性能和低功耗，又能够提供处理器级别的指令集灵活性，是解决该问题的途径之一。

　　量化与加速是深度神经网络硬件实现时常用的两项技术，卷积神经网络是最有代表性和最通用的深度神经网络。本文的主要工作即围绕这两项技术，进行面向TTA架构ASIP设计的卷积神经网络的优化，具体内容包含以下两个部分：

　　其一，本文针对基于TTA架构的神经网络ASIP的需求，提出了一套端到端完整的8比特量化方案。该方案结合权重、激活值和梯度的各自特点，为它们制定了相应的量化策略，包括了对称仿射的权重量化、带动态上限的激活值量化、变精度的梯度量化以及一种近似的批量归一化算法。在多数据集、多模型结构的实验中，该方案都取得了与全精度网络相当的精度，领先于部分当下常用的量化方案。

　　其二，本文将查找表资源融入到卷积运算中，提出了一种基于乘法结合律的卷积运算的加速方案。该方案针对面向TTA架构的量化卷积功能单元，提供了符合量化卷积特性的卷积核分块、循环展开、数据交换规则，并展示了基于TTA架构的神经网络加速器的整体结构。对比传统卷积方案，该方案缓解了有限的乘法器资源对于神经网络并行计算的限制，在并行度与计算能效比两方面都有所提升。

　　本文中，量化方案是加速方案的基础，加速方案是量化方案的补充，二者共同构成了本文的优化工作，为基于TTA架构的深度神经网络的ASIP实现提供了支持。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

qaz12340 2022-08-23 0 回复举报 http://house.china.com.cn/sousou/%25D4%25DA%25CF%25DF%252C%2B%25C3%25E5%25B5%25E9%25D3%25F1%25CF%25E9%25BC%25AF%25CD%25C5B2024.cN%252C%25D6%25D0%25C9%25BD%25C1%25AA%25CD%25A8_76s.htm http://house.china.com.cn/sousou/%25B9%25D9%25B7%25BD%25CD%25F8%25D5%25BE%252C%2B%25B9%25FB%25B8%25D2%25C1%25FA%25CC%25DA%25B9%25FA%25BC%25CA%25BC%25AF%25CD%25C5B2024.cN%252C%25D2%25F8%25B4%25A8%25D1%25A7%25B8%25AE_2s.htm http://house.china.com.cn/sousou/%25BA%25F3%25CC%25A8%252C%2B%25C3%25E5%25B1%25B1%25D3%25C0%25B2%25FD%25C6%25BD%25CC%25A8B2024.cN_1s.htm http://house.china.com.cn/sousou/%25CB%25D1%25BA%25FC%252C%2B%25CC%25DA%25C1%25FA%25B9%25FA%25BC%25CA%25D3%25E9%25C0%25D6%25B3%25C7B2024.cN_8s.htm http://house.china.com.cn/sousou/%25CA%25D7%25D2%25B3%252C%2B%25B9%25FB%25B8%25D2%25C1%25FA%25CC%25DA%25B9%25FA%25BC%25CA%25B9%25AB%25CB%25BEB2024.cN_15s.htm 收起回复

相关下载
相关文章

下载排行榜

UC3842/3/4/5电源管理芯片中文手册
2024-12-02 17次下载

下载
3314A函数发生器维修手册
2024-12-19 13次下载

下载
DMT0660数字万用表产品说明书
2024-12-03 13次下载

下载
华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法
2024-12-03 11次下载

下载
TPS54202H降压转换器评估模块用户指南
2024-12-04 8次下载

下载
STM32F101x8/STM32F101xB手册
2024-12-06 8次下载

下载

面向TTA架构ASIP设计的深度神经网络优化论文免费下载

PyTorch教程10.3之深度递归神经网络

PyTorch教程8.1之深度卷积神经网络(AlexNet)

基于BP神经网络优化的光伏发电预测模型

基于改进郊狼优化算法的浅层神经网络进化

基于神经网络的优化计算实验

自构造RBF神经网络及其参数优化

人工神经网络控制

深度学习中的卷积神经网络层级分解综述

基于剪枝与量化的卷积神经网络压缩算法

基于深度神经网络的天气智能识别模型

BP神经网络基本原理简介

神经网络基础知识

3小时学习神经网络与深度学习课件下载

基于深度神经网络的强对流天气智能识别模型

深度神经网络模型的压缩和优化综述

基于深度神经网络的图像语义分割方法

神经网络图像压缩算法的FPGA实现技术研究论文免费下载

综述深度神经网络的解释方法及发展趋势

一种基于多视图架构的深度卷积神经网络模型

神经网络的方法学习课件免费下载

基于深度神经网络的文本分类分析

Matlab神经网络的学习练习题合集免费下载

神经网络与神经网络控制的学习课件免费下载

神经网络的基本概念学习课件免费下载

基于多孔卷积神经网络的图像深度估计模型

卷积神经网络的资料合集免费下载

神经网络的复习资料免费下载

BP神经网络的简单MATLAB实例免费下载

快速了解神经网络与深度学习的教程资料免费下载

《神经网络和深度学习》中文版电子教材免费下载

残差网络是深度神经网络吗

神经网络优化器有哪些

简单认识深度神经网络

深度神经网络(DNN)架构解析与优化策略

深度神经网络概述及其应用

深度神经网络与基本神经网络的区别

深度神经网络的设计方法

神经网络优化算法有哪些

bp神经网络是深度神经网络吗

卷积神经网络分类方法有哪些

卷积神经网络和bp神经网络的区别

深度神经网络模型有哪些

神经网络架构有哪些

如何训练和优化神经网络

详解深度学习、神经网络与卷积神经网络的应用

浅析深度神经网络压缩与加速技术

深度学习的神经网络架构解析

卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

浅析三种主流深度神经网络

浅析三种主流深度神经网络

什么是神经网络？什么是卷积神经网络？

NVIDIA CUDA深度神经网络库实现高性能GPU加速

基于深度神经网络开发AI编译器

深度神经网络的基本理论和架构

面向低功耗AI芯片上的神经网络设计介绍

深度神经网络在识别物体上的能力怎样

深度神经网络的实现机理与决策逻辑难以理解

【人工神经网络基础】为什么神经网络选择了“深度”？

斯坦福探索深度神经网络可解释性 决策树是关键

下载排行榜

UC3842/3/4/5电源管理芯片中文手册

3314A函数发生器维修手册

DMT0660数字万用表产品说明书

华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法

TPS54202H降压转换器评估模块用户指南

STM32F101x8/STM32F101xB手册

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

斯坦福探索深度神经网络可解释性决策树是关键