完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
随着视频、语音识别、自然语言处理、推荐系统等中基于图像和手势识别的应用和服务的数量不断增加,对高性能人工智能训练计算的需求迅速增加,并在加速增长。随着需求的增加,需要更高的训练速度、吞吐量和容量,这就转化为对训练系统高效扩展的日益增长的需求。
典型的深度学习训练算法包括多种类型的算子,这些算子加起来要进行数十亿次运算。这些大量的操作可以通过使用先进GPU提供的固有并行处理来加速。然而,GPU主要用于高效渲染图形,而不是执行深度学习工作负载。深度学习工作负载的GPU效率低下严重影响了云平台和数据中心的运营成本。为了解决这个问题,哈瓦那实验室开发了从头开始设计的人工智能训练处理器解决方案,以满足大型DNN工作负载的大规模计算需求,并为大规模系统提供前所未有的效率:高迪训练处理器。在训练过程中,神经网络的内部参数会针对目标应用进行调整和优化。一个典型的网络包含数十亿个内部参数,所有这些参数在训练时都经过多次调整和更改,导致处理时间非常长,即使在大规模多GPU系统上也是如此。本文对培训过程作了进一步的阐述。尽管近年来在GPU硬件、网络架构和训练方法方面取得了重大进展,但事实仍然是,在单机上进行网络训练可能需要不切实际的长时间。幸运的是,我们不局限于一台机器。为了实现深度神经网络的高效分布式训练,已经进行了大量的研究和开发。本白皮书对Gaudi Training系统进行了技术回顾,该系统是分布式DNN高性能计算的基础设施
|
|
相关推荐
|
|
只有小组成员才能发言,加入小组>>
3个成员聚集在这个小组
加入小组232浏览 1评论
在DL Workbench 2022.1中转换模型时遇到的错误问题
313浏览 1评论
使用OpenVINO推断时收到ImportError: DLL load failed while importing ie_api错误
423浏览 1评论
如何将PyTorch模型与OpenVINO trade结合使用?
997浏览 1评论
求助,无法找到rdquo;OpenCV ldquo提供的封装配置文件求分享
540浏览 1评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2025-1-6 12:38 , Processed in 0.604786 second(s), Total 74, Slave 55 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (威廉希尔官方网站 图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号