NVIDIA 发布的 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。 CUDA 继续推动 GPU 加速度的边界,并为 HPC 、可视化、 AI 、 ML 和 DL 和数据科学中的新应用奠定基础。
CUDA 11.6 有几个重要特性。这篇文章概述了关键功能:
GSP 驱动程序架构现在默认为图灵和安培 GPU
新 API 允许禁用实例化图中的节点
完全支持 128 位整数类型
协作组命名空间更新
CUDA 编译器更新
Nsight Compute 2022.1 版本
CUDA 11.6 附带 R510 驱动程序,这是一个更新分支。 CUDA 11.6 工具包可供下载 。
GSP 驱动程序体系结构
GSP 驱动程序体系结构现在是所有列出的图灵和安培 GPU 的默认驱动程序模式。较旧的驱动程序体系结构作为后备支持。有关更多信息,请参阅 R510 驱动程序自述 。
实例化的图形节点 API 添加
我们添加了一个新的 API cudaGraphNodeSetEnabled,以允许禁用实例化图中的节点。在此版本中,支持仅限于内核节点。相应的 API cudaGraphNodeGetEnabled允许查询节点的启用状态。我们还添加了禁用空内核图节点启动的功能。
128 位整数支持
CUDA 11.6 包括 128 位整数(__int128)数据类型的完整版本,包括编译器和开发工具支持。主机端编译器必须支持__int128类型才能使用此功能。
协作组名称空间
协作组名称空间已更新为新函数,以提高命名、函数范围以及单元维度和大小的一致性。
CUDA 编译器
在编译过程中向目标安装的 GPU 添加了-arch=native编译选项。这扩展了现有的-gencode=arch=compute_xx,code=sm_xx体系结构规范
添加从nvlink创建 PTX 文件的功能
不推荐的功能
不推荐使用用于设备上 fork 和 join 并行的cudaDeviceSynchronize(),以便为具有更高性能的替换编程模型做准备。这些函数在本版本中继续工作,但这些工具会发出有关即将发生的更改的警告。
CentOS Linux 8 已经到了生命的尽头 在 2021 年 12 月 31 日,对这个操作系统的支持现在在 CUDA 工具包中被弃用。 CentOS Linux 8 支持将在未来版本中完全取消。
关于作者
Rob Armstrong 是 CUDA 工具包的主要技术产品经理。 20 多年来,他一直专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互特别感兴趣。
Arthy Sundaram 是 CUDA 平台的技术产品经理。她拥有哥伦比亚大学计算机科学硕士学位。她感兴趣的领域是操作系统、编译器和计算机体系结构。
Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高级产品营销经理。弗雷德拥有加州大学戴维斯分校计算机科学和数学学士学位。他的职业生涯开始于一名 UNIX 软件工程师,负责将内核服务和设备驱动程序移植到 x86 体系结构。他喜欢《星球大战》、《星际迷航》和 NBA 勇士队。
-
NVIDIA
+关注
关注
14文章
4985浏览量
103037 -
gpu
+关注
关注
28文章
4737浏览量
128939
发布评论请先 登录
相关推荐
评论