摩尔线程开源高性能线性代数模板库MUTLASS-电子发烧友网

近日，摩尔线程宣布开源高性能线性代数模板库MUTLASS，以便开发者能够更高效针对摩尔线程全功能GPU的MUSA Core及Tensor Core等单元进行编程，加速基于国产GPU的算子开发以及算法创新。

在数值计算和深度学习领域，矩阵乘法（GEMM）及其变种(如FlashAttention、Convolution）是构建复杂上层应用的基石。然而，为了追求更高的算子融合效率或者更创新的算法，开发者们往往需要超越标准化计算接口的限制，如标准BLAS接口以及芯片厂商的计算库接口，以实现高性能的定制化算子。

MUTLASS（MUSA Templates for Linear Algebra Subroutines）正是为满足这一需求而设计。作为摩尔线程专为MUSA架构优化的高性能计算库，MUTLASS是基于开源模板库CUTLASS进行的MUSA适配和定制化开发、优化，针对矩阵乘法及相关变种，MUTLASS提供了一系列高性能的C++模板组件，并采用了与muDNN库类似的分层分解及数据搬运策略，以确保性能的充分发挥。

在本次开源的版本中，摩尔线程适配了CuTe后端库，为其增加了第三代MUSA架构的MMA计算原语，支持TF32/FP16/BF16/INT8等多种数据精度，并以此为基础，初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持。

借助MUTLASS，开发者们既可以灵活复用不同层级的模板组件，也可以按需修改各种模板组件的实现细节，以较低的开发成本实现定制化的高性能算子，从而在摩尔线程全功能GPU上充分释放性能，并尝试更多的算法创新。

摩尔线程将持续优化MUTLASS的性能，并不断引入新的功能。我们诚邀广大开发者体验MUTLASS，并提供宝贵的反馈意见，共同促进MUTLASS在性能和功能上的持续完善，携手推动基于国产GPU的生态建设。

关于摩尔线程

摩尔线程成立于2020年10月，以全功能GPU为核心，致力于向全球提供加速计算的基础设施和一站式解决方案，为各行各业的数智化转型提供强大的AI计算支持。

我们的目标是成为具备国际竞争力的GPU领军企业，为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4736

浏览量
128929
开源

开源

+关注

关注
3

文章
3342

浏览量
42487
摩尔线程

摩尔线程

+关注

关注
2

文章
200

浏览量
4564

原文标题：开源MUTLASS｜摩尔线程加速基于国产GPU的算子开发以及算法创新

文章出处：【微信号：moorethreads，微信公众号：摩尔线程】欢迎添加关注！文章转载请注明出处。

摩尔线程完成股改，筹备上市

近日，摩尔线程智能科技（北京）股份有限公司（简称“摩尔线程”）宣布已完成股改，并正积极筹备上市。据国家企业信用信息公示系统最新查询结果显示，摩尔

发表于 11-12 14:15 •439次阅读

摩尔线程成立摩尔学院，赋能GPU开发者

近日，摩尔线程宣布正式成立摩尔学院，为GPU开发者生态建设揭开新篇章。摩尔学院作为一个专业的GPU技术培训与交流平台，现已正式对外开放。

发表于 10-28 17:03 •443次阅读

摩尔线程与超图软件完成产品兼容认证

。据悉，为了确保产品间的兼容性，摩尔线程与超图软件进行了严格的测试工作。经过双方的努力，适配调优后的软件在摩尔线程GPU上展现出了卓越的性能

发表于 10-24 10:25 •455次阅读

摩尔线程与羽人科技完成大语言模型训练测试

近日，摩尔线程与羽人科技携手宣布，双方已成功实现夸娥（KUAE）千卡智算集群与羽人系列模型解决方案的训练兼容适配。在本次测试中，羽人科技通过摩尔线程夸娥千卡智算集群，高效完成了70亿参

发表于 08-27 16:19 •530次阅读

摩尔线程正式开源音频理解大模型MooER

近日，国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源其自主研发的音频理解大模型MooER（摩耳）。这一举动标志着我国在音频处理与理解领域迈出了坚实的一步，特别是在基于国产硬件的AI模型研发上取得了显著成就。

发表于 08-27 15:24 •501次阅读

摩尔线程携手智源研究院完成基于Triton的大模型算子库适配

近日，摩尔线程与北京智源人工智能研究院（简称：智源研究院）已顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。得益于摩尔

发表于 08-02 11:06 •870次阅读

摩尔线程携手东华软件完成AI大模型推理测试与适配

近日，摩尔线程与东华软件云筑AI创新中心宣布，双方已完成大模型推理测试与适配。依托摩尔线程的全功能GPU国产算力，东华软件打造安全可信的基于私有化大模型的“智多型（A.I.Cognif

发表于 07-31 10:51 •739次阅读

摩尔线程和乐创能源签署战略合作协议

近日，摩尔线程和乐创能源签署了战略合作协议，双方将聚焦能源大模型的创新与应用，围绕新能源领域的电池、新能源发电、负荷管理、需求侧响应等产品技术方向，共同研发能源大模型。依托摩尔线程全功

发表于 07-11 14:35 •721次阅读

摩尔线程与智谱AI完成大模型性能测试与适配

近日，摩尔线程与智谱AI在人工智能领域开展了一轮深入的合作，共同对GPU大模型进行了适配及性能测试。此次测试不仅涵盖了大模型的推理能力，还涉及了基于摩尔

发表于 06-14 16:40 •1078次阅读

摩尔线程和滴普科技完成大模型训练与推理适配

近日，摩尔线程与滴普科技宣布了一项重要合作成果。摩尔线程的夸娥（KUAE）千卡智算集群与滴普科技的企业大模型Deepexi已完成训练及推理适配，共同实现了700亿参数LLaMA2大语言

发表于 05-30 10:14 •546次阅读

集特摩尔线程显卡#显卡

显卡摩尔线程

jf_67464575
发布于 :2024年05月07日 15:11:28

国产显卡摩尔线程MTT S30讲评

摩尔线程

国产计算机小秦
发布于 :2024年03月20日 16:20:37

摩尔线程MUSA/MUSIFY未受影响

近日，我们关注到网络上对于英伟达CUDA兼容相关的报道，并对摩尔线程MUSA/MUSIFY也表示了关切。

发表于 03-06 09:50 •736次阅读

国产摩尔线程显卡驱动重磅升级！

今日，摩尔线程正式发布版本号为v250.60的Windows驱动程序，着重对DirectX 11游戏性能进行了大幅优化。

发表于 02-21 09:13 •1084次阅读

MTVerse XR重磅上线，摩尔线程元计算版图稳步展开

的应用程序通过高性能网络和USB流式传输到XR设备。结合摩尔线程全功能GPU的强大能力，为用户提供高质量的XR体验。 MTVerse XR提供了低延时、高质量XR串流能力，同时支持无线WIFI和有线USB

发表于 01-09 20:14 •938次阅读

搜索历史

摩尔线程开源高性能线性代数模板库MUTLASS

评论

摩尔线程完成股改，筹备上市

摩尔线程成立摩尔学院，赋能GPU开发者

摩尔线程与超图软件完成产品兼容认证

摩尔线程与羽人科技完成大语言模型训练测试

摩尔线程正式开源音频理解大模型MooER

摩尔线程携手智源研究院完成基于Triton的大模型算子库适配

摩尔线程携手东华软件完成AI大模型推理测试与适配

摩尔线程和乐创能源签署战略合作协议

摩尔线程与智谱AI完成大模型性能测试与适配

摩尔线程和滴普科技完成大模型训练与推理适配

集特摩尔线程显卡#显卡

国产显卡摩尔线程MTT S30讲评

摩尔线程MUSA/MUSIFY未受影响

国产摩尔线程显卡驱动重磅升级！

MTVerse XR重磅上线，摩尔线程元计算版图稳步展开