0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程开源高性能线性代数模板库MUTLASS

摩尔线程 来源:摩尔线程 2024-11-13 11:53 次阅读

近日,摩尔线程宣布开源高性能线性代数模板库MUTLASS,以便开发者能够更高效针对摩尔线程全功能GPU的MUSA Core及Tensor Core等单元进行编程,加速基于国产GPU的算子开发以及算法创新。

在数值计算和深度学习领域,矩阵乘法(GEMM)及其变种(如FlashAttention、Convolution)是构建复杂上层应用的基石。然而,为了追求更高的算子融合效率或者更创新的算法,开发者们往往需要超越标准化计算接口的限制,如标准BLAS接口以及芯片厂商的计算库接口,以实现高性能的定制化算子。

MUTLASS(MUSA Templates for Linear Algebra Subroutines)正是为满足这一需求而设计。作为摩尔线程专为MUSA架构优化的高性能计算库,MUTLASS是基于开源模板库CUTLASS进行的MUSA适配和定制化开发、优化,针对矩阵乘法及相关变种,MUTLASS提供了一系列高性能的C++模板组件,并采用了与muDNN库类似的分层分解及数据搬运策略,以确保性能的充分发挥。

在本次开源的版本中,摩尔线程适配了CuTe后端库,为其增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等多种数据精度,并以此为基础,初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持。

借助MUTLASS,开发者们既可以灵活复用不同层级的模板组件,也可以按需修改各种模板组件的实现细节,以较低的开发成本实现定制化的高性能算子,从而在摩尔线程全功能GPU上充分释放性能,并尝试更多的算法创新。

摩尔线程将持续优化MUTLASS的性能,并不断引入新的功能。我们诚邀广大开发者体验MUTLASS,并提供宝贵的反馈意见,共同促进MUTLASS在性能和功能上的持续完善,携手推动基于国产GPU的生态建设。

关于摩尔线程

摩尔线程成立于2020年10月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。

我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4736

    浏览量

    128929
  • 开源
    +关注

    关注

    3

    文章

    3342

    浏览量

    42487
  • 摩尔线程
    +关注

    关注

    2

    文章

    200

    浏览量

    4564

原文标题:开源MUTLASS|摩尔线程加速基于国产GPU的算子开发以及算法创新

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    摩尔线程完成股改,筹备上市

    近日,摩尔线程智能科技(北京)股份有限公司(简称“摩尔线程”)宣布已完成股改,并正积极筹备上市。据国家企业信用信息公示系统最新查询结果显示,摩尔
    的头像 发表于 11-12 14:15 439次阅读

    摩尔线程成立摩尔学院,赋能GPU开发者

    近日,摩尔线程宣布正式成立摩尔学院,为GPU开发者生态建设揭开新篇章。摩尔学院作为一个专业的GPU技术培训与交流平台,现已正式对外开放。
    的头像 发表于 10-28 17:03 443次阅读

    摩尔线程与超图软件完成产品兼容认证

    。 据悉,为了确保产品间的兼容性,摩尔线程与超图软件进行了严格的测试工作。经过双方的努力,适配调优后的软件在摩尔线程GPU上展现出了卓越的性能
    的头像 发表于 10-24 10:25 455次阅读

    摩尔线程与羽人科技完成大语言模型训练测试

    近日,摩尔线程与羽人科技携手宣布,双方已成功实现夸娥(KUAE)千卡智算集群与羽人系列模型解决方案的训练兼容适配。在本次测试中,羽人科技通过摩尔线程夸娥千卡智算集群,高效完成了70亿参
    的头像 发表于 08-27 16:19 530次阅读

    摩尔线程正式开源音频理解大模型MooER

    近日,国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源其自主研发的音频理解大模型MooER(摩耳)。这一举动标志着我国在音频处理与理解领域迈出了坚实的一步,特别是在基于国产硬件的AI模型研发上取得了显著成就。
    的头像 发表于 08-27 15:24 501次阅读

    摩尔线程携手智源研究院完成基于Triton的大模型算子适配

    近日,摩尔线程与北京智源人工智能研究院(简称:智源研究院)已顺利完成基于Triton语言的高性能算子FlagGems的适配工作。得益于摩尔
    的头像 发表于 08-02 11:06 870次阅读

    摩尔线程携手东华软件完成AI大模型推理测试与适配

    近日,摩尔线程与东华软件云筑AI创新中心宣布,双方已完成大模型推理测试与适配。依托摩尔线程的全功能GPU国产算力,东华软件打造安全可信的基于私有化大模型的“智多型(A.I.Cognif
    的头像 发表于 07-31 10:51 739次阅读

    摩尔线程和乐创能源签署战略合作协议

    近日,摩尔线程和乐创能源签署了战略合作协议,双方将聚焦能源大模型的创新与应用,围绕新能源领域的电池、新能源发电、负荷管理、需求侧响应等产品技术方向,共同研发能源大模型。依托摩尔线程全功
    的头像 发表于 07-11 14:35 721次阅读

    摩尔线程与智谱AI完成大模型性能测试与适配

    近日,摩尔线程与智谱AI在人工智能领域开展了一轮深入的合作,共同对GPU大模型进行了适配及性能测试。此次测试不仅涵盖了大模型的推理能力,还涉及了基于摩尔
    的头像 发表于 06-14 16:40 1078次阅读

    摩尔线程和滴普科技完成大模型训练与推理适配

    近日,摩尔线程与滴普科技宣布了一项重要合作成果。摩尔线程的夸娥(KUAE)千卡智算集群与滴普科技的企业大模型Deepexi已完成训练及推理适配,共同实现了700亿参数LLaMA2大语言
    的头像 发表于 05-30 10:14 546次阅读

    集特摩尔线程显卡#显卡

    显卡摩尔线程
    jf_67464575
    发布于 :2024年05月07日 15:11:28

    国产显卡摩尔线程MTT S30讲评

    摩尔线程
    国产计算机小秦
    发布于 :2024年03月20日 16:20:37

    摩尔线程MUSA/MUSIFY未受影响

    近日,我们关注到网络上对于英伟达CUDA兼容相关的报道,并对摩尔线程MUSA/MUSIFY也表示了关切。
    的头像 发表于 03-06 09:50 736次阅读

    国产摩尔线程显卡驱动重磅升级!

    今日,摩尔线程正式发布版本号为v250.60的Windows驱动程序,着重对DirectX 11游戏性能进行了大幅优化。
    的头像 发表于 02-21 09:13 1084次阅读
    国产<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>显卡驱动重磅升级!

    MTVerse XR重磅上线,摩尔线程元计算版图稳步展开

    的应用程序通过高性能网络和USB流式传输到XR设备。结合摩尔线程全功能GPU的强大能力,为用户提供高质量的XR体验。 MTVerse XR提供了低延时、高质量XR串流能力,同时支持无线WIFI和有线USB
    的头像 发表于 01-09 20:14 938次阅读