昇思推出基于AlphaFold2算法的蛋白质结构预测推理工具

电子说

1.3w人已加入

描述

近日,昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具。

该工具首次提供了基于昇腾AI基础软硬件平台的解决方案,并且端到端性能优于原版AlphaFold2 2-3倍。相关模型代码将依托于华为全场景AI框架昇思MindSpore进行开源、并将定期扩展与维护,旨在为全球产、学、研界领域伙伴提供优质的昇腾AI软硬件解决方案。

蛋白质在分子生物学的中心法则中具有十分重要的地位,在各种生命过程中不可或缺。传统的药物设计一般要通过大批量筛选,寻找易与目标蛋白质分子紧密结合、易合成且没有毒副作用的化合物来完成,因此研发周期长、费用高,而在了解蛋白质的空间结构后可减少寻找药物的盲目性,从而缩短研发周期并降低成本。

因此,准确、快速的蛋白质结构预测不仅可以在学术研究领域帮助科学家快速获得或验证关键蛋白结构,促进人们对重要生命过程中分子机理的理解,而且在医疗健康和生物工程领域也能作为有力的工具,引发药物靶点发现、功能蛋白设计(如抗体和人工酶)以及大分子(蛋白)或小分子药物高通量虚拟筛选的革命。

传统蛋白质结构预测方法一直存在计算精度不足的缺陷,直至2020年谷歌DeepMind团队基于AlphaFold2利用计算机高效准确获取蛋白质空间结构取得CASP14比赛(全球蛋白质结构预测比赛)中蛋白质3D结构预测的榜首,才让这一缺陷得到弥补。蛋白质结构预测工具精度可与实验方法相媲美,这一成就被Nature等杂志喻为“前所未有的进步”。

本次北大高毅勤课题组成功推出基于昇腾AI的蛋白结构预测工具,大大降低了广大生物医疗实验工作者的使用门槛,也将为生物蛋白质领域的基础研究与应用工作提供助力。

该工具依托昇思MindSpore,可对氨基酸序列长度2000+的蛋白质结构解析,能覆盖约99%以上的蛋白序列。同时,借助异构计算架构CANN(Compute Architecture for Neural Network)释放昇腾AI处理器的澎湃算力,通过软硬件协同优化大大提高了蛋白质预测的计算效率。参考DeepMind于2021年7月份开源的蛋白质结构预测模型AlphaFold2,本次开源的蛋白质结构预测推理工具模型部分与其相同,在多序列比对阶段,采用了MMseqs2进行序列检索,相比于原版算法端到端运算速度有2-3倍的提升。

针对蛋白质结构预测及折叠问题,联合团队未来还会发布创新的全栈(算法+软件+硬件)自主创新技术,同时也会牵手更多的学术科研界合作伙伴,期望能够在蛋白质结构预测领域上共同探索和进步,助力医学、生物科学等领域的发展,促进国内相关基础研究的发展。

代码开源路径:

https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE/mindsponge/fold

昇思MindSpore开源地址:

Gitee:https://gitee.com/mindspore/mindspore

Github:https://github.com/mindspore-ai/mindspore

编辑:jq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分