电子说
2017年12月,谷歌发布了一款新的人工智能工具,可利用基因测序数据准确地构建人类的基因组图像。虽然科学家在约十五年前就已经首次完成人类基因组的测序工作,但在十五年后的今天,理解编码人类生命的海量数据仍然是艰难挑战,而这正是机器学习技术擅长解决的那类问题。
谷歌于2017年12月4日星期一发布了一款名为DeepVariant的工具。该工具使用最新的人工智能(AI)技术,通过测序数据构建更加准确的人类基因组图像。
DeepVariant可帮助将高通量测序读数转换为全基因组图像。它会自动识别测序数据中的小型插入和缺失突变,以及单碱基对突变。
高通量测序技术在二十一世纪初得到广泛应用,让基因组测序变得更加普遍。但使用此类系统生成的数据仅能提供有限且容易出错的全基因组概况。对于科学家而言,将测序流程中生成的随机错误与小型突变区分开来十分具有挑战性,特别是在基因组的重复部分。这些突变可能会与癌症等疾病直接相关。
目前存在多款可用于解读此类读数的工具,其中包括GATK、VarDict和FreeBayes。但是,这些软件程序通常使用简单的统计方法和机器学习方法,尝试通过排除读取错误来确定突变。
“其中一个挑战在于基因组的疑难部分,每款[工具]都有其优势和劣势,”测试过DeepVariant早期版本的哈佛大学公共卫生学院研究科学家Brad Chapman表示。“这些疑难部分对于临床测序工作而言日益重要,因而必须采用多种方法。”
DeepVariant由来自谷歌大脑(Google Brain)团队(专注于开发和应用人工智能技术)和Verily(专注于生命科学领域的Alphabet[前身为谷歌]子公司)的研究人员开发。
该团队通过Genome in a Bottle(瓶中基因组,GIAB)项目收集了数百万高通量读数及全测序基因组。这个项目是公立部门和私立部门联合推动使用基因组测序工具及技术的成果。他们向深度学习系统提供数据并精心调整模型参数,直到相关模型学会以高准确度解读测序数据。
2016年,DeepVariant在美国食品药品监督管理局(FDA)举办的PrecisionFDA Truth Challenge比赛中赢得了第一名,这项比赛旨在推动更加准确地进行基因测序。
“DeepVariant的成功具有重要意义,因为它表明在基因组学领域,深度学习技术可用于自动训练表现优于复杂手动操作系统的系统,”加拿大Deep Genomics公司的首席执行官Brendan Frey说道。
DeepVariant的发布是机器学习技术有望推动基因组学进步的最新标志。
Deep Genomics是尝试使用人工智能方法(例如深度学习)梳理出疾病的发病基因并确定可能的药物疗法的数家公司之一。
全部0条评论
快来发表一下你的评论吧 !