执行全基因组和跨基因组数据分析的能力可以大大减少新的生物发现所需的时间。这就提出了生物信息学数据库研究中涉及数据表示和数据集成的重要问题。传统的数据库系统不支持基本的生物数据类型(如序列位置)和工具(如流行的BLAST序列比对工具),这迫使研究人员反直观地表示生物知识,并实现数据操作代码。本文介绍了生物索引,一种用于表示和管理生物信息的概念性基础设施,它允许在现代数据库系统中查询这些信息。本文还描述了一个实现-BLASTgres,一个PostgreSQL数据库系统的扩展-提供可索引的生物信息数据类型和可连接的BLAST对齐。BLASTgres中的序列位置数据类型具有特殊的意义,因为它是可索引的,对BLAST生成的序列比对信息至关重要,并且在现有的生物信息中普遍存在。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !