云计算正在成为生物医学领域的核心驱动力。2015年8月14日,北京贝瑞和康生物技术有限公司与阿里云宣布合作,共同打造以海量中国人群基因组数据为核心的数据云平台,旨在实现对个人基因组数据的精准解读。这一合作标志着中国在基因组大数据领域迈出了重要一步。
双方合作的“神州基因组数据云项目”将首先聚焦于基因组大数据在云平台上的批量计算、分析及存储,进而推动基因大数据领域的前沿探索。贝瑞和康首席生物信息官于福利博士表示:“打造基因组大数据,相当于建立了一个中国人基因版的《本草纲目》,将记载中国人群最核心的基因信息,为重大疾病的预测、预防、诊断和治疗奠定基础。”
中国是全球出生缺陷高发地区之一。每年1600万至2000万新生儿中,有80万至120万出生缺陷儿。1996年至2010年,新生儿出生缺陷发生率增幅达70.9%,每万名新生儿中就有149.9人患有先天性缺陷。这一现状有望通过“神州基因组数据云”项目得到改善。贝瑞和康已构建包含超过四十万份基因组数据的中国人群基因组大数据库,深入挖掘这些数据将揭示中国人群遗传突变分布,极大提升遗传疾病诊断的效率和精准度。
贝瑞和康作为国际领先的基因测序技术临床转化服务商,专注于为临床医学提供“无创式”整体解决方案,是无创DNA产前检测和肿瘤循环DNA个体化医疗基因检测的行业领导者。基因测序技术能够从血液或唾液中分析测定基因全序列,预测多种罕见疾病的可能性,如地中海贫血。
随着下一代基因测序、生物质谱和医学成像等技术的迅猛发展,大数据浪潮为生物医学带来了前所未有的机遇,将根本性改变基础研究和医疗实践。然而,生物医学领域数据爆炸式增长也对海量数据的存储和分析提出新挑战。云计算通过虚拟化大量计算、存储和软件资源,形成共享资源池,有效满足生物医学对IT资源的弹性需求。
新一代基因测序技术通常需要30X的测序深度才能获得准确信息,这意味着一个人的基因组检测约产生90Gb数据,在普通电脑或小型服务器上运行极为困难。阿里云作为全球领先的云计算服务平台,提供海量计算、存储资源和大数据处理能力。根据IDC报告,阿里云是国内最大的公共云计算服务提供商。
此次合作基于阿里云批量计算服务的强大能力,利用云计算优势降低成本、提高数据分析速度。阿里云批量计算服务是一种适用于大规模并行批处理作业的分布式云服务,适用于生物基因分析、渲染、多媒体转码、科学计算等多个领域。阿里云高级专家林河山介绍:“借助批量计算服务,用户可以调动海量计算资源快速完成基因大数据处理。该服务提供简单易用的API,支持通过有向无环图灵活组建工作流,计算资源管理、作业调度和数据分发由系统自动完成。同时,支持自定义镜像,并允许应用通过网络文件系统协议高效访问阿里云对象存储上的数据,使原有分析流程轻松上云。”
业内专家预计,双方合作完成的基因组数据云将对中国临床医学的精准诊断、预防和治疗产生深远推动力。借助阿里云的批量计算服务,用户将更便捷、更迅速地完成基因大数据计算,大幅降低成本。云计算的赋能将为研究人员开展大规模基因组学研究打开“方便之门”,催生一批影响人类健康的变革性成果。