2015年,华大基因在深圳盐田运营着全球最大的基因组学研究中心,其主导建设的深圳国家基因库一期基本完工,样本量已达840万份。十年后的今天,这座被称为“生物银行”的基因库已正式运营多年,样本保存量突破数千万份,成为全球生命科学领域不可或缺的基础设施。
国家基因库的核心理念是“像存钱一样存你的基因”——将个人或物种的血液、细胞、DNA、RNA等生物样本长期储存,为精准医疗、物种保护、农业育种等提供数据支撑。华大基因董事长汪建曾将其形容为每个人的“生物银行”。按最新规划,该基因库目前已实现3000万份以上可溯源生物样本的自动化存储与管理,其中人类医学健康相关样本占主导。
基因测序技术的进步是这一愿景实现的基石。目前,华大基因旗下拥有超过200台高通量测序仪,24小时自动化运行,单台机器每天可产生数万亿碱基对的序列数据。以一部高清电影4GB、时长1.5小时计算,国家基因库的总数据量相当于一部需要连续观看4万年的高清电影。
精准医疗的核心在于通过基因测序寻找“错别字”。华大基因董事长汪建本人便是一位首批“试验者”:2002年他被诊断出冠心病后,通过基因检测发现了糖脂代谢、心血管猝死及肿瘤等多类易感基因,随后结合基因数据精准用药,并持续10年记录超过14TB的多组学健康数据(含遗传、蛋白、代谢、菌群、环境、运动等),成功实现了疾病的风险管控。这一模式成为精准医疗的早期实践范例。
2015年,美国启动“精准医疗计划”,进一步推动了全球范围的基因测序应用。中国国家基因库在此基础上,建立了覆盖出生缺陷、传染病、肿瘤三大领域的基因检测体系。超过50%的疾病可通过基因测序提前防范:例如,无创产前检测可筛查染色体异常;通过病毒基因测序可快速锁定埃博拉、SARS等病原体;肿瘤基因检测则能识别驱动突变,指导靶向用药。然而,基因并非单一作用,疾病的发生涉及多基因、多环境因素的复杂交互,需要积累海量人群数据才能实现精准解读。
自2011年获批组建以来,深圳国家基因库已从单一存储平台发展为贯穿“资源-科研-产业”的全链条枢纽,不仅保存了中国特有的遗传资源,还推动了基因组学在精准医疗、生物多样性保护、农业分子育种等领域的转化应用。截至2025年,基因测序成本已降至数百美元/基因组,精准医疗正从概念走向常规诊疗,而国家基因库作为“数字生命”的基石,其战略价值日益凸显。