“这项工作让所有人认识到,基因组测序不仅是面向未来的研究和医学应用,更可以对患者护理产生即时影响。” —— Jeroen de Ridder,乌得勒支大学医学中心教授
高达四分之一的进入重症监护的儿童患有未确诊的遗传病。要获得正确治疗,首先需要诊断——这通常意味着要对其基因组进行测序。传统流程耗时长达七周。对于危重患儿,时间窗口往往以小时甚至分钟计算,七周的等待太过漫长。
从七周到八小时:流式分析改变游戏规则
Sneha Goenka 与她的同事们设计了一套快速测序流程,能在不到八小时内提供基因诊断。Goenka 的软件计算和硬件架构设计是加速流程中每一阶段的关键。
传统诊断流程:采血 -> DNA提取(约3小时)-> 测序(约1.5小时)-> 数据处理(约21小时) -> 结果判读 -> 总时长可达数周。
Goenka 的核心创新是构建了一个实时流式系统:“流式”分析测序数据,在数据生成的当下就进行分析,就像在线流媒体播放一部电影,而不是下载完整部影片再观看。为此,她设计了一套云计算架构来聚合更强大的计算能力。
三大技术突破:
-
优化云上传:精简测序仪与云端之间的请求,计算所需的确切通信通道数量,并创建算法以最高效方式重复利用这些通道。
-
分布式碱基识别:编写软件将数据流直接自动分配给云端专用节点,避免了中央节点协调的低效和易错。
-
并行处理:编写定制程序,使对齐步骤可以在前一批数据碱基识别完毕后立即触发,同时启动下一批数据的碱基识别。
这些改进将分析基因组突变所需的总时间从约20小时压缩至1.5小时。加上最后的基因变异筛选和人工审核(约3小时),诊断可在6-8小时内完成。
实战检验:为马修赢得移植机会
2021年,13岁的马修因呼吸困难和心力衰竭被送入斯坦福儿童医院。医生需要知道其心脏炎症是由病毒还是基因突变引起,这决定了他是否需要心脏移植。血液样本在周四被采集,而移植委员会在周五开会决策。
当时正在孟买的Goenka彻夜未眠,远程监控计算。最终测序结果显示存在致病性基因突变。马修于次日被列入移植名单,三周后成功接受心脏移植。Goenka的技术迄今已在包括马修在内的26名患者中得到测试。斯坦福大学教授Euan Ashley表示,该流程“直接影响着斯坦福重症监护室新生儿的医疗护理”。
更快、更包容:技术推广与泛基因组计划
Goenka已与同事共同创办公司,致力于将该技术推向全球。同时她正在进一步精化计算流程,有望将诊断时间缩短至约六小时。她还在开发更具包容性的软件以解决参考基因组主要偏向欧洲裔的问题。她将利用人类泛基因组项目(构建来自更广泛种群的参考基因组)的数据,为患者所属人群定制变异筛选过滤器,提高对其他族裔患者的诊断准确性。
Goenka因此获得了2025年麻省理工科技评论“年度创新者”称号。她的成功不仅源于天才的技术创想,更根植于将计算机工程应用于临床医学、挽救生命的坚韧信念。正如她所说,这个项目不再仅仅是“为了提速而提速”,而是成为了“我们多快能得到这个结果来挽救这个人的生命”的生死时速。
关键术语表
| 术语 | 解释 |
|---|---|
| 基因组测序 | 确定个体完整DNA序列(即基因组)的过程,用于识别可能导致疾病的遗传变异。 |
| 碱基识别 | 将测序仪产生的原始电信号数据转化为对应的DNA碱基(A、T、C、G)序列的计算过程,是数据分析的关键一步。 |
| 参考基因组 | 作为标准参照的数字化基因组序列,通常来自少数个体。新测序的基因组需要与之比对,以识别变异。 |
| Oxford Nanopore测序技术 | 一种能够对极长片段的单条DNA分子进行实时测序的技术,为流式分析提供了可能。 |
| 人类泛基因组项目 | 一项旨在绘制更全面、更能代表全人类遗传多样性(包括不同种族和地理起源)的参考基因组的国际计划。 |
| 云计算架构 | 通过网络(通常是互联网)按需提供计算资源(如服务器、存储、数据库、软件)的设计与部署方式。 |
| 计算生物学/生物信息学 | 应用计算机科学、数学和统计学的方法来处理、分析和解释生物学数据(特别是基因序列数据)的交叉学科。 |
——本文基于 MIT Technology Review “年度创新者”系列报道编译,介绍获奖者的技术突破与个人经历