开放神经科学数据集的爆炸式增长催生了新一代具有数据科学专业知识的研究人员。艾伦人类大脑图谱、人类连接组计划、ENIGMA联盟等大规模数据集已被用于数万篇研究出版物中,以前所未有的方式推进了我们对大脑的理解。然而,美国新的联邦限制正在危及这些努力。自2025年1月以来,数千个网页和公共存储库中的数据集被删除或修改,以符合行政命令和政策变化。受影响的一个关键资源是ABCD研究(青少年大脑认知发展研究)——有史以来最大、最全面的青少年大脑发育研究。该研究一直在收集全面的性别相关信息,但最近的政策变化迫使所有性别相关信息从最新数据发布中被删除,且这些数据将不再被收集。纵向研究中特定变量的数据收集中断造成了永久性的科学理解空白——一旦特定的时间窗口在没有数据收集的情况下过去,这些缺口永远无法填补。本文基于《The Transmitter》的观点文章,系统解析数据删除对神经科学的影响、受影响的资源以及保护数据的行动呼吁。
一、开放神经科学数据集的变革性影响
| 数据集/倡议 | 描述 | 影响 |
|---|---|---|
| 艾伦人类大脑图谱 | 空间基因表达模式图谱 | 用于数千项研究 |
| 人类连接组计划 | 大脑结构和功能连接图谱 | 推进对大脑网络的理解 |
| ENIGMA联盟 | 整合神经成像和遗传学 | 帮助理解大脑结构、功能和疾病 |
| ABCD研究 | 11,000+名儿童(自2016年随访) | 迄今1,400+篇出版物;对发育的见解 |
二、新联邦限制的影响
| 影响 | 描述 |
|---|---|
| 数据删除 | 数千个网页和数据集从公共存储库中被删除或修改 |
| 数据收集停止 | 特定变量的数据收集被中断(如ABCD研究中的性别相关信息) |
| 纵向数据缺口 | 一旦特定的时间窗口在没有数据收集的情况下过去,这些缺口永远无法填补 |
| 研究计划破坏 | 依靠这些数据集的科学家必须重新思考他们的方法 |
| 职业影响 | 早期职业研究人员面临越来越大的压力,需要重新调整研究方向 |
三、受影响的具体资源
| 资源 | 影响 |
|---|---|
| ABCD研究 | 所有性别相关信息从最新数据发布中被删除;将不再收集这些数据 |
| 人口与健康调查计划 | 暂停(90+个国家,400+项调查,涵盖人口、心理健康、营养等) |
| 美国联邦数据集 | 2025年1月20日至3月25日期间,审查的232个数据集中近一半被实质性更改;仅13%的更改被记录 |
四、为什么纵向数据缺口特别有害
| 问题 | 描述 |
|---|---|
| 唯一性 | 纵向研究提供了关于个体随时间变化的独特见解 |
| 不可逆性 | 一旦特定的时间窗口过去,没有数据收集,这些缺口永远无法填补 |
| 世代影响 | 系统性地从正在进行的研究中消除变量将产生可能持续数代人的理解盲点 |
五、数据保护工作
| 努力 | 描述 | 局限性 |
|---|---|---|
| 数据救援项目 | 数据救援相关工作的中心枢纽 | 正在开发中 |
| 哈佛法学院图书馆Data.gov档案 | 联邦公共数据集档案 | 正在开发中 |
| GovWayback工具 | 访问美国政府网站的历史版本 | 正在开发中 |
| ABCD研究等 | 具有防止共享的数据使用协议 | 不包括在保护工作中 |
六、对科学家的行动呼吁
| 行动 | 描述 |
|---|---|
| 保护现有数据 | 建立安全、去中心化、开放访问的公共数据集档案 |
| 监测更改 | 建立透明系统以监测和记录科学数据集的更改 |
| 制定应急计划 | 正在进行的纵向研究应通过国际合作和私营伙伴关系制定应急计划 |
| 建立弹性研究计划 | 跨研究方法、资金来源和科学伙伴关系多样化 |
| 国际数据利用 | 利用其他国家的数据并设计可适应的研究计划 |
| 倡导 | 倡导保护基于证据的研究,以推进人类知识和改善公共卫生 |
七、对早期职业研究人员的建议
| 建议 | 描述 |
|---|---|
| 建立弹性研究计划 | 在专注和灵活性之间找到平衡 |
| 多样化资金来源 | 寻求联邦资助以外的资金 |
| 建立国际伙伴关系 | 建立国际科学伙伴关系 |
| 利用非美国数据 | 利用其他国家的数据 |
| 设计适应性程序 | 设计可以转向不同研究问题的研究计划 |
八、结论:数据是科学的基石
数据构成了现代科学的基础,支持着不受边界、信仰或偏见约束的发现。在没有数据的时代,我们失去了挑战虚假主张的能力,也失去了建立新发现的基础。当错误信息迅速传播时,科学数据的系统性移除正在阻碍研究进展,并削弱我们以经验证据对抗错误叙事的能力。
核心信息:
-
开放神经科学数据集催化了新一代数据科学研究人员。
-
美国的新联邦限制正在导致数据删除和收集停止。
-
ABCD研究等纵向数据一旦中断,造成的缺口永远无法填补。
-
数据删除威胁着职业生涯、研究计划和科学进步。
-
需要协调努力来保护数据访问、建立国际保障措施和维持研究连续性。
-
数据是区分事实与虚构的最有力工具。