越来越多的资助者和期刊政策现在要求神经科学家共享他们产生的数据。但要真正获得好处,数据必须被良好地共享——这在神经科学中绝非易事,该领域在空间尺度上产生多种复杂的数据类型。什么能激励神经科学家花费时间和资源,使他们共享的数据对他人真正有用?如果没有足够的支持,新的数据共享政策有可能变成仅仅是“打勾”的练习。如果我们真的想改变数据管理和共享的文化,我们必须专注于改善数据提交体验。在这些早期、关键的大规模数据共享日子里,我们必须鼓励存储库采取更以客户服务为导向的数据提交方法,并提供必要的支持。最有效的做法是,存储库必须努力引导和协助研究人员完成提交过程,而不仅仅是向他们指出文档或提供关于他们失败地方的反馈。本文基于《The Transmitter》的观点文章,系统解析数据共享中的客户服务方法以及数据管理员的重要性。
一、数据共享的挑战
| 挑战 | 描述 |
|---|---|
| 准备数据是重大负担 | 为存储库准备数据,特别是需要严格遵守数据和元数据标准的存储库,是研究者面临的重大负担 |
| 研究者缺乏技能 | 数据生产者通常对数据有深刻理解,但不具备优化数据以便重用的数据/元数据标准的思维方式、知识或资源 |
| 低质量元数据 | 研究者经常提交低质量的元数据 |
| 培训不是唯一解决方案 | 仅仅为研究者提供更好的数据管理或数据科学培训不能解决问题 |
二、解决方案:数据管理员
| 方面 | 描述 |
|---|---|
| 角色 | 知识工程师和数据管理员 |
| 职责 | 根据特定数据存储库的标准格式化和记录数据;审查提交的数据,必要时与提交者互动以确保合规性;提供额外服务,如将元数据映射到受控词汇表或用关键词标记数据 |
三、以客户服务为导向的存储库示例
| 存储库 | 描述 |
|---|---|
| EBRAINS(前欧洲人类脑计划神经信息学平台) | 投资于管理员以改进提交数据的一致性和质量 |
| SPARC(刺激外周活动以缓解疾病) | 使用基于脑成像数据结构的跨模态数据标准SPARC数据结构;管理员与研究者建立良好关系,承认过程困难时并协助他们克服障碍 |
| 脊髓损伤开放数据共享库 | 投资于管理员 |
| 创伤性脑损伤开放数据共享库 | 投资于管理员 |
四、SPARC项目的经验教训
| 方面 | 描述 |
|---|---|
| 初期 | 科学家发现提交过程令人沮丧且劳动密集,导致许多愤怒的电子邮件 |
| 管理员的作用 | 管理员与研究者建立尊重、支持的关系,使他们的体验负担大大减轻 |
| 结果 | 尽管初期有显著挫折,但当调查时,许多研究者表示即使他们的SPARC特定资金结束后,他们仍打算继续使用SPARC作为数据共享平台 |
五、管理员对研究者的好处
| 好处 | 描述 |
|---|---|
| 数据变得FAIR | 数据不仅对社区可发现、可访问、可互操作、可重用,对原始实验室也是如此 |
| 长期可用性 | 当博士后离开时,他们的数据可以被可靠地找到、访问和理解 |
| 学习机会 | 当研究者与管理员合作时,他们开始欣赏存储库的要求如何服务于整体数据管理,并开始在自己的实验室中开发促进共享的实践 |
六、成本考虑
| 方面 | 描述 |
|---|---|
| 人类管理昂贵 | 人类管理是昂贵且难以扩展的,资助者通常不愿意为此付费 |
| 自动化潜力 | 在SPARC项目中,一位年轻研究者开发了一个名为SODA的软件向导,用于自动化文件级操作,并逐步指导研究者完成过程 |
| 人工智能的影响 | 可以预期人工智能的快速发展将对管理、数据集成和其他数据挑战产生重大影响 |
七、结论:客户服务导向的管理是释放数据科学全部力量的关键
如果我们真的想改变数据管理和共享的文化,我们必须专注于改善数据提交体验。最有效的做法是,存储库必须采取更以客户服务为导向的数据提交方法。投资于以客户服务为导向的管理(而不是通过降低要求)将大大有助于释放数据科学在这一最复杂器官——大脑上的全部力量。
核心信息:
-
数据共享政策有变成“打勾”练习的风险,如果没有足够的支持。
-
研究者缺乏准备数据以供重用的技能。
-
数据管理员可以格式化和记录数据,与提交者互动,并提供额外服务。
-
以客户服务为导向的存储库(EBRAINS、SPARC)已投资于管理员,并看到积极的结果。
-
管理员帮助研究者理解存储库的要求,并欣赏数据管理实践。
-
人类管理是昂贵的,但自动化(SODA)和人工智能可以提供帮助。
参考来源:
Martone, M. (2023). Incentivizing data-sharing in neuroscience: How about a little customer service? The Transmitter.