根据埃米编辑公众号的原创内容,2020年,诺贝尔化学奖得主Frances H. Arnold教授所发表的一篇《Science》论文因部分关键实验数据缺失而被撤回。对此,Arnold教授在推特上诚实地承认了这一问题,并表示这是她科研生涯中的一次深刻教训。
实际上,由于数据处理失误导致的撤稿事件并不少见,但相关的撤稿通知中常常缺乏详细的说明和解释,这使得作者在感到懊恼的同时,常常也无从理解问题所在。
一、数据处理失误的类型
2025年1月,Nature发布了一篇名为《由于诚实错误造成的撤稿极具压力,研究人员表示》的文章。该文通过6680份调查问卷,总结出了5种常见的数据处理失误,让我们一起看看这些错误及其避免方法。
研究人员通过Retraction Watch数据库,识别出5041篇因数据处理错误而被撤回的论文。针对6680名作者的问卷调查,发现以下五种最常见的数据处理错误:
- 数据处理和分析错误(19%):在数据建模或统计分析中出现错误,导致实验结果偏离事实。
- 数据编码错误(14%):在脚本编写阶段,错误的变量定义或操作逻辑可能直接改变分析结果。
- 数据文件丢失(11%):原始实验数据未妥善保存或备份,导致无法复现研究。
- 数据输入错误(11%):手动录入数据时易出错,包括误输入、漏输或单位不一致。
- 数据命名不当(8%):文件命名混乱,版本管理不清晰,或命名不符合规范,导致数据计算和运行错误。
其他错误类型还包括数据传输错误(7%)、错误报告(6%)、编程错误(4%)、文件不充分或不正确(4%)、数据选择/合并错误(4%)、项目管理错误(2%)、数据点连接不正确(2%)、偏离协议(2%)、数据或文件组织错误(2%)。
这些失误的常见原因包括不专心(14%)、技术性问题(13%)、沟通失误(12%)、粗心大意(11%)和缺乏经验(9%)等。
二、如何避免数据处理失误
为了有效避免数据处理失误,研究团队可以采取以下措施:
- 明确数据管理责任:项目应指定专人负责数据管理,确保责任明确。
- 定期培训和学习:进行数据管理及工具使用的培训,以提升技能水平。
- 引入双重核查机制:数据提交前进行二次审查,以减少因粗心或遗漏造成的错误。
- 加强技术支持:投入资源采购可靠的存储设备,并使用自动化备份工具。
此外,研究人员也希望期刊能够提供更明确的指引,告知哪些错误可能导致撤稿,哪些则可以通过修改来补救,这对于作者和编辑都十分重要。
与其因撤稿而懊恼,不如提前做好防范:用心对待数据细节,谨慎处理每一个环节。每位科研工作者都应时刻保持对“数据”的高度重视!
你是否也有过“数据翻车”的经历呢?关注尊龙凯时公众号,并回复“礼包”,即可免费领取100+写作投稿资料包和30个投稿问题解析。
关于尊龙凯时:尊龙凯时是一家来自美国的专业机构,致力于为科研学者提供论文润色、学术翻译和期刊出版支持等服务。所有润色工作均由美国本土经验丰富的编辑完成,以确保优质服务。