在2020年,诺贝尔化学奖得主Frances H. Arnold教授的一篇发表在《Science》的论文因关键实验数据缺失而被撤稿。对此,Arnold教授在推特上诚实地承认了这一问题,表示这是她科研生涯中的一次深刻教训。
实际上,由于数据处理失误导致的撤稿并不少见,而这种撤稿通知中通常缺乏具体细节的说明和解释,这使得作者在懊恼之余,还感到十分困惑。
一、数据处理失误的类型
2025年1月,《Nature》期刊发表了一篇题为《Retractions caused by honest mistakes are extremely stressful, say researchers》的文章。通过对6680份调查问卷的分析,研究人员总结出了五种常见的数据处理失误,我们一起来看看,并学习如何避免这些失误。
研究团队通过Retraction Watch数据库,识别出5041篇因数据处理错误而被撤回的论文,并对6680名作者进行了调查,询问他们对撤稿原因的理解和分析。在97份有效回复中,提炼出了五种最常见的数据处理错误:
- 数据处理和分析错误(19%):在数据建模或统计分析中出现错误,导致实验结果与实际不符。
- 数据编码错误(14%):常见于脚本编写阶段,错误的变量定义或操作逻辑可能直接影响分析结果。
- 数据文件丢失(11%):原始实验数据未妥善保存或备份,导致无法复现研究。
- 数据输入错误(11%):在手动录入时容易出现误输入、漏输或单位不一致的情况。
- 数据命名不当(8%):文件命名混乱、版本管理不清晰或命名不规范可能导致数据计算和运行错误。
此外,调查还发现其他错误类型,包括数据传输错误、错误的报告、编程错误等。这些错误的常见原因包括注意力不集中、技术性问题、沟通失误、粗心大意和缺乏经验。
二、如何避免数据处理失误?
为了减少数据处理中的错误,可以采取以下措施:
- 明确数据管理责任:为项目指定专人负责数据管理,确保责任明确。
- 定期培训和学习:进行数据管理和工具使用的相关培训,提高团队技能水平。
- 引入双重核查机制:在数据提交前进行二次审查,减少因粗心或遗漏造成的错误。
- 加强技术支持:投入资源购买可靠的存储设备,并使用自动化备份工具。
此外,作者们也希望期刊能够提供更明确的说明,哪些失误可能导致撤稿,哪些可以通过修改补救。这对作者和编辑都具有重要意义。
与其因撤稿而懊恼,不如提前做好防范。对待数据细节要用心,谨慎处理每个环节,每位科研工作者都应该紧绷“数据”这根弦。
你是否有过“数据翻车”的经历呢?关注尊龙凯时,获取更多关于数据管理和处理的相关知识和资源,帮助你在科研道路上少走弯路。
关于尊龙凯时:我们致力于为科研学者提供专业的论文润色、学术翻译和期刊出版支持,所有润色工作均由美国本土的资深编辑完成,确保服务质量,使你在科研上更为顺利。