AI“参与”同行评审喜忧参半

2025-04-21 00:04:56 来源:文章憎命网 分类:{typename type="name"/}

今年2月,参与加拿大蒙特利尔大学生态学家蒂莫西·波伊索在审阅自己论文的同行评审意见时,意外发现其中一份评审报告可能由AI代笔。评审他对此感到愤怒并在博客中痛斥:我递交论文参与评审,喜忧期待的参半是同行的思想碰撞。若这一前提不再,参与那么同行评审制度将沦为数字废墟。同行

英国《自然》杂志网站在3月27日的评审报道中指出,AI系统正以惊人速度渗透同行评审体系。喜忧多家出版商纷纷测试各种AI审稿系统,参半用于标记稿件中的参与文本谬误、数据漏洞,同行以及对文字进行润色等。评审一些平台甚至能一键生成完整AI评审报告。喜忧一些拥趸认为同行评审自动化不可避免,参半另外一些科学家则忧心AI未来可能最终主导同行评审过程,弱化甚至完全取代人类审稿人的角色。

AI“参与”同行评审喜忧参半

人工智能渗入评审生态

在ChatGPT等基于大语言模型(LLMs)的生成式AI工具掀起浪潮前,学术出版界已将AI技术引入同行评审环节,用于数据校验、研究结论提炼等辅助工作。但随着具备类人写作能力的生成式AI工具横空出世,这场技术革命也在学术界掀起一场风浪。

美国威利出版集团针对近5000名研究者的调研显示,约19%的受访者承认尝试过使用AI工具提高评审效率。更令人关注的是,对2023年—2024年AI领域会议论文的评审报告分析发现,7%—17%的评审报告存在由AI工具“深度润色”的迹象,这意味着修改幅度远超基础语法校正范畴。

当前,很多资助机构和出版商明令禁止评审人员在论文或基金评审中使用AI工具,主要担忧敏感信息经聊天机器人外泄。不过,美国哥本哈根大学科学家塞巴斯蒂安·波斯达姆·曼认为,若使用本地部署的离线AI工具,数据无需上传云端即可处理完成,大大降低了泄密风险。葡萄牙里斯本天主教大学组织行为学研究员德里琼·格鲁达补充道,离线LLMs犹如智能文字助手,能加速并优化评审意见的撰写过程,前提是AI工具仅作帮手而非代写全文。

尽管使用生成式AI工具日益普遍,但知名期刊仍对其持谨慎观望态度。2024年底针对78种顶级医学期刊AI评审指南的调查显示,59%的期刊完全禁止评审环节使用AI技术。其余期刊允许使用,但提出了不同要求。三大出版集团对AI评审的态度也大不相同。爱思唯尔集团目前禁止审稿人使用生成式AI工具辅助审稿;威利和施普林格·自然集团则允许“有限使用”,但须披露使用细节,并严禁将论文上传至在线平台。

智能助手纷纷上线

鉴于主流学术期刊对AI自主评审持审慎态度,科研团队纷纷开发辅助人类评审的生成式AI工具。

比如,斯坦福大学计算生物学家詹姆斯·周团队打造的“反馈代理”审稿系统,如同文字雕琢大师,能自动识别评审报告中出现的语义模糊等问题,并给审稿人提供相关建议。

荷兰阿姆斯特丹WBS公司开发的Eliza工具则展现出跨语言处理智能:不仅能向人类评审推荐参考文献,还能将其他语言的评审内容实时翻译成英文。创始人泽杰·卡尔森表示,这就像为审稿人配备了一款多语种秘书,但最终决策权仍在人类手中。据悉,该技术已经帮助《欧洲物理评论》杂志处理了23%的非英语评审内容。

由英论阁出版集团和查尔斯沃思属公司携手开发的“审议助手”则能快速识别违反匿名规则的论文。不过,该工具也可能产生带有偏见的评审意见,如误认为英语为母语作者的论文更具创新性。

英国初创公司Grounded AI打造的Veracity系统堪称“打假利器”,可以验证引用文献的真实性,以及文献与文章观点是否相符。此外,它还能标记高重复率段落,防范抄袭风险。该公司联合创始人尼克·莫利描述称,这位不知疲倦的学术侦探,专治文献注水。

Alchemist review则能快速提炼论文核心发现,评估研究方法的创新性,并验证数据的可重复性。美国物理联合会出版社目前正在旗下两家期刊上试运行该软件。据悉,该系统已经拦截了7篇涉嫌数据造假的投稿。

由澳大利亚认知神经科学家尚恩·伊尔哈特等人开发的Paper Wizard,能生成多页评审报告,并对论文的方法论进行系统性审查,开发者将其定位为这是一种“预审阶段的智能助手”。

包括威利出版集团在内的一些出版商也在尝试开发内部AI工具助力同行评审。

学术批判力不可或缺

关于AI评审,人们最大的担忧是,其未来会取代人类评审员。

加拿大非营利学术服务公司OurResearch联合创始人贾森·普瑞姆是AI评审的狂热拥趸,他表示,未来所有论文或都将由AI评审。

学术传播顾问克里斯·莱昂纳德也预测,尽管目前的AI系统无法完成人类评审员的全部工作,比如精准判断论文的原创性等。但是,随着技术不断精进,AI生成的评审报告的质量将显著优于大多数人类评审。而且至关重要的是,AI的工作效率很高。

不过,他也强调,就像自动驾驶需要人类监督一样,AI评审必须配备“思想制动系统”。在必要的情况下,启动二次评审。

包括波伊索在内的一些科学家则认为,AI不具备评审所需的批判性思维,提出的内容大多是“泛泛而谈”。华盛顿大学进化生物学家卡尔·伯格斯特龙也表示,LLMs远不足以写出合格的同行评审报告。写作即思考,如果审稿人将评审工作外包给AI,会导致评审内容流于肤浅。

波斯达姆·曼则声称,尽管AI确实能对某些评审人的报告进行润色。但LLMs基于训练数据和输入内容生成统计概率上看似合理的文本,其输出几乎总会包含错误。

英国牛津大学学术伦理研究中心主任艾玛·威尔逊更是警告称:当算法开始评判人类智慧,人们失去的不仅是审稿人的专业判断,更是学术共同体最珍贵的批判性思维。

如果科学界开始接受AI审查,那么就需要制定强有力的透明度标准,AI审查的每个细节、使用的每个提示词等,都必须予以公开。

更多资讯请点击:知识

推荐资讯

欧阳黔森代表谈《哪吒2》:融合中国传统文化与现代价值观

截至3月4日,全球动画电影票房冠军《哪吒之魔童闹海》的总票房突破145亿元。这一围绕中国古代神话进行的动漫创作何以受到海内外观众瞩目?其成功的背后有哪些关键因素?全国人大代表、贵州省文联主席欧阳黔森对

经常出现打嗝的现象,或与这些因素有关,要及时检查

打嗝指的呃逆,是一种比较多见的生理现象,是因为膈肌出现不由自主痉挛,导致外界空气被快速吸进肺部当中,使得声带中的裂缝收窄,从而引起的一种现象。在日常生活当中,有很多人经常会出现打嗝的现象,严重影响到患

患有颈椎病,要及时治疗,注意这些事,以免病情进一步加重

随着低头时间的不断延长,颈椎病已经成为了很多人共有的通病。在很多人眼中,颈椎病不需要太过重视,因为只会导致肩颈酸痛,这种观点是完全错误的。颈椎病的危害其实是非常巨大的,只不过在病情初期展现出的危害看起

北京养生会所最适合老人宝宝孕妇的补铁食物

铁是人体正常工作有必要的元素,假如缺铁,就会形成贫血、疲倦、发育缓慢和头晕耳鸣等疑问,老人、宝宝和孕妇是最容易缺铁的人群,那么这三种人群吃什么食物补铁呢?下面就和北京养生会所小编一起来看看吧!

八十多年前“正兴德”茶庄资料

□郑毅去年8月,“黄山莫问茶號徽茶博物馆”正式向社会公众免费开放。这是一家集展览、参观、体验于一体的茶文化博物馆,本着发掘、保护、传承和弘扬黄山“云雾茶”非遗的初衷,依托黄山丰富的景观、文化、生态、物

北京养生会所男性吃什么水果能强精壮阳呢?

每个男性朋友都十分的想要强精壮阳,那男性吃什么水果能强精壮阳呢?下面就跟从北京养生会所的小编一同来看看吧。