AI在研究中的应用:我们不应将所有AI相关问题视为不当行为
随着AI在研究中的应用日益普遍,区分负责任的使用、误用和不当行为变得至关重要。本文提出了一个基于意图和影响两个维度的框架,以帮助研究界做出适当且一致的回应。
随着人工智能在研究领域的应用日益普遍,如何界定其合理使用范围成为关注焦点。一项获奖白皮书指出,AI在研究中的应用正逐年快速增长,许多研究者感到必须采用AI,否则可能落后。然而,关于如何负责任地使用AI的共同规范仍在发展中。
调查显示,71%的受访者担心AI工具被误用,53%的研究人员表示他们观察到同行存在所谓的“AI误用”行为。这种担忧反映出一个关键问题:研究者采用AI工具的速度快于负责任使用规范的形成。为了维护学术记录的可信度,研究界需要更清晰、更一致的方式来区分负责任的使用、不良实践、误用和故意不当行为。
“AI误用”这一术语目前使用广泛但含义模糊,常被用作涵盖从诚实错误、未经批判性依赖AI输出、未披露到故意欺诈等各种行为的笼统标签。研究者将其应用于从故意不当行为(如捏造数据)到不良实践(如未经适当验证即依赖AI输出)的各种情况。这种混淆并非无害:当故意欺骗和诚实错误被视为同样的问题时,我们就失去了做出适当回应的能力,削弱了政策和惩罚措施的有效性,扭曲了问责制,并影响了有效的培训。
缺乏共享定义正开始影响对制裁和问责的态度。调查结果显示,观点高度两极分化,从零容忍到更务实的透明度要求不一。例如,有人主张对使用AI的作者永久列入黑名单,而另一些人则呼吁区分无意误用和故意欺诈,并强调披露的重要性。最近还有提议对虚构参考文献等行为实施长达一年的临时禁令,这显示了一种趋向惩罚性回应的态度,即使意图尚不明确。
实际上,AI相关问题(像任何形式的不当行为一样)可以从因不良做法导致的无意错误到带有恶意的故意欺诈不等。一些现有框架已经认识到行为可以是一个连续谱,但在AI讨论中,这些区别常常被扁平化为单一类别。
仅凭意图维度不足,意图难以判断,而仅凭影响维度也不够,因为一些有害行为初期影响有限。因此,稳健的评估需要同时考虑意图和影响,以及行为发生的背景,以一致且相称的方式区分错误、误用和不当行为。
为应对这一挑战,我们提出了一个简单框架,沿意图和影响两个维度区分AI相关问题。这为评估哪些情况属于负责任使用、低风险误用、高风险误用或严重不当行为提供了更实用的基础。
负责任使用意味着在适当的人工监督、验证和问责下使用AI,包括透明披露、验证AI输出、明确人类对最终工作的责任、关注偏见、包容性、隐私和数据保护,以及遵守期刊、机构和领域指南。这些原则已得到广泛认可。
AI误用(不当或疏忽使用)定义为无明确欺骗意图的不当、粗心或疏忽使用,包括纳入未经适当审查的AI生成文本、引用未验证或捏造的参考文献、依赖引入错误或偏见的输出、在没有充分监督或专业判断的情况下重复使用AI,以及未按要求披露AI协助。并非所有误用后果相同:低风险误用可通过更正纠正,不影响研究有效性;高风险误用则影响解释、可重复性或信任。
严重不当行为(故意欺骗或欺诈)定义为故意使用AI严重损害研究诚信,包括伪造数据、结果或图像,将虚假或AI生成参考文献呈现为真实,隐瞒AI使用以误导,将大量AI生成内容作为原创贡献呈现,以及利用AI逃避抄袭检查或掩盖重复内容。
框架的目标不是原谅不良实践或降低标准,而是支持对AI在研究中的使用做出更一致和适当的回应。通过区分负责任使用、误用和不当行为,研究界可以在出现错误时进行教育,在存在欺骗时实施制裁,在继续受益于AI潜力的同时维护学术记录的可信度。