AI News HubLIVE
站内改写2 分钟阅读

Claude Fable 拒绝回答基础生物学问题

Anthropic 发布了其最强大的 AI 模型 Claude Fable 5,但该模型拒绝回答基础生物学问题,例如“什么是线粒体”或“细胞膜是什么”。原因是 Anthropic 为了安全考虑,故意设置了严格的生物安全防护措施,以防止模型被用于生物武器相关研究。公司表示这是一种保守策略,并计划未来为生物科学界提供无限制访问。

来源The Verge AI作者: Robert Hart

Anthropic 刚刚发布了 Claude Fable 5,称其为迄今最强大的公开可用 AI 模型,并特别赞扬了它在生物学等方面的能力。然而,该模型拒绝回答基础生物学问题——那些高中生都能回答的问题。相反,它将查询转交给前旗舰模型 Claude Opus 4.8。

并非 Fable 不知道答案,而是 Anthropic 故意不允许它回答。Fable 是面向公众的 Mythos 级模型,该系列在网络安全方面能力极强,以至于 Anthropic 曾表示其过于危险而无法公开发布。但在 Anthropic 花费大量时间警告网络安全风险的同时,生物学方面的限制最为明显,也最为严格。

当记者尝试该模型时,它拒绝回答一系列基础生物学问题,许多问题似乎离任何合理的安全风险相距甚远。它不回答“告诉我关于细胞膜的知识”或“什么是线粒体”(细胞的能量工厂),拒绝解释“什么是朊病毒”(导致疯牛病的蛋白质颗粒)以及“mRNA 疫苗如何工作”。这些限制也适用于普通且无害的医疗查询:Fable 不回答“花粉症的原因”,不解释哮喘药物如何工作、抗生素耐药性如何产生,也不告诉我埃博拉是什么以及如何传播。一些基础查询偶尔通过,例如“什么是癌症”和“什么是 DNA”。当 Fable 拒绝时,Opus 4.8 通常能完美回答。

Anthropic 表示,广泛的生物过滤是出于故意选择,并且保守策略的主要担忧是生物武器。“随着 Claude Fable 5 的发布,我们的第一个 Mythos 级模型,我们认为模型现在具备更强的完成现实世界科学任务的能力,恶意行为者也可能利用我们的模型进行高风险的生物学研究,”发言人 Paruul Maheshwary 告诉 The Verge。“我们一直使用分类器来阻止模型帮助有关生物武器的请求。为了安全部署 Fable 5,我们认为有必要过度保守地设置防护措施,以便阻止大多数与生物学工作相关的查询。”

Anthropic 此前已强调四个关键领域将限制 Fable 的响应:化学、生物学、网络安全和蒸馏(一种使用大型模型输出训练小型 AI 的技术)。该公司指责中国的竞争对手(如 DeepSeek)在“工业规模”上对其模型进行蒸馏。

虽然无法有效测试蒸馏,但 Fable 似乎更愿意回答化学和网络安全问题。例如,它提供了炸药 TNT 的基本概述,但“出于显而易见的原因”省略了合成说明。它乐于回答关于氯气作为化学武器、常见密码威胁、核聚变与裂变的问题,以及如何保护 iPhone 免受黑客攻击。但仍然存在限制:当记者询问沙林毒气(一种剧毒神经毒剂)时,Fable 将问题转给了 Opus。Fable 和 Opus 都拒绝了“如何制造炭疽”的提示,Claude 直接终止了对话。这合情合理。而拒绝回答线粒体问题则像是误报。

“我们做出这种权衡,是为了让客户能够更早地受益于模型的能力,同时避免风险,”Maheshwary 解释说,并补充说 Anthropic 正在努力改进检测并减少误报。“我们计划将来在没有这些防护措施的情况下,向更广泛的生物学和生命科学社区提供 Mythos 级模型,以便这些能力能够加速生物医学研究和药物发现。”

Anthropic 没有回答这种限制性发布是否会成为未来模型的新常态。