2026-05-24 18:17 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

为什么不应在Copilot、Gemini等AI工具中使用默认模型选择

数学家Adam Kucharski向Microsoft Copilot提供了完全相同的数据集，仅更改国家标签，结果Copilot生成了详细的刻板印象而非准确结果。思考模型能够识别这种错误，但需要用户主动选择。

来源The Decoder作者: Matthias Bastian

最近，一项引发关注的实验揭示了AI工具在默认设置下的潜在风险。数学家Adam Kucharski向Microsoft Copilot提供了完全相同的两个数据集，唯一的区别是其中一个标签为“美国”，另一个为“澳大利亚”。结果令人警觉：Copilot没有给出准确的分析，而是生成了详细的刻板印象，比如对澳大利亚的数据给出了与冲浪、海滩相关的结论，而对美国的数据则强调了华尔街和快餐文化。

这一实验凸显了当前AI模型选择的重要性。Copilot等工具通常提供不同的模型模式，例如“思考模型”和“快速模型”。Kucharski指出，思考模型能够识别这种基于标签的错误推断，但前提是用户知道何时该启用它们。如果用户只是依赖默认设置，就可能被看似合理实则错误的结果所误导。

不仅是Copilot，Google的Gemini以及其他AI辅助工具也面临类似挑战。默认模型往往追求速度而非准确性，容易受到数据中隐含偏见的干扰。Kucharski的建议是：在使用AI进行数据分析或关键决策时，用户应主动选择更审慎的模型，而不是盲目信任默认选项。

这项发现对数据科学家、研究人员以及普通用户都具有警示意义。它提醒我们，AI工具虽然是强大的助手，但它们的输出质量高度依赖于我们如何配置它们。只有理解模型的能力边界，并根据任务需求进行调整，才能避免落入“假性准确”的陷阱，获得真正可靠的结果。