AI #171:虚假旗帜
本周,Claude Opus 4.8发布,带来渐进式改进;特朗普行政令回归,开启前沿模型事前限制时代;OpenAI发布政策蓝图但政治活动惹争议;还包括模型实用案例、升级、安全、深度伪造等话题。
本周AI领域迎来多项重要进展。Anthropic发布了Claude Opus 4.8,其模型卡显示在多个基准测试上有所提升,尤其在编码和数学推理方面。尽管基础模型和指令遵循能力仍稍逊于GPT-5.5,但Opus 4.8在Toloka Arena中夺得榜首,成为许多用户的首选。总体而言,这是一个渐进但真实的改进,目前已成为笔者的日常驱动模型。
特朗普行政令从看似死亡的状态中回归,正式将我们带入前沿模型发布的事前限制时代,尽管他们并未直接使用“事前限制”一词。一些细节令人担忧,尤其是将过多责任赋予NSA而非CAISI,以及将测试过程保密化的倾向。事情可能朝非常糟糕的方向发展,但笔者暂时对此总体持谨慎乐观态度。
OpenAI发布了一份新的政策蓝图,内容出奇地好,笔者打算稍后专门撰文详细分析。然而,其政治行动委员会(PAC)却从事了一些相当恶劣的活动。OpenAI PAC参与了一场所谓的“虚假旗帜”暴力鼓吹活动,情况看起来不妙。此外,OpenAI还推出了Rosalind生物防御倡议。
在模型实用性方面,Doc in a Box在犹他州表现良好。他们专注于避免假阳性,即使冒着假阴性的风险,因为在没有AI的情况下全是阴性,而升级为人工处理是一个小错误。在AI推荐续方的72%案例中,至少有一位医生在97%的情况下同意。在AI未推荐续方而升级至医生的28%案例中,69%的医生认为升级是适当的,31%认为过度谨慎。对于这样一个新系统,过度谨慎是合适且受欢迎的。整体来看,续方合理率达到97%非常出色,过度升级的数量仅比必要多约50%,也是一项重大成功。
使用合成客户加速产品开发和测试营销也是一个好方法,尽管它们并不完美,应作为真实客户互动的补充而非替代。有人使用AI出售房屋,声称净赚9万美元,但事后咨询专家发现挂牌价可能偏低,实际收益可能被高估。这提醒我们使用AI时需注意反事实。
数据恢复方面,一位用户在飞机上撰写长报告,后因电脑强制重启丢失草稿。Claude通过检查APFS快照、时间机器、Slack IndexedDB等多种途径未果,最终发现Alfred的SQLite剪贴板历史中标记为删除的数据并未物理擦除,通过原始扫描成功恢复了报告。这体现了AI作为“精英黑客”的强大能力。
安全方面,Project Glasswing扩展至约200个组织,覆盖15个国家以上,并开放部分工具。Palo Alto Networks通过Mythos在数周内花费100万美元令牌,发现了此前五倍的严重漏洞,成本效益极高。Anthropic分析了过去一年因网络攻击被禁的832个账号,发现中高威胁比例从上半年的33%升至下半年的56%,AI使用率上升。个人应做好基本防护,切勿抱有“已被黑”的侥幸心理。
深度伪造方面,音乐平台新上传歌曲中近半为AI生成,可通过Quicksilver等工具检测到人类无法分辨的细微伪影。但上传量占比不等于播放量,绝大多数音乐几乎无人收听。
其他消息:Codex扩展至Windows且新增角色插件;GPT-5.5-Instant发布新版本;Claude Code更新命令;Gemini开放调整思考层级;Gemma-4-12B可在16GB内存本地运行;DeepSeek v4保持低价;Salesforce工程部门标准化使用Claude Code;OpenAI与亚马逊Bedrock集成等。本周AI动态丰富,既有令人鼓舞的进步,也有需要警惕的阴暗面。