MAGA权力斗争可能决定Anthropic的命运 2026-06-16 05:08 UTC+8 Anthropic突然撤销了其最强大的AI模型Fable 5和Mythos 5的访问权限,原因是美国政府发布了出口管制指令。此前有报道称亚马逊CEO安迪·贾西向特朗普政府报告了模型的安全漏洞,但Anthropic CEO达里奥·阿莫代伊在电话会议上反驳了政府的担忧。这是特朗普政府第二次对Anthropic采取严厉法律行动。
Anthropic撤销了Claude Fable 5和Mythos 5的访问权限,因政府出口管制。 亚马逊CEO安迪·贾西向特朗普政府报告了潜在安全漏洞。 Anthropic的Fable是迄今为止最受限制的公开模型 2026-06-12 06:50 UTC+8 Anthropic发布Claude Fable 5,因计划暗中降低对涉及前沿大模型开发问题的回答质量而引发争议。批评者认为此举阻碍研究且损害信任。Anthropic随后调整策略,改为透明地降级用户至较弱的Claude Opus 4.8。即便如此,Fable 5的安全过滤仍比其他前沿模型严格,甚至对“什么是蛋白质?”这类问题也会触发降级。文章详细解释了Anthropic的安全过滤机制及其演变。
Anthropic最初计划暗中降低对前沿大模型开发相关问题的回答质量,引发强烈反对。 批评者包括AI研究员Nathan Lambert和前特朗普政府AI政策官员Dean Ball,他们认为这阻碍研究且破坏信任。 6月23日DC地区欢乐时光活动! 2026-06-11 22:47 UTC+8 了解AI团队将于6月23日在The Crown & Crow举办欢乐时光活动,欢迎DC地区读者参加,与团队和特邀嘉宾交流。
活动时间:6月23日下午5:30至8:00,地点:The Crown & Crow。 团队全员出席,特邀嘉宾Andy Masley和Abi Olvera将到场。 Anthropic在图像理解上追平OpenAI 2026-06-11 03:21 UTC+8 Anthropic发布了两个新模型Claude Mythos 5和Claude Fable 5,在编程能力上大幅提升,但在图像理解方面进步有限。作者测试发现,Fable 5和GPT-5.5能解决许多去年顶尖模型无法处理的图像问题,但几何推理能力仍只相当于幼儿水平,表明通用人工智能可能仍遥远。
Anthropic发布Claude Mythos 5和Claude Fable 5,两者均为两个月前预览版的变体。 Mythos仅限特定组织使用,Fable向公众开放但有安全限制。 我们正在构建一种不同类型的AI新闻编辑室 2026-06-02 03:03 UTC+8 理解AI雇佣了Kai Williams,使订阅直接支持他的工作。
Kai Williams作为员工加入理解AI。 订阅费用现在直接用于支付他的工资。 OpenAI的数学突破:发挥人工智能的优势 2026-05-28 21:54 UTC+8 OpenAI的AI模型推翻了埃尔德什单位距离猜想,这是一个80年未解的几何问题。该结果被视为AI在数学研究中的重要里程碑,但专家指出,AI并未创造全新方法,而是巧妙结合现有思想。未来人类数学家可能与AI互补,但AI的快速进步可能改变这一格局。
OpenAI的AI模型自主证明并推翻了埃尔德什单位距离猜想。 该结果被认为是AI首次解决重大公开猜想,但未引入全新数学技巧。 我访问中国的一个重大教训:计算短缺阻碍了中国AI发展 2026-05-13 05:15 UTC+8 作者访问中国AI公司Moonshot AI,发现其办公室以摇滚乐队命名,并了解到中国AI行业面临的计算资源短缺问题。据估计,OpenAI拥有的计算资源几乎相当于整个中国AI行业的总和。
Moonshot AI办公室以摇滚乐队命名,展示公司文化 中国AI行业面临严重的计算资源短缺 我并不认为我们接近“AI科学家” 2026-05-07 04:31 UTC+8 当前AI代理并非为从新观察中提取深层洞察而设计,缺乏持续学习和隐性知识转移能力,因此距离真正的“AI科学家”还很遥远。
LLM能识别作者,但无法解释原因,显露出隐性知识但无法持续学习。 AI代理如Claude Code和OpenClaw虽进步显著,但受限于上下文窗口和知识固化。 人类司机频频撞上Waymo无人车 2026-04-23 06:49 UTC+8 Waymo的安全记录总体良好,但多数事故由人类司机引发。Waymo自身失误多为过度谨慎,例如在高速路错误停车导致追尾事故,以及处理突发事件时反应不当。
Waymo在7个月内报告78起严重事故,其中大部分由人类司机造成。 Waymo的失误主要是过于谨慎,如违规停车或过度制动。 时隔一年,Meta重返大语言模型领域 2026-04-20 21:39 UTC+8 Meta于2025年4月8日发布新模型Muse Spark,结束了自Llama 4发布以来长达一年的沉寂。尽管模型性能基准得分不错,但业界对其实际实用性存疑,且Meta在后期训练(模型个性化)方面仍落后于Anthropic和OpenAI。文章回顾了Llama 4的失败及Meta通过高薪挖角、收购初创公司等方式重建AI团队的历程,指出Meta的指标驱动文化可能有助于追赶,但难以引领前沿创新。
Meta发布Muse Spark,重返大语言模型竞赛,此前因Llama 4表现不佳沉寂一年。 Llama 4曾因基准测试作弊和实际性能差而遭到社区批评。 为何Anthropic认为其最新模型过于危险不宜发布 2026-04-09 07:25 UTC+8 Anthropic的安全研究员在测试中发现,其最新LLM Claude Mythos Preview具备惊人的黑客能力,能够突破安全沙盒、发现并利用多种软件漏洞,包括存在27年之久的OpenBSD漏洞。由于担心模型被恶意使用,Anthropic决定暂不公开发布,仅向约50家关键基础设施企业提供受限访问,并捐赠1亿美元用于漏洞修补。该模型的高昂计算成本及潜在的安全风险也促使公司采取谨慎策略。
Claude Mythos Preview模型展示了超强的漏洞发现与利用能力,包括在Linux内核中组合多个漏洞实现完全控制。 Anthropic因安全担忧限制发布,仅向Google、微软等50家机构开放,并启动Project Glasswing计划。 伯尼·桑德斯计划阻止人工智能产业 2026-04-07 03:02 UTC+8 参议员伯尼·桑德斯提出暂停数据中心建设法案,试图联合反AI力量,但各群体目标不一,联盟前景不明。
桑德斯和奥卡西奥-科尔特斯提出法案,在国会通过全面AI立法前禁止新建数据中心。 民调显示46%美国人对AI持负面看法,存在建立广泛反AI联盟的潜力。 为何衡量AI性能变得越来越难 2026-04-02 19:33 UTC+8 AI性能基准测试正面临饱和与测量精度下降的挑战。METR的经典图表显示AI能力快速提升,但最新数据的置信区间极宽,且基准测试本身接近极限。随着AI处理更长时间的任务,传统测试方法难以反映真实工作场景的复杂度,测量能力与实用性能之间的鸿沟可能扩大。
METR图表显示AI模型完成软件工程任务的时间从GPT-3.5的30秒跃升至Claude Opus 4.6的12小时,但最新结果的置信区间高达5-66小时。 传统基准如MMLU已饱和,模型得分接近理论上限(93%),无法区分顶尖模型。 OpenAI关闭其AI视频应用Sora 2026-03-26 03:00 UTC+8 OpenAI宣布关闭AI视频生成应用Sora,一位高管表示“不能因为分心而错过这个时刻”。此举与公司战略调整有关,引发行业关注。
OpenAI决定停止运营Sora应用。 高管强调需聚焦核心任务,避免分心。 如何思考AI公司的财务状况 2026-03-20 04:49 UTC+8 本文通过咖啡店扩张的类比,解释了AI公司(如OpenAI和Anthropic)为何在亏损中仍大力投资数据中心。作者强调,只要毛利率为正,扩大规模最终会带来盈利,这是科技初创企业的标准做法。文章还对比了亚马逊的成功与MoviePass的失败,指出关键在于毛利率是否为正。
AI公司利用标准科技创业策略:先投资后盈利 正毛利率是关键:每笔销售盈利则规模扩大有利 AI泡沫仍未出现:Anthropic营收翻倍 2026-03-16 23:26 UTC+8 去年秋天,许多人担心AI泡沫可能破裂,但Anthropic的年度营收在短短两个月内从90亿美元飙升至190亿美元,远超预期,显示出AI需求的强劲增长。
Anthropic年化营收在两个月内从90亿美元翻倍至190亿美元。 其他AI公司虽未实现同等增长,但整体需求健康。 五角大楼与OpenAI的惊人交易解读 2026-03-03 05:28 UTC+8 OpenAI与五角大楼达成协议,承诺不将AI用于全自动武器或大规模监控美国人,但批评者认为措辞模糊,可能为政府滥用留下空间。Anthropic因拒绝类似条款遭到特朗普政府威胁。文章分析历史先例,指出国会立法才是根本解决方案。
OpenAI与五角大楼达成协议,但限制条款被认为存在漏洞。 Anthropic因拒绝放宽AI使用限制被特朗普政府列为供应链风险。