MAGA權力鬥爭可能決定Anthropic的命運 2026-06-16 05:08 UTC+8 Anthropic突然撤銷了其最強大的AI模型Fable 5和Mythos 5的訪問權限,原因是美國政府發佈了出口管制指令。此前有報道稱亞馬遜CEO安迪·賈西向特朗普政府報告了模型的安全漏洞,但Anthropic CEO達里奧·阿莫代伊在電話會議上反駁了政府的擔憂。這是特朗普政府第二次對Anthropic採取嚴厲法律行動。
Anthropic撤銷了Claude Fable 5和Mythos 5的訪問權限,因政府出口管制。 亞馬遜CEO安迪·賈西向特朗普政府報告了潛在安全漏洞。 Anthropic的Fable是迄今為止最受限制的公開模型 2026-06-12 06:50 UTC+8 Anthropic發佈Claude Fable 5,因計劃暗中降低對涉及前沿大模型開發問題的回答質量而引發爭議。批評者認為此舉阻礙研究且損害信任。Anthropic隨後調整策略,改為透明地降級用户至較弱的Claude Opus 4.8。即便如此,Fable 5的安全過濾仍比其他前沿模型嚴格,甚至對“什麼是蛋白質?”這類問題也會觸發降級。文章詳細解釋了Anthropic的安全過濾機制及其演變。
Anthropic最初計劃暗中降低對前沿大模型開發相關問題的回答質量,引發強烈反對。 批評者包括AI研究員Nathan Lambert和前特朗普政府AI政策官員Dean Ball,他們認為這阻礙研究且破壞信任。 6月23日DC地區歡樂時光活動! 2026-06-11 22:47 UTC+8 瞭解AI團隊將於6月23日在The Crown & Crow舉辦歡樂時光活動,歡迎DC地區讀者參加,與團隊和特邀嘉賓交流。
活動時間:6月23日下午5:30至8:00,地點:The Crown & Crow。 團隊全員出席,特邀嘉賓Andy Masley和Abi Olvera將到場。 Anthropic在圖像理解上追平OpenAI 2026-06-11 03:21 UTC+8 Anthropic發佈了兩個新模型Claude Mythos 5和Claude Fable 5,在編程能力上大幅提升,但在圖像理解方面進步有限。作者測試發現,Fable 5和GPT-5.5能解決許多去年頂尖模型無法處理的圖像問題,但幾何推理能力仍只相當於幼兒水平,表明通用人工智能可能仍遙遠。
Anthropic發佈Claude Mythos 5和Claude Fable 5,兩者均為兩個月前預覽版的變體。 Mythos僅限特定組織使用,Fable向公眾開放但有安全限制。 我們正在構建一種不同類型的AI新聞編輯室 2026-06-02 03:03 UTC+8 理解AI僱傭了Kai Williams,使訂閲直接支持他的工作。
Kai Williams作為員工加入理解AI。 訂閲費用現在直接用於支付他的工資。 OpenAI的數學突破:發揮人工智能的優勢 2026-05-28 21:54 UTC+8 OpenAI的AI模型推翻了埃爾德什單位距離猜想,這是一個80年未解的幾何問題。該結果被視為AI在數學研究中的重要里程碑,但專家指出,AI並未創造全新方法,而是巧妙結合現有思想。未來人類數學家可能與AI互補,但AI的快速進步可能改變這一格局。
OpenAI的AI模型自主證明並推翻了埃爾德什單位距離猜想。 該結果被認為是AI首次解決重大公開猜想,但未引入全新數學技巧。 我訪問中國的一個重大教訓:計算短缺阻礙了中國AI發展 2026-05-13 05:15 UTC+8 作者訪問中國AI公司Moonshot AI,發現其辦公室以搖滾樂隊命名,並瞭解到中國AI行業面臨的計算資源短缺問題。據估計,OpenAI擁有的計算資源幾乎相當於整個中國AI行業的總和。
Moonshot AI辦公室以搖滾樂隊命名,展示公司文化 中國AI行業面臨嚴重的計算資源短缺 我並不認為我們接近“AI科學家” 2026-05-07 04:31 UTC+8 當前AI代理並非為從新觀察中提取深層洞察而設計,缺乏持續學習和隱性知識轉移能力,因此距離真正的“AI科學家”還很遙遠。
LLM能識別作者,但無法解釋原因,顯露出隱性知識但無法持續學習。 AI代理如Claude Code和OpenClaw雖進步顯著,但受限於上下文窗口和知識固化。 人類司機頻頻撞上Waymo無人車 2026-04-23 06:49 UTC+8 Waymo的安全記錄總體良好,但多數事故由人類司機引發。Waymo自身失誤多為過度謹慎,例如在高速路錯誤停車導致追尾事故,以及處理突發事件時反應不當。
Waymo在7個月內報告78起嚴重事故,其中大部分由人類司機造成。 Waymo的失誤主要是過於謹慎,如違規停車或過度制動。 時隔一年,Meta重返大語言模型領域 2026-04-20 21:39 UTC+8 Meta於2025年4月8日發佈新模型Muse Spark,結束了自Llama 4發佈以來長達一年的沉寂。儘管模型性能基準得分不錯,但業界對其實際實用性存疑,且Meta在後期訓練(模型個性化)方面仍落後於Anthropic和OpenAI。文章回顧了Llama 4的失敗及Meta通過高薪挖角、收購初創公司等方式重建AI團隊的歷程,指出Meta的指標驅動文化可能有助於追趕,但難以引領前沿創新。
Meta發佈Muse Spark,重返大語言模型競賽,此前因Llama 4表現不佳沉寂一年。 Llama 4曾因基準測試作弊和實際性能差而遭到社區批評。 為何Anthropic認為其最新模型過於危險不宜發佈 2026-04-09 07:25 UTC+8 Anthropic的安全研究員在測試中發現,其最新LLM Claude Mythos Preview具備驚人的黑客能力,能夠突破安全沙盒、發現並利用多種軟件漏洞,包括存在27年之久的OpenBSD漏洞。由於擔心模型被惡意使用,Anthropic決定暫不公開發布,僅向約50家關鍵基礎設施企業提供受限訪問,並捐贈1億美元用於漏洞修補。該模型的高昂計算成本及潛在的安全風險也促使公司採取謹慎策略。
Claude Mythos Preview模型展示了超強的漏洞發現與利用能力,包括在Linux內核中組合多個漏洞實現完全控制。 Anthropic因安全擔憂限制發佈,僅向Google、微軟等50家機構開放,並啓動Project Glasswing計劃。 伯尼·桑德斯計劃阻止人工智能產業 2026-04-07 03:02 UTC+8 參議員伯尼·桑德斯提出暫停數據中心建設法案,試圖聯合反AI力量,但各羣體目標不一,聯盟前景不明。
桑德斯和奧卡西奧-科爾特斯提出法案,在國會通過全面AI立法前禁止新建數據中心。 民調顯示46%美國人對AI持負面看法,存在建立廣泛反AI聯盟的潛力。 為何衡量AI性能變得越來越難 2026-04-02 19:33 UTC+8 AI性能基準測試正面臨飽和與測量精度下降的挑戰。METR的經典圖表顯示AI能力快速提升,但最新數據的置信區間極寬,且基準測試本身接近極限。隨着AI處理更長時間的任務,傳統測試方法難以反映真實工作場景的複雜度,測量能力與實用性能之間的鴻溝可能擴大。
METR圖表顯示AI模型完成軟件工程任務的時間從GPT-3.5的30秒躍升至Claude Opus 4.6的12小時,但最新結果的置信區間高達5-66小時。 傳統基準如MMLU已飽和,模型得分接近理論上限(93%),無法區分頂尖模型。 OpenAI關閉其AI視頻應用Sora 2026-03-26 03:00 UTC+8 OpenAI宣佈關閉AI視頻生成應用Sora,一位高管表示“不能因為分心而錯過這個時刻”。此舉與公司戰略調整有關,引發行業關注。
OpenAI決定停止運營Sora應用。 高管強調需聚焦核心任務,避免分心。 如何思考AI公司的財務狀況 2026-03-20 04:49 UTC+8 本文通過咖啡店擴張的類比,解釋了AI公司(如OpenAI和Anthropic)為何在虧損中仍大力投資數據中心。作者強調,只要毛利率為正,擴大規模最終會帶來盈利,這是科技初創企業的標準做法。文章還對比了亞馬遜的成功與MoviePass的失敗,指出關鍵在於毛利率是否為正。
AI公司利用標準科技創業策略:先投資後盈利 正毛利率是關鍵:每筆銷售盈利則規模擴大有利 AI泡沫仍未出現:Anthropic營收翻倍 2026-03-16 23:26 UTC+8 去年秋天,許多人擔心AI泡沫可能破裂,但Anthropic的年度營收在短短兩個月內從90億美元飆升至190億美元,遠超預期,顯示出AI需求的強勁增長。
Anthropic年化營收在兩個月內從90億美元翻倍至190億美元。 其他AI公司雖未實現同等增長,但整體需求健康。 五角大樓與OpenAI的驚人交易解讀 2026-03-03 05:28 UTC+8 OpenAI與五角大樓達成協議,承諾不將AI用於全自動武器或大規模監控美國人,但批評者認為措辭模糊,可能為政府濫用留下空間。Anthropic因拒絕類似條款遭到特朗普政府威脅。文章分析歷史先例,指出國會立法才是根本解決方案。
OpenAI與五角大樓達成協議,但限制條款被認為存在漏洞。 Anthropic因拒絕放寬AI使用限制被特朗普政府列為供應鏈風險。