AI #171:虛假旗幟
本週,Claude Opus 4.8釋出,帶來漸進式改進;特朗普行政令迴歸,開啟前沿模型事前限制時代;OpenAI釋出政策藍圖但政治活動惹爭議;還包括模型實用案例、升級、安全、深度偽造等話題。
本週AI領域迎來多項重要進展。Anthropic釋出了Claude Opus 4.8,其模型卡顯示在多個基準測試上有所提升,尤其在編碼和數學推理方面。儘管基礎模型和指令遵循能力仍稍遜於GPT-5.5,但Opus 4.8在Toloka Arena中奪得榜首,成為許多使用者的首選。總體而言,這是一個漸進但真實的改進,目前已成為筆者的日常驅動模型。
特朗普行政令從看似死亡的狀態中迴歸,正式將我們帶入前沿模型釋出的事前限制時代,儘管他們並未直接使用“事前限制”一詞。一些細節令人擔憂,尤其是將過多責任賦予NSA而非CAISI,以及將測試過程保密化的傾向。事情可能朝非常糟糕的方向發展,但筆者暫時對此總體持謹慎樂觀態度。
OpenAI釋出了一份新的政策藍圖,內容出奇地好,筆者打算稍後專門撰文詳細分析。然而,其政治行動委員會(PAC)卻從事了一些相當惡劣的活動。OpenAI PAC參與了一場所謂的“虛假旗幟”暴力鼓吹活動,情況看起來不妙。此外,OpenAI還推出了Rosalind生物防禦倡議。
在模型實用性方面,Doc in a Box在猶他州表現良好。他們專注於避免假陽性,即使冒著假陰性的風險,因為在沒有AI的情況下全是陰性,而升級為人工處理是一個小錯誤。在AI推薦續方的72%案例中,至少有一位醫生在97%的情況下同意。在AI未推薦續方而升級至醫生的28%案例中,69%的醫生認為升級是適當的,31%認為過度謹慎。對於這樣一個新系統,過度謹慎是合適且受歡迎的。整體來看,續方合理率達到97%非常出色,過度升級的數量僅比必要多約50%,也是一項重大成功。
使用合成客戶加速產品開發和測試營銷也是一個好方法,儘管它們並不完美,應作為真實客戶互動的補充而非替代。有人使用AI出售房屋,聲稱淨賺9萬美元,但事後諮詢專家發現掛牌價可能偏低,實際收益可能被高估。這提醒我們使用AI時需注意反事實。
資料恢復方面,一位使用者在飛機上撰寫長報告,後因電腦強制重啟丟失草稿。Claude透過檢查APFS快照、時間機器、Slack IndexedDB等多種途徑未果,最終發現Alfred的SQLite剪貼簿歷史中標記為刪除的資料並未物理擦除,透過原始掃描成功恢復了報告。這體現了AI作為“精英駭客”的強大能力。
安全方面,Project Glasswing擴充套件至約200個組織,覆蓋15個國家以上,並開放部分工具。Palo Alto Networks透過Mythos在數週內花費100萬美元令牌,發現了此前五倍的嚴重漏洞,成本效益極高。Anthropic分析了過去一年因網路攻擊被禁的832個賬號,發現中高威脅比例從上半年的33%升至下半年的56%,AI使用率上升。個人應做好基本防護,切勿抱有“已被黑”的僥倖心理。
深度偽造方面,音樂平臺新上傳歌曲中近半為AI生成,可透過Quicksilver等工具檢測到人類無法分辨的細微偽影。但上傳量佔比不等於播放量,絕大多數音樂幾乎無人收聽。
其他訊息:Codex擴充套件至Windows且新增角色外掛;GPT-5.5-Instant釋出新版本;Claude Code更新命令;Gemini開放調整思考層級;Gemma-4-12B可在16GB記憶體本地執行;DeepSeek v4保持低價;Salesforce工程部門標準化使用Claude Code;OpenAI與亞馬遜Bedrock整合等。本週AI動態豐富,既有令人鼓舞的進步,也有需要警惕的陰暗面。