2026-06-08 00:24 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI #171：虛假旗幟

本週，Claude Opus 4.8釋出，帶來漸進式改進；特朗普行政令迴歸，開啟前沿模型事前限制時代；OpenAI釋出政策藍圖但政治活動惹爭議；還包括模型實用案例、升級、安全、深度偽造等話題。

來源Hacker News AI作者: paulpauper

本週AI領域迎來多項重要進展。Anthropic釋出了Claude Opus 4.8，其模型卡顯示在多個基準測試上有所提升，尤其在編碼和數學推理方面。儘管基礎模型和指令遵循能力仍稍遜於GPT-5.5，但Opus 4.8在Toloka Arena中奪得榜首，成為許多使用者的首選。總體而言，這是一個漸進但真實的改進，目前已成為筆者的日常驅動模型。

特朗普行政令從看似死亡的狀態中迴歸，正式將我們帶入前沿模型釋出的事前限制時代，儘管他們並未直接使用“事前限制”一詞。一些細節令人擔憂，尤其是將過多責任賦予NSA而非CAISI，以及將測試過程保密化的傾向。事情可能朝非常糟糕的方向發展，但筆者暫時對此總體持謹慎樂觀態度。

OpenAI釋出了一份新的政策藍圖，內容出奇地好，筆者打算稍後專門撰文詳細分析。然而，其政治行動委員會（PAC）卻從事了一些相當惡劣的活動。OpenAI PAC參與了一場所謂的“虛假旗幟”暴力鼓吹活動，情況看起來不妙。此外，OpenAI還推出了Rosalind生物防禦倡議。

在模型實用性方面，Doc in a Box在猶他州表現良好。他們專注於避免假陽性，即使冒著假陰性的風險，因為在沒有AI的情況下全是陰性，而升級為人工處理是一個小錯誤。在AI推薦續方的72%案例中，至少有一位醫生在97%的情況下同意。在AI未推薦續方而升級至醫生的28%案例中，69%的醫生認為升級是適當的，31%認為過度謹慎。對於這樣一個新系統，過度謹慎是合適且受歡迎的。整體來看，續方合理率達到97%非常出色，過度升級的數量僅比必要多約50%，也是一項重大成功。

使用合成客戶加速產品開發和測試營銷也是一個好方法，儘管它們並不完美，應作為真實客戶互動的補充而非替代。有人使用AI出售房屋，聲稱淨賺9萬美元，但事後諮詢專家發現掛牌價可能偏低，實際收益可能被高估。這提醒我們使用AI時需注意反事實。

資料恢復方面，一位使用者在飛機上撰寫長報告，後因電腦強制重啟丟失草稿。Claude透過檢查APFS快照、時間機器、Slack IndexedDB等多種途徑未果，最終發現Alfred的SQLite剪貼簿歷史中標記為刪除的資料並未物理擦除，透過原始掃描成功恢復了報告。這體現了AI作為“精英駭客”的強大能力。

安全方面，Project Glasswing擴充套件至約200個組織，覆蓋15個國家以上，並開放部分工具。Palo Alto Networks透過Mythos在數週內花費100萬美元令牌，發現了此前五倍的嚴重漏洞，成本效益極高。Anthropic分析了過去一年因網路攻擊被禁的832個賬號，發現中高威脅比例從上半年的33%升至下半年的56%，AI使用率上升。個人應做好基本防護，切勿抱有“已被黑”的僥倖心理。

深度偽造方面，音樂平臺新上傳歌曲中近半為AI生成，可透過Quicksilver等工具檢測到人類無法分辨的細微偽影。但上傳量佔比不等於播放量，絕大多數音樂幾乎無人收聽。

其他訊息：Codex擴充套件至Windows且新增角色外掛；GPT-5.5-Instant釋出新版本；Claude Code更新命令；Gemini開放調整思考層級；Gemma-4-12B可在16GB記憶體本地執行；DeepSeek v4保持低價；Salesforce工程部門標準化使用Claude Code；OpenAI與亞馬遜Bedrock整合等。本週AI動態豐富，既有令人鼓舞的進步，也有需要警惕的陰暗面。