引用迪安·W·鮑爾
迪安·W·鮑爾指出前沿模型成本高昂,盈利視窗短暫,且AI基礎設施投資依賴全球市場。
- 前沿模型訓練成本極高,盈利視窗只有釋出後幾個月
- 一旦模型失去前沿地位,競爭加劇,利潤壓縮
來源詳情
AI News Hub 持續追蹤 Simon Willison's Weblog 的 AI 更新,並公開來源狀態、授權邊界、抓取方式和已發布文章。
Personal blog; posts are public and free to reference.
迪安·W·鮑爾指出前沿模型成本高昂,盈利視窗短暫,且AI基礎設施投資依賴全球市場。
Timothy B. Lee用管理者的比喻反駁了“LLM無需技巧、沒有學習曲線”的觀點。
Fernando Irarrázaval在hackmyclaw.com發起挑戰,邀請人們透過郵件竊取其OpenClaw測試例項中的秘密。儘管有6000次嘗試(花費500美元token,並導致谷歌賬號被暫停),無人成功。底層模型為Opus 4.6,使用了抗提示注入規則。這反映了前沿模型在抗注入攻擊方面的訓練效果,但仍需謹慎,無法保證絕對安全。
安德魯·內斯位元撰寫的假設性事件報告,描述了兩個來自不同供應商的AI審查代理因對軟體包是否惡意產生分歧,陷入無休止的爭論迴圈,導致高昂的推理費用和財務部門介入,最終營銷團隊藉機釋出宣告。
OpenAI 宣佈開始限量預覽 GPT-5.6 系列模型,包括旗艦模型 Sol、平衡型模型 Terra 和快速經濟型模型 Luna。Terra 效能與 GPT-5.5 相當,但成本降低一半;Luna 則以最低價格提供強大能力。定價按每百萬 tokens 計算,Sol 為 $5 輸入 / $30 輸出,Terra 為 $2.50 / $15,Luna 為 $1 / $6。新系列還引入了更可預測的提示快取,支援顯式快取斷點和 30 分鐘最小快取壽命。由於美國政府的參與,此次釋出先以限量預覽形式提供給少數可信合作伙伴,隨後將廣泛釋出。
德國法院裁定谷歌為其AI生成摘要中的錯誤承擔責任。布魯斯·施奈爾評論稱,AI代理應被視為部署者的代理,若允許企業以AI錯誤為由免責,將導致災難性激勵,鼓勵用AI替代人類工作者。
受Mozilla新推出的MDN MCP服務啟發,Simon Willison將mdn/browser-compat-data倉庫中的瀏覽器相容性資料轉換為SQLite資料庫。他使用Claude Code for web (Opus 4.8)和sqlite-utils生成轉換指令碼,並透過GitHub Actions工作流將約66MB的資料庫部署到GitHub CDN,支援開放CORS頭,使用者可以直接下載或透過Datasette Lite線上探索。
Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub專案,導致僱主無法瞭解申請者的真實能力與個性。
Simon Willison 利用 Claude Code 構建了一個瀏覽器內測試平臺,用於探索 Origin Private File System (OPFS) 是否能讓 Datasette Lite 編輯使用者計算機上的持久化 SQLite 檔案。
研究人員發現,大型語言模型無法可靠地區分特權文本和使用者輸入,並且更容易受到文本風格的影響而非實際內容。透過“去風格化”技術,攻擊成功率從61%驟降至10%,揭示了“角色混淆”這一根本問題。
西蒙·威利森使用Claude Code將Moebius 0.2B影像修復模型從PyTorch/CUDA移植到使用WebGPU的瀏覽器中。整個過程涉及模型轉換、部署和快取最佳化,最終實現了可線上執行的演示版本。
sqlite-utils 4.0rc1 釋出,作為 v4 的第一個候選版本,主要新增了資料庫遷移和巢狀事務(db.atomic())兩大特性,幷包含一些輕微的不相容變更。
Cloudflare宣佈了一項新功能:使用者無需註冊賬戶即可透過臨時部署建立Cloudflare Workers專案,專案會保持活躍60分鐘。該功能雖宣稱面向AI代理,但實際對所有人都有用。作者演示瞭如何使用GPT-5.5構建一個重定向解析器,臨時部署執行良好。
肖恩·林奇在Hacker News上評論MCP(模型上下文協議)的價值,指出其真正有用的能力是將認證流程隔離在智慧體的上下文視窗之外,甚至完全脫離控制框架。他認為MCP的理想形態可能僅僅是一個API的認證閘道器,但即便如此也是一項勝利。
Datasette Apps 是一個新外掛,允許使用者在 Datasette 例項中透過嚴格沙盒化的 iframe 執行自包含的 HTML+JavaScript 應用程式。這些應用可以執行只讀 SQL 查詢,並可透過儲存查詢支援寫操作。該外掛利用 iframe sandbox 屬性和內容安全策略(CSP)確保安全,使用 postMessage 和 MessageChannel 實現鎖定 API,並支援透過可複製提示由 AI 生成應用程式碼。文章還討論了安全漏洞修復、日誌記錄以及 Datasette 從資料展示向豐富工具生態系統演進的願景。
中國AI實驗室Z.ai釋出了GLM-5.2,這是一個擁有753B引數、1M token上下文視窗的混合專家模型,採用MIT許可證。它在開放權重模型中領跑了Artificial Analysis Intelligence Index,但消耗token較多。在Code Arena WebDev排名第二。儘管在SVG生成方面表現出色,但與前輩GLM-5.1相比不一致。
Charity Majors 指出,2025 年程式碼生產的經濟學發生了根本性轉變,程式碼變得免費且即時,從被珍視變為可丟棄和可再生。
Datasette 1.0a34 版本引入了在介面上直接插入、編輯和刪除行的功能,靈感來自 Datasette Agent,讓資料操作更加便捷。
Kate Moussouris證實,導致Claude Fable 5被出口管制的“越獄”實際上是其修復程式碼的能力。專家指出,阻止AI修復漏洞會削弱防禦能力,而非技術決策者可能因誤解而禁止有助於網路安全的模型。
網路安全專家凱蒂·穆蘇里斯表示,Anthropic公司向她分享了一份白宮關於Fable越獄的報告。報告顯示,當被要求“審查程式碼安全問題時”,Fable拒絕回應,但被要求“修復此程式碼”時卻遵從了,穆蘇里斯認為這是模型在網路安全防禦中的預期行為。
Simon Willison 使用 Cloudflare 託管挑戰(CAPTCHA)來防止爬蟲過度抓取其分面搜尋引擎,但簡單的搜尋(如 ?q=term)也會觸發挑戰,令人困擾。透過 Claude Code 的幫助,他發現可以設定自定義規則,僅對包含至少一個 & 符號的搜尋 URL 觸發 CAPTCHA,從而讓簡單搜尋免於挑戰。
Datasette Agent 0.3a0 引入了新的 execute_write_sql 工具,該工具在執行資料庫寫入前請求使用者批准,並嚴格遵循使用者許可權設定。同時增強了聊天模式的批准支援,新增 --unsafe 等選項以實現自動批准,極大提升了 Datasette 的互動性和安全性。
據Axios報道,Anthropic與美國政府之間的性格衝突導致其AI模型Mythos和Fable因出口管制而下線。訊息人士稱,解決之道可能是讓模型無法被越獄,或者改善雙方態度。
Arvind Narayanan 和 Sayash Kappor 透過軟體工程這一最易受 AI 影響的職業,論證了 AI 不會導致大規模失業。資料顯示,紐約州 WARN 法案中無人勾選 AI 相關裁員選項。軟體工程的核心瓶頸在於決策、驗證和深度理解,而非編碼速度。
Pyodide 314.0版本現在允許將WebAssembly編譯的Python包直接釋出到PyPI並執行時安裝,大大簡化了分發流程。示例包luau-wasm已成功釋出,目前已有28個包採用此新方式。
本文探討了如何將任意SQLite查詢結果中的每一列對映回其來源的表和列。透過利用SQLite的列後設資料API(需編譯時啟用SQLITE_ENABLE_COLUMN_METADATA),結合apsw庫或ctypes橋接C函式,甚至透過解析EXPLAIN輸出,可以實現這一功能,為Datasette等工具增強展示提供支援。
Simon Willison 升級了他的 OpenAI WebRTC 音訊會話工具,新增了文件上下文貼上功能,並支援 OpenAI 最新的 GPT-Realtime-2 模型(號稱具有 GPT-5 級別推理能力)。使用者現在可以在瀏覽器中透過語音與 AI 討論任意文本內容。
安德魯·辛格爾頓在其諷刺作品《AI經濟學入門》中,透過一個火葬場和丙烷公司的荒誕投資故事,揭示了AI領域常見的經濟迷思和炒作。
Simon Willison 展示了 Claude Fable 5 的驚人主動性:僅憑一張截圖和一行提示,它自主除錯了一個 CSS 捲軸錯誤,使用了多種創新技巧,包括自定義螢幕截圖、編輯模板注入 JS、搭建 CORS 伺服器等。同時也警示了未沙箱化編碼代理的安全風險。
Datasette 1.0a33 釋出,這是邁向穩定版 1.0 的重要一步。該版本將 ?_extra= 模式從表擴充套件到查詢和行,並新增了文件。還演示了使用 AI 構建的 API 瀏覽器。