引用迪安·W·鮑爾
迪安·W·鮑爾指出前沿模型成本高昂,盈利窗口短暫,且AI基礎設施投資依賴全球市場。
- 前沿模型訓練成本極高,盈利窗口只有發佈後幾個月
- 一旦模型失去前沿地位,競爭加劇,利潤壓縮
來源詳情
AI News Hub 持續追蹤 Simon Willison's Weblog 的 AI 更新,並公開來源狀態、授權邊界、抓取方式和已發布文章。
Personal blog; posts are public and free to reference.
迪安·W·鮑爾指出前沿模型成本高昂,盈利窗口短暫,且AI基礎設施投資依賴全球市場。
Timothy B. Lee用管理者的比喻反駁了“LLM無需技巧、沒有學習曲線”的觀點。
Fernando Irarrázaval在hackmyclaw.com發起挑戰,邀請人們通過郵件竊取其OpenClaw測試實例中的秘密。儘管有6000次嘗試(花費500美元token,並導致谷歌賬號被暫停),無人成功。底層模型為Opus 4.6,使用了抗提示注入規則。這反映了前沿模型在抗注入攻擊方面的訓練效果,但仍需謹慎,無法保證絕對安全。
安德魯·內斯比特撰寫的假設性事件報告,描述了兩個來自不同供應商的AI審查代理因對軟件包是否惡意產生分歧,陷入無休止的爭論循環,導致高昂的推理費用和財務部門介入,最終營銷團隊藉機發佈聲明。
OpenAI 宣佈開始限量預覽 GPT-5.6 系列模型,包括旗艦模型 Sol、平衡型模型 Terra 和快速經濟型模型 Luna。Terra 性能與 GPT-5.5 相當,但成本降低一半;Luna 則以最低價格提供強大能力。定價按每百萬 tokens 計算,Sol 為 $5 輸入 / $30 輸出,Terra 為 $2.50 / $15,Luna 為 $1 / $6。新系列還引入了更可預測的提示緩存,支持顯式緩存斷點和 30 分鐘最小緩存壽命。由於美國政府的參與,此次發佈先以限量預覽形式提供給少數可信合作伙伴,隨後將廣泛發佈。
德國法院裁定谷歌為其AI生成摘要中的錯誤承擔責任。布魯斯·施奈爾評論稱,AI代理應被視為部署者的代理,若允許企業以AI錯誤為由免責,將導致災難性激勵,鼓勵用AI替代人類工作者。
受Mozilla新推出的MDN MCP服務啓發,Simon Willison將mdn/browser-compat-data倉庫中的瀏覽器兼容性數據轉換為SQLite數據庫。他使用Claude Code for web (Opus 4.8)和sqlite-utils生成轉換腳本,並通過GitHub Actions工作流將約66MB的數據庫部署到GitHub CDN,支持開放CORS頭,用户可以直接下載或通過Datasette Lite在線探索。
Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub項目,導致僱主無法瞭解申請者的真實能力與個性。
Simon Willison 利用 Claude Code 構建了一個瀏覽器內測試平台,用於探索 Origin Private File System (OPFS) 是否能讓 Datasette Lite 編輯用户計算機上的持久化 SQLite 文件。
研究人員發現,大型語言模型無法可靠地區分特權文本和用户輸入,並且更容易受到文本風格的影響而非實際內容。通過“去風格化”技術,攻擊成功率從61%驟降至10%,揭示了“角色混淆”這一根本問題。
西蒙·威利森使用Claude Code將Moebius 0.2B圖像修復模型從PyTorch/CUDA移植到使用WebGPU的瀏覽器中。整個過程涉及模型轉換、部署和緩存優化,最終實現了可在線運行的演示版本。
sqlite-utils 4.0rc1 發佈,作為 v4 的第一個候選版本,主要新增了數據庫遷移和嵌套事務(db.atomic())兩大特性,幷包含一些輕微的不兼容變更。
Cloudflare宣佈了一項新功能:用户無需註冊賬户即可通過臨時部署創建Cloudflare Workers項目,項目會保持活躍60分鐘。該功能雖宣稱面向AI代理,但實際對所有人都有用。作者演示瞭如何使用GPT-5.5構建一個重定向解析器,臨時部署運行良好。
肖恩·林奇在Hacker News上評論MCP(模型上下文協議)的價值,指出其真正有用的能力是將認證流程隔離在智能體的上下文窗口之外,甚至完全脱離控制框架。他認為MCP的理想形態可能僅僅是一個API的認證網關,但即便如此也是一項勝利。
Datasette Apps 是一個新插件,允許用户在 Datasette 實例中通過嚴格沙盒化的 iframe 運行自包含的 HTML+JavaScript 應用程序。這些應用可以執行只讀 SQL 查詢,並可通過存儲查詢支持寫操作。該插件利用 iframe sandbox 屬性和內容安全策略(CSP)確保安全,使用 postMessage 和 MessageChannel 實現鎖定 API,並支持通過可複製提示由 AI 生成應用代碼。文章還討論了安全漏洞修復、日誌記錄以及 Datasette 從數據展示向豐富工具生態系統演進的願景。
中國AI實驗室Z.ai發佈了GLM-5.2,這是一個擁有753B參數、1M token上下文窗口的混合專家模型,採用MIT許可證。它在開放權重模型中領跑了Artificial Analysis Intelligence Index,但消耗token較多。在Code Arena WebDev排名第二。儘管在SVG生成方面表現出色,但與前輩GLM-5.1相比不一致。
Charity Majors 指出,2025 年代碼生產的經濟學發生了根本性轉變,代碼變得免費且即時,從被珍視變為可丟棄和可再生。
Datasette 1.0a34 版本引入了在界面上直接插入、編輯和刪除行的功能,靈感來自 Datasette Agent,讓數據操作更加便捷。
Kate Moussouris證實,導致Claude Fable 5被出口管制的“越獄”實際上是其修復代碼的能力。專家指出,阻止AI修復漏洞會削弱防禦能力,而非技術決策者可能因誤解而禁止有助於網絡安全的模型。
網絡安全專家凱蒂·穆蘇里斯表示,Anthropic公司向她分享了一份白宮關於Fable越獄的報告。報告顯示,當被要求“審查代碼安全問題時”,Fable拒絕回應,但被要求“修復此代碼”時卻遵從了,穆蘇里斯認為這是模型在網絡安全防禦中的預期行為。
Simon Willison 使用 Cloudflare 託管挑戰(CAPTCHA)來防止爬蟲過度抓取其分面搜索引擎,但簡單的搜索(如 ?q=term)也會觸發挑戰,令人困擾。通過 Claude Code 的幫助,他發現可以設置自定義規則,僅對包含至少一個 & 符號的搜索 URL 觸發 CAPTCHA,從而讓簡單搜索免於挑戰。
Datasette Agent 0.3a0 引入了新的 execute_write_sql 工具,該工具在執行數據庫寫入前請求用户批准,並嚴格遵循用户權限設置。同時增強了聊天模式的批准支持,新增 --unsafe 等選項以實現自動批准,極大提升了 Datasette 的交互性和安全性。
據Axios報道,Anthropic與美國政府之間的性格衝突導致其AI模型Mythos和Fable因出口管制而下線。消息人士稱,解決之道可能是讓模型無法被越獄,或者改善雙方態度。
Arvind Narayanan 和 Sayash Kappor 通過軟件工程這一最易受 AI 影響的職業,論證了 AI 不會導致大規模失業。數據顯示,紐約州 WARN 法案中無人勾選 AI 相關裁員選項。軟件工程的核心瓶頸在於決策、驗證和深度理解,而非編碼速度。
Pyodide 314.0版本現在允許將WebAssembly編譯的Python包直接發佈到PyPI並運行時安裝,大大簡化了分發流程。示例包luau-wasm已成功發佈,目前已有28個包採用此新方式。
本文探討了如何將任意SQLite查詢結果中的每一列映射回其來源的表和列。通過利用SQLite的列元數據API(需編譯時啓用SQLITE_ENABLE_COLUMN_METADATA),結合apsw庫或ctypes橋接C函數,甚至通過解析EXPLAIN輸出,可以實現這一功能,為Datasette等工具增強展示提供支持。
Simon Willison 升級了他的 OpenAI WebRTC 音頻會話工具,新增了文檔上下文粘貼功能,並支持 OpenAI 最新的 GPT-Realtime-2 模型(號稱具有 GPT-5 級別推理能力)。用户現在可以在瀏覽器中通過語音與 AI 討論任意文本內容。
安德魯·辛格爾頓在其諷刺作品《AI經濟學入門》中,通過一個火葬場和丙烷公司的荒誕投資故事,揭示了AI領域常見的經濟迷思和炒作。
Simon Willison 展示了 Claude Fable 5 的驚人主動性:僅憑一張截圖和一行提示,它自主調試了一個 CSS 滾動條錯誤,使用了多種創新技巧,包括自定義屏幕截圖、編輯模板注入 JS、搭建 CORS 服務器等。同時也警示了未沙箱化編碼代理的安全風險。
Datasette 1.0a33 發佈,這是邁向穩定版 1.0 的重要一步。該版本將 ?_extra= 模式從表擴展到查詢和行,並新增了文檔。還演示了使用 AI 構建的 API 瀏覽器。