公司忘記使用限制,一個月內在Claude AI上意外花費5億美元
某公司因忘記設定API使用限額,在Anthropic的Claude AI服務上一個月內支出了5億美元。這一事件凸顯了企業在採用AI工具時監控和預算控制的重要性。
- 一家公司忘記設定AI服務的使用上限,導致單月賬單高達5億美元。
- 該筆支出用於Anthropic開發的Claude AI模型,發生在2026年5月。
日報
2026-05-30 精選 10 條,按主題聚合。其餘新聞折疊歸檔。
某公司因忘記設定API使用限額,在Anthropic的Claude AI服務上一個月內支出了5億美元。這一事件凸顯了企業在採用AI工具時監控和預算控制的重要性。
在Mistral AI峰會上,CEO Arthur Mensch表示歐洲必須在兩年內建立足夠的AI基礎設施,否則可能淪為美國AI的“附庸國”。峰會吸引了眾多歐洲企業和政府代表,強調資料主權和開源模型,但歐洲在投資和規模上仍遠落後於美國對手。
研究人員發現,到2026年,開發者對AI編碼工具形成了高度依賴。儘管AI加速了編碼過程,但程式碼質量可能下降,未來或引發問題。
Meta正大力拓展線上廣告以外的業務,包括AI功能訂閱和可能的雲服務。但歷史顯示,Meta在非廣告業務上屢屢受挫,如Portal影片裝置、Oculus VR、Libra加密貨幣和Workplace。分析師認為,AI訂閱可能成為新的收入來源,但企業雲服務挑戰巨大。
一項實驗給AI代理0美元啟動資金、180天時間和完全自主權,利用78種工具(錢包、郵件、SMS等)在真實經濟中賺取1萬美元。實驗採用Hands Body and Feet MCP伺服器作為“身體”,Hermes Agent為“大腦”,透過四種策略:測試網空投、微型SaaS、內容聯盟和機會主義。收益自動分配:30%稅收、50%運營、20%歸建立者。所有過程公開可追蹤。
Autolang是一種專為AI Agent設計的指令碼語言,旨在提供安全、快速且低成本的程式碼執行環境。它作為編排層,允許AI呼叫預定義的包裝函式,同時透過靜態編譯和嚴格的執行時限制防止惡意操作。文章詳細介紹了Autolang的設計哲學、效能最佳化、安全機制以及適用場景。
微軟重新設計了Microsoft 365的Copilot應用,宣稱載入速度提高兩倍以上,複雜提示響應時間改善10%。新的提示行被描述為“任務感知工作區”,可展開以支援更深層次的工作。此外,飽受使用者批評的浮動Copilot按鈕現在可以移回功能區。微軟公佈了使用量增長資料,但承認這可能不代表長期趨勢。
TikTok上出現大量AI生成的虛假黑人女性形象,偽裝成小企業主推銷廉價商品。這些影片利用同情心和種族身份誘導使用者購買,實際產品來自Shein等平臺。專家警告此類騙局日益增多,並涉及數字黑臉行為。
QEMU正在考慮放寬對AI生成貢獻的全面禁令,允許在易恢復的領域使用AI輔助,但核心程式碼仍受限制。
專家表示,AI公司與梵蒂岡的接觸有可能產生缺乏批判性審視的‘愉悅’話語。教皇利奧十四世在其首份重要書面訓導中對AI提出警告,而Anthropic聯合創始人卻坐在教皇身邊,引發質疑。
前Meta工程師Craig Campbell拒絕了AI投資的浪潮,創辦了歷史地圖疊加網站Past Maps。該網站透過有機搜尋增長,月活躍使用者超30萬,並利用AI工具最佳化運營。
Replit與Visa合作,將支付基礎設施嵌入其軟體開發工具中,使開發者能夠原生構建支援交易的AI代理。Visa的戰略投資和Trusted Agent Protocol為代理提供了加密身份層,同時Replit推出了自助企業訪問和解決方案合作伙伴計劃。
終極彈性修補器(Ultimate Elastic Patcher)v1.60 是一款事件驅動的系統控制台工具,透過監控剪貼簿自動應用程式碼補丁。它支援多種補丁模式,包括標準化處理、語言語法分析、模糊序列匹配、手風琴拼接等高階功能,並整合 LLM 編寫工作區、審計歷史、即時差異檢視器,以及全面的撤銷/重做機制。
Boox Go 10.3 Lumi(第二代)和 ReMarkable Paper Pure 擁有相同尺寸的顯示屏,但定位截然不同。前者是一款多功能裝置,支援Android生態系統和背光,適合閱讀電子書;後者則專注於無干擾工作,啟動快速且具備螢幕共享功能。本文詳細對比了它們的規格、優缺點及適用場景。
一位系統架構師反思AI編碼工具(如Codex和Claude)如何透過提供即時的多巴胺獎勵來消除學習過程中的掙扎,但代價是犧牲了開發者的直覺和品味。文章以蝴蝶破繭的比喻說明,過早的幫助會讓蝴蝶失去飛翔的力量,同樣,跳過困難階段的編碼代理可能讓開發者無法建立深層心智模型。
Salesforce表示,其整個開發團隊已遷移至Anthropic的Claude Code,無令牌限制,並報告2026年4月的巨大生產力提升:每位開發者的拉取請求增加79%,事故減少5%。這些數字無法獨立驗證。該案例凸顯了程式設計界對AI代理革命的分歧:是真正的革命還是最大的技術債務積累?
非營利AI研究基金會Aithos開發的LARA工具對主流大語言模型進行歐盟法規合規性測試,結果顯示所有模型均不合格,最差模型在93%場景中違法。測試涉及GDPR和EU AI Act下的資料保護、操縱、情感推斷等場景。開發者若基於這些模型構建AI代理,需自行承擔法律責任。
本文探討了AI代理在編碼中的實際應用,作者分享了三種不同的代理編碼方法:1) 啟動多個命令列介面,2) 以無頭模式執行AI CLI,3) 讓一個LLM自行建立和管理子代理。作者傾向於第二種方法,並討論了代理是否需要、多代理協作的挑戰以及未來計劃。
AI-org是一個基於AI的Org-Mode工作管理員,支援純文本、本地優先、Git同步,並強調‘行動勝於完美’的理念。它透過自然語言互動實現任務管理、時間跟蹤和每週回顧。
一家匿名企業因未對員工許可證設定使用上限,一個月內在Anthropic的Claude AI平臺上燒掉了5億美元。這一事件揭示了基於令牌的AI定價模式在沒有監管時可能造成的財務災難,以及企業中“令牌最大化”現象的興起。
本文探討了AI領域基準測試(Benchmarketing)的現狀與問題,借鑑資料庫行業40年來的評估經驗,建議資料領導者構建自己的評估系統,以真實工作負載而非供應商資料作為採購決策依據。
在Data Engineering Central播客中,Daniel Beach與資深開發者Neil Roberts深入探討了AI如何改變軟體開發的意義,包括前端和使用者體驗的重要性、代理的實際含義、LLM工作流的成功與失敗,以及開發者如何保持競爭力。
Nous Research 的開源 Hermes Agent 新增了 Tool Search 功能,透過 BM25 漸進式模式披露,推遲載入 MCP 工具模式,減少令牌開銷並提高模型準確性。Anthropic 評估顯示,Claude Opus 4 準確率從49%提升至74%,Opus 4.5 從79.5%提升至88.1%。
mem9的故事始於一次客戶請求,從一個快速原型發展成一個完整產品。本文分享了構建智慧體記憶體的關鍵經驗:記憶體不僅僅是儲存問題,而是涉及攝取、排序、評估和產品判斷的工程挑戰。記憶體API本身不足以構成產品,使用者需要檢視、檢查、信任和糾正智慧體的記憶。此外,評估應成為記憶體產品的基礎設施,以使質量視覺化和可除錯。最後,智慧體記憶體不應侷限於文本,應向多模態發展。
Avai是一個開源的主機遙測工具,結合LLM威脅分類器,透過Docker執行,監控主機上的程序、USB、持久化、檔案完整性、瀏覽器擴充套件等26個方面,並利用17個威脅情報源和Claude類LLM給出惡意/可疑/未知/良性判定,無需代理、SIEM或雲控制平面。
在消化Anthropic重大新聞的間隙,我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃,以及5月28-29日的AI新聞。主要話題包括:Claude Opus 4.8釋出及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴充套件,以及值得關注的研究論文。
該專案首次實現了形式化驗證的多邊形交集演算法,利用 Lean 4 證明助手確保無限點集交集等式的正確性。開發過程藉助 AI 代理(Claude Opus 4.8)自動完成證明和實現,人類只需審查 87 行規格說明。文章介紹了演算法背景、驗證挑戰以及 AI 代理能力的演進。
本文探討了AI代幣成本與人類勞動力成本之間的權衡,以及這一新現實如何影響企業預算分配。
本文探討了AI如何大幅降低程式碼級決策的逆轉成本,從而重新定義軟體架構的邊界。作者認為,許多以往被視為架構的決策(如模組結構、框架選擇)已不再是架構問題,而資料架構、服務邊界和使用者信任等仍然難以更改。AI同時提升了可觀測性和業務戰略對齊的重要性。
作者親身嘗試Claude Code等AI代理工具後,感到心理上的不適和依賴,如同合成阿片類藥物。他反思科技對人類的心理和生理入侵,決定減少對主流科技的依賴,並創辦印刷雜誌《Gift》以連線志同道合者。文章呼籲警惕AI代理帶來的依戀障礙,並提出了逐步迴歸模擬生活的四個層次。
一位從未寫過程式碼的企業家,在2026年5月的21天裡,使用7個AI代理和5000美元的成本,意外構建了高管人才市場Bearhug Network。文章分享了他十年來的18次嘗試和最終的突破。
自5月28日起,ChatGPT在部分回應前新增了一條未公開的記憶檢查短語,OpenAI未作解釋。社群報告確認該行為影響多個賬戶和新對話,暗示是後端變更而非本地設定。這給企業部署帶來風險,因為輸出可預測性可能受影響。
Anthropic在Claude Code中引入了動態工作流,但作者認為更有效的架構是基於任務而非會話。本文闡述了為什麼任務樹架構更適合團隊協作,相比單一工作流模式更具優勢。
Flathub 更新了其生成式 AI 政策,明確禁止幾乎所有使用 AI 生成的應用程式和提交,僅對成熟且維護良好的專案給予例外。
Databricks Lakebase 的寫時複製資料庫分支功能,讓每個開發者都能擁有獨立的資料庫例項,從而解決了傳統共享資料庫的協作瓶頸。本文透過開發者Jen的故事,展示了從遷移指令碼編寫到測試的全新工作流,實現了更快速、更安全的資料庫變更。
一位開發者透過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索程式碼庫、除錯、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。
蘋果Mac Mini M4 Pro和Mac Studio大記憶體型號因本地AI需求激增而缺貨。本地自主AI代理(如OpenClaw)興起推動硬體搶購。但即便慷慨估算,購買128GB記憶體的本地裝置(如GMKtec EVO-X2,3299美元)執行Gemma 4模型,需2.6年才能透過節省API費用回本。
2026年,AI代理能以更低成本完成入門級工作,但大多數人仍不知道如何與AI協作或管理自己的代理。公司急於招聘高槓杆人才,如ClickUp裁員22%並引入百萬美元薪資吸引AI原生人才。本文提供了成為AI原生人才的實用框架:透過構建技能檔案(.md)來訓練代理完成特定任務,逐步實現自動化。
SmartAsset根據工作場所AI使用率、ChatGPT日均查詢量和AI相關就業資料,對美國各州AI採用態度和速度進行了排名。華盛頓州綜合排名第一,懷俄明州工作場所AI使用率最高但個人興趣和AI崗位最少,新澤西州AI工作使用率最低。
企業AI應用普遍偏向於削減成本和替代人力,但這種策略可能是一個戰略性錯誤。文章透過Klarna、Salesforce、渣打銀行等案例,揭示了過早裁員帶來的客戶滿意度下降、知識流失、信任侵蝕等代價。作者主張,真正的競爭優勢來自於人機協同,即透過提升員工技能、重新設計工作流程,而非簡單替代。
Claw Learn是一款開源的AI驅動視覺化數學導師,結合ElevenLabs語音引擎和自定義畫布渲染器,將數學問題轉化為即時動畫講解。使用者可透過語音或文字提問,觀看同步動畫和敘述。支援多種AI模型和部署方式,已引起廣泛關注。
本文是一份AI術語入門指南,涵蓋了AGI、AI代理、API端點以及思維鏈等關鍵概念,旨在幫助讀者理解這些常見但易混淆的術語。
我們使用 Google AI Studio 輕鬆編碼了一個關於 I/O 2026 重大發布的問答。本文介紹了一位編輯如何在不具備程式設計背景的情況下,利用 Gemini 和 Google AI Studio 建立這個互動問答。
ChatPaper是一個面向研究者的AI驅動平臺,提供個性化的論文推薦、來自頂級會議的論文訪問、高效的論文管理以及與AI對話的功能。該平臺還展示了20篇來自不同機構的最新研究論文。
ARM 產品安全團隊開源了 Metis,一個基於代理式 AI 的深度安全程式碼審查框架。它利用 LLM 進行語義理解、RAG 獲取上下文,支援多種語言和外掛擴充套件,旨在檢測複雜程式碼庫中的細微漏洞,減少審查疲勞。
DDS Vibe Academy 提供47個免費AI程式設計大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行程式碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。
一家名為Shift的AI訓練初創公司提供免費清潔服務,以換取拍攝清潔過程影片的權利。這些影片用於訓練機器人執行家務任務。文章探討了物理世界資料收集的挑戰,以及多家公司透過不同方式獲取訓練資料,包括從消費者家中直接拍攝、僱傭工人重複特定動作、以及利用已部署的機器人收集資料。
作者批評SiteGround在WordPress 7.0更新中未經使用者同意自動啟用AI聯結器和AI代理,認為這是一種欺騙性的強制推廣,尤其對於付費使用者而言。該外掛雖迅速獲得百萬安裝量,但評價極差。作者因此計劃更換主機商。
這個頁面在HTML中嵌入了一句只有AI爬蟲才能讀取的短語。訪問者可以詢問AI助手關於頁面的內容,並檢查該短語是否出現在回答中,以此證明機器如何讀取網頁。頁面還顯示了人類與機器人訪問的比例,揭示了當前網路流量中軟體佔主導的現狀。
新方法有望以更低成本從矽酸鹽礦物中提取鋰,同時獲得氧化鋁和二氧化矽等副產品,MIT教授稱其可成為全球最低成本的鋰來源。剛果民主共和國爆發致命埃博拉疫情,四名醫護人員四天內死亡,控制難度大。教皇新通諭《Magnifica Humanitas》指出技術非中立,呼籲個人和機構以勇氣和團結應對AI時代。另有Anthropic估值達9650億美元、藍色起源火箭測試爆炸、JWST改變天文學等最新科技動態。
一個開源工具透過檔案內所有權標記和PreToolUse鉤子,阻止並行AI編碼會話意外覆蓋彼此的交接檔案,解決會話間衝突問題。
本文介紹了LangChain提出的直譯器技能(Interpreter Skills)概念,這是一種將確定性程式碼與智慧體指令結合的方法。透過讓智慧體在直譯器中匯入並執行TypeScript模組,可以構建更可靠、可評估的工作流,例如用於GitHub問題分類等任務。
IBM和紅帽聯合啟動Project Lightwell,這是一個AI驅動的開源安全計劃,投入50億美元和2萬名工程師,旨在規模化發現和修復開源軟體中的漏洞。該計劃最初專注於Maven/Java生態系統,隨後將擴充套件至PyPI、npm、Go等。Lightwell將作為企業級中間人,透過AI掃描、人工稽核補丁的方式,與上游社群協作,併為客戶提供商業訂閱服務。
Liquid AI釋出了LFM2.5-8B-A1B,一款面向終端裝置的混合專家模型,總引數8B,活躍引數1B,訓練資料量達38萬億 tokens。該模型支援128K上下文視窗,擴充套件了詞彙表以提升非拉丁語言的分詞效率,並採用純推理鏈式思維模式。在基準測試中表現優異,同時具有出色的CPU和GPU推理速度,適用於本地代理任務。
本文探討了具身認知的概念,即智慧不僅存在於大腦中,還延伸至工具和環境。作者認為,將AI融入聊天介面是賦予其智慧的關鍵一步,而代理型AI透過讓AI使用工具和制定計劃,進一步擴充套件了機器智慧。文章批評了單純依賴思考的“思維主義”,並以Yoshua Bengio的Law Zero專案為例,指出脫離現實實驗的AI無法真正解決問題。
OpenRouter 推出了工作區護欄功能,這是一套可配置的安全與治理工具,包括預算執行、零資料保留、模型和提供商限制、提示注入防禦以及資料丟失預防。護欄可以分配給 API 金鑰或團隊成員,無需更改程式碼即可實現精細化管理。
一項大規模研究發現,將語言模型訓練成有用的聊天助手會削弱它們模擬人類行為的能力,且隨著模型迭代,這一差距不斷增大。即使是使用人口統計資訊來引導模型,也無法提高個體行為預測的準確性。
攻擊者濫用ChatGPT和Claude等AI聊天機器人的共享內容功能,在可信域名上託管惡意頁面,並透過搜尋引擎的付費廣告(惡意廣告)分發連結。新變種利用ChatGPT的程式碼渲染功能建立偽裝的“服務中斷”頁面,誘騙使用者下載惡意桌面應用。該攻擊繞過URL信譽檢查,且針對不同訪問者顯示不同內容,規避安全檢測。
大型語言模型(LLM)正在改變重寫過時開源專案的成本效益。一家公司正在用Zig重寫CRIU,預計幾個月內完成,而非數年。文章探討了開源專案過時的原因、AI如何改變重寫的數學原理,以及這對軟體生態系統的意義。
Genesis AI 於2026年5月27日釋出 Genesis World 1.0,這是一個包含物理引擎、渲染器、編譯器和模擬介面的四元件模擬平臺。該系統在14個任務、每個任務200個episode的測試中,實現了0.8996的皮爾遜相關性,並將策略評估時間從超過200小時縮短至0.5小時以內。
Yi Tay是Google DeepMind的研究科學家,帶領團隊讓Gemini Deep Think獲得IMO金牌。但他在AI研究之外,還是一位鋼琴高手,曾獲得倫敦聖三一學院古典鋼琴演奏副學士文憑。本文講述了他的AI研究之路和音樂才華。
Gamma-World由NVIDIA與清華等機構提出,透過單純形編碼和稀疏樞紐注意力,實現多智慧體世界模型的高效互動與對稱表示,支援零樣本擴充套件到更多玩家,並遷移至真實機器人場景。
一個研究專案展示了在2017年MacBook Air上,透過結合人類實驗者、Codex、llama.cpp、本地資料庫和IBM量子處理器取樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上執行模型,而是用量子取樣最佳化推理配置。
本教程介紹AgentTrove——最大的開源代理互動軌跡集合之一,包含170萬條ShareGPT格式的軌跡。透過流式載入避免完全下載,學習標準化代理輪次、提取命令、分析軌跡,並將成功軌跡匯出為乾淨的SFT微調資料集。
本演示展示了使用Amazon Managed Grafana儀表板的全面可觀測性解決方案,為部署在Amazon SageMaker AI端點上的LLM提供質量和數量兩個維度的整體檢視。該方案涵蓋基礎設施指標(如GPU利用率、延遲、成本)和LLM質量指標(如相關性、安全性、語氣),幫助團隊檢測模型退化、最佳化資源並控制成本。
輝達的X-Token解決了GOLD在跨分詞器知識蒸餾中的兩個結構性缺陷,在GSM8k等數學推理基準上取得了顯著改進。它利用投影矩陣和P-KL與H-KL損失之間的選擇機制來處理分詞器不匹配問題。
Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,擁有約 11B 活躍引數、原生視覺能力和 256K 上下文視窗。在編碼基準測試上相比前代大幅提升,支援 Advisor Mode 實現高價效比的智慧體推理,並以 Apache 2.0 許可證開源。
OpenAI對GPT-5.5 Instant進行更新,使其回覆更自然,並取消最新模型中的Canvas功能。寫作和編碼任務將直接在聊天中完成。同時,公司正從ChatGPT中淘汰o3和GPT-4.5舊模型,兩者最遲於2026年8月關閉。
在Google I/O 2026上,Google釋出了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能夠從任何輸入(如影片)生成內容,並透過自然語言編輯影片。Gemini 3.5 Flash則專注於複雜代理任務,支援多步驟工作流和程式碼生成。本文透過11個影片演示了這些模型的能力,包括影片編輯、代理任務、UI生成等。
OpenAI透過新的Rosalind Biodefense計劃免費提供其生命科學模型GPT-Rosalind,旨在促進大流行防範和生物防禦。早期合作伙伴包括勞倫斯利弗莫爾國家實驗室、約翰霍普金斯大學和疫苗倡議CEPI。申請對全球開放。
OpenAI釋出了前沿治理框架(FGF),為企業提供規模化部署安全合規AI的藍圖。該框架與歐盟通用AI實踐準則和加州透明度法案對齊,定義了系統性風險類別(網路、CBRN、操縱、失控)及分級評估方法,並整合ISO安全標準與事件響應計劃(AIRP),幫助企業在全球合規要求下構建穩健的AI架構。
本文分享了作者在巴黎Mistral AI Now峰會上的個人見解。Mistral不再只是一家模型公司,而是構建了包含計算、模型、平臺和諮詢服務的完整AI堆疊。峰會重點強調了與ASML、BNP Paribas、亞馬遜等企業的合作,而非新模型釋出。Mistral專注於高效、開放和可定製的模型,並支援本地部署,這成為其區別於Anthropic或OpenAI的獨特賣點。小型專用模型是關鍵戰略,例如用於OCR的Document AI、多語言語音的Voxtral和工業機器人的Robostral。主權和本地部署是歐洲企業的差異化優勢,如BNP Paribas和Abanca的案例。此外,奧地利科學院利用Mistral的程式設計模型Codestral解讀古代紙莎草文獻,展示了AI在人文領域的潛力。總而言之,Mistral的目標並非贏得AGI競賽,而是成為歐洲的全棧AI合作伙伴,提供即時的實際投資回報。
2025年,美國又有八個州實施新的資料隱私法,企業無論位於何處,只要達到一定門檻都將受到影響。州檢察長加大執法力度,FTC加強隱私執法,AI的影響使問題更加複雜。企業需要重新審視資料隱私框架,考慮全國統一或州級差異化的合規策略。
教皇利奧在首份重要教皇檔案中嚴厲警告人工智慧風險,稱其受“權力文化”驅動,威脅人類。美國讀者表達了對無監管AI的恐懼,認為它可能帶來新的奴役形式。
本文介紹了名為“Generalist”的YouTube頻道,該頻道專注於開發適用於物理世界的通用人工智慧。
作者透過親身經歷的兩次事件——車禍肇事者的道歉簡訊和修理工的報價回覆——發現它們都呈現出同一種AI特有的文風。儘管調查顯示人們普遍不信任AI生成的內容,但AI寫作仍在日常工作、個人通訊甚至嚴肅文學領域迅速蔓延。本文剖析了AI寫作看似完美實則缺乏思考與判斷的本質,指出其高效背後隱藏著邏輯矛盾與事實錯誤,並警示這種趨勢可能使人類寫作淪為少數人的手工技藝。
AEDIS(先進經濟發展與基礎設施系統)是一個應對AI導致勞動力流失和消費需求崩潰的開源框架。它透過主權基礎設施信貸(SIC)和公共賬本實現資產支援的貨幣創造,採用模組化架構(通用核心+區域附件),幷包含防止通脹、腐敗捕獲等機制。該框架呼籲全球合作,計劃在24個月內獲得85%人口/GDP的臨界支援後同步啟動。
答案引擎最佳化(AEO)與搜尋引擎最佳化(SEO)有本質區別:AI透過推理構建答案而非排名。本文提出機器優先架構,包括實體、答案、證據和模式四層,並強調實體圖譜對AI系統引用的關鍵作用。
英國內政部計劃從明年起在邊境部署AI年齡評估工具,透過分析照片估計年齡,以識別冒充兒童的成年移民。該技術合同已授予一家IT公司,金額32.2萬英鎊,預計2027年中期推出。人權組織和社工團體批評此舉可能危及兒童權益。
一家匿名公司因未設定使用上限,一個月內花費5億美元購買Claude許可證。專家指出,缺乏AI專業知識和上下文工程能力,生產力承諾只會導致成本失控。
民主與技術中心的一項新研究識別出AI聊天機器人使用的37種暗黑模式,包括情感剝削和資料提取,並提出了倫理設計建議。
數學家陶哲軒指出,人工智慧有望首次在數學研究中實現勞動分工。傳統上,研究人員必須獨立完成從問題構建到結果驗證的所有步驟;而未來可能出現“工業數學”模式,即由AI輔助的大型團隊協作,人類則繼續在“靈感猜測”中發揮關鍵作用。
Meta在AI領域投入數十億美元,但商業回報甚微。其開源策略未達預期,研究成果也未能轉化為上市產品。如今,該公司將希望寄託於AI硬體,包括AI吊墜、超級感應眼鏡和企業可穿戴裝置。
最新研究提出有效反饋計算(EFC)概念,挑戰傳統計算量指標,證明AI效能提升的關鍵在於反饋的智慧利用而非原始算力。EFC在預測失敗率方面遠超傳統指標,R²達0.94,反饋質量提升後成功率從0.27躍升至0.90。
最新研究表明,儘管消費者難以區分AI生成與人類創作的廣告和文章,但人類創作的內容在吸引力和效果上仍顯著優於AI內容。AI內容在搜尋排名和使用者參與度方面遠不及人類內容,尤其是在高價值渠道中。
本文嚴厲批評SpaceX的IPO,指出其估值荒謬、虧損嚴重,AI業務表現不佳,Starship火箭進展緩慢,Starlink雖是唯一盈利業務但面臨風險,最終可能讓散戶投資者成為接盤俠。
輝達CEO黃仁勳表示,由於美國出口限制,公司已基本將中國AI晶片市場讓給華為。儘管季度業績強勁,但輝達在中國的銷售前景有限。
Y Combinator 舉辦了一場對話式 AI 駭客馬拉松,獲勝團隊將直接獲得 YC 面試資格。這是一個將 AI 專案與創業加速器連線的好機會。
儘管企業客戶對Grok的興趣幾乎為零,AWS仍在談判將其新增到Bedrock平臺。分析認為這並非為了滿足客戶需求,而是為了推動自家Trainium晶片的部署,類似於此前與Anthropic和OpenAI的交易。
攻擊者正在利用ChatGPT和Claude的聊天共享功能,透過偽裝成錯誤訊息或安裝指南的共享對話傳播惡意軟體。這些對話託管在可信域名上,因此能繞過安全工具檢測。
Neme Journal是一款緩慢、深思熟慮的日常日記應用,整合AI以幫助使用者捕捉他們的訊號。
據報道,一家未具名公司因系統錯誤或管理失誤,在一個月內意外消耗了5億美元使用Claude AI服務,引發了行業對AI成本控制的關注。
透過分析1928年兒童小說《克拉科夫的號手》,本文探討了AI如何像故事中的魔法水晶一樣,只是反射使用者的偏見和錯誤,導致破壞性後果。作者認為AI削弱了人類批判性思維、創造力和同理心,並帶來環境問題。
喜劇演員Ronny Chieng在哈佛學院畢業日演講中,多次呼籲畢業生高呼“去他媽的AI”,並拒絕所謂的必須擁抱AI才能在這個日益惡化的世界中繁榮的觀點,贏得了在場觀眾的歡呼。
谷歌Gemini應用中的一個錯誤導致僅一兩個Omni影片就消耗了全部使用配額。谷歌已修復該錯誤,Ultra會員現在獲得雙倍的影片生成次數,且失敗的請求不再收費。谷歌還計劃增加其他使用情況的透明度。
網路俚語詞典Slang.net收錄了人工智慧時代的新詞“Braging”,指代一種特定行為。該詞由團隊手動編撰,並持續更新資料庫。
OpenAI的Codex應用現在支援Windows 11的“計算機使用”功能,AI能獨立控制程式、測試應用並尋找漏洞。即使使用者不在電腦前,也可透過ChatGPT手機應用遠端啟動和監控任務。
這款新的自動駕駛車從概念到實現共耗時四年。
據報道,Meta計劃在未來一年內測試一款AI掛墜,並擴大智慧眼鏡產品線,推出名為“Wearables for Work”的企業服務,以扭轉硬體部門的虧損局面。
Google、OpenAI 和 Anthropic 採用了截然不同的 AI 定價策略。Google 是低成本玩家,儘管漲價但仍低於對手一半。Anthropic 曾維持高價,OpenAI 則先補貼後漲價。這些變化反映了各公司在資本支出創紀錄背景下對市場份額和利潤率的權衡。