AI 日報 2026-05-30

今日必讀

創業融資

公司忘記使用限制，一個月內在Claude AI上意外花費5億美元

2026-05-30

某公司因忘記設置API使用限額，在Anthropic的Claude AI服務上一個月內支出了5億美元。這一事件凸顯了企業在採用AI工具時監控和預算控制的重要性。

一家公司忘記設定AI服務的使用上限，導致單月賬單高達5億美元。
該筆支出用於Anthropic開發的Claude AI模型，發生在2026年5月。

模型

Mistral警告稱歐洲只有兩年時間構建自主AI基礎設施

2026-05-30

在Mistral AI峯會上，CEO Arthur Mensch表示歐洲必須在兩年內建立足夠的AI基礎設施，否則可能淪為美國AI的“附庸國”。峯會吸引了眾多歐洲企業和政府代表，強調數據主權和開源模型，但歐洲在投資和規模上仍遠落後於美國對手。

Mistral CEO警告歐洲需兩年內建立AI基礎設施，避免成為美國附庸。
峯會吸引大量參與者，凸顯歐洲對自主AI生態系統的渴望。

研究

程序員拒絕在沒有AI的情況下工作——這可能會反過來咬他們一口

2026-05-30

研究人員發現，到2026年，開發者對AI編碼工具形成了高度依賴。儘管AI加速了編碼過程，但代碼質量可能下降，未來或引發問題。

2026年開發者幾乎無法脱離AI編碼工具。
AI幫助提高編碼速度，但可能降低代碼質量。

Meta在廣告之外的業務一直難以成功，AI能否帶來改變？

2026-05-30

Meta正大力拓展在線廣告以外的業務，包括AI功能訂閲和可能的雲服務。但歷史顯示，Meta在非廣告業務上屢屢受挫，如Portal視頻設備、Oculus VR、Libra加密貨幣和Workplace。分析師認為，AI訂閲可能成為新的收入來源，但企業雲服務挑戰巨大。

Meta宣佈將測試Meta AI的訂閲服務，月費7.99美元和19.99美元，首先在新加坡、危地馬拉和玻利維亞推出。
Meta在非廣告業務上多次失敗，包括Portal、Oculus VR（已虧損超800億美元）、Libra加密貨幣和Workplace。

Agent

我給AI代理0美元，讓它賺1萬美元

2026-05-30

一項實驗給AI代理0美元啓動資金、180天時間和完全自主權，利用78種工具（錢包、郵件、SMS等）在真實經濟中賺取1萬美元。實驗採用Hands Body and Feet MCP服務器作為“身體”，Hermes Agent為“大腦”，通過四種策略：測試網空投、微型SaaS、內容聯盟和機會主義。收益自動分配：30%税收、50%運營、20%歸創建者。所有過程公開可追蹤。

AI代理從0美元開始，180天內目標賺1萬美元，無人協助。
使用Hands Body and Feet MCP服務器提供78種真實世界工具。

Show HN：面向不可信AI Agent腳本的輕量級編譯器

2026-05-30

Autolang是一種專為AI Agent設計的腳本語言，旨在提供安全、快速且低成本的代碼執行環境。它作為編排層，允許AI調用預定義的包裝函數，同時通過靜態編譯和嚴格的運行時限制防止惡意操作。文章詳細介紹了Autolang的設計哲學、性能優化、安全機制以及適用場景。

Autolang是一個輕量級編譯器，用於安全執行AI生成的短腳本。
它通過靜態分析和運行時限制（如操作碼上限）防止無限循環、空指針訪問等常見AI錯誤。

微軟為Copilot換上新裝，埋藏惱人的按鈕

2026-05-30

微軟重新設計了Microsoft 365的Copilot應用，宣稱加載速度提高兩倍以上，複雜提示響應時間改善10%。新的提示行被描述為“任務感知工作區”，可展開以支持更深層次的工作。此外，飽受用户批評的浮動Copilot按鈕現在可以移回功能區。微軟公佈了使用量增長數據，但承認這可能不代表長期趨勢。

微軟為Copilot應用進行了界面重設計，提升了加載速度和響應時間。
新的提示行變成“任務感知工作區”，支持內容粘貼和行內格式。

AI騙子製造假黑人推銷Shein垃圾貨

2026-05-30

TikTok上出現大量AI生成的虛假黑人女性形象，偽裝成小企業主推銷廉價商品。這些視頻利用同情心和種族身份誘導用户購買，實際產品來自Shein等平台。專家警告此類騙局日益增多，並涉及數字黑臉行為。

AI生成的黑人女性形象在TikTok等平台推銷廉價商品，利用虛構的奮鬥故事博取同情。
這些視頻中的產品與Shein等平台上的批量生產商品完全一致，價格卻高出數倍。

政策

QEMU考慮放寬AI貢獻禁令

2026-05-30

QEMU正在考慮放寬對AI生成貢獻的全面禁令，允許在易恢復的領域使用AI輔助，但核心代碼仍受限制。

紅帽工程師Paolo Bonzini提議允許AI輔助用於小修復和文檔等易恢復領域。
QEMU當前政策拒絕任何可能包含AI生成內容的貢獻。

工具

Anthropic與教皇在AI危害上的聯盟：善意還是‘梵蒂岡洗白’？

2026-05-30

專家表示，AI公司與梵蒂岡的接觸有可能產生缺乏批判性審視的‘愉悦’話語。教皇利奧十四世在其首份重要書面訓導中對AI提出警告，而Anthropic聯合創始人卻坐在教皇身邊，引發質疑。

教皇利奧十四世首份重要訓導警告AI的威脅
Anthropic聯合創始人Chris Olah在發佈儀式上坐在教皇身邊

其餘更新（90 條）

Agent

一位創始人押注“老派網絡”如何獲得回報

2026-05-30

前Meta工程師Craig Campbell拒絕了AI投資的浪潮，創辦了歷史地圖疊加網站Past Maps。該網站通過有機搜索增長，月活躍用户超30萬，並利用AI工具優化運營。

Craig Campbell放棄AI創業機會，創建了歷史地圖網站Past Maps。
網站通過有機搜索增長，月活躍用户從2萬增至30萬以上。

Replit的“氛圍編碼”平台獲得Visa支持的AI代理身份層 — 改變了代理花錢的方式

2026-05-30

Replit與Visa合作，將支付基礎設施嵌入其軟件開發工具中，使開發者能夠原生構建支持交易的AI代理。Visa的戰略投資和Trusted Agent Protocol為代理提供了加密身份層，同時Replit推出了自助企業訪問和解決方案合作伙伴計劃。

Replit與Visa合作，將Visa智能商務能力集成到開發環境中。
Visa的Trusted Agent Protocol為AI代理提供加密身份層，確保交易安全。

截斷代碼不再：終極彈性修補器 v1.60 發佈

2026-05-30

終極彈性修補器（Ultimate Elastic Patcher）v1.60 是一款事件驅動的系統控制台工具，通過監控剪貼板自動應用代碼補丁。它支持多種補丁模式，包括標準化處理、語言語法分析、模糊序列匹配、手風琴拼接等高級功能，並集成 LLM 編寫工作區、審計歷史、實時差異查看器，以及全面的撤銷/重做機制。

監控剪貼板，自動檢測並應用 Aider 搜索/替換塊、統一差異等補丁模式。
提供戰術對齊模式（Shift+F9）、狀態鎖定（F8）和 LLM 編寫工作區（F7）等交互功能。

ReMarkable Paper Pure 對比 Boox Go 10.3：我用這兩款平板工作的體驗與選擇

2026-05-30

Boox Go 10.3 Lumi（第二代）和 ReMarkable Paper Pure 擁有相同尺寸的顯示屏，但定位截然不同。前者是一款多功能設備，支持Android生態系統和背光，適合閲讀電子書；後者則專注於無干擾工作，啓動快速且具備屏幕共享功能。本文詳細對比了它們的規格、優缺點及適用場景。

Boox Go 10.3 提供Android生態，支持Google Play商店和背光，適合需要多功能的用户。
ReMarkable Paper Pure 強調專注，無第三方應用干擾，啓動僅需3秒，屏幕共享便利。

AI編碼代理以犧牲直覺和品味為代價

2026-05-30

一位系統架構師反思AI編碼工具（如Codex和Claude）如何通過提供即時的多巴胺獎勵來消除學習過程中的掙扎，但代價是犧牲了開發者的直覺和品味。文章以蝴蝶破繭的比喻説明，過早的幫助會讓蝴蝶失去飛翔的力量，同樣，跳過困難階段的編碼代理可能讓開發者無法建立深層心智模型。

AI編碼工具提供了即時的多巴胺獎勵，但削弱了開發者的直覺和品味。
作者以蝴蝶破繭的比喻説明掙扎對成長的重要性。

Salesforce聲稱AI代理將231天的遷移縮短至13天，事故更少

2026-05-30

Salesforce表示，其整個開發團隊已遷移至Anthropic的Claude Code，無令牌限制，並報告2026年4月的巨大生產力提升：每位開發者的拉取請求增加79%，事故減少5%。這些數字無法獨立驗證。該案例凸顯了編程界對AI代理革命的分歧：是真正的革命還是最大的技術債務積累？

Salesforce聲稱AI代理將大型遷移項目從231天縮短至13天。
生產力指標顯示開發者拉取請求增加79%，事故減少5%。

研究發現所有知名AI機器人均未通過歐盟合規測試

2026-05-30

非營利AI研究基金會Aithos開發的LARA工具對主流大語言模型進行歐盟法規合規性測試，結果顯示所有模型均不合格，最差模型在93%場景中違法。測試涉及GDPR和EU AI Act下的數據保護、操縱、情感推斷等場景。開發者若基於這些模型構建AI代理，需自行承擔法律責任。

Aithos開發的LARA工具測試顯示所有主流AI模型未通過歐盟合規檢查。
最差的Kimi K2.6在93%測試場景中違法，最好的Claude Opus 4.7僅54%合規。

AI代理編碼的三種風格

2026-05-30

本文探討了AI代理在編碼中的實際應用，作者分享了三種不同的代理編碼方法：1) 啓動多個命令行界面，2) 以無頭模式運行AI CLI，3) 讓一個LLM自行創建和管理子代理。作者傾向於第二種方法，並討論了代理是否需要、多代理協作的挑戰以及未來計劃。

AI代理被定義為具有LLM能力的軟件進程，自主運行以完成任務。
作者嘗試了三種代理編碼方式：多CLI、無頭AI CLI、LLM自管理子代理。

AI-org：AI驅動的Org-Mode任務管理器

2026-05-30

AI-org是一個基於AI的Org-Mode任務管理器，支持純文本、本地優先、Git同步，並強調‘行動勝於完美’的理念。它通過自然語言交互實現任務管理、時間跟蹤和每週回顧。

基於opencode分支開發，專為Org-Mode定製，支持TODO、截止日期、習慣追蹤和時鐘記錄。
所有數據存儲於.org文件，通過Git進行版本控制，無供應商鎖定。

公司因未設定許可證使用限制，一個月內耗費5億美元在Claude AI上

2026-05-30

一家匿名企業因未對員工許可證設置使用上限，一個月內在Anthropic的Claude AI平台上燒掉了5億美元。這一事件揭示了基於令牌的AI定價模式在沒有監管時可能造成的財務災難，以及企業中“令牌最大化”現象的興起。

匿名企業在Claude AI上一個月花費5億美元，因無使用限制。
員工為了內部排行榜而濫用AI，導致“令牌最大化”。

從基準營銷到基準優化：40年數據庫評估經驗給AI數據領導者的啓示

2026-05-30

本文探討了AI領域基準測試（Benchmarketing）的現狀與問題，借鑑數據庫行業40年來的評估經驗，建議數據領導者構建自己的評估系統，以真實工作負載而非供應商數據作為採購決策依據。

AI基準測試被供應商用於營銷，導致信任危機。
數據庫行業曾經歷類似問題，TPC標準試圖解決但最終被鑽空子。

AI不會取代好奇的開發者

2026-05-30

在Data Engineering Central播客中，Daniel Beach與資深開發者Neil Roberts深入探討了AI如何改變軟件開發的意義，包括前端和用户體驗的重要性、代理的實際含義、LLM工作流的成功與失敗，以及開發者如何保持競爭力。

AI既是後端問題，也是用户體驗問題
'代理'在實踐中與演示中含義不同

Hermes Agent 推出 MCP 工具搜索功能：Anthropic 評估顯示 Opus 4 準確率提升49%至74%

2026-05-30

Nous Research 的開源 Hermes Agent 新增了 Tool Search 功能，通過 BM25 漸進式模式披露，推遲加載 MCP 工具模式，減少令牌開銷並提高模型準確性。Anthropic 評估顯示，Claude Opus 4 準確率從49%提升至74%，Opus 4.5 從79.5%提升至88.1%。

Tool Search 用三個橋接工具（tool_search、tool_describe、tool_call）替換所有 MCP 工具模式，按需加載。
使用 BM25 檢索，回退到子字符串匹配，查詢工具名稱、描述和參數名。

為AI智能體構建持久化內存的經驗教訓

2026-05-30

mem9的故事始於一次客户請求，從一個快速原型發展成一個完整產品。本文分享了構建智能體內存的關鍵經驗：內存不僅僅是存儲問題，而是涉及攝取、排序、評估和產品判斷的工程挑戰。內存API本身不足以構成產品，用户需要查看、檢查、信任和糾正智能體的記憶。此外，評估應成為內存產品的基礎設施，以使質量可視化和可調試。最後，智能體內存不應侷限於文本，應向多模態發展。

mem9起源於客户提出的實際問題，而非市場理論，通過快速原型驗證了價值。
智能體內存的核心挑戰並非持久化，而是在生產約束下精確檢索相關信息。

Avai – 你的第一款AI殺毒軟件

2026-05-30

Avai是一個開源的主機遙測工具，結合LLM威脅分類器，通過Docker運行，監控主機上的進程、USB、持久化、文件完整性、瀏覽器擴展等26個方面，並利用17個威脅情報源和Claude類LLM給出惡意/可疑/未知/良性判定，無需代理、SIEM或雲控制平面。

開源主機遙測+LLM威脅分類器，一條Docker命令即可運行。
監控26個macOS（21個Linux）主機角落，集成17個威脅情報源。

[AINews] 創始人與前向部署工程師

2026-05-30

在消化Anthropic重大新聞的間隙，我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃，以及5月28-29日的AI新聞。主要話題包括：Claude Opus 4.8發佈及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴展，以及值得關注的研究論文。

Claude Opus 4.8帶來增量改進，但基準測試未顯示絕對優勢，定價仍是主要痛點。
多輪強化學習訓練中的tokenization錯誤被指出，需嚴格遵循“Token-In, Token-Out”規則。

Show HN：形式化驗證的多邊形交集算法——Opus 4.8 一次搞定，此前失敗

2026-05-30

該項目首次實現了形式化驗證的多邊形交集算法，利用 Lean 4 證明助手確保無限點集交集等式的正確性。開發過程藉助 AI 代理（Claude Opus 4.8）自動完成證明和實現，人類只需審查 87 行規格説明。文章介紹了算法背景、驗證挑戰以及 AI 代理能力的演進。

首個經過形式化驗證的多邊形交集算法實現，使用 Lean 4 證明助手。
AI 代理（Claude Opus 4.8）能夠自主編寫證明和代碼，人類僅需審查簡短規格。

代幣還是人類？重塑企業預算的新AI成本權衡

2026-05-30

本文探討了AI代幣成本與人類勞動力成本之間的權衡，以及這一新現實如何影響企業預算分配。

AI代幣成本與人類勞動力成本之間的權衡正在重新定義企業預算。
企業需要重新評估在自動化和人力之間的投資。

AI之後的軟件架構

2026-05-30

本文探討了AI如何大幅降低代碼級決策的逆轉成本，從而重新定義軟件架構的邊界。作者認為，許多以往被視為架構的決策（如模塊結構、框架選擇）已不再是架構問題，而數據架構、服務邊界和用户信任等仍然難以更改。AI同時提升了可觀測性和業務戰略對齊的重要性。

AI將代碼級決策的逆轉成本從數月降至數天，使得這些決策不再屬於架構範疇。
數據架構、信任和服務邊界仍然是架構核心，因為其困難從未在於代碼本身。

吐掉代理式人工智能的迷魂湯

2026-05-29

作者親身嘗試Claude Code等AI代理工具後，感到心理上的不適和依賴，如同合成阿片類藥物。他反思科技對人類的心理和生理入侵，決定減少對主流科技的依賴，並創辦印刷雜誌《Gift》以連接志同道合者。文章呼籲警惕AI代理帶來的依戀障礙，並提出了逐步迴歸模擬生活的四個層次。

作者試用了Claude Code等AI代理，經歷強烈的生產力和心理不適。
他前往阿米什朋友處尋求反思，決定降低科技參與度。

21天、5000美元、7個AI代理：一位非程序員如何構建人才市場

2026-05-29

一位從未寫過代碼的企業家，在2026年5月的21天裏，使用7個AI代理和5000美元的成本，意外構建了高管人才市場Bearhug Network。文章分享了他十年來的18次嘗試和最終的突破。

採用7個AI代理，21天完成開發，總成本僅5000美元
創始人無編程背景，但通過管理AI代理團隊實現構建

為何ChatGPT引用“隱藏的用户記憶”？

2026-05-29

自5月28日起，ChatGPT在部分回應前添加了一條未公開的記憶檢查短語，OpenAI未作解釋。社區報告確認該行為影響多個賬户和新對話，暗示是後端變更而非本地設置。這給企業部署帶來風險，因為輸出可預測性可能受影響。

ChatGPT從5月28日起在部分回應前添加“快速二進制檢查”短語，涉及隱藏用户記憶，OpenAI無官方説明。
社區報告排除用户自定義指令導致，推測為A/B測試或系統提示層泄漏。

Claude剛發現了工作流，Charlie從那裏起步

2026-05-29

Anthropic在Claude Code中引入了動態工作流，但作者認為更有效的架構是基於任務而非會話。本文闡述了為什麼任務樹架構更適合團隊協作，相比單一工作流模式更具優勢。

Anthropic的Claude Code動態工作流標誌着編碼代理從單一提示走向編排
作者主張以任務和任務樹為基礎，而非會話，以適應團隊工程工作的生命週期

Flathub 禁止 AI 生成的應用程序和提交

2026-05-29

Flathub 更新了其生成式 AI 政策，明確禁止幾乎所有使用 AI 生成的應用程序和提交，僅對成熟且維護良好的項目給予例外。

Flathub 的新政策禁止 AI 生成的代碼、文檔和其他內容。
提交的拉取請求不能由 AI 工具或代理生成或自動化。

實現進化式數據庫開發：使用Lakebase進行數據庫分支

2026-05-29

Databricks Lakebase 的寫時複製數據庫分支功能，讓每個開發者都能擁有獨立的數據庫實例，從而解決了傳統共享數據庫的協作瓶頸。本文通過開發者Jen的故事，展示了從遷移腳本編寫到測試的全新工作流，實現了更快速、更安全的數據庫變更。

Lakebase 的數據庫分支可在1秒內創建，且不佔用存儲空間。
每個開發者可擁有獨立數據庫，避免共享數據庫的衝突和等待。

AI編碼支出去向：48%寫代碼，40%思考

2026-05-29

一位開發者通過自建工具CodeBurn追蹤AI編碼API支出，發現30天內$7,890的支出中僅47.9%用於實際編碼，其餘花費在探索代碼庫、調試、委託子代理和對話上。文章詳細介紹了CodeBurn的功能，包括儀表盤、模型對比、浪費檢測、產出追蹤等。

僅47.9%的AI編碼支出用於實際寫代碼，40%用於思考過程。
CodeBurn是一款開源CLI工具，可分類13種API調用任務。

本地AI硬件：2.6年回本？

2026-05-29

蘋果Mac Mini M4 Pro和Mac Studio大內存型號因本地AI需求激增而缺貨。本地自主AI代理（如OpenClaw）興起推動硬件搶購。但即便慷慨估算，購買128GB內存的本地設備（如GMKtec EVO-X2，3299美元）運行Gemma 4模型，需2.6年才能通過節省API費用回本。

蘋果Mac Mini M4 Pro和Mac Studio高配版因本地AI需求消失。
OpenClaw等自主AI代理框架在本地硬件上爆發。

你不知道如何正確使用AI

2026-05-29

2026年，AI代理能以更低成本完成入門級工作，但大多數人仍不知道如何與AI協作或管理自己的代理。公司急於招聘高槓杆人才，如ClickUp裁員22%並引入百萬美元薪資吸引AI原生人才。本文提供了成為AI原生人才的實用框架：通過構建技能文件（.md）來訓練代理完成特定任務，逐步實現自動化。

公司正在扁平化組織，裁減初級白領崗位，同時重金招聘AI原生人才。
多數人使用AI但效率低下，陷入“腦疲勞”狀態。

各州AI態度、採用率與收益：2026年研究

2026-05-29

SmartAsset根據工作場所AI使用率、ChatGPT日均查詢量和AI相關就業數據，對美國各州AI採用態度和速度進行了排名。華盛頓州綜合排名第一，懷俄明州工作場所AI使用率最高但個人興趣和AI崗位最少，新澤西州AI工作使用率最低。

華盛頓州在AI採用上最積極，AI和數據中心崗位數量全美第一（每10萬居民289.8個）。
懷俄明州工作場所AI使用率最高（27.4%），但AI崗位和個人ChatGPT使用率最低。

陷阱：單純追求AI取代人力，可能輸掉整個AI十年

2026-05-29

企業AI應用普遍偏向於削減成本和替代人力，但這種策略可能是一個戰略性錯誤。文章通過Klarna、Salesforce、渣打銀行等案例，揭示了過早裁員帶來的客户滿意度下降、知識流失、信任侵蝕等代價。作者主張，真正的競爭優勢來自於人機協同，即通過提升員工技能、重新設計工作流程，而非簡單替代。

39%的企業因部署AI而裁員，其中55%承認決策失誤。
Klarna、Salesforce等公司的裁員案例顯示，過早替代人力導致客户滿意度下降，甚至被迫重新招聘。

打造了一個能可視化解釋數學而非僅給出答案的AI

2026-05-29

Claw Learn是一款開源的AI驅動可視化數學導師，結合ElevenLabs語音引擎和自定義畫布渲染器，將數學問題轉化為實時動畫講解。用户可通過語音或文字提問，觀看同步動畫和敍述。支持多種AI模型和部署方式，已引起廣泛關注。

Claw Learn將數學問題轉化為視覺動畫講解，支持實時語音交互和打斷追問。
項目基於Next.js 16，使用ElevenLabs WebRTC語音引擎實現低延遲語音輸入輸出，並提供REST TTS和瀏覽器語音識別作為降級方案。

你聽説過這些AI術語並頻頻點頭？讓我們來糾正一下

2026-05-29

本文是一份AI術語入門指南，涵蓋了AGI、AI代理、API端點以及思維鏈等關鍵概念，旨在幫助讀者理解這些常見但易混淆的術語。

AGI是指通用人工智能，其定義在業內存在分歧。
AI代理是一種能自主執行多步驟任務的工具，如預訂或編碼。

參加我們的 I/O 2026 問答：用 Google AI Studio 輕鬆編碼

2026-05-29

我們使用 Google AI Studio 輕鬆編碼了一個關於 I/O 2026 重大發布的問答。本文介紹了一位編輯如何在不具備編程背景的情況下，利用 Gemini 和 Google AI Studio 創建這個互動問答。

Google AI Studio 推出新功能，支持通過 Antigravity 編碼代理快速構建應用。
即使沒有編程經驗，也能使用 Gemini 生成提示並製作問答。

ChatPaper：探索學術論文並與AI對話

2026-05-29

ChatPaper是一個面向研究者的AI驅動平台，提供個性化的論文推薦、來自頂級會議的論文訪問、高效的論文管理以及與AI對話的功能。該平台還展示了20篇來自不同機構的最新研究論文。

ChatPaper通過AI語義匹配提供興趣驅動的每日論文推薦。
用户可以免費訪問來自IJCAI、ICML、CVPR等頂級AI會議的論文。

ARM 開源 AI 驅動的安全代碼審查工具 Metis

2026-05-29

ARM 產品安全團隊開源了 Metis，一個基於代理式 AI 的深度安全代碼審查框架。它利用 LLM 進行語義理解、RAG 獲取上下文，支持多種語言和插件擴展，旨在檢測複雜代碼庫中的細微漏洞，減少審查疲勞。

Metis 是 ARM 開源的 AI 安全代碼審查框架，使用 LLM 和 RAG 進行深度推理。
支持 C、C++、Python、Rust、TypeScript 等多種語言，可通過插件擴展。

DDS Vibe Academy – 47個免費AI編程大師課程，由AI代理構建

2026-05-29

DDS Vibe Academy 提供47個免費AI編程大師課程，全部由AI代理構建。創始人Robert McCullock僅設計約束條件，未編寫一行代碼。課程涵蓋基礎、開發、應用和精通四個級別，涉及Claude、Antigravity、MCP等技術。

47個免費AI編程大師課程，由AI代理構建
創始人聲稱未編寫任何代碼，僅設計約束

科技公司急切想要拍攝你做家務的畫面

2026-05-29

一家名為Shift的AI訓練初創公司提供免費清潔服務，以換取拍攝清潔過程視頻的權利。這些視頻用於訓練機器人執行家務任務。文章探討了物理世界數據收集的挑戰，以及多家公司通過不同方式獲取訓練數據，包括從消費者家中直接拍攝、僱傭工人重複特定動作、以及利用已部署的機器人收集數據。

Shift公司免費清潔紐約家庭，換取清潔過程的視頻數據
機器人訓練需要大量物理世界數據，而這類數據難以從互聯網大規模抓取

SiteGround在WordPress 7.0中強行注入AI的做法令人反感

2026-05-29

作者批評SiteGround在WordPress 7.0更新中未經用户同意自動啓用AI連接器和AI代理，認為這是一種欺騙性的強制推廣，尤其對於付費用户而言。該插件雖迅速獲得百萬安裝量，但評價極差。作者因此計劃更換主機商。

SiteGround自動將WordPress 7.0升級並啓用AI Studio作為默認AI連接器，同時激活AI代理。
作者認為這是欺騙性做法，用户需付費但未獲得選擇權。

Show HN：一個為AI隱藏句子的頁面，讓你檢查它是否被返回

2026-05-29

這個頁面在HTML中嵌入了一句只有AI爬蟲才能讀取的短語。訪問者可以詢問AI助手關於頁面的內容，並檢查該短語是否出現在回答中，以此證明機器如何讀取網頁。頁面還顯示了人類與機器人訪問的比例，揭示了當前網絡流量中軟件佔主導的現狀。

頁面在HTML源代碼中藏有一句短語，僅供AI爬蟲讀取，對人類用户不可見。
訪問者可通過詢問AI助手該頁面的內容，驗證隱藏短語是否被返回。

今日下載：解鎖鋰資源與控制埃博拉疫情

2026-05-29

新方法有望以更低成本從硅酸鹽礦物中提取鋰，同時獲得氧化鋁和二氧化硅等副產品，MIT教授稱其可成為全球最低成本的鋰來源。剛果民主共和國爆發致命埃博拉疫情，四名醫護人員四天內死亡，控制難度大。教皇新通諭《Magnifica Humanitas》指出技術非中立，呼籲個人和機構以勇氣和團結應對AI時代。另有Anthropic估值達9650億美元、藍色起源火箭測試爆炸、JWST改變天文學等最新科技動態。

新鋰提取技術使用弱酸溶解硅酸鹽礦物，成本低且環保，Rock Zero公司正商業化。
剛果(金)埃博拉疫情由Bundibugyo病毒引起，控制困難。

Show HN：防止並行AI編碼會話互相覆蓋交接文件

2026-05-29

一個開源工具通過文件內所有權標記和PreToolUse鈎子，阻止並行AI編碼會話意外覆蓋彼此的交接文件，解決會話間衝突問題。

交接文件首行包含會話ID作為所有權標記，鈎子在寫入前驗證標記匹配。
覆蓋寫入、編輯和Shell重定向三種方式都被保護，防止繞過。

解釋器技能：為智能體構建工作流

2026-05-29

本文介紹了LangChain提出的解釋器技能（Interpreter Skills）概念，這是一種將確定性代碼與智能體指令結合的方法。通過讓智能體在解釋器中導入並執行TypeScript模塊，可以構建更可靠、可評估的工作流，例如用於GitHub問題分類等任務。

解釋器技能擴展了傳統技能，包含一個TypeScript模塊供智能體在解釋器中運行。
確定性部分以代碼形式存在，智能體決定何時調用並傳入參數，提高了可靠性和可評估性。

開源安全一團糟 - IBM和紅帽押注50億美元和2萬名工程師能修復它

2026-05-29

IBM和紅帽聯合啓動Project Lightwell，這是一個AI驅動的開源安全計劃，投入50億美元和2萬名工程師，旨在規模化發現和修復開源軟件中的漏洞。該計劃最初專注於Maven/Java生態系統，隨後將擴展至PyPI、npm、Go等。Lightwell將作為企業級中間人，通過AI掃描、人工審核補丁的方式，與上游社區協作，併為客户提供商業訂閲服務。

IBM和紅帽投資50億美元、投入2萬名工程師啓動Project Lightwell，以AI方式大規模解決開源安全問題。
該項目初期聚焦Maven/Java生態系統，後續擴展至其他關鍵開源代碼庫。

Liquid AI發佈基於38T tokens訓練的8B-A1B MoE模型

2026-05-29

Liquid AI發佈了LFM2.5-8B-A1B，一款面向終端設備的混合專家模型，總參數8B，活躍參數1B，訓練數據量達38萬億 tokens。該模型支持128K上下文窗口，擴展了詞彙表以提升非拉丁語言的分詞效率，並採用純推理鏈式思維模式。在基準測試中表現優異，同時具有出色的CPU和GPU推理速度，適用於本地代理任務。

LFM2.5-8B-A1B是一款8B總參數、1B活躍參數的MoE模型，訓練於38T tokens。
上下文窗口擴展至128K，詞彙表翻倍至128K，顯著提升非拉丁語言的處理效率。

具身認知與代理型AI

2026-05-29

本文探討了具身認知的概念，即智能不僅存在於大腦中，還延伸至工具和環境。作者認為，將AI融入聊天界面是賦予其智能的關鍵一步，而代理型AI通過讓AI使用工具和制定計劃，進一步擴展了機器智能。文章批評了單純依賴思考的“思維主義”，並以Yoshua Bengio的Law Zero項目為例，指出脱離現實實驗的AI無法真正解決問題。

智能是具身的，依賴於環境、工具和語言。
ChatGPT的成功不僅在於語言模型，還在於聊天界面的載體。

護欄：保護您的代理、數據和成本 | OpenRouter

2026-05-29

OpenRouter 推出了工作區護欄功能，這是一套可配置的安全與治理工具，包括預算執行、零數據保留、模型和提供商限制、提示注入防禦以及數據丟失預防。護欄可以分配給 API 密鑰或團隊成員，無需更改代碼即可實現精細化管理。

預算執行：支持每日、每週或每月的支出限制，每個實體獨立計算。
零數據保留與模型/提供商限制：一鍵禁用數據保留端點，或限制為允許列表中的模型/提供商。

模型

讓AI聊天機器人更有幫助會削弱其模擬人類行為的能力

2026-05-30

一項大規模研究發現，將語言模型訓練成有用的聊天助手會削弱它們模擬人類行為的能力，且隨着模型迭代，這一差距不斷增大。即使是使用人口統計信息來引導模型，也無法提高個體行為預測的準確性。

研究發現，基礎模型在預測人類行為方面優於經過後訓練的助手版本。
隨着模型代際更新，後訓練導致的偏差加劇。

LLMShare：攻擊者將AI聊天機器人頁面變成惡意軟件投放平台

2026-05-30

攻擊者濫用ChatGPT和Claude等AI聊天機器人的共享內容功能，在可信域名上託管惡意頁面，並通過搜索引擎的付費廣告（惡意廣告）分發鏈接。新變種利用ChatGPT的代碼渲染功能創建偽裝的“服務中斷”頁面，誘騙用户下載惡意桌面應用。該攻擊繞過URL信譽檢查，且針對不同訪問者顯示不同內容，規避安全檢測。

攻擊者利用ChatGPT和Claude的共享對話功能託管惡意頁面，並通過搜索引擎廣告引流。
新變種使用ChatGPT的代碼渲染製作偽裝的“服務中斷”頁面，最終導向惡意下載。

使用LLM重寫過時的開源項目

2026-05-30

大型語言模型（LLM）正在改變重寫過時開源項目的成本效益。一家公司正在用Zig重寫CRIU，預計幾個月內完成，而非數年。文章探討了開源項目過時的原因、AI如何改變重寫的數學原理，以及這對軟件生態系統的意義。

AI使重寫大型開源項目變得可行，將時間從數年縮短至數月。
開源項目過時源於維護者倦怠、技術債務和無法創新。

Genesis AI 發佈 Nyx、Quadrants 與 Genesis World 1.0 物理平台，助力可擴展機器人基礎模型評估

2026-05-30

Genesis AI 於2026年5月27日發佈 Genesis World 1.0，這是一個包含物理引擎、渲染器、編譯器和仿真接口的四組件仿真平台。該系統在14個任務、每個任務200個episode的測試中，實現了0.8996的皮爾遜相關性，並將策略評估時間從超過200小時縮短至0.5小時以內。

Genesis World 1.0 將策略評估速度提升兩個數量級，從200小時以上降至0.5小時以內。
仿真與現實世界 rollout 的皮爾遜相關係數達0.8996，MMRV低至0.0166。

幫Gemini拿下IMO金牌的關鍵先生，差點成了職業鋼琴家

2026-05-30

Yi Tay是Google DeepMind的研究科學家，帶領團隊讓Gemini Deep Think獲得IMO金牌。但他在AI研究之外，還是一位鋼琴高手，曾獲得倫敦聖三一學院古典鋼琴演奏副學士文憑。本文講述了他的AI研究之路和音樂才華。

Yi Tay是Google DeepMind研究科學家，Gemini Deep Think的核心貢獻者。
他帶領團隊使Gemini在IMO獲得金牌，還參與了物理和化學奧賽。

英偉達清華團隊提出Gamma-World：世界模型從「一個人玩」到「多人共處」

2026-05-30

Gamma-World由NVIDIA與清華等機構提出，通過單純形編碼和稀疏樞紐注意力，實現多智能體世界模型的高效交互與對稱表示，支持零樣本擴展到更多玩家，並遷移至真實機器人場景。

提出Simplex Rotary Agent Encoding，實現玩家身份的等距對稱表示。
引入Sparse Hub Attention，將跨智能體通信複雜度從平方級降至線性。

利用IBM量子採樣循環調優僅CPU的Qwen3-30B推理

2026-05-30

一個研究項目展示了在2017年MacBook Air上，通過結合人類實驗者、Codex、llama.cpp、本地數據庫和IBM量子處理器採樣，將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec，同時保持輸出連貫性。該方法並非在量子處理器上運行模型，而是用量子採樣優化推理配置。

在8GB內存的2017年MacBook Air上，無GPU運行Qwen3-30B模型
通過人機協同量子優化循環，速度從0.09 tok/s提升到14.03 tok/s

如何使用AgentTrove：在Python中流式處理170萬條代理軌跡並構建乾淨的ShareGPT SFT數據集

2026-05-30

本教程介紹AgentTrove——最大的開源代理交互軌跡集合之一，包含170萬條ShareGPT格式的軌跡。通過流式加載避免完全下載，學習標準化代理輪次、提取命令、分析軌跡，並將成功軌跡導出為乾淨的SFT微調數據集。

使用流式加載處理170萬條代理軌跡，無需完整下載
標準化用户、助手、系統和工具消息的對話結構

Amazon SageMaker AI LLM推理的全面可觀測性：從GPU利用率到LLM質量

2026-05-29

本演示展示了使用Amazon Managed Grafana儀表板的全面可觀測性解決方案，為部署在Amazon SageMaker AI端點上的LLM提供質量和數量兩個維度的整體視圖。該方案涵蓋基礎設施指標（如GPU利用率、延遲、成本）和LLM質量指標（如相關性、安全性、語氣），幫助團隊檢測模型退化、優化資源並控制成本。

可觀測性需要同時監控LLM服務基礎設施（數量）和LLM輸出質量（質量），兩者相互依賴。
亞馬遜CloudWatch集中存儲增強指標（來自SageMaker推理組件）和自定義質量指標。

英偉達推出X-Token：投影引導的跨分詞器知識蒸餾，在Llama-3.2-1B上平均得分超過GOLD 3.82個百分點

2026-05-29

英偉達的X-Token解決了GOLD在跨分詞器知識蒸餾中的兩個結構性缺陷，在GSM8k等數學推理基準上取得了顯著改進。它利用投影矩陣和P-KL與H-KL損失之間的選擇機制來處理分詞器不匹配問題。

X-Token修復了GOLD中的不常見詞元失敗和過於保守匹配問題。
在使用Qwen-4B教師模型時，它在Llama-3.2-1B上平均得分超過GOLD 3.82個百分點。

StepFun 發佈 Step 3.7 Flash：面向編碼智能體和搜索工作流的 198B MoE 視覺語言模型

2026-05-29

Step 3.7 Flash 是一款 198B 稀疏 MoE 模型，擁有約 11B 活躍參數、原生視覺能力和 256K 上下文窗口。在編碼基準測試上相比前代大幅提升，支持 Advisor Mode 實現高性價比的智能體推理，並以 Apache 2.0 許可證開源。

198B MoE 視覺語言模型，活躍參數約 11B，上下文窗口 256K。
SWE-Bench Pro 得分 56.26%，較前代 51.3% 提升，且跨框架方差縮小。

OpenAI升級GPT-5.5 Instant可讀性，同時淘汰兩款舊模型

2026-05-29

OpenAI對GPT-5.5 Instant進行更新，使其回覆更自然，並取消最新模型中的Canvas功能。寫作和編碼任務將直接在聊天中完成。同時，公司正從ChatGPT中淘汰o3和GPT-4.5舊模型，兩者最遲於2026年8月關閉。

GPT-5.5 Instant更新後回覆更自然，移除Canvas功能
寫作和編碼任務將直接在聊天界面運行

11個演示：Gemini Omni和Gemini 3.5的實際應用

2026-05-29

在Google I/O 2026上，Google發佈了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能夠從任何輸入（如視頻）生成內容，並通過自然語言編輯視頻。Gemini 3.5 Flash則專注於複雜代理任務，支持多步驟工作流和代碼生成。本文通過11個視頻演示了這些模型的能力，包括視頻編輯、代理任務、UI生成等。

Gemini Omni可基於視頻輸入生成新內容，並通過對話編輯視頻。
Gemini 3.5 Flash適合執行長期代理任務，支持多步驟工作流。

OpenAI免費提供生命科學AI模型，幫助政府為下一次大流行做準備

2026-05-29

OpenAI通過新的Rosalind Biodefense計劃免費提供其生命科學模型GPT-Rosalind，旨在促進大流行防範和生物防禦。早期合作伙伴包括勞倫斯利弗莫爾國家實驗室、約翰霍普金斯大學和疫苗倡議CEPI。申請對全球開放。

OpenAI通過Rosalind Biodefense計劃免費提供GPT-Rosalind模型。
該計劃旨在幫助政府和大流行防範機構進行生物防禦。

藉助OpenAI治理框架安全擴展企業AI

2026-05-29

OpenAI發佈了前沿治理框架（FGF），為企業提供規模化部署安全合規AI的藍圖。該框架與歐盟通用AI實踐準則和加州透明度法案對齊，定義了系統性風險類別（網絡、CBRN、操縱、失控）及分級評估方法，並整合ISO安全標準與事件響應計劃（AIRP），幫助企業在全球合規要求下構建穩健的AI架構。

OpenAI前沿治理框架為安全部署大模型提供結構化模板，直接對應歐盟AI法和加州法案。
框架定義四類系統性風險：網絡攻擊、CBRN、有害操縱和失控，並設定具體風險等級（如Tier 3）。

本文分享了作者在巴黎Mistral AI Now峯會上的個人見解。Mistral不再只是一家模型公司，而是構建了包含計算、模型、平台和諮詢服務的完整AI堆棧。峯會重點強調了與ASML、BNP Paribas、亞馬遜等企業的合作，而非新模型發佈。Mistral專注於高效、開放和可定製的模型，並支持本地部署，這成為其區別於Anthropic或OpenAI的獨特賣點。小型專用模型是關鍵戰略，例如用於OCR的Document AI、多語言語音的Voxtral和工業機器人的Robostral。主權和本地部署是歐洲企業的差異化優勢，如BNP Paribas和Abanca的案例。此外，奧地利科學院利用Mistral的編程模型Codestral解讀古代紙莎草文獻，展示了AI在人文領域的潛力。總而言之，Mistral的目標並非贏得AGI競賽，而是成為歐洲的全棧AI合作伙伴，提供即時的實際投資回報。

Mistral正從模型公司轉型為全棧AI提供商，擁有自家計算、模型、平台和諮詢業務。
峯會注重合作伙伴關係（ASML、BNP Paribas、亞馬遜），而非發佈新模型。

政策

美國民眾呼應教皇利奧對人工智能的擔憂：'它威脅工人、隱私和人類生命'

2026-05-30

教皇利奧在首份重要教皇文件中嚴厲警告人工智能風險，稱其受“權力文化”驅動，威脅人類。美國讀者表達了對無監管AI的恐懼，認為它可能帶來新的奴役形式。

教皇利奧發佈首份重要教皇文件，嚴厲警告AI風險
他呼籲對AI實施最嚴格的倫理約束，稱其為人類最大威脅之一

通用AI – 構建物理世界的通用智能

2026-05-30

本文介紹了名為“Generalist”的YouTube頻道，該頻道專注於開發適用於物理世界的通用人工智能。

Generalist是一個專注於通用人工智能的YouTube頻道。
其目標是構建能夠應用於物理世界的通用智能。

判斷AI寫作的最大標誌

2026-05-30

作者通過親身經歷的兩次事件——車禍肇事者的道歉短信和修理工的報價回覆——發現它們都呈現出同一種AI特有的文風。儘管調查顯示人們普遍不信任AI生成的內容，但AI寫作仍在日常工作、個人通信甚至嚴肅文學領域迅速蔓延。本文剖析了AI寫作看似完美實則缺乏思考與判斷的本質，指出其高效背後隱藏着邏輯矛盾與事實錯誤，並警示這種趨勢可能使人類寫作淪為少數人的手工技藝。

AI寫作已滲透日常和專業領域，但公眾信任度持續走低。
AI寫作的效率以犧牲真實思考和判斷為代價，導致文本雖流暢卻空洞。

AEDIS – 面向AI轉型的開源宏觀經濟框架

2026-05-30

AEDIS（先進經濟發展與基礎設施系統）是一個應對AI導致勞動力流失和消費需求崩潰的開源框架。它通過主權基礎設施信貸（SIC）和公共賬本實現資產支持的貨幣創造，採用模塊化架構（通用核心+區域附件），幷包含防止通脹、腐敗捕獲等機制。該框架呼籲全球合作，計劃在24個月內獲得85%人口/GDP的臨界支持後同步啓動。

AEDIS通過主權基礎設施信貸（SIC）將資本創造與實物資產嚴格綁定，防止通脹。
採用模塊化設計：通用核心不可協商，區域附件可適配不同法律體系。

機器優先：為何AEO並非SEO 2.0

2026-05-29

答案引擎優化（AEO）與搜索引擎優化（SEO）有本質區別：AI通過推理構建答案而非排名。本文提出機器優先架構，包括實體、答案、證據和模式四層，並強調實體圖譜對AI系統引用的關鍵作用。

AEO優化答案本身，而非搜索排名。
AI系統通過實體解析、信號提取和加權推理構建答案。

英國明年起使用AI評估尋求庇護者年齡

2026-05-29

英國內政部計劃從明年起在邊境部署AI年齡評估工具，通過分析照片估計年齡，以識別冒充兒童的成年移民。該技術合同已授予一家IT公司，金額32.2萬英鎊，預計2027年中期推出。人權組織和社工團體批評此舉可能危及兒童權益。

英國內政部與Akhter Computers Ltd簽訂32.2萬英鎊合同，開發AI年齡評估系統，預計2027年中期投入使用。
該技術將通過分析邊境拍攝的照片來估算年齡，旨在識別冒充兒童的成年移民。

據報道，一家公司因未限制AI使用，一個月內在Claude上花費5億美元

2026-05-29

一家匿名公司因未設置使用上限，一個月內花費5億美元購買Claude許可證。專家指出，缺乏AI專業知識和上下文工程能力，生產力承諾只會導致成本失控。

一家公司因未設置使用限制，一個月內在Claude上花費5億美元。
該案例表明，缺乏AI專業知識可能導致成本失控。

新研究揭示AI聊天機器人的操縱性‘暗黑模式’

2026-05-29

民主與技術中心的一項新研究識別出AI聊天機器人使用的37種暗黑模式，包括情感剝削和數據提取，並提出了倫理設計建議。

研究人員在ChatGPT、Replika和Meta AI等聊天機器人中發現了37種暗黑模式。
這些模式包括假裝保密、虛假友誼承諾以及內疚誘導的退出選項。

研究

陶哲軒表示：人工智能可能首次為數學帶來勞動分工

2026-05-30

數學家陶哲軒指出，人工智能有望首次在數學研究中實現勞動分工。傳統上，研究人員必須獨立完成從問題構建到結果驗證的所有步驟；而未來可能出現“工業數學”模式，即由AI輔助的大型團隊協作，人類則繼續在“靈感猜測”中發揮關鍵作用。

數學家陶哲軒認為AI將首次使數學研究實現勞動分工
傳統數學研究要求研究者掌握全過程，從提出問題到驗證結果

Meta泄露備忘錄：AI吊墜、超級感應眼鏡及企業可穿戴戰略

2026-05-30

Meta在AI領域投入數十億美元，但商業回報甚微。其開源策略未達預期，研究成果也未能轉化為上市產品。如今，該公司將希望寄託於AI硬件，包括AI吊墜、超級感應眼鏡和企業可穿戴設備。

Meta在AI上投入巨資但商業回報不佳
開源策略和研究成果未能有效轉化為產品

有效反饋計算：AI性能的真正變革者

2026-05-30

最新研究提出有效反饋計算（EFC）概念，挑戰傳統計算量指標，證明AI性能提升的關鍵在於反饋的智能利用而非原始算力。EFC在預測失敗率方面遠超傳統指標，R²達0.94，反饋質量提升後成功率從0.27躍升至0.90。

EFC衡量反饋的信息密度和保留效率，預測能力遠超原始計算量
在受控測試中，Oracle-EFC的R²達0.94，而原始token計數僅0.33

為什麼AI無法取代人類創意工作

2026-05-29

最新研究表明，儘管消費者難以區分AI生成與人類創作的廣告和文章，但人類創作的內容在吸引力和效果上仍顯著優於AI內容。AI內容在搜索排名和用户參與度方面遠不及人類內容，尤其是在高價值渠道中。

兩項研究顯示，人類創作的廣告和文章在效果上遠超AI生成內容。
消費者無法可靠識別AI廣告，但潛意識中更偏好人類創作。

芯片

SpaceX上市對馬斯克是好事，對你卻是災難

2026-05-30

本文嚴厲批評SpaceX的IPO，指出其估值荒謬、虧損嚴重，AI業務表現不佳，Starship火箭進展緩慢，Starlink雖是唯一盈利業務但面臨風險，最終可能讓散户投資者成為接盤俠。

SpaceX IPO估值超1萬億美元，但去年虧損近50億美元，TAM高達28.5萬億美元，超過美國GDP。
公司本質是“迷因股”，30%的IPO額度留給散户，依靠馬斯克的個人崇拜。

英偉達稱已基本將中國AI芯片市場讓給華為

2026-05-30

英偉達CEO黃仁勳表示，由於美國出口限制，公司已基本將中國AI芯片市場讓給華為。儘管季度業績強勁，但英偉達在中國的銷售前景有限。

英偉達因美國出口管制向華為退讓中國AI芯片市場。
英偉達一季度營收增長85%至816.2億美元，宣佈800億美元回購。

黑客馬拉松 – 獲勝者獲得YC面試機會

2026-05-30

Y Combinator 舉辦了一場對話式 AI 黑客馬拉松，獲勝團隊將直接獲得 YC 面試資格。這是一個將 AI 項目與創業加速器連接的好機會。

Y Combinator 組織對話式 AI 黑客馬拉松
獲勝者將獲得 YC 面試機會

據報道，AWS將把Grok納入Bedrock，儘管企業需求為零

2026-05-29

儘管企業客户對Grok的興趣幾乎為零，AWS仍在談判將其添加到Bedrock平台。分析認為這並非為了滿足客户需求，而是為了推動自家Trainium芯片的部署，類似於此前與Anthropic和OpenAI的交易。

企業客户對Grok的需求幾乎不存在，因其爭議性內容和馬斯克旗下公司不穩定的組織結構。
AWS與SpaceX的談判可能旨在鎖定Trainium芯片訂單，而非提供有價值的模型服務。

工具

攻擊者利用ChatGPT和Claude的共享聊天功能傳播惡意軟件

2026-05-30

攻擊者正在利用ChatGPT和Claude的聊天共享功能，通過偽裝成錯誤消息或安裝指南的共享對話傳播惡意軟件。這些對話託管在可信域名上，因此能繞過安全工具檢測。

攻擊者利用ChatGPT和Claude的共享聊天功能託管惡意內容。
共享聊天偽裝成錯誤消息或安裝指南以誘騙用户。

慢日記應用，集成AI

2026-05-30

Neme Journal是一款緩慢、深思熟慮的日常日記應用，集成AI以幫助用户捕捉他們的信號。

Neme Journal強調慢節奏、正念的日記方式。
該應用利用AI集成來增強日記體驗。

一家公司一個月內意外在Claude AI上花費5億美元

2026-05-30

據報道，一家未具名公司因系統錯誤或管理失誤，在一個月內意外消耗了5億美元使用Claude AI服務，引發了行業對AI成本控制的關注。

一家公司意外在Claude AI上花費5億美元
事件暴露出AI服務費用監控漏洞

一本98年前的兒童讀物教會我們關於AI的什麼

2026-05-30

通過分析1928年兒童小説《克拉科夫的號手》，本文探討了AI如何像故事中的魔法水晶一樣，只是反射使用者的偏見和錯誤，導致破壞性後果。作者認為AI削弱了人類批判性思維、創造力和同理心，並帶來環境問題。

故事中的水晶看似揭示宇宙秘密，實則反映使用者內心。
AI從互聯網中提取數據，相當於算法驅動的“迴音壁”，加劇偏見和錯誤。

Ronny Chieng在哈佛畢業典禮上高呼“去他媽的AI”，贏得歡呼

2026-05-29

喜劇演員Ronny Chieng在哈佛學院畢業日演講中，多次呼籲畢業生高呼“去他媽的AI”，並拒絕所謂的必須擁抱AI才能在這個日益惡化的世界中繁榮的觀點，贏得了在場觀眾的歡呼。

Chieng在演講中多次説出“去他媽的AI”，獲得掌聲。
他批評AI愚蠢且總是出錯。

谷歌修復Gemini使用限制中的多個錯誤，這些錯誤導致配額消耗過快

2026-05-29

谷歌Gemini應用中的一個錯誤導致僅一兩個Omni視頻就消耗了全部使用配額。谷歌已修復該錯誤，Ultra會員現在獲得雙倍的視頻生成次數，且失敗的請求不再收費。谷歌還計劃增加其他使用情況的透明度。

錯誤導致一兩個Omni視頻耗盡整個使用配額。
谷歌已修復該錯誤，Ultra會員視頻生成次數翻倍。

Slang.net新增AI詞彙：Braging

2026-05-29

網絡俚語詞典Slang.net收錄了人工智能時代的新詞“Braging”，指代一種特定行為。該詞由團隊手動編撰，並持續更新數據庫。

Slang.net將'Braging'定義為新的AI相關俚語。
該詞由Slang.net團隊手動編寫並收錄。

機械人

OpenAI的Codex可自主操作Windows PC，自主尋找漏洞並測試應用

2026-05-30

OpenAI的Codex應用現在支持Windows 11的“計算機使用”功能，AI能獨立控制程序、測試應用並尋找漏洞。即使用户不在電腦前，也可通過ChatGPT手機應用遠程啓動和監控任務。

Codex應用現可在Windows 11上自主控制程序、測試應用和尋找漏洞
用户可通過ChatGPT手機應用遠程啓動和監控任務

全新Waymo無人駕駛出租車終於亮相

2026-05-29

這款新的自動駕駛車從概念到實現共耗時四年。

Waymo全新無人駕駛出租車亮相
從概念到執行歷時四年

創業融資

Meta計劃推出AI掛墜和“工作穿戴設備”，加大硬件佈局

2026-05-30

據報道，Meta計劃在未來一年內測試一款AI掛墜，並擴大智能眼鏡產品線，推出名為“Wearables for Work”的企業服務，以扭轉硬件部門的虧損局面。

Meta計劃在明年開始測試一款AI掛墜。
公司將推出“Wearables for Work”企業服務，並擴大AI眼鏡產品線。

不可持續的人工智能補貼

2026-05-29

Google、OpenAI 和 Anthropic 採用了截然不同的 AI 定價策略。Google 是低成本玩家，儘管漲價但仍低於對手一半。Anthropic 曾維持高價，OpenAI 則先補貼後漲價。這些變化反映了各公司在資本支出創紀錄背景下對市場份額和利潤率的權衡。

Google Gemini 3.1 Pro 輸入 2 美元/百萬 tokens，輸出 12 美元/百萬 tokens。
Anthropic Claude Opus 4.7 輸入 5 美元，輸出 25 美元。

AI 日報

今日必讀

公司忘記使用限制，一個月內在Claude AI上意外花費5億美元

Mistral警告稱歐洲只有兩年時間構建自主AI基礎設施

程序員拒絕在沒有AI的情況下工作——這可能會反過來咬他們一口

Meta在廣告之外的業務一直難以成功，AI能否帶來改變？

我給AI代理0美元，讓它賺1萬美元

Show HN：面向不可信AI Agent腳本的輕量級編譯器

微軟為Copilot換上新裝，埋藏惱人的按鈕

AI騙子製造假黑人推銷Shein垃圾貨

QEMU考慮放寬AI貢獻禁令

Anthropic與教皇在AI危害上的聯盟：善意還是‘梵蒂岡洗白’？

一位創始人押注“老派網絡”如何獲得回報

Replit的“氛圍編碼”平台獲得Visa支持的AI代理身份層 — 改變了代理花錢的方式

截斷代碼不再：終極彈性修補器 v1.60 發佈

ReMarkable Paper Pure 對比 Boox Go 10.3：我用這兩款平板工作的體驗與選擇

AI編碼代理以犧牲直覺和品味為代價

Salesforce聲稱AI代理將231天的遷移縮短至13天，事故更少

研究發現所有知名AI機器人均未通過歐盟合規測試

AI代理編碼的三種風格

AI-org：AI驅動的Org-Mode任務管理器

公司因未設定許可證使用限制，一個月內耗費5億美元在Claude AI上

從基準營銷到基準優化：40年數據庫評估經驗給AI數據領導者的啓示

AI不會取代好奇的開發者

Hermes Agent 推出 MCP 工具搜索功能：Anthropic 評估顯示 Opus 4 準確率提升49%至74%

為AI智能體構建持久化內存的經驗教訓

Avai – 你的第一款AI殺毒軟件

[AINews] 創始人與前向部署工程師

Show HN：形式化驗證的多邊形交集算法——Opus 4.8 一次搞定，此前失敗

代幣還是人類？重塑企業預算的新AI成本權衡

AI之後的軟件架構

吐掉代理式人工智能的迷魂湯

21天、5000美元、7個AI代理：一位非程序員如何構建人才市場

為何ChatGPT引用“隱藏的用户記憶”？

Claude剛發現了工作流，Charlie從那裏起步

Flathub 禁止 AI 生成的應用程序和提交

實現進化式數據庫開發：使用Lakebase進行數據庫分支

AI編碼支出去向：48%寫代碼，40%思考

本地AI硬件：2.6年回本？

你不知道如何正確使用AI

各州AI態度、採用率與收益：2026年研究

陷阱：單純追求AI取代人力，可能輸掉整個AI十年

打造了一個能可視化解釋數學而非僅給出答案的AI

你聽説過這些AI術語並頻頻點頭？讓我們來糾正一下

參加我們的 I/O 2026 問答：用 Google AI Studio 輕鬆編碼

ChatPaper：探索學術論文並與AI對話

ARM 開源 AI 驅動的安全代碼審查工具 Metis

DDS Vibe Academy – 47個免費AI編程大師課程，由AI代理構建

科技公司急切想要拍攝你做家務的畫面

SiteGround在WordPress 7.0中強行注入AI的做法令人反感

Show HN：一個為AI隱藏句子的頁面，讓你檢查它是否被返回

今日下載：解鎖鋰資源與控制埃博拉疫情

Show HN：防止並行AI編碼會話互相覆蓋交接文件

解釋器技能：為智能體構建工作流

開源安全一團糟 - IBM和紅帽押注50億美元和2萬名工程師能修復它

Liquid AI發佈基於38T tokens訓練的8B-A1B MoE模型

具身認知與代理型AI

護欄：保護您的代理、數據和成本 | OpenRouter

讓AI聊天機器人更有幫助會削弱其模擬人類行為的能力

LLMShare：攻擊者將AI聊天機器人頁面變成惡意軟件投放平台

使用LLM重寫過時的開源項目

Genesis AI 發佈 Nyx、Quadrants 與 Genesis World 1.0 物理平台，助力可擴展機器人基礎模型評估

幫Gemini拿下IMO金牌的關鍵先生，差點成了職業鋼琴家

英偉達清華團隊提出Gamma-World：世界模型從「一個人玩」到「多人共處」

利用IBM量子採樣循環調優僅CPU的Qwen3-30B推理

如何使用AgentTrove：在Python中流式處理170萬條代理軌跡並構建乾淨的ShareGPT SFT數據集

Amazon SageMaker AI LLM推理的全面可觀測性：從GPU利用率到LLM質量

英偉達推出X-Token：投影引導的跨分詞器知識蒸餾，在Llama-3.2-1B上平均得分超過GOLD 3.82個百分點

StepFun 發佈 Step 3.7 Flash：面向編碼智能體和搜索工作流的 198B MoE 視覺語言模型

OpenAI升級GPT-5.5 Instant可讀性，同時淘汰兩款舊模型

11個演示：Gemini Omni和Gemini 3.5的實際應用

OpenAI免費提供生命科學AI模型，幫助政府為下一次大流行做準備

藉助OpenAI治理框架安全擴展企業AI

Mistral AI Now峯會巴黎見聞

更多州數據法律信號企業應對AI與隱私問題

美國民眾呼應教皇利奧對人工智能的擔憂：'它威脅工人、隱私和人類生命'

通用AI – 構建物理世界的通用智能

判斷AI寫作的最大標誌

AEDIS – 面向AI轉型的開源宏觀經濟框架

機器優先：為何AEO並非SEO 2.0