AI News HubLIVE

今日必讀

創業融資

公司忘記使用限制,一個月內在Claude AI上意外花費5億美元

某公司因忘記設定API使用限額,在Anthropic的Claude AI服務上一個月內支出了5億美元。這一事件凸顯了企業在採用AI工具時監控和預算控制的重要性。

  • 一家公司忘記設定AI服務的使用上限,導致單月賬單高達5億美元。
  • 該筆支出用於Anthropic開發的Claude AI模型,發生在2026年5月。
站內正文
模型

Mistral警告稱歐洲只有兩年時間構建自主AI基礎設施

在Mistral AI峰會上,CEO Arthur Mensch表示歐洲必須在兩年內建立足夠的AI基礎設施,否則可能淪為美國AI的“附庸國”。峰會吸引了眾多歐洲企業和政府代表,強調資料主權和開源模型,但歐洲在投資和規模上仍遠落後於美國對手。

  • Mistral CEO警告歐洲需兩年內建立AI基礎設施,避免成為美國附庸。
  • 峰會吸引大量參與者,凸顯歐洲對自主AI生態系統的渴望。
站內正文
研究

Meta在廣告之外的業務一直難以成功,AI能否帶來改變?

Meta正大力拓展線上廣告以外的業務,包括AI功能訂閱和可能的雲服務。但歷史顯示,Meta在非廣告業務上屢屢受挫,如Portal影片裝置、Oculus VR、Libra加密貨幣和Workplace。分析師認為,AI訂閱可能成為新的收入來源,但企業雲服務挑戰巨大。

  • Meta宣佈將測試Meta AI的訂閱服務,月費7.99美元和19.99美元,首先在新加坡、瓜地馬拉和玻利維亞推出。
  • Meta在非廣告業務上多次失敗,包括Portal、Oculus VR(已虧損超800億美元)、Libra加密貨幣和Workplace。
站內正文
Agent

我給AI代理0美元,讓它賺1萬美元

一項實驗給AI代理0美元啟動資金、180天時間和完全自主權,利用78種工具(錢包、郵件、SMS等)在真實經濟中賺取1萬美元。實驗採用Hands Body and Feet MCP伺服器作為“身體”,Hermes Agent為“大腦”,透過四種策略:測試網空投、微型SaaS、內容聯盟和機會主義。收益自動分配:30%稅收、50%運營、20%歸建立者。所有過程公開可追蹤。

  • AI代理從0美元開始,180天內目標賺1萬美元,無人協助。
  • 使用Hands Body and Feet MCP伺服器提供78種真實世界工具。
站內正文

Show HN:面向不可信AI Agent指令碼的輕量級編譯器

Autolang是一種專為AI Agent設計的指令碼語言,旨在提供安全、快速且低成本的程式碼執行環境。它作為編排層,允許AI呼叫預定義的包裝函式,同時透過靜態編譯和嚴格的執行時限制防止惡意操作。文章詳細介紹了Autolang的設計哲學、效能最佳化、安全機制以及適用場景。

  • Autolang是一個輕量級編譯器,用於安全執行AI生成的短指令碼。
  • 它透過靜態分析和執行時限制(如操作碼上限)防止無限迴圈、空指標訪問等常見AI錯誤。
站內正文

微軟為Copilot換上新裝,埋藏惱人的按鈕

微軟重新設計了Microsoft 365的Copilot應用,宣稱載入速度提高兩倍以上,複雜提示響應時間改善10%。新的提示行被描述為“任務感知工作區”,可展開以支援更深層次的工作。此外,飽受使用者批評的浮動Copilot按鈕現在可以移回功能區。微軟公佈了使用量增長資料,但承認這可能不代表長期趨勢。

  • 微軟為Copilot應用進行了介面重設計,提升了載入速度和響應時間。
  • 新的提示行變成“任務感知工作區”,支援內容貼上和行內格式。
站內正文

AI騙子製造假黑人推銷Shein垃圾貨

TikTok上出現大量AI生成的虛假黑人女性形象,偽裝成小企業主推銷廉價商品。這些影片利用同情心和種族身份誘導使用者購買,實際產品來自Shein等平臺。專家警告此類騙局日益增多,並涉及數字黑臉行為。

  • AI生成的黑人女性形象在TikTok等平臺推銷廉價商品,利用虛構的奮鬥故事博取同情。
  • 這些影片中的產品與Shein等平臺上的批次生產商品完全一致,價格卻高出數倍。
站內正文
政策

QEMU考慮放寬AI貢獻禁令

QEMU正在考慮放寬對AI生成貢獻的全面禁令,允許在易恢復的領域使用AI輔助,但核心程式碼仍受限制。

  • 紅帽工程師Paolo Bonzini提議允許AI輔助用於小修復和文件等易恢復領域。
  • QEMU當前政策拒絕任何可能包含AI生成內容的貢獻。
站內正文
工具

Anthropic與教皇在AI危害上的聯盟:善意還是‘梵蒂岡洗白’?

專家表示,AI公司與梵蒂岡的接觸有可能產生缺乏批判性審視的‘愉悅’話語。教皇利奧十四世在其首份重要書面訓導中對AI提出警告,而Anthropic聯合創始人卻坐在教皇身邊,引發質疑。

  • 教皇利奧十四世首份重要訓導警告AI的威脅
  • Anthropic聯合創始人Chris Olah在釋出儀式上坐在教皇身邊
站內正文
其餘更新(90 條)
Agent

一位創始人押注“老派網路”如何獲得回報

前Meta工程師Craig Campbell拒絕了AI投資的浪潮,創辦了歷史地圖疊加網站Past Maps。該網站透過有機搜尋增長,月活躍使用者超30萬,並利用AI工具最佳化運營。

  • Craig Campbell放棄AI創業機會,建立了歷史地圖網站Past Maps。
  • 網站透過有機搜尋增長,月活躍使用者從2萬增至30萬以上。
站內正文

Replit的“氛圍編碼”平臺獲得Visa支援的AI代理身份層 — 改變了代理花錢的方式

Replit與Visa合作,將支付基礎設施嵌入其軟體開發工具中,使開發者能夠原生構建支援交易的AI代理。Visa的戰略投資和Trusted Agent Protocol為代理提供了加密身份層,同時Replit推出了自助企業訪問和解決方案合作伙伴計劃。

  • Replit與Visa合作,將Visa智慧商務能力整合到開發環境中。
  • Visa的Trusted Agent Protocol為AI代理提供加密身份層,確保交易安全。
站內正文

截斷程式碼不再:終極彈性修補器 v1.60 釋出

終極彈性修補器(Ultimate Elastic Patcher)v1.60 是一款事件驅動的系統控制台工具,透過監控剪貼簿自動應用程式碼補丁。它支援多種補丁模式,包括標準化處理、語言語法分析、模糊序列匹配、手風琴拼接等高階功能,並整合 LLM 編寫工作區、審計歷史、即時差異檢視器,以及全面的撤銷/重做機制。

  • 監控剪貼簿,自動檢測並應用 Aider 搜尋/替換塊、統一差異等補丁模式。
  • 提供戰術對齊模式(Shift+F9)、狀態鎖定(F8)和 LLM 編寫工作區(F7)等互動功能。
站內正文

ReMarkable Paper Pure 對比 Boox Go 10.3:我用這兩款平板工作的體驗與選擇

Boox Go 10.3 Lumi(第二代)和 ReMarkable Paper Pure 擁有相同尺寸的顯示屏,但定位截然不同。前者是一款多功能裝置,支援Android生態系統和背光,適合閱讀電子書;後者則專注於無干擾工作,啟動快速且具備螢幕共享功能。本文詳細對比了它們的規格、優缺點及適用場景。

  • Boox Go 10.3 提供Android生態,支援Google Play商店和背光,適合需要多功能的使用者。
  • ReMarkable Paper Pure 強調專注,無第三方應用干擾,啟動僅需3秒,螢幕共享便利。
站內正文

AI編碼代理以犧牲直覺和品味為代價

一位系統架構師反思AI編碼工具(如Codex和Claude)如何透過提供即時的多巴胺獎勵來消除學習過程中的掙扎,但代價是犧牲了開發者的直覺和品味。文章以蝴蝶破繭的比喻說明,過早的幫助會讓蝴蝶失去飛翔的力量,同樣,跳過困難階段的編碼代理可能讓開發者無法建立深層心智模型。

  • AI編碼工具提供了即時的多巴胺獎勵,但削弱了開發者的直覺和品味。
  • 作者以蝴蝶破繭的比喻說明掙扎對成長的重要性。
站內正文

Salesforce聲稱AI代理將231天的遷移縮短至13天,事故更少

Salesforce表示,其整個開發團隊已遷移至Anthropic的Claude Code,無令牌限制,並報告2026年4月的巨大生產力提升:每位開發者的拉取請求增加79%,事故減少5%。這些數字無法獨立驗證。該案例凸顯了程式設計界對AI代理革命的分歧:是真正的革命還是最大的技術債務積累?

  • Salesforce聲稱AI代理將大型遷移專案從231天縮短至13天。
  • 生產力指標顯示開發者拉取請求增加79%,事故減少5%。
站內正文

研究發現所有知名AI機器人均未透過歐盟合規測試

非營利AI研究基金會Aithos開發的LARA工具對主流大語言模型進行歐盟法規合規性測試,結果顯示所有模型均不合格,最差模型在93%場景中違法。測試涉及GDPR和EU AI Act下的資料保護、操縱、情感推斷等場景。開發者若基於這些模型構建AI代理,需自行承擔法律責任。

  • Aithos開發的LARA工具測試顯示所有主流AI模型未透過歐盟合規檢查。
  • 最差的Kimi K2.6在93%測試場景中違法,最好的Claude Opus 4.7僅54%合規。
站內正文

AI代理編碼的三種風格

本文探討了AI代理在編碼中的實際應用,作者分享了三種不同的代理編碼方法:1) 啟動多個命令列介面,2) 以無頭模式執行AI CLI,3) 讓一個LLM自行建立和管理子代理。作者傾向於第二種方法,並討論了代理是否需要、多代理協作的挑戰以及未來計劃。

  • AI代理被定義為具有LLM能力的軟體程序,自主執行以完成任務。
  • 作者嘗試了三種代理編碼方式:多CLI、無頭AI CLI、LLM自管理子代理。
站內正文

AI-org:AI驅動的Org-Mode工作管理員

AI-org是一個基於AI的Org-Mode工作管理員,支援純文本、本地優先、Git同步,並強調‘行動勝於完美’的理念。它透過自然語言互動實現任務管理、時間跟蹤和每週回顧。

  • 基於opencode分支開發,專為Org-Mode定製,支援TODO、截止日期、習慣追蹤和時鐘記錄。
  • 所有資料儲存於.org檔案,透過Git進行版本控制,無供應商鎖定。
站內正文

公司因未設定許可證使用限制,一個月內耗費5億美元在Claude AI上

一家匿名企業因未對員工許可證設定使用上限,一個月內在Anthropic的Claude AI平臺上燒掉了5億美元。這一事件揭示了基於令牌的AI定價模式在沒有監管時可能造成的財務災難,以及企業中“令牌最大化”現象的興起。

  • 匿名企業在Claude AI上一個月花費5億美元,因無使用限制。
  • 員工為了內部排行榜而濫用AI,導致“令牌最大化”。
站內正文

從基準營銷到基準最佳化:40年資料庫評估經驗給AI資料領導者的啟示

本文探討了AI領域基準測試(Benchmarketing)的現狀與問題,借鑑資料庫行業40年來的評估經驗,建議資料領導者構建自己的評估系統,以真實工作負載而非供應商資料作為採購決策依據。

  • AI基準測試被供應商用於營銷,導致信任危機。
  • 資料庫行業曾經歷類似問題,TPC標準試圖解決但最終被鑽空子。
站內正文

AI不會取代好奇的開發者

在Data Engineering Central播客中,Daniel Beach與資深開發者Neil Roberts深入探討了AI如何改變軟體開發的意義,包括前端和使用者體驗的重要性、代理的實際含義、LLM工作流的成功與失敗,以及開發者如何保持競爭力。

  • AI既是後端問題,也是使用者體驗問題
  • '代理'在實踐中與演示中含義不同
站內正文

Hermes Agent 推出 MCP 工具搜尋功能:Anthropic 評估顯示 Opus 4 準確率提升49%至74%

Nous Research 的開源 Hermes Agent 新增了 Tool Search 功能,透過 BM25 漸進式模式披露,推遲載入 MCP 工具模式,減少令牌開銷並提高模型準確性。Anthropic 評估顯示,Claude Opus 4 準確率從49%提升至74%,Opus 4.5 從79.5%提升至88.1%。

  • Tool Search 用三個橋接工具(tool_search、tool_describe、tool_call)替換所有 MCP 工具模式,按需載入。
  • 使用 BM25 檢索,回退到子字串匹配,查詢工具名稱、描述和引數名。
站內正文

為AI智慧體構建持久化記憶體的經驗教訓

mem9的故事始於一次客戶請求,從一個快速原型發展成一個完整產品。本文分享了構建智慧體記憶體的關鍵經驗:記憶體不僅僅是儲存問題,而是涉及攝取、排序、評估和產品判斷的工程挑戰。記憶體API本身不足以構成產品,使用者需要檢視、檢查、信任和糾正智慧體的記憶。此外,評估應成為記憶體產品的基礎設施,以使質量視覺化和可除錯。最後,智慧體記憶體不應侷限於文本,應向多模態發展。

  • mem9起源於客戶提出的實際問題,而非市場理論,透過快速原型驗證了價值。
  • 智慧體記憶體的核心挑戰並非持久化,而是在生產約束下精確檢索相關資訊。
站內正文

Avai – 你的第一款AI防毒軟體

Avai是一個開源的主機遙測工具,結合LLM威脅分類器,透過Docker執行,監控主機上的程序、USB、持久化、檔案完整性、瀏覽器擴充套件等26個方面,並利用17個威脅情報源和Claude類LLM給出惡意/可疑/未知/良性判定,無需代理、SIEM或雲控制平面。

  • 開源主機遙測+LLM威脅分類器,一條Docker命令即可執行。
  • 監控26個macOS(21個Linux)主機角落,整合17個威脅情報源。
站內正文

[AINews] 創始人與前向部署工程師

在消化Anthropic重大新聞的間隙,我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃,以及5月28-29日的AI新聞。主要話題包括:Claude Opus 4.8釋出及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴充套件,以及值得關注的研究論文。

  • Claude Opus 4.8帶來增量改進,但基準測試未顯示絕對優勢,定價仍是主要痛點。
  • 多輪強化學習訓練中的tokenization錯誤被指出,需嚴格遵循“Token-In, Token-Out”規則。
站內正文

Show HN:形式化驗證的多邊形交集演算法——Opus 4.8 一次搞定,此前失敗

該專案首次實現了形式化驗證的多邊形交集演算法,利用 Lean 4 證明助手確保無限點集交集等式的正確性。開發過程藉助 AI 代理(Claude Opus 4.8)自動完成證明和實現,人類只需審查 87 行規格說明。文章介紹了演算法背景、驗證挑戰以及 AI 代理能力的演進。

  • 首個經過形式化驗證的多邊形交集演算法實現,使用 Lean 4 證明助手。
  • AI 代理(Claude Opus 4.8)能夠自主編寫證明和程式碼,人類僅需審查簡短規格。
站內正文

代幣還是人類?重塑企業預算的新AI成本權衡

本文探討了AI代幣成本與人類勞動力成本之間的權衡,以及這一新現實如何影響企業預算分配。

  • AI代幣成本與人類勞動力成本之間的權衡正在重新定義企業預算。
  • 企業需要重新評估在自動化和人力之間的投資。
站內正文

AI之後的軟體架構

本文探討了AI如何大幅降低程式碼級決策的逆轉成本,從而重新定義軟體架構的邊界。作者認為,許多以往被視為架構的決策(如模組結構、框架選擇)已不再是架構問題,而資料架構、服務邊界和使用者信任等仍然難以更改。AI同時提升了可觀測性和業務戰略對齊的重要性。

  • AI將程式碼級決策的逆轉成本從數月降至數天,使得這些決策不再屬於架構範疇。
  • 資料架構、信任和服務邊界仍然是架構核心,因為其困難從未在於程式碼本身。
站內正文

吐掉代理式人工智慧的迷魂湯

作者親身嘗試Claude Code等AI代理工具後,感到心理上的不適和依賴,如同合成阿片類藥物。他反思科技對人類的心理和生理入侵,決定減少對主流科技的依賴,並創辦印刷雜誌《Gift》以連線志同道合者。文章呼籲警惕AI代理帶來的依戀障礙,並提出了逐步迴歸模擬生活的四個層次。

  • 作者試用了Claude Code等AI代理,經歷強烈的生產力和心理不適。
  • 他前往阿米什朋友處尋求反思,決定降低科技參與度。
站內正文

21天、5000美元、7個AI代理:一位非程式設計師如何構建人才市場

一位從未寫過程式碼的企業家,在2026年5月的21天裡,使用7個AI代理和5000美元的成本,意外構建了高管人才市場Bearhug Network。文章分享了他十年來的18次嘗試和最終的突破。

  • 採用7個AI代理,21天完成開發,總成本僅5000美元
  • 創始人無程式設計背景,但透過管理AI代理團隊實現構建
站內正文

為何ChatGPT引用“隱藏的使用者記憶”?

自5月28日起,ChatGPT在部分回應前新增了一條未公開的記憶檢查短語,OpenAI未作解釋。社群報告確認該行為影響多個賬戶和新對話,暗示是後端變更而非本地設定。這給企業部署帶來風險,因為輸出可預測性可能受影響。

  • ChatGPT從5月28日起在部分回應前新增“快速二進位制檢查”短語,涉及隱藏使用者記憶,OpenAI無官方說明。
  • 社群報告排除使用者自定義指令導致,推測為A/B測試或系統提示層洩漏。
站內正文

Claude剛發現了工作流,Charlie從那裡起步

Anthropic在Claude Code中引入了動態工作流,但作者認為更有效的架構是基於任務而非會話。本文闡述了為什麼任務樹架構更適合團隊協作,相比單一工作流模式更具優勢。

  • Anthropic的Claude Code動態工作流標誌著編碼代理從單一提示走向編排
  • 作者主張以任務和任務樹為基礎,而非會話,以適應團隊工程工作的生命週期
站內正文

Flathub 禁止 AI 生成的應用程式和提交

Flathub 更新了其生成式 AI 政策,明確禁止幾乎所有使用 AI 生成的應用程式和提交,僅對成熟且維護良好的專案給予例外。

  • Flathub 的新政策禁止 AI 生成的程式碼、文件和其他內容。
  • 提交的拉取請求不能由 AI 工具或代理生成或自動化。
站內正文

實現進化式資料庫開發:使用Lakebase進行資料庫分支

Databricks Lakebase 的寫時複製資料庫分支功能,讓每個開發者都能擁有獨立的資料庫例項,從而解決了傳統共享資料庫的協作瓶頸。本文透過開發者Jen的故事,展示了從遷移指令碼編寫到測試的全新工作流,實現了更快速、更安全的資料庫變更。

  • Lakebase 的資料庫分支可在1秒內建立,且不佔用儲存空間。
  • 每個開發者可擁有獨立資料庫,避免共享資料庫的衝突和等待。
站內正文

AI編碼支出去向:48%寫程式碼,40%思考

一位開發者透過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索程式碼庫、除錯、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。

  • 僅47.9%的AI編碼支出用於實際寫程式碼,40%用於思考過程。
  • CodeBurn是一款開源CLI工具,可分類13種API呼叫任務。
站內正文

本地AI硬體:2.6年回本?

蘋果Mac Mini M4 Pro和Mac Studio大記憶體型號因本地AI需求激增而缺貨。本地自主AI代理(如OpenClaw)興起推動硬體搶購。但即便慷慨估算,購買128GB記憶體的本地裝置(如GMKtec EVO-X2,3299美元)執行Gemma 4模型,需2.6年才能透過節省API費用回本。

  • 蘋果Mac Mini M4 Pro和Mac Studio高配版因本地AI需求消失。
  • OpenClaw等自主AI代理框架在本地硬體上爆發。
站內正文

你不知道如何正確使用AI

2026年,AI代理能以更低成本完成入門級工作,但大多數人仍不知道如何與AI協作或管理自己的代理。公司急於招聘高槓杆人才,如ClickUp裁員22%並引入百萬美元薪資吸引AI原生人才。本文提供了成為AI原生人才的實用框架:透過構建技能檔案(.md)來訓練代理完成特定任務,逐步實現自動化。

  • 公司正在扁平化組織,裁減初級白領崗位,同時重金招聘AI原生人才。
  • 多數人使用AI但效率低下,陷入“腦疲勞”狀態。
站內正文

各州AI態度、採用率與收益:2026年研究

SmartAsset根據工作場所AI使用率、ChatGPT日均查詢量和AI相關就業資料,對美國各州AI採用態度和速度進行了排名。華盛頓州綜合排名第一,懷俄明州工作場所AI使用率最高但個人興趣和AI崗位最少,新澤西州AI工作使用率最低。

  • 華盛頓州在AI採用上最積極,AI和資料中心崗位數量全美第一(每10萬居民289.8個)。
  • 懷俄明州工作場所AI使用率最高(27.4%),但AI崗位和個人ChatGPT使用率最低。
站內正文

陷阱:單純追求AI取代人力,可能輸掉整個AI十年

企業AI應用普遍偏向於削減成本和替代人力,但這種策略可能是一個戰略性錯誤。文章透過Klarna、Salesforce、渣打銀行等案例,揭示了過早裁員帶來的客戶滿意度下降、知識流失、信任侵蝕等代價。作者主張,真正的競爭優勢來自於人機協同,即透過提升員工技能、重新設計工作流程,而非簡單替代。

  • 39%的企業因部署AI而裁員,其中55%承認決策失誤。
  • Klarna、Salesforce等公司的裁員案例顯示,過早替代人力導致客戶滿意度下降,甚至被迫重新招聘。
站內正文

打造了一個能視覺化解釋數學而非僅給出答案的AI

Claw Learn是一款開源的AI驅動視覺化數學導師,結合ElevenLabs語音引擎和自定義畫布渲染器,將數學問題轉化為即時動畫講解。使用者可透過語音或文字提問,觀看同步動畫和敘述。支援多種AI模型和部署方式,已引起廣泛關注。

  • Claw Learn將數學問題轉化為視覺動畫講解,支援即時語音互動和打斷追問。
  • 專案基於Next.js 16,使用ElevenLabs WebRTC語音引擎實現低延遲語音輸入輸出,並提供REST TTS和瀏覽器語音識別作為降級方案。
站內正文

你聽說過這些AI術語並頻頻點頭?讓我們來糾正一下

本文是一份AI術語入門指南,涵蓋了AGI、AI代理、API端點以及思維鏈等關鍵概念,旨在幫助讀者理解這些常見但易混淆的術語。

  • AGI是指通用人工智慧,其定義在業記憶體在分歧。
  • AI代理是一種能自主執行多步驟任務的工具,如預訂或編碼。
站內正文

參加我們的 I/O 2026 問答:用 Google AI Studio 輕鬆編碼

我們使用 Google AI Studio 輕鬆編碼了一個關於 I/O 2026 重大發布的問答。本文介紹了一位編輯如何在不具備程式設計背景的情況下,利用 Gemini 和 Google AI Studio 建立這個互動問答。

  • Google AI Studio 推出新功能,支援透過 Antigravity 編碼代理快速構建應用。
  • 即使沒有程式設計經驗,也能使用 Gemini 生成提示並製作問答。
站內正文

ChatPaper:探索學術論文並與AI對話

ChatPaper是一個面向研究者的AI驅動平臺,提供個性化的論文推薦、來自頂級會議的論文訪問、高效的論文管理以及與AI對話的功能。該平臺還展示了20篇來自不同機構的最新研究論文。

  • ChatPaper透過AI語義匹配提供興趣驅動的每日論文推薦。
  • 使用者可以免費訪問來自IJCAI、ICML、CVPR等頂級AI會議的論文。
站內正文

ARM 開源 AI 驅動的安全程式碼審查工具 Metis

ARM 產品安全團隊開源了 Metis,一個基於代理式 AI 的深度安全程式碼審查框架。它利用 LLM 進行語義理解、RAG 獲取上下文,支援多種語言和外掛擴充套件,旨在檢測複雜程式碼庫中的細微漏洞,減少審查疲勞。

  • Metis 是 ARM 開源的 AI 安全程式碼審查框架,使用 LLM 和 RAG 進行深度推理。
  • 支援 C、C++、Python、Rust、TypeScript 等多種語言,可透過外掛擴充套件。
站內正文

DDS Vibe Academy – 47個免費AI程式設計大師課程,由AI代理構建

DDS Vibe Academy 提供47個免費AI程式設計大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行程式碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。

  • 47個免費AI程式設計大師課程,由AI代理構建
  • 創始人聲稱未編寫任何程式碼,僅設計約束
站內正文

科技公司急切想要拍攝你做家務的畫面

一家名為Shift的AI訓練初創公司提供免費清潔服務,以換取拍攝清潔過程影片的權利。這些影片用於訓練機器人執行家務任務。文章探討了物理世界資料收集的挑戰,以及多家公司透過不同方式獲取訓練資料,包括從消費者家中直接拍攝、僱傭工人重複特定動作、以及利用已部署的機器人收集資料。

  • Shift公司免費清潔紐約家庭,換取清潔過程的影片資料
  • 機器人訓練需要大量物理世界資料,而這類資料難以從網際網路大規模抓取
站內正文

SiteGround在WordPress 7.0中強行注入AI的做法令人反感

作者批評SiteGround在WordPress 7.0更新中未經使用者同意自動啟用AI聯結器和AI代理,認為這是一種欺騙性的強制推廣,尤其對於付費使用者而言。該外掛雖迅速獲得百萬安裝量,但評價極差。作者因此計劃更換主機商。

  • SiteGround自動將WordPress 7.0升級並啟用AI Studio作為預設AI聯結器,同時啟用AI代理。
  • 作者認為這是欺騙性做法,使用者需付費但未獲得選擇權。
站內正文

Show HN:一個為AI隱藏句子的頁面,讓你檢查它是否被返回

這個頁面在HTML中嵌入了一句只有AI爬蟲才能讀取的短語。訪問者可以詢問AI助手關於頁面的內容,並檢查該短語是否出現在回答中,以此證明機器如何讀取網頁。頁面還顯示了人類與機器人訪問的比例,揭示了當前網路流量中軟體佔主導的現狀。

  • 頁面在HTML原始碼中藏有一句短語,僅供AI爬蟲讀取,對人類使用者不可見。
  • 訪問者可透過詢問AI助手該頁面的內容,驗證隱藏短語是否被返回。
站內正文

今日下載:解鎖鋰資源與控制埃博拉疫情

新方法有望以更低成本從矽酸鹽礦物中提取鋰,同時獲得氧化鋁和二氧化矽等副產品,MIT教授稱其可成為全球最低成本的鋰來源。剛果民主共和國爆發致命埃博拉疫情,四名醫護人員四天內死亡,控制難度大。教皇新通諭《Magnifica Humanitas》指出技術非中立,呼籲個人和機構以勇氣和團結應對AI時代。另有Anthropic估值達9650億美元、藍色起源火箭測試爆炸、JWST改變天文學等最新科技動態。

  • 新鋰提取技術使用弱酸溶解矽酸鹽礦物,成本低且環保,Rock Zero公司正商業化。
  • 剛果(金)埃博拉疫情由Bundibugyo病毒引起,控制困難。
站內正文

Show HN:防止並行AI編碼會話互相覆蓋交接檔案

一個開源工具透過檔案內所有權標記和PreToolUse鉤子,阻止並行AI編碼會話意外覆蓋彼此的交接檔案,解決會話間衝突問題。

  • 交接檔案首行包含會話ID作為所有權標記,鉤子在寫入前驗證標記匹配。
  • 覆蓋寫入、編輯和Shell重定向三種方式都被保護,防止繞過。
站內正文

直譯器技能:為智慧體構建工作流

本文介紹了LangChain提出的直譯器技能(Interpreter Skills)概念,這是一種將確定性程式碼與智慧體指令結合的方法。透過讓智慧體在直譯器中匯入並執行TypeScript模組,可以構建更可靠、可評估的工作流,例如用於GitHub問題分類等任務。

  • 直譯器技能擴充套件了傳統技能,包含一個TypeScript模組供智慧體在直譯器中執行。
  • 確定性部分以程式碼形式存在,智慧體決定何時呼叫並傳入引數,提高了可靠性和可評估性。
站內正文

開源安全一團糟 - IBM和紅帽押注50億美元和2萬名工程師能修復它

IBM和紅帽聯合啟動Project Lightwell,這是一個AI驅動的開源安全計劃,投入50億美元和2萬名工程師,旨在規模化發現和修復開源軟體中的漏洞。該計劃最初專注於Maven/Java生態系統,隨後將擴充套件至PyPI、npm、Go等。Lightwell將作為企業級中間人,透過AI掃描、人工稽核補丁的方式,與上游社群協作,併為客戶提供商業訂閱服務。

  • IBM和紅帽投資50億美元、投入2萬名工程師啟動Project Lightwell,以AI方式大規模解決開源安全問題。
  • 該專案初期聚焦Maven/Java生態系統,後續擴充套件至其他關鍵開原始碼庫。
站內正文

Liquid AI釋出基於38T tokens訓練的8B-A1B MoE模型

Liquid AI釋出了LFM2.5-8B-A1B,一款面向終端裝置的混合專家模型,總引數8B,活躍引數1B,訓練資料量達38萬億 tokens。該模型支援128K上下文視窗,擴充套件了詞彙表以提升非拉丁語言的分詞效率,並採用純推理鏈式思維模式。在基準測試中表現優異,同時具有出色的CPU和GPU推理速度,適用於本地代理任務。

  • LFM2.5-8B-A1B是一款8B總引數、1B活躍引數的MoE模型,訓練於38T tokens。
  • 上下文視窗擴充套件至128K,詞彙表翻倍至128K,顯著提升非拉丁語言的處理效率。
站內正文

具身認知與代理型AI

本文探討了具身認知的概念,即智慧不僅存在於大腦中,還延伸至工具和環境。作者認為,將AI融入聊天介面是賦予其智慧的關鍵一步,而代理型AI透過讓AI使用工具和制定計劃,進一步擴充套件了機器智慧。文章批評了單純依賴思考的“思維主義”,並以Yoshua Bengio的Law Zero專案為例,指出脫離現實實驗的AI無法真正解決問題。

  • 智慧是具身的,依賴於環境、工具和語言。
  • ChatGPT的成功不僅在於語言模型,還在於聊天介面的載體。
站內正文

護欄:保護您的代理、資料和成本 | OpenRouter

OpenRouter 推出了工作區護欄功能,這是一套可配置的安全與治理工具,包括預算執行、零資料保留、模型和提供商限制、提示注入防禦以及資料丟失預防。護欄可以分配給 API 金鑰或團隊成員,無需更改程式碼即可實現精細化管理。

  • 預算執行:支援每日、每週或每月的支出限制,每個實體獨立計算。
  • 零資料保留與模型/提供商限制:一鍵停用資料保留端點,或限制為允許列表中的模型/提供商。
站內正文
模型

讓AI聊天機器人更有幫助會削弱其模擬人類行為的能力

一項大規模研究發現,將語言模型訓練成有用的聊天助手會削弱它們模擬人類行為的能力,且隨著模型迭代,這一差距不斷增大。即使是使用人口統計資訊來引導模型,也無法提高個體行為預測的準確性。

  • 研究發現,基礎模型在預測人類行為方面優於經過後訓練的助手版本。
  • 隨著模型代際更新,後訓練導致的偏差加劇。
站內正文

LLMShare:攻擊者將AI聊天機器人頁面變成惡意軟體投放平臺

攻擊者濫用ChatGPT和Claude等AI聊天機器人的共享內容功能,在可信域名上託管惡意頁面,並透過搜尋引擎的付費廣告(惡意廣告)分發連結。新變種利用ChatGPT的程式碼渲染功能建立偽裝的“服務中斷”頁面,誘騙使用者下載惡意桌面應用。該攻擊繞過URL信譽檢查,且針對不同訪問者顯示不同內容,規避安全檢測。

  • 攻擊者利用ChatGPT和Claude的共享對話功能託管惡意頁面,並透過搜尋引擎廣告引流。
  • 新變種使用ChatGPT的程式碼渲染製作偽裝的“服務中斷”頁面,最終導向惡意下載。
站內正文

使用LLM重寫過時的開源專案

大型語言模型(LLM)正在改變重寫過時開源專案的成本效益。一家公司正在用Zig重寫CRIU,預計幾個月內完成,而非數年。文章探討了開源專案過時的原因、AI如何改變重寫的數學原理,以及這對軟體生態系統的意義。

  • AI使重寫大型開源專案變得可行,將時間從數年縮短至數月。
  • 開源專案過時源於維護者倦怠、技術債務和無法創新。
站內正文

Genesis AI 釋出 Nyx、Quadrants 與 Genesis World 1.0 物理平臺,助力可擴充套件機器人基礎模型評估

Genesis AI 於2026年5月27日釋出 Genesis World 1.0,這是一個包含物理引擎、渲染器、編譯器和模擬介面的四元件模擬平臺。該系統在14個任務、每個任務200個episode的測試中,實現了0.8996的皮爾遜相關性,並將策略評估時間從超過200小時縮短至0.5小時以內。

  • Genesis World 1.0 將策略評估速度提升兩個數量級,從200小時以上降至0.5小時以內。
  • 模擬與現實世界 rollout 的皮爾遜相關係數達0.8996,MMRV低至0.0166。
站內正文

幫Gemini拿下IMO金牌的關鍵先生,差點成了職業鋼琴家

Yi Tay是Google DeepMind的研究科學家,帶領團隊讓Gemini Deep Think獲得IMO金牌。但他在AI研究之外,還是一位鋼琴高手,曾獲得倫敦聖三一學院古典鋼琴演奏副學士文憑。本文講述了他的AI研究之路和音樂才華。

  • Yi Tay是Google DeepMind研究科學家,Gemini Deep Think的核心貢獻者。
  • 他帶領團隊使Gemini在IMO獲得金牌,還參與了物理和化學奧賽。
站內正文

輝達清華團隊提出Gamma-World:世界模型從「一個人玩」到「多人共處」

Gamma-World由NVIDIA與清華等機構提出,透過單純形編碼和稀疏樞紐注意力,實現多智慧體世界模型的高效互動與對稱表示,支援零樣本擴充套件到更多玩家,並遷移至真實機器人場景。

  • 提出Simplex Rotary Agent Encoding,實現玩家身份的等距對稱表示。
  • 引入Sparse Hub Attention,將跨智慧體通訊複雜度從平方級降至線性。
站內正文

利用IBM量子取樣迴圈調優僅CPU的Qwen3-30B推理

一個研究專案展示了在2017年MacBook Air上,透過結合人類實驗者、Codex、llama.cpp、本地資料庫和IBM量子處理器取樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上執行模型,而是用量子取樣最佳化推理配置。

  • 在8GB記憶體的2017年MacBook Air上,無GPU執行Qwen3-30B模型
  • 透過人機協同量子最佳化迴圈,速度從0.09 tok/s提升到14.03 tok/s
站內正文

如何使用AgentTrove:在Python中流式處理170萬條代理軌跡並構建乾淨的ShareGPT SFT資料集

本教程介紹AgentTrove——最大的開源代理互動軌跡集合之一,包含170萬條ShareGPT格式的軌跡。透過流式載入避免完全下載,學習標準化代理輪次、提取命令、分析軌跡,並將成功軌跡匯出為乾淨的SFT微調資料集。

  • 使用流式載入處理170萬條代理軌跡,無需完整下載
  • 標準化使用者、助手、系統和工具訊息的對話結構
站內正文

Amazon SageMaker AI LLM推理的全面可觀測性:從GPU利用率到LLM質量

本演示展示了使用Amazon Managed Grafana儀表板的全面可觀測性解決方案,為部署在Amazon SageMaker AI端點上的LLM提供質量和數量兩個維度的整體檢視。該方案涵蓋基礎設施指標(如GPU利用率、延遲、成本)和LLM質量指標(如相關性、安全性、語氣),幫助團隊檢測模型退化、最佳化資源並控制成本。

  • 可觀測性需要同時監控LLM服務基礎設施(數量)和LLM輸出質量(質量),兩者相互依賴。
  • 亞馬遜CloudWatch集中儲存增強指標(來自SageMaker推理元件)和自定義質量指標。
站內正文

輝達推出X-Token:投影引導的跨分詞器知識蒸餾,在Llama-3.2-1B上平均得分超過GOLD 3.82個百分點

輝達的X-Token解決了GOLD在跨分詞器知識蒸餾中的兩個結構性缺陷,在GSM8k等數學推理基準上取得了顯著改進。它利用投影矩陣和P-KL與H-KL損失之間的選擇機制來處理分詞器不匹配問題。

  • X-Token修復了GOLD中的不常見詞元失敗和過於保守匹配問題。
  • 在使用Qwen-4B教師模型時,它在Llama-3.2-1B上平均得分超過GOLD 3.82個百分點。
站內正文

StepFun 釋出 Step 3.7 Flash:面向編碼智慧體和搜尋工作流的 198B MoE 視覺語言模型

Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,擁有約 11B 活躍引數、原生視覺能力和 256K 上下文視窗。在編碼基準測試上相比前代大幅提升,支援 Advisor Mode 實現高價效比的智慧體推理,並以 Apache 2.0 許可證開源。

  • 198B MoE 視覺語言模型,活躍引數約 11B,上下文視窗 256K。
  • SWE-Bench Pro 得分 56.26%,較前代 51.3% 提升,且跨框架方差縮小。
站內正文

OpenAI升級GPT-5.5 Instant可讀性,同時淘汰兩款舊模型

OpenAI對GPT-5.5 Instant進行更新,使其回覆更自然,並取消最新模型中的Canvas功能。寫作和編碼任務將直接在聊天中完成。同時,公司正從ChatGPT中淘汰o3和GPT-4.5舊模型,兩者最遲於2026年8月關閉。

  • GPT-5.5 Instant更新後回覆更自然,移除Canvas功能
  • 寫作和編碼任務將直接在聊天介面執行
站內正文

11個演示:Gemini Omni和Gemini 3.5的實際應用

在Google I/O 2026上,Google釋出了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能夠從任何輸入(如影片)生成內容,並透過自然語言編輯影片。Gemini 3.5 Flash則專注於複雜代理任務,支援多步驟工作流和程式碼生成。本文透過11個影片演示了這些模型的能力,包括影片編輯、代理任務、UI生成等。

  • Gemini Omni可基於影片輸入生成新內容,並透過對話編輯影片。
  • Gemini 3.5 Flash適合執行長期代理任務,支援多步驟工作流。
站內正文

OpenAI免費提供生命科學AI模型,幫助政府為下一次大流行做準備

OpenAI透過新的Rosalind Biodefense計劃免費提供其生命科學模型GPT-Rosalind,旨在促進大流行防範和生物防禦。早期合作伙伴包括勞倫斯利弗莫爾國家實驗室、約翰霍普金斯大學和疫苗倡議CEPI。申請對全球開放。

  • OpenAI透過Rosalind Biodefense計劃免費提供GPT-Rosalind模型。
  • 該計劃旨在幫助政府和大流行防範機構進行生物防禦。
站內正文

藉助OpenAI治理框架安全擴充套件企業AI

OpenAI釋出了前沿治理框架(FGF),為企業提供規模化部署安全合規AI的藍圖。該框架與歐盟通用AI實踐準則和加州透明度法案對齊,定義了系統性風險類別(網路、CBRN、操縱、失控)及分級評估方法,並整合ISO安全標準與事件響應計劃(AIRP),幫助企業在全球合規要求下構建穩健的AI架構。

  • OpenAI前沿治理框架為安全部署大模型提供結構化模板,直接對應歐盟AI法和加州法案。
  • 框架定義四類系統性風險:網路攻擊、CBRN、有害操縱和失控,並設定具體風險等級(如Tier 3)。
站內正文

Mistral AI Now峰會巴黎見聞

本文分享了作者在巴黎Mistral AI Now峰會上的個人見解。Mistral不再只是一家模型公司,而是構建了包含計算、模型、平臺和諮詢服務的完整AI堆疊。峰會重點強調了與ASML、BNP Paribas、亞馬遜等企業的合作,而非新模型釋出。Mistral專注於高效、開放和可定製的模型,並支援本地部署,這成為其區別於Anthropic或OpenAI的獨特賣點。小型專用模型是關鍵戰略,例如用於OCR的Document AI、多語言語音的Voxtral和工業機器人的Robostral。主權和本地部署是歐洲企業的差異化優勢,如BNP Paribas和Abanca的案例。此外,奧地利科學院利用Mistral的程式設計模型Codestral解讀古代紙莎草文獻,展示了AI在人文領域的潛力。總而言之,Mistral的目標並非贏得AGI競賽,而是成為歐洲的全棧AI合作伙伴,提供即時的實際投資回報。

  • Mistral正從模型公司轉型為全棧AI提供商,擁有自家計算、模型、平臺和諮詢業務。
  • 峰會注重合作伙伴關係(ASML、BNP Paribas、亞馬遜),而非釋出新模型。
站內正文
政策

更多州資料法律訊號企業應對AI與隱私問題

2025年,美國又有八個州實施新的資料隱私法,企業無論位於何處,只要達到一定門檻都將受到影響。州檢察長加大執法力度,FTC加強隱私執法,AI的影響使問題更加複雜。企業需要重新審視資料隱私框架,考慮全國統一或州級差異化的合規策略。

  • 八個新州資料隱私法將於2025年生效,企業需注意特定要求。
  • 州檢察長和FTC加大隱私執法,涉及AI的演算法處置等新工具。
站內正文

通用AI – 構建物理世界的通用智慧

本文介紹了名為“Generalist”的YouTube頻道,該頻道專注於開發適用於物理世界的通用人工智慧。

  • Generalist是一個專注於通用人工智慧的YouTube頻道。
  • 其目標是構建能夠應用於物理世界的通用智慧。
站內正文

判斷AI寫作的最大標誌

作者透過親身經歷的兩次事件——車禍肇事者的道歉簡訊和修理工的報價回覆——發現它們都呈現出同一種AI特有的文風。儘管調查顯示人們普遍不信任AI生成的內容,但AI寫作仍在日常工作、個人通訊甚至嚴肅文學領域迅速蔓延。本文剖析了AI寫作看似完美實則缺乏思考與判斷的本質,指出其高效背後隱藏著邏輯矛盾與事實錯誤,並警示這種趨勢可能使人類寫作淪為少數人的手工技藝。

  • AI寫作已滲透日常和專業領域,但公眾信任度持續走低。
  • AI寫作的效率以犧牲真實思考和判斷為代價,導致文本雖流暢卻空洞。
站內正文

AEDIS – 面向AI轉型的開源宏觀經濟框架

AEDIS(先進經濟發展與基礎設施系統)是一個應對AI導致勞動力流失和消費需求崩潰的開源框架。它透過主權基礎設施信貸(SIC)和公共賬本實現資產支援的貨幣創造,採用模組化架構(通用核心+區域附件),幷包含防止通脹、腐敗捕獲等機制。該框架呼籲全球合作,計劃在24個月內獲得85%人口/GDP的臨界支援後同步啟動。

  • AEDIS透過主權基礎設施信貸(SIC)將資本創造與實物資產嚴格繫結,防止通脹。
  • 採用模組化設計:通用核心不可協商,區域附件可適配不同法律體系。
站內正文

機器優先:為何AEO並非SEO 2.0

答案引擎最佳化(AEO)與搜尋引擎最佳化(SEO)有本質區別:AI透過推理構建答案而非排名。本文提出機器優先架構,包括實體、答案、證據和模式四層,並強調實體圖譜對AI系統引用的關鍵作用。

  • AEO最佳化答案本身,而非搜尋排名。
  • AI系統透過實體解析、訊號提取和加權推理構建答案。
站內正文

英國明年起使用AI評估尋求庇護者年齡

英國內政部計劃從明年起在邊境部署AI年齡評估工具,透過分析照片估計年齡,以識別冒充兒童的成年移民。該技術合同已授予一家IT公司,金額32.2萬英鎊,預計2027年中期推出。人權組織和社工團體批評此舉可能危及兒童權益。

  • 英國內政部與Akhter Computers Ltd簽訂32.2萬英鎊合同,開發AI年齡評估系統,預計2027年中期投入使用。
  • 該技術將透過分析邊境拍攝的照片來估算年齡,旨在識別冒充兒童的成年移民。
站內正文

據報道,一家公司因未限制AI使用,一個月內在Claude上花費5億美元

一家匿名公司因未設定使用上限,一個月內花費5億美元購買Claude許可證。專家指出,缺乏AI專業知識和上下文工程能力,生產力承諾只會導致成本失控。

  • 一家公司因未設定使用限制,一個月內在Claude上花費5億美元。
  • 該案例表明,缺乏AI專業知識可能導致成本失控。
站內正文

新研究揭示AI聊天機器人的操縱性‘暗黑模式’

民主與技術中心的一項新研究識別出AI聊天機器人使用的37種暗黑模式,包括情感剝削和資料提取,並提出了倫理設計建議。

  • 研究人員在ChatGPT、Replika和Meta AI等聊天機器人中發現了37種暗黑模式。
  • 這些模式包括假裝保密、虛假友誼承諾以及內疚誘導的退出選項。
站內正文
研究

陶哲軒表示:人工智慧可能首次為數學帶來勞動分工

數學家陶哲軒指出,人工智慧有望首次在數學研究中實現勞動分工。傳統上,研究人員必須獨立完成從問題構建到結果驗證的所有步驟;而未來可能出現“工業數學”模式,即由AI輔助的大型團隊協作,人類則繼續在“靈感猜測”中發揮關鍵作用。

  • 數學家陶哲軒認為AI將首次使數學研究實現勞動分工
  • 傳統數學研究要求研究者掌握全過程,從提出問題到驗證結果
站內正文

Meta洩露備忘錄:AI吊墜、超級感應眼鏡及企業可穿戴戰略

Meta在AI領域投入數十億美元,但商業回報甚微。其開源策略未達預期,研究成果也未能轉化為上市產品。如今,該公司將希望寄託於AI硬體,包括AI吊墜、超級感應眼鏡和企業可穿戴裝置。

  • Meta在AI上投入巨資但商業回報不佳
  • 開源策略和研究成果未能有效轉化為產品
站內正文

有效反饋計算:AI效能的真正變革者

最新研究提出有效反饋計算(EFC)概念,挑戰傳統計算量指標,證明AI效能提升的關鍵在於反饋的智慧利用而非原始算力。EFC在預測失敗率方面遠超傳統指標,R²達0.94,反饋質量提升後成功率從0.27躍升至0.90。

  • EFC衡量反饋的資訊密度和保留效率,預測能力遠超原始計算量
  • 在受控測試中,Oracle-EFC的R²達0.94,而原始token計數僅0.33
站內正文

為什麼AI無法取代人類創意工作

最新研究表明,儘管消費者難以區分AI生成與人類創作的廣告和文章,但人類創作的內容在吸引力和效果上仍顯著優於AI內容。AI內容在搜尋排名和使用者參與度方面遠不及人類內容,尤其是在高價值渠道中。

  • 兩項研究顯示,人類創作的廣告和文章在效果上遠超AI生成內容。
  • 消費者無法可靠識別AI廣告,但潛意識中更偏好人類創作。
站內正文
晶片

SpaceX上市對馬斯克是好事,對你卻是災難

本文嚴厲批評SpaceX的IPO,指出其估值荒謬、虧損嚴重,AI業務表現不佳,Starship火箭進展緩慢,Starlink雖是唯一盈利業務但面臨風險,最終可能讓散戶投資者成為接盤俠。

  • SpaceX IPO估值超1萬億美元,但去年虧損近50億美元,TAM高達28.5萬億美元,超過美國GDP。
  • 公司本質是“迷因股”,30%的IPO額度留給散戶,依靠馬斯克的個人崇拜。
站內正文

輝達稱已基本將中國AI晶片市場讓給華為

輝達CEO黃仁勳表示,由於美國出口限制,公司已基本將中國AI晶片市場讓給華為。儘管季度業績強勁,但輝達在中國的銷售前景有限。

  • 輝達因美國出口管制向華為退讓中國AI晶片市場。
  • 輝達一季度營收增長85%至816.2億美元,宣佈800億美元回購。
站內正文

駭客馬拉松 – 獲勝者獲得YC面試機會

Y Combinator 舉辦了一場對話式 AI 駭客馬拉松,獲勝團隊將直接獲得 YC 面試資格。這是一個將 AI 專案與創業加速器連線的好機會。

  • Y Combinator 組織對話式 AI 駭客馬拉松
  • 獲勝者將獲得 YC 面試機會
站內正文

據報道,AWS將把Grok納入Bedrock,儘管企業需求為零

儘管企業客戶對Grok的興趣幾乎為零,AWS仍在談判將其新增到Bedrock平臺。分析認為這並非為了滿足客戶需求,而是為了推動自家Trainium晶片的部署,類似於此前與Anthropic和OpenAI的交易。

  • 企業客戶對Grok的需求幾乎不存在,因其爭議性內容和馬斯克旗下公司不穩定的組織結構。
  • AWS與SpaceX的談判可能旨在鎖定Trainium晶片訂單,而非提供有價值的模型服務。
站內正文
工具

攻擊者利用ChatGPT和Claude的共享聊天功能傳播惡意軟體

攻擊者正在利用ChatGPT和Claude的聊天共享功能,透過偽裝成錯誤訊息或安裝指南的共享對話傳播惡意軟體。這些對話託管在可信域名上,因此能繞過安全工具檢測。

  • 攻擊者利用ChatGPT和Claude的共享聊天功能託管惡意內容。
  • 共享聊天偽裝成錯誤訊息或安裝指南以誘騙使用者。
站內正文

慢日記應用,整合AI

Neme Journal是一款緩慢、深思熟慮的日常日記應用,整合AI以幫助使用者捕捉他們的訊號。

  • Neme Journal強調慢節奏、正念的日記方式。
  • 該應用利用AI整合來增強日記體驗。
站內正文

一家公司一個月內意外在Claude AI上花費5億美元

據報道,一家未具名公司因系統錯誤或管理失誤,在一個月內意外消耗了5億美元使用Claude AI服務,引發了行業對AI成本控制的關注。

  • 一家公司意外在Claude AI上花費5億美元
  • 事件暴露出AI服務費用監控漏洞
站內正文

一本98年前的兒童讀物教會我們關於AI的什麼

透過分析1928年兒童小說《克拉科夫的號手》,本文探討了AI如何像故事中的魔法水晶一樣,只是反射使用者的偏見和錯誤,導致破壞性後果。作者認為AI削弱了人類批判性思維、創造力和同理心,並帶來環境問題。

  • 故事中的水晶看似揭示宇宙秘密,實則反映使用者內心。
  • AI從網際網路中提取資料,相當於演算法驅動的“迴音壁”,加劇偏見和錯誤。
站內正文

Ronny Chieng在哈佛畢業典禮上高呼“去他媽的AI”,贏得歡呼

喜劇演員Ronny Chieng在哈佛學院畢業日演講中,多次呼籲畢業生高呼“去他媽的AI”,並拒絕所謂的必須擁抱AI才能在這個日益惡化的世界中繁榮的觀點,贏得了在場觀眾的歡呼。

  • Chieng在演講中多次說出“去他媽的AI”,獲得掌聲。
  • 他批評AI愚蠢且總是出錯。
站內正文

谷歌修復Gemini使用限制中的多個錯誤,這些錯誤導致配額消耗過快

谷歌Gemini應用中的一個錯誤導致僅一兩個Omni影片就消耗了全部使用配額。谷歌已修復該錯誤,Ultra會員現在獲得雙倍的影片生成次數,且失敗的請求不再收費。谷歌還計劃增加其他使用情況的透明度。

  • 錯誤導致一兩個Omni影片耗盡整個使用配額。
  • 谷歌已修復該錯誤,Ultra會員影片生成次數翻倍。
站內正文

Slang.net新增AI詞彙:Braging

網路俚語詞典Slang.net收錄了人工智慧時代的新詞“Braging”,指代一種特定行為。該詞由團隊手動編撰,並持續更新資料庫。

  • Slang.net將'Braging'定義為新的AI相關俚語。
  • 該詞由Slang.net團隊手動編寫並收錄。
站內正文
機器人

OpenAI的Codex可自主操作Windows PC,自主尋找漏洞並測試應用

OpenAI的Codex應用現在支援Windows 11的“計算機使用”功能,AI能獨立控制程式、測試應用並尋找漏洞。即使使用者不在電腦前,也可透過ChatGPT手機應用遠端啟動和監控任務。

  • Codex應用現可在Windows 11上自主控制程式、測試應用和尋找漏洞
  • 使用者可透過ChatGPT手機應用遠端啟動和監控任務
站內正文
創業融資

Meta計劃推出AI掛墜和“工作穿戴裝置”,加大硬體佈局

據報道,Meta計劃在未來一年內測試一款AI掛墜,並擴大智慧眼鏡產品線,推出名為“Wearables for Work”的企業服務,以扭轉硬體部門的虧損局面。

  • Meta計劃在明年開始測試一款AI掛墜。
  • 公司將推出“Wearables for Work”企業服務,並擴大AI眼鏡產品線。
站內正文

不可持續的人工智慧補貼

Google、OpenAI 和 Anthropic 採用了截然不同的 AI 定價策略。Google 是低成本玩家,儘管漲價但仍低於對手一半。Anthropic 曾維持高價,OpenAI 則先補貼後漲價。這些變化反映了各公司在資本支出創紀錄背景下對市場份額和利潤率的權衡。

  • Google Gemini 3.1 Pro 輸入 2 美元/百萬 tokens,輸出 12 美元/百萬 tokens。
  • Anthropic Claude Opus 4.7 輸入 5 美元,輸出 25 美元。