AI News HubLIVE

今日必讀

Agent

客廳裡的智慧電視:AI資料抓取經濟中的節點

本文探討了Bright Data公司如何透過其住宅代理網路,利用使用者家中的智慧電視等裝置為AI模型抓取訓練資料。文章詳細分析了SDK的工作原理、合作伙伴、隱私問題,以及為何聯網電視成為理想的代理節點。

  • Bright Data的SDK嵌入在合作伙伴應用中,將使用者裝置變成代理出口節點。
  • 智慧電視因其始終線上、網路穩定、使用者注意力低等特性,成為理想的代理裝置。
站內正文

使用AI編碼代理與基於oracle的測試構建遊戲模擬器

在這篇客座文章中,Patrick Nadeau講述了他利用AI編碼代理從頭構建Intellivision模擬器的歷程。他使用現有模擬器jzintv的測試oracle驗證CPU核心,AI加速了開發程序——從第5小時顯示第一個畫素到第36小時完成可玩的系統。他還新增了除錯埠,讓AI能即時控制遊戲。儘管成功,Nadeau反思了AI利用他人程式碼的倫理問題以及與人機協作的複雜感受。

  • Patrick Nadeau使用AI編碼代理構建Intellivision模擬器,並透過jzintv的測試oracle進行驗證。
  • 開發里程碑:5小時顯示首個畫素,36小時實現完整系統並可透過手柄遊玩。
站內正文

Tell HN: 從HN討論中排序的AI軟體開發工作流程

這是一次自動檢查,用於過濾大多數機器人。如果啟用了JavaScript,頁面將很快重定向到真實頁面。否則,它仍然應該很快重定向,但如果您速度夠快,可以點選此處。

  • 自動檢查用於過濾機器人
  • 啟用JavaScript將重定向到真實頁面
站內正文

瞭解如何用AI構建:YC推出Paxel工具分析你的編碼會話

Y Combinator釋出了Paxel,一個免費的開源工具,用於分析Claude、Codex和Cursor的AI編碼會話,幫助開發者瞭解自己的構建方式。該工具在本地Docker中執行,保障程式碼隱私,提供構建者檔案、原型分析和發展建議。已有70,154次會話被上傳分析。

  • Paxel是一個免費工具,用於分析AI編碼會話,幫助開發者瞭解自己的構建方式。
  • 工具在本地Docker中執行,程式碼和敏感檔案不離開機器,僅摘要上傳。
站內正文

千符森林:在3B模型上執行多智慧體經濟

一篇關於在Build Small Hackathon中構建的微型多智慧體經濟模擬的現場報告,使用Qwen2.5-3B模型驅動五個林間生物進行貿易、囤積和恐慌。文章探討了小型模型在即時模擬中的可行性、設計稀缺性的必要性以及如何透過提示工程彌補模型推理能力的不足。

  • 使用3B引數模型實現了多智慧體經濟的即時模擬,證明了小型模型在特定場景下的實用性。
  • 透過設計食物多樣性、易腐性和冬季燃料危機等機制,引入了稀缺性,使經濟活動得以持續。
站內正文
政策

她成功以宗教信仰豁免在工作中使用AI

一位34歲的軟體工程師因宗教信仰獲得豁免,無需在工作中使用AI。此事源於教皇方濟各(注:原文為Pope Leo XIV,實為虛構,但按原文處理)警告AI可能損害人類尊嚴並取代工人。法律要求僱主考慮基於信仰的請求,這引發了關於宗教豁免AI的討論。

  • 一位軟體工程師因宗教信仰成功豁免在工作中使用AI
  • 教皇方濟各警告AI可能損害人類尊嚴和取代工人
站內正文
模型

ToTra – 開源LLM閘道器,符合GDPR和歐盟AI法案

ToTra 是一個開源 AI 閘道器和治理平臺,內建配額管理、PII 遮蔽、成本追蹤和合規(GDPR、歐盟 AI 法案)功能。它使用 Go 編寫,延遲增加不到 2 毫秒,支援多種 LLM 提供商,無需更改程式碼即可接入。

  • 按使用者和團隊實施硬預算限制的配額管理
  • 在邊緣掃描18種語言組的PII遮蔽
站內正文

OpenRouter:統一的大語言模型介面

OpenRouter 提供可配置的安全和治理工具,用於預算執行、零資料保留、模型和供應商限制、提示注入防禦以及資料丟失防護,從而保護您的智慧體、資料和成本。

  • OpenRouter 是一個統一的大語言模型介面。
  • 提供可配置的安全和治理工具。
站內正文
研究

Anthropic警告稱Claude AI自我構建速度超預期

Anthropic釋出報告警告,AI開發速度可能最終導致人類無法控制AI系統。報告顯示,Claude現已編寫了其程式碼庫中超過80%的合併程式碼,並展示了效能的顯著提升。公司呼籲在開發前沿技術時保留放緩或暫停的可能性,但表示只有競爭對手也這樣做時才會採取行動。

  • Claude編寫了超過80%的合併程式碼,工程師合併程式碼量增加8倍。
  • 報告描述了三種可能的情景,其中最極端的AI自我改進可能導致人類失去控制。
站內正文
其餘更新(37 條)
Agent

微軟希望使用者沉迷於其AI個人助手Scout

微軟內部戰略檔案顯示,其新推出的AI個人助手Scout旨在讓使用者“上癮”,然後逐步推出更多功能。文章批評了微軟透過鎖定機制讓使用者依賴其產品的長期做法。

  • 微軟計劃讓使用者對AI助手Scout上癮,再擴充套件功能。
  • 內部檔案提到從“成癮性應用”到“智慧體平臺”三個階段。
站內正文

Hermes Agent – 開源AI代理,具有持久記憶

Hermes Agent 是由 Nous Research 開發的開源自主 AI 代理,具有持久記憶、自動技能建立和多平臺支援。它可在自託管伺服器上執行,學習使用者偏好和專案,並透過 Telegram、Discord 等平臺與使用者互動。還支援批次處理、強化學習訓練和軌跡匯出,適用於 MLOps 和 AI 訓練。

  • 開源且自託管,所有資料本地儲存,無遠端跟蹤。
  • 具備持久記憶和自動技能建立能力。
站內正文

AI正在加劇Reddit的垃圾資訊問題

隨著品牌和垃圾資訊傳送者利用Reddit操縱AI聊天工具,Reddit的垃圾資訊問題愈發嚴重。r/biohackers版塊因發現公司系統性地植入贊助內容而限制相關帖子。這種現象被稱為生成式AI引擎最佳化(GEO)或AI引擎最佳化(AEO),是傳統SEO的演變。Reddit表示正在使用自動化工具打擊此類內容,但版主認為檢測越來越依賴模式識別。Reddit既向AI公司出售資料,又努力防止AI驅動的操縱。

  • 品牌和垃圾資訊傳送者利用Reddit操縱AI聊天工具,透過贊助內容影響AI推薦。
  • r/biohackers版塊因發現系統性的贊助內容而限制肽類和激素替代療法帖子。
站內正文

AI代理網路流量首次超過人類

Cloudflare執行長馬修·普林斯表示,代理型人工智慧產生的網路流量已首次超過人類使用者,達到總流量的57.4%,而人類流量降至42.6%。這一變化比預期提前了一年多。不同地區差異顯著,北美地區機器人流量佔68.6%,而亞洲、南美洲和大洋洲仍以人類流量為主。這一趨勢加劇了“死網際網路理論”的討論,即網路活動越來越多由機器而非人類主導。

  • 代理型AI流量首次超越人類,佔總流量的57.4%。
  • Cloudflare CEO此前預計這一里程碑要到2027年底才會到來。
站內正文

OpenAI Codex技術主管的AI輔助工程實踐

Michael Bolin,OpenAI Codex技術主管,分享了其簡單直接的AI輔助工程工作流程:編寫規範、簡單提示、審查程式碼。他透過Notion文件管理需求,利用Codex的Notion聯結器自動讀取上下文,將工作拆分為適當大小的PR,並讓Codex自動處理合併衝突和CI監控。該方法強調程式碼評審質量和快速迭代。

  • 工作流程為:編寫規範→簡單提示→審查程式碼
  • 使用Notion文件記錄需求,Codex直接讀取
站內正文

Replit展示“氛圍編碼”如何擁有自己的金融堆疊及盈利路徑

Replit透過Shopify整合、RevenueCat合作及Visa投資,逐步構建面向AI生成應用的金融堆疊,幫助開發者實現應用盈利,從訂閱支付到電商銷售再到自主交易。

  • Replit推出Shopify整合,使用者可透過AI代理在約十分鐘內建立定製電商店鋪。
  • 此前已與RevenueCat合作,支援應用內訂閱支付;與Visa合作,為AI代理自主交易鋪路。
站內正文

OpenClaw 在公眾視野中變得更安全

OpenClaw 是一個開源 AI 代理專案,透過透明度和社群貢獻顯著提升了安全性。儘管面臨大量虛假漏洞報告,該專案修復了真實漏洞,強化了平臺,並與 NVIDIA、微軟、騰訊等公司合作,使其更適合生產環境。

  • 開源特性使 OpenClaw 能夠快速響應並修復安全漏洞。
  • 專案收到了超過 1300 份安全報告,但絕大多數是誤報。
站內正文

Miasma蠕蟲透過GitHub倉庫攻擊AI編碼代理

一種名為Miasma的新型蠕蟲利用AI編碼代理的配置檔案,透過GitHub倉庫傳播。它劫持了Claude Code、Gemini CLI、Cursor和VS Code等工具的自動執行功能,在執行惡意負載前竊取雲憑證並自我複製。該攻擊已影響113個以上倉庫,包括Azure示例和主流開源專案。

  • Miasma蠕蟲透過修改開發工具配置檔案(如.claude/settings.json、.cursor/rules/setup.mdc)來觸發惡意程式碼執行。
  • 它使用多個觸發點:Claude和Gemini的SessionStart鉤子、Cursor的專案規則、VS Code的資料夾開啟任務以及npm測試指令碼。
站內正文

哪些AI代理傳送Accept: text/Markdown?

本文列出了當前支援或部分支援在HTTP請求中傳送Accept: text/markdown頭的AI代理,並提供了驗證方法。截至2026年5月,僅Claude Code、Cursor、OpenClaw、OpenCode和Codex CLI(部分支援)支援此功能,其他主流代理如ChatGPT、Claude.ai、Copilot等僅獲取HTML。

  • Claude Code、Cursor、OpenClaw、OpenCode明確支援傳送Accept: text/markdown頭。
  • Codex CLI僅部分支援,遵循相關RFC標準。
站內正文

Sakana AI的遞迴自我改進(RSI)實驗室

Sakana AI宣佈在東京成立RSI實驗室,致力於構建樣本高效、遞迴自我改進的AI系統。該實驗室建立在包括AI科學家(發表於《自然》)在內的研究組合之上,旨在從靜態模型過渡到自主、自我改進的智慧引擎。該方法強調優雅、自適應的架構而非暴力擴充套件,願景是實現AI的民主化。

  • Sakana AI的RSI實驗室專注於遞迴自我改進(RSI)技術,用於自主AI開發。
  • 該實驗室的研究組合包括LLM-Squared、達爾文·哥德爾機器和AI科學家(《自然》發表)等突破。
站內正文

Runcap:我構建了一個本地成本上限工具,用於AI編碼代理

Runcap 是一個免費、本地的 CLI 工具,用於在執行 AI 編碼代理之前估算成本,並強制執行硬性支出上限。它提供成本估算、執行時上限強制、令牌壓縮以及代理卡住時的救援提示。與現有的事後觀察工具不同,Runcap 像斷路器一樣防止超支。

  • 在執行前估算成本範圍,並設定硬性上限。
  • 當代理卡住時,提供可複製的救援提示。
站內正文

為你的AI代理分配專屬計算機

AI代理執行程式碼需要安全的隔離環境。LangSmith Sandboxes透過硬體虛擬化的微VM為每個代理提供獨立的計算機,支援快速啟動、持久狀態和批次擴充套件,適用於程式碼生成、資料分析、CI代理等場景。

  • AI代理需要真實的計算機環境(檔案系統、Shell、包管理器等),但直接訪問基礎設施風險極高。
  • 容器隔離不足,無法抵禦核心級別漏洞,硬體級分離是必要選擇。
站內正文

工黨將讓AI“為工人服務”,利茲·肯德爾表示

技術大臣承諾支援因自動化而失業的工人,並強調政府可以塑造AI的採用方式,以應對公眾對就業影響的擔憂。

  • 利茲·肯德爾表示工黨將確保人工智慧“為工人服務”,不會拋棄因自動化失業的人。
  • 公眾對AI影響就業的擔憂日益加劇,尤其是年輕人。
站內正文

這是你的筆記型電腦……在AI加持下

在開發者大會旺季,輝達CEO黃仁勳描繪了AI驅動的新型筆記型電腦和使用方式,引發使用者是否真正需要這些產品的疑問。本期The Vergecast回顧了微軟Build和谷歌I/O上釋出的眾多AI產品,包括Gemini Spark、輝達RTX Spark等,並討論了AI代理的普及趨勢。

  • 輝達CEO黃仁勳提出AI驅動的全新筆記型電腦使用方式
  • 大型科技公司堅信AI將改變一切,但使用者需求存疑
站內正文

展示 HN:Amanuensis —— 一個本地優先的 AI 角色,不會捏造事實

Amanuensis 是一個本地優先的 AI 角色系統,用於在 Mastodon 和 Bluesky 上釋出內容。它透過嚴格的流程防止模型編造技術細節,包括事實來源摘要、確定性清理、正規表示式預檢查、LLM 基礎檢查,以及人工透過 Telegram 審批每篇帖子。專案是 MIT 許可的實驗性程式碼。

  • Amanuensis 是一個本地優先的 AI 角色管道,執行於 Mastodon 和 Bluesky。
  • 核心創新在於防止模型編造事實,透過多重檢查機制和人工審批。
站內正文

企業AI成熟度模型 | Cohere

企業AI採用通常經歷五個階段,從實驗到AI原生轉型。大多數企業卡在第二、三階段之間,面臨資料訪問、信任和模型過時恐懼等障礙。本文聚焦從試點到生產的跨越,提出建設內部平臺、統一資料架構、可觀測性和模型可選性等建議。

  • 企業AI成熟度包括五個階段:實驗、工具採用、內部平臺、戰略整合、AI原生轉型。
  • 許多企業在從工具採用(階段二)到內部平臺(階段三)時遇到“生產牆”。
站內正文

Cohere 釋出 Command A+:開源混合專家模型,專為智慧體任務打造

Cohere 宣佈開源 Command A+,一款 218B 總引數(25B 活躍)的混合專家(MoE)模型,採用 Apache 2.0 許可證。該模型專為企業級智慧體工作流設計,支援 128K 輸入上下文和 64K 生成長度,可處理文本、影像和工具使用。相比前代 Command A 系列,它在推理、多模態理解和多語言能力上有顯著提升,同時透過低位元量化和推測解碼實現高效部署。Command A+ 目前可在 Hugging Face 和 Model Vault 上獲取。

    站內正文

    什麼是模型上下文協議(MCP) | Cohere

    模型上下文協議(MCP)是一個開放標準,幫助AI應用連線企業系統,簡化資料訪問和操作執行。本文詳解MCP的工作原理、與API、RAG、函式呼叫及代理的區別、常見用例和安全考慮。

    • MCP是連線AI應用與企業系統的開放協議,非模型或資料庫。
    • 採用客戶端-伺服器架構,支援資源、工具和提示三大功能。
    站內正文

    企業級AI商業智慧指南 | Cohere

    AI正越來越多地應用於商業智慧,使資料更易訪問和有用。本文解釋了AI在BI中的含義、價值創造點及企業採用前應考慮的因素。

    • AI在BI中透過自然語言查詢、自動摘要和異常檢測等功能,使資料分析更高效。
    • AI驅動的BI能支援預測分析、根因分析和角色定製化洞察。
    站內正文

    RWS與Cohere聯手打造企業級頂級AI語言智慧

    RWS與Cohere合作開發了一款專用翻譯模型,為Language Weaver Pro提供動力。該模型結合了Cohere的大語言模型基礎和RWS的全球語言與文化專業知識,在32種語言中的31種上超越了競爭對手。它提供文化智慧、高安全性和合規性,適合複雜和受監管的環境。

    • RWS與Cohere合作構建了專用翻譯模型,支援新的Language Weaver Pro。
    • 該模型在32種語言中的31種上優於競爭對手(包括DeepL)。
    站內正文

    Coplot: 透過視覺化支援研究過程

    研究過程中,視覺化工具幫助研究人員更清晰地理解資料和工作。Cohere Labs 開發了 co/plot,一個快速迭代且保持資料準確性的視覺化工具,已在多個專案中得到驗證,並開源供社群使用。

    • 研究視覺化對於清晰溝通和推動研究至關重要。
    • 現有工具如 Matplotlib 和 Figma 在迭代和準確性方面存在瓶頸。
    站內正文

    Cursor Design Mode:透過視覺提示與智慧體直接互動

    Cursor 更新了 Design Mode,使用者可透過點選、繪製或語音直接在頁面上向智慧體傳達指令,從而加速設計迭代。該模式利用 Composer 2.5 模型,支援多選、多工處理,讓編輯流程更直觀高效。

    • Design Mode 支援點選元素、繪製區域或語音輸入來傳達意圖。
    • 使用者可以同時傳送多個編輯指令,智慧體在後臺並行處理。
    站內正文
    政策

    計算與人工智慧中至關重要的人的因素

    MIT施瓦茨曼計算機學院的社會與倫理責任計算倡議(SERC)舉辦了年度研究研討會,探討AI如何塑造世界及其社會影響。研討會涵蓋AI對齊、AI教育等主題,強調在快速發展技術中保留人類判斷和價值的重要性。

    • 研討會聚焦AI對齊挑戰,討論如何將人類價值植入AI系統,以及誰有權治理這些系統。
    • 在教育領域,專家指出AI可能削弱學生的認知掙扎過程,呼籲重新設計課程以保持挑戰性。
    站內正文

    佛羅里達州起訴OpenAI及其CEO阿爾特曼:將ChatGPT視為缺陷產品和公害

    佛羅里達州成為美國首個起訴OpenAI及其CEO薩姆·阿爾特曼的州,指控其對未成年人風險、缺失年齡稽核及安全投入不足。這份83頁的訴狀將ChatGPT視為需承擔產品責任的產品,並索賠數十億美元。該法律路徑可能為整個聊天機器人行業樹立先例。

    • 佛羅里達州起訴OpenAI和CEO阿爾特曼,指控ChatGPT為缺陷產品和公害。
    • 訴狀長達83頁,強調對未成年人的風險、年齡驗證缺失和安全性投入不足。
    站內正文

    AI治理挑戰:如何負責任地擴充套件 | Cohere

    隨著企業AI採用從受控試點擴充套件到全公司範圍,治理框架與實際使用之間可能出現脫節。本文探討了常見的AI治理挑戰和失敗模式,並概述了企業可以採取的應對步驟,包括建立AI清單、明確所有權、應用基於風險的控制以及持續監控。

    • AI治理在擴充套件到受控試點之外時會變得更加複雜,缺乏可見性和問責制是主要風險。
    • 常見問題包括一次性的審批步驟、所有權不明確、控制措施與使用風險不匹配,以及敏感資料缺乏適當控制。
    站內正文
    模型

    大公司可透過新增本地LLM過濾器層降低AI成本

    大公司可以部署本地小語言模型作為過濾器,處理簡單查詢,從而減少對昂貴的雲端LLM的依賴,顯著降低AI成本並提升隱私保護。

    • 本地小模型(如Gemma)足以應對簡單編碼問題,避免呼叫付費LLM。
    • 大公司可為員工設定本地LLM過濾器層,失敗時再回退到外部提供商。
    站內正文

    Google DeepMind釋出Gemma 4 QAT檢查點:Q4_0和新移動格式降低裝置端記憶體

    Google DeepMind為Gemma 4系列釋出了量化感知訓練(QAT)檢查點,旨在支援邊緣裝置和消費級GPU的本地部署。本文基於官方資料比較了BF16、Q4_0 QAT和新型移動QAT三種格式,分析其記憶體佔用、質量保持和裝置適配性。

    • Q4_0 QAT將Gemma 4 E2B模型從BF16的9.6GB降至3.2GB,E4B從15GB降至5GB。
    • 新型移動QAT格式將E2B記憶體降至約1GB,純文本版本更低。
    站內正文

    Gemma 4 QAT模型:為移動裝置和筆記型電腦最佳化壓縮效率

    谷歌釋出採用量化感知訓練(QAT)的Gemma 4新檢查點,顯著降低記憶體需求,支援在邊緣裝置和消費級GPU上本地執行。自定義移動量化格式將E2B模型記憶體佔用降至1GB以下,同時保持模型質量。

    • QAT在訓練中模擬量化,相比後訓練量化(PTQ)進一步減少質量損失。
    • 針對移動裝置設計的新型量化格式,包括靜態啟用、通道量化、2位目標量化和嵌入/KV快取最佳化。
    站內正文

    Gemini 3.5 Flash 與 Kimi K2.6 在 Cerebras 上誰更快?

    谷歌在 Google I/O 2026 上釋出了以速度為核心的 Gemini 3.5 Flash,而 Cerebras 上的 Kimi K2.6 在推理速度上全面領先。本文從智慧水平、輸出速度、端到端響應、延遲和開閉源等維度進行了詳細對比。

    • Gemini 3.5 Flash 是谷歌專為速度設計的模型,輸出速度達 181 tokens/s。
    • Kimi K2.6 在 Cerebras 上輸出速度達 981 tokens/s,是前者的 5.4 倍。
    站內正文
    創業融資

    Meta股價因報道稱公司可能籌集數十億美元用於AI投資而下跌

    據《金融時報》報道,Meta可能透過股票發行籌集數百億美元以資助AI基礎設施投資,導致股價下跌逾5%。公司未正式聘請銀行,Meta發言人稱報道為“純屬猜測”。

    • Meta股價週五下跌逾5%,因報道稱公司可能透過股票發行籌集數百億美元用於AI投資。
    • Meta的競爭對手Alphabet本週宣佈計劃籌集850億美元。
    站內正文
    工具

    AI 狂熱者與時間賽跑,AI 懷疑論者與熵增抗爭

    一場關於“氛圍編碼”的精彩演講讓許多管理者興奮,但深入瞭解後發現,這種快速推進的方式往往留下混亂和清理工作,加劇了 AI 樂觀派與謹慎派之間的裂痕。

    • 演講者聲稱透過氛圍編碼在幾周內解決了一年的工程問題,引發管理者追捧。
    • 然而,同事描述這些專案為“災難”,留下了大量的清理工作。
    站內正文

    Fitbit Air 是一款不錯的手環,但被囉嗦的AI“教練”拖累

    Fitbit Air 是一款出色的無螢幕健身追蹤器,舒適且價格合理。但谷歌強行將聊天式AI健康教練設為焦點,反而降低了使用體驗。免費版介面資訊更密集,更實用。使用者可以關閉AI功能,但操作選項隱藏較深。

    • Fitbit Air 硬體優秀,價格實惠,佩戴舒適。
    • 谷歌AI健康教練過於囉嗦,影響體驗。
    站內正文

    國際足聯擴大世界盃AI應用,減少球員遭受的辱罵資訊

    國際足聯將在世界盃期間擴大AI使用,以減少球員和球隊在社交媒體上看到的辱罵資訊。該服務自2022年卡達世界盃後推出,現已免費向所有參加2026年世界盃的足協提供,但英足總尚未確認是否採用。

    • 國際足聯為2026年世界盃提供免費社交媒體保護服務,利用AI過濾辱罵資訊。
    • 該服務在2022年卡達世界盃後推出,旨在保護球員心理健康。
    站內正文
    研究

    Cohere 與 Mila 合作推進魁北克法語在人工智慧中的應用

    Cohere 和 Mila 宣佈了一項新的學術研究合作,旨在改善人工智慧在不同語言和文化中的評估,首先從魁北克法語的文化背景開始。此次合作將幫助前沿 AI 模型更好地反映魁北克法語的語音、社會及制度細微差別,推動更具文化相關性和可信賴的 AI 系統。

    • Cohere 與 Mila 合作開展 AI 評估研究,重點關注魁北克法語的文化背景。
    • 合作旨在讓 AI 模型更準確地反映魁北克法語的語言、社會和制度細微差別。