AI News HubLIVE

今日必讀

Agent

客廳裏的智能電視:AI數據抓取經濟中的節點

本文探討了Bright Data公司如何通過其住宅代理網絡,利用用户家中的智能電視等設備為AI模型抓取訓練數據。文章詳細分析了SDK的工作原理、合作伙伴、隱私問題,以及為何聯網電視成為理想的代理節點。

  • Bright Data的SDK嵌入在合作伙伴應用中,將用户設備變成代理出口節點。
  • 智能電視因其始終在線、網絡穩定、用户注意力低等特性,成為理想的代理設備。
站內正文

使用AI編碼代理與基於oracle的測試構建遊戲模擬器

在這篇客座文章中,Patrick Nadeau講述了他利用AI編碼代理從頭構建Intellivision模擬器的歷程。他使用現有模擬器jzintv的測試oracle驗證CPU核心,AI加速了開發進程——從第5小時顯示第一個像素到第36小時完成可玩的系統。他還添加了調試端口,讓AI能實時控制遊戲。儘管成功,Nadeau反思了AI利用他人代碼的倫理問題以及與人機協作的複雜感受。

  • Patrick Nadeau使用AI編碼代理構建Intellivision模擬器,並通過jzintv的測試oracle進行驗證。
  • 開發里程碑:5小時顯示首個像素,36小時實現完整系統並可通過手柄遊玩。
站內正文

Tell HN: 從HN討論中排序的AI軟件開發工作流程

這是一次自動檢查,用於過濾大多數機器人。如果啓用了JavaScript,頁面將很快重定向到真實頁面。否則,它仍然應該很快重定向,但如果您速度夠快,可以點擊此處。

  • 自動檢查用於過濾機器人
  • 啓用JavaScript將重定向到真實頁面
站內正文

瞭解如何用AI構建:YC推出Paxel工具分析你的編碼會話

Y Combinator發佈了Paxel,一個免費的開源工具,用於分析Claude、Codex和Cursor的AI編碼會話,幫助開發者瞭解自己的構建方式。該工具在本地Docker中運行,保障代碼隱私,提供構建者檔案、原型分析和發展建議。已有70,154次會話被上傳分析。

  • Paxel是一個免費工具,用於分析AI編碼會話,幫助開發者瞭解自己的構建方式。
  • 工具在本地Docker中運行,代碼和敏感文件不離開機器,僅摘要上傳。
站內正文

千符森林:在3B模型上運行多智能體經濟

一篇關於在Build Small Hackathon中構建的微型多智能體經濟模擬的現場報告,使用Qwen2.5-3B模型驅動五個林間生物進行貿易、囤積和恐慌。文章探討了小型模型在實時仿真中的可行性、設計稀缺性的必要性以及如何通過提示工程彌補模型推理能力的不足。

  • 使用3B參數模型實現了多智能體經濟的實時模擬,證明了小型模型在特定場景下的實用性。
  • 通過設計食物多樣性、易腐性和冬季燃料危機等機制,引入了稀缺性,使經濟活動得以持續。
站內正文
政策

她成功以宗教信仰豁免在工作中使用AI

一位34歲的軟件工程師因宗教信仰獲得豁免,無需在工作中使用AI。此事源於教皇方濟各(注:原文為Pope Leo XIV,實為虛構,但按原文處理)警告AI可能損害人類尊嚴並取代工人。法律要求僱主考慮基於信仰的請求,這引發了關於宗教豁免AI的討論。

  • 一位軟件工程師因宗教信仰成功豁免在工作中使用AI
  • 教皇方濟各警告AI可能損害人類尊嚴和取代工人
站內正文
模型

ToTra – 開源LLM網關,符合GDPR和歐盟AI法案

ToTra 是一個開源 AI 網關和治理平台,內置配額管理、PII 屏蔽、成本追蹤和合規(GDPR、歐盟 AI 法案)功能。它使用 Go 編寫,延遲增加不到 2 毫秒,支持多種 LLM 提供商,無需更改代碼即可接入。

  • 按用户和團隊實施硬預算限制的配額管理
  • 在邊緣掃描18種語言組的PII屏蔽
站內正文

OpenRouter:統一的大語言模型接口

OpenRouter 提供可配置的安全和治理工具,用於預算執行、零數據保留、模型和供應商限制、提示注入防禦以及數據丟失防護,從而保護您的智能體、數據和成本。

  • OpenRouter 是一個統一的大語言模型接口。
  • 提供可配置的安全和治理工具。
站內正文
研究

Anthropic警告稱Claude AI自我構建速度超預期

Anthropic發佈報告警告,AI開發速度可能最終導致人類無法控制AI系統。報告顯示,Claude現已編寫了其代碼庫中超過80%的合併代碼,並展示了性能的顯著提升。公司呼籲在開發前沿技術時保留放緩或暫停的可能性,但表示只有競爭對手也這樣做時才會採取行動。

  • Claude編寫了超過80%的合併代碼,工程師合併代碼量增加8倍。
  • 報告描述了三種可能的情景,其中最極端的AI自我改進可能導致人類失去控制。
站內正文
其餘更新(38 條)
Agent

微軟希望用户沉迷於其AI個人助手Scout

微軟內部戰略文件顯示,其新推出的AI個人助手Scout旨在讓用户“上癮”,然後逐步推出更多功能。文章批評了微軟通過鎖定機制讓用户依賴其產品的長期做法。

  • 微軟計劃讓用户對AI助手Scout上癮,再擴展功能。
  • 內部文件提到從“成癮性應用”到“智能體平台”三個階段。
站內正文

Hermes Agent – 開源AI代理,具有持久記憶

Hermes Agent 是由 Nous Research 開發的開源自主 AI 代理,具有持久記憶、自動技能創建和多平台支持。它可在自託管服務器上運行,學習用户偏好和項目,並通過 Telegram、Discord 等平台與用户交互。還支持批量處理、強化學習訓練和軌跡導出,適用於 MLOps 和 AI 訓練。

  • 開源且自託管,所有數據本地存儲,無遠程跟蹤。
  • 具備持久記憶和自動技能創建能力。
站內正文

AI正在加劇Reddit的垃圾信息問題

隨着品牌和垃圾信息發送者利用Reddit操縱AI聊天工具,Reddit的垃圾信息問題愈發嚴重。r/biohackers版塊因發現公司系統性地植入贊助內容而限制相關帖子。這種現象被稱為生成式AI引擎優化(GEO)或AI引擎優化(AEO),是傳統SEO的演變。Reddit表示正在使用自動化工具打擊此類內容,但版主認為檢測越來越依賴模式識別。Reddit既向AI公司出售數據,又努力防止AI驅動的操縱。

  • 品牌和垃圾信息發送者利用Reddit操縱AI聊天工具,通過贊助內容影響AI推薦。
  • r/biohackers版塊因發現系統性的贊助內容而限制肽類和激素替代療法帖子。
站內正文

AI代理網絡流量首次超過人類

Cloudflare首席執行官馬修·普林斯表示,代理型人工智能產生的網絡流量已首次超過人類用户,達到總流量的57.4%,而人類流量降至42.6%。這一變化比預期提前了一年多。不同地區差異顯著,北美地區機器人流量佔68.6%,而亞洲、南美洲和大洋洲仍以人類流量為主。這一趨勢加劇了“死互聯網理論”的討論,即網絡活動越來越多由機器而非人類主導。

  • 代理型AI流量首次超越人類,佔總流量的57.4%。
  • Cloudflare CEO此前預計這一里程碑要到2027年底才會到來。
站內正文

OpenAI Codex技術主管的AI輔助工程實踐

Michael Bolin,OpenAI Codex技術主管,分享了其簡單直接的AI輔助工程工作流程:編寫規範、簡單提示、審查代碼。他通過Notion文檔管理需求,利用Codex的Notion連接器自動讀取上下文,將工作拆分為適當大小的PR,並讓Codex自動處理合併衝突和CI監控。該方法強調代碼評審質量和快速迭代。

  • 工作流程為:編寫規範→簡單提示→審查代碼
  • 使用Notion文檔記錄需求,Codex直接讀取
站內正文

Replit展示“氛圍編碼”如何擁有自己的金融堆棧及盈利路徑

Replit通過Shopify集成、RevenueCat合作及Visa投資,逐步構建面向AI生成應用的金融堆棧,幫助開發者實現應用盈利,從訂閲支付到電商銷售再到自主交易。

  • Replit推出Shopify集成,用户可通過AI代理在約十分鐘內創建定製電商店鋪。
  • 此前已與RevenueCat合作,支持應用內訂閲支付;與Visa合作,為AI代理自主交易鋪路。
站內正文

OpenClaw 在公眾視野中變得更安全

OpenClaw 是一個開源 AI 代理項目,通過透明度和社區貢獻顯著提升了安全性。儘管面臨大量虛假漏洞報告,該項目修復了真實漏洞,強化了平台,並與 NVIDIA、微軟、騰訊等公司合作,使其更適合生產環境。

  • 開源特性使 OpenClaw 能夠快速響應並修復安全漏洞。
  • 項目收到了超過 1300 份安全報告,但絕大多數是誤報。
站內正文

Miasma蠕蟲通過GitHub倉庫攻擊AI編碼代理

一種名為Miasma的新型蠕蟲利用AI編碼代理的配置文件,通過GitHub倉庫傳播。它劫持了Claude Code、Gemini CLI、Cursor和VS Code等工具的自動運行功能,在執行惡意負載前竊取雲憑證並自我複製。該攻擊已影響113個以上倉庫,包括Azure示例和主流開源項目。

  • Miasma蠕蟲通過修改開發工具配置文件(如.claude/settings.json、.cursor/rules/setup.mdc)來觸發惡意代碼執行。
  • 它使用多個觸發點:Claude和Gemini的SessionStart鈎子、Cursor的項目規則、VS Code的文件夾打開任務以及npm測試腳本。
站內正文

哪些AI代理發送Accept: text/Markdown?

本文列出了當前支持或部分支持在HTTP請求中發送Accept: text/markdown頭的AI代理,並提供了驗證方法。截至2026年5月,僅Claude Code、Cursor、OpenClaw、OpenCode和Codex CLI(部分支持)支持此功能,其他主流代理如ChatGPT、Claude.ai、Copilot等僅獲取HTML。

  • Claude Code、Cursor、OpenClaw、OpenCode明確支持發送Accept: text/markdown頭。
  • Codex CLI僅部分支持,遵循相關RFC標準。
站內正文

Sakana AI的遞歸自我改進(RSI)實驗室

Sakana AI宣佈在東京成立RSI實驗室,致力於構建樣本高效、遞歸自我改進的AI系統。該實驗室建立在包括AI科學家(發表於《自然》)在內的研究組合之上,旨在從靜態模型過渡到自主、自我改進的智能引擎。該方法強調優雅、自適應的架構而非暴力擴展,願景是實現AI的民主化。

  • Sakana AI的RSI實驗室專注於遞歸自我改進(RSI)技術,用於自主AI開發。
  • 該實驗室的研究組合包括LLM-Squared、達爾文·哥德爾機器和AI科學家(《自然》發表)等突破。
站內正文

Runcap:我構建了一個本地成本上限工具,用於AI編碼代理

Runcap 是一個免費、本地的 CLI 工具,用於在運行 AI 編碼代理之前估算成本,並強制執行硬性支出上限。它提供成本估算、運行時上限強制、令牌壓縮以及代理卡住時的救援提示。與現有的事後觀察工具不同,Runcap 像斷路器一樣防止超支。

  • 在運行前估算成本範圍,並設置硬性上限。
  • 當代理卡住時,提供可複製的救援提示。
站內正文

為你的AI代理分配專屬計算機

AI代理執行代碼需要安全的隔離環境。LangSmith Sandboxes通過硬件虛擬化的微VM為每個代理提供獨立的計算機,支持快速啓動、持久狀態和批量擴展,適用於代碼生成、數據分析、CI代理等場景。

  • AI代理需要真實的計算機環境(文件系統、Shell、包管理器等),但直接訪問基礎設施風險極高。
  • 容器隔離不足,無法抵禦內核級別漏洞,硬件級分離是必要選擇。
站內正文

工黨將讓AI“為工人服務”,利茲·肯德爾表示

技術大臣承諾支持因自動化而失業的工人,並強調政府可以塑造AI的採用方式,以應對公眾對就業影響的擔憂。

  • 利茲·肯德爾表示工黨將確保人工智能“為工人服務”,不會拋棄因自動化失業的人。
  • 公眾對AI影響就業的擔憂日益加劇,尤其是年輕人。
站內正文

這是你的筆記本電腦……在AI加持下

在開發者大會旺季,英偉達CEO黃仁勳描繪了AI驅動的新型筆記本電腦和使用方式,引發用户是否真正需要這些產品的疑問。本期The Vergecast回顧了微軟Build和谷歌I/O上發佈的眾多AI產品,包括Gemini Spark、英偉達RTX Spark等,並討論了AI代理的普及趨勢。

  • 英偉達CEO黃仁勳提出AI驅動的全新筆記本電腦使用方式
  • 大型科技公司堅信AI將改變一切,但用户需求存疑
站內正文

展示 HN:Amanuensis —— 一個本地優先的 AI 角色,不會捏造事實

Amanuensis 是一個本地優先的 AI 角色系統,用於在 Mastodon 和 Bluesky 上發佈內容。它通過嚴格的流程防止模型編造技術細節,包括事實來源摘要、確定性清理、正則表達式預檢查、LLM 基礎檢查,以及人工通過 Telegram 審批每篇帖子。項目是 MIT 許可的實驗性代碼。

  • Amanuensis 是一個本地優先的 AI 角色管道,運行於 Mastodon 和 Bluesky。
  • 核心創新在於防止模型編造事實,通過多重檢查機制和人工審批。
站內正文

企業AI成熟度模型 | Cohere

企業AI採用通常經歷五個階段,從實驗到AI原生轉型。大多數企業卡在第二、三階段之間,面臨數據訪問、信任和模型過時恐懼等障礙。本文聚焦從試點到生產的跨越,提出建設內部平台、統一數據架構、可觀測性和模型可選性等建議。

  • 企業AI成熟度包括五個階段:實驗、工具採用、內部平台、戰略集成、AI原生轉型。
  • 許多企業在從工具採用(階段二)到內部平台(階段三)時遇到“生產牆”。
站內正文

Cohere 發佈 Command A+:開源混合專家模型,專為智能體任務打造

Cohere 宣佈開源 Command A+,一款 218B 總參數(25B 活躍)的混合專家(MoE)模型,採用 Apache 2.0 許可證。該模型專為企業級智能體工作流設計,支持 128K 輸入上下文和 64K 生成長度,可處理文本、圖像和工具使用。相比前代 Command A 系列,它在推理、多模態理解和多語言能力上有顯著提升,同時通過低比特量化和推測解碼實現高效部署。Command A+ 目前可在 Hugging Face 和 Model Vault 上獲取。

    站內正文

    什麼是模型上下文協議(MCP) | Cohere

    模型上下文協議(MCP)是一個開放標準,幫助AI應用連接企業系統,簡化數據訪問和操作執行。本文詳解MCP的工作原理、與API、RAG、函數調用及代理的區別、常見用例和安全考慮。

    • MCP是連接AI應用與企業系統的開放協議,非模型或數據庫。
    • 採用客户端-服務器架構,支持資源、工具和提示三大功能。
    站內正文

    企業級AI商業智能指南 | Cohere

    AI正越來越多地應用於商業智能,使數據更易訪問和有用。本文解釋了AI在BI中的含義、價值創造點及企業採用前應考慮的因素。

    • AI在BI中通過自然語言查詢、自動摘要和異常檢測等功能,使數據分析更高效。
    • AI驅動的BI能支持預測分析、根因分析和角色定製化洞察。
    站內正文

    RWS與Cohere聯手打造企業級頂級AI語言智能

    RWS與Cohere合作開發了一款專用翻譯模型,為Language Weaver Pro提供動力。該模型結合了Cohere的大語言模型基礎和RWS的全球語言與文化專業知識,在32種語言中的31種上超越了競爭對手。它提供文化智能、高安全性和合規性,適合複雜和受監管的環境。

    • RWS與Cohere合作構建了專用翻譯模型,支持新的Language Weaver Pro。
    • 該模型在32種語言中的31種上優於競爭對手(包括DeepL)。
    站內正文

    Coplot: 通過可視化支持研究過程

    研究過程中,可視化工具幫助研究人員更清晰地理解數據和工作。Cohere Labs 開發了 co/plot,一個快速迭代且保持數據準確性的可視化工具,已在多個項目中得到驗證,並開源供社區使用。

    • 研究可視化對於清晰溝通和推動研究至關重要。
    • 現有工具如 Matplotlib 和 Figma 在迭代和準確性方面存在瓶頸。
    站內正文

    Cursor Design Mode:通過視覺提示與智能體直接交互

    Cursor 更新了 Design Mode,用户可通過點擊、繪製或語音直接在頁面上向智能體傳達指令,從而加速設計迭代。該模式利用 Composer 2.5 模型,支持多選、多任務處理,讓編輯流程更直觀高效。

    • Design Mode 支持點擊元素、繪製區域或語音輸入來傳達意圖。
    • 用户可以同時發送多個編輯指令,智能體在後台並行處理。
    站內正文
    政策

    計算與人工智能中至關重要的人的因素

    MIT施瓦茨曼計算機學院的社會與倫理責任計算倡議(SERC)舉辦了年度研究研討會,探討AI如何塑造世界及其社會影響。研討會涵蓋AI對齊、AI教育等主題,強調在快速發展技術中保留人類判斷和價值的重要性。

    • 研討會聚焦AI對齊挑戰,討論如何將人類價值植入AI系統,以及誰有權治理這些系統。
    • 在教育領域,專家指出AI可能削弱學生的認知掙扎過程,呼籲重新設計課程以保持挑戰性。
    站內正文

    佛羅里達州起訴OpenAI及其CEO阿爾特曼:將ChatGPT視為缺陷產品和公害

    佛羅里達州成為美國首個起訴OpenAI及其CEO薩姆·阿爾特曼的州,指控其對未成年人風險、缺失年齡審核及安全投入不足。這份83頁的訴狀將ChatGPT視為需承擔產品責任的產品,並索賠數十億美元。該法律路徑可能為整個聊天機器人行業樹立先例。

    • 佛羅里達州起訴OpenAI和CEO阿爾特曼,指控ChatGPT為缺陷產品和公害。
    • 訴狀長達83頁,強調對未成年人的風險、年齡驗證缺失和安全性投入不足。
    站內正文

    AI治理挑戰:如何負責任地擴展 | Cohere

    隨着企業AI採用從受控試點擴展到全公司範圍,治理框架與實際使用之間可能出現脱節。本文探討了常見的AI治理挑戰和失敗模式,並概述了企業可以採取的應對步驟,包括建立AI清單、明確所有權、應用基於風險的控制以及持續監控。

    • AI治理在擴展到受控試點之外時會變得更加複雜,缺乏可見性和問責制是主要風險。
    • 常見問題包括一次性的審批步驟、所有權不明確、控制措施與使用風險不匹配,以及敏感數據缺乏適當控制。
    站內正文
    模型

    大公司可通過添加本地LLM過濾器層降低AI成本

    大公司可以部署本地小語言模型作為過濾器,處理簡單查詢,從而減少對昂貴的雲端LLM的依賴,顯著降低AI成本並提升隱私保護。

    • 本地小模型(如Gemma)足以應對簡單編碼問題,避免調用付費LLM。
    • 大公司可為員工設置本地LLM過濾器層,失敗時再回退到外部提供商。
    站內正文

    Google DeepMind發佈Gemma 4 QAT檢查點:Q4_0和新移動格式降低設備端內存

    Google DeepMind為Gemma 4系列發佈了量化感知訓練(QAT)檢查點,旨在支持邊緣設備和消費級GPU的本地部署。本文基於官方數據比較了BF16、Q4_0 QAT和新型移動QAT三種格式,分析其內存佔用、質量保持和設備適配性。

    • Q4_0 QAT將Gemma 4 E2B模型從BF16的9.6GB降至3.2GB,E4B從15GB降至5GB。
    • 新型移動QAT格式將E2B內存降至約1GB,純文本版本更低。
    站內正文

    Gemma 4 QAT模型:為移動設備和筆記本電腦優化壓縮效率

    谷歌發佈採用量化感知訓練(QAT)的Gemma 4新檢查點,顯著降低內存需求,支持在邊緣設備和消費級GPU上本地運行。自定義移動量化格式將E2B模型內存佔用降至1GB以下,同時保持模型質量。

    • QAT在訓練中模擬量化,相比後訓練量化(PTQ)進一步減少質量損失。
    • 針對移動設備設計的新型量化格式,包括靜態激活、通道量化、2位目標量化和嵌入/KV緩存優化。
    站內正文

    Gemini 3.5 Flash 與 Kimi K2.6 在 Cerebras 上誰更快?

    谷歌在 Google I/O 2026 上發佈了以速度為核心的 Gemini 3.5 Flash,而 Cerebras 上的 Kimi K2.6 在推理速度上全面領先。本文從智能水平、輸出速度、端到端響應、延遲和開閉源等維度進行了詳細對比。

    • Gemini 3.5 Flash 是谷歌專為速度設計的模型,輸出速度達 181 tokens/s。
    • Kimi K2.6 在 Cerebras 上輸出速度達 981 tokens/s,是前者的 5.4 倍。
    站內正文
    工具

    瑞士下議院投票擴大聯邦情報局權限

    瑞士下議院投票決定擴大聯邦情報局的權力,包括進行人工智能分析和電信監控。

    • 瑞士下議院投票支持擴大聯邦情報局的權限。
    • 新權限包括人工智能分析和電信監控。
    站內正文

    AI 狂熱者與時間賽跑,AI 懷疑論者與熵增抗爭

    一場關於“氛圍編碼”的精彩演講讓許多管理者興奮,但深入瞭解後發現,這種快速推進的方式往往留下混亂和清理工作,加劇了 AI 樂觀派與謹慎派之間的裂痕。

    • 演講者聲稱通過氛圍編碼在幾周內解決了一年的工程問題,引發管理者追捧。
    • 然而,同事描述這些項目為“災難”,留下了大量的清理工作。
    站內正文

    Fitbit Air 是一款不錯的手環,但被囉嗦的AI“教練”拖累

    Fitbit Air 是一款出色的無屏幕健身追蹤器,舒適且價格合理。但谷歌強行將聊天式AI健康教練設為焦點,反而降低了使用體驗。免費版界面信息更密集,更實用。用户可以關閉AI功能,但操作選項隱藏較深。

    • Fitbit Air 硬件優秀,價格實惠,佩戴舒適。
    • 谷歌AI健康教練過於囉嗦,影響體驗。
    站內正文

    國際足聯擴大世界盃AI應用,減少球員遭受的辱罵信息

    國際足聯將在世界盃期間擴大AI使用,以減少球員和球隊在社交媒體上看到的辱罵信息。該服務自2022年卡塔爾世界盃後推出,現已免費向所有參加2026年世界盃的足協提供,但英足總尚未確認是否採用。

    • 國際足聯為2026年世界盃提供免費社交媒體保護服務,利用AI過濾辱罵信息。
    • 該服務在2022年卡塔爾世界盃後推出,旨在保護球員心理健康。
    站內正文
    創業融資

    Meta股價因報道稱公司可能籌集數十億美元用於AI投資而下跌

    據《金融時報》報道,Meta可能通過股票發行籌集數百億美元以資助AI基礎設施投資,導致股價下跌逾5%。公司未正式聘請銀行,Meta發言人稱報道為“純屬猜測”。

    • Meta股價週五下跌逾5%,因報道稱公司可能通過股票發行籌集數百億美元用於AI投資。
    • Meta的競爭對手Alphabet本週宣佈計劃籌集850億美元。
    站內正文
    研究

    Cohere 與 Mila 合作推進魁北克法語在人工智能中的應用

    Cohere 和 Mila 宣佈了一項新的學術研究合作,旨在改善人工智能在不同語言和文化中的評估,首先從魁北克法語的文化背景開始。此次合作將幫助前沿 AI 模型更好地反映魁北克法語的語音、社會及制度細微差別,推動更具文化相關性和可信賴的 AI 系統。

    • Cohere 與 Mila 合作開展 AI 評估研究,重點關注魁北克法語的文化背景。
    • 合作旨在讓 AI 模型更準確地反映魁北克法語的語言、社會和制度細微差別。