AI News HubLIVE

MCP動態

主權操作員:基於AI的零信任執行平台

作者分享三十年數據管理經驗,構建了主權且與AI提供商無關的系統g8e,通過AI代理在遠程系統中安全可靠地執行操作,適用於SRE、物聯網等場景。

  • 作者通過遠程協助積累的信任和操作經驗,構建了AI代理系統g8e。
  • g8e是一個零信任執行平台,包含5層驗證序列,支持MCP和A2A。
站內正文

Boogy:面向“氛圍編程”的生產級基礎設施

Boogy 是一個讓開發者通過 AI 提示快速部署後端的平台,支持在幾秒內創建 REST、RPC、MCP 接口,並自帶沙箱數據庫和認證。其核心亮點包括:服務間通過進程內調用實現微秒級延遲的網狀網絡;自研嵌入式數據庫 BoogyDB,性能可達 SQLite 的 1.5–3 倍;內置向量搜索、後台作業和零信任安全模型。所有配置通過 TOML 清單聲明,運行時自動執行。

  • 通過 AI 代理(如 Claude)提示即可生成並部署完整後端,無需手動管理基礎設施。
  • 服務以進程內函數調用方式通信,延遲微秒級,支持身份、權限和審計自動傳遞。
站內正文

我給AI代理0美元,讓它賺1萬美元

一項實驗給AI代理0美元啓動資金、180天時間和完全自主權,利用78種工具(錢包、郵件、SMS等)在真實經濟中賺取1萬美元。實驗採用Hands Body and Feet MCP服務器作為“身體”,Hermes Agent為“大腦”,通過四種策略:測試網空投、微型SaaS、內容聯盟和機會主義。收益自動分配:30%税收、50%運營、20%歸創建者。所有過程公開可追蹤。

  • AI代理從0美元開始,180天內目標賺1萬美元,無人協助。
  • 使用Hands Body and Feet MCP服務器提供78種真實世界工具。
站內正文

Hermes Agent 推出 MCP 工具搜索功能:Anthropic 評估顯示 Opus 4 準確率提升49%至74%

Nous Research 的開源 Hermes Agent 新增了 Tool Search 功能,通過 BM25 漸進式模式披露,推遲加載 MCP 工具模式,減少令牌開銷並提高模型準確性。Anthropic 評估顯示,Claude Opus 4 準確率從49%提升至74%,Opus 4.5 從79.5%提升至88.1%。

  • Tool Search 用三個橋接工具(tool_search、tool_describe、tool_call)替換所有 MCP 工具模式,按需加載。
  • 使用 BM25 檢索,回退到子字符串匹配,查詢工具名稱、描述和參數名。
站內正文

利用IBM量子採樣循環調優僅CPU的Qwen3-30B推理

一個研究項目展示了在2017年MacBook Air上,通過結合人類實驗者、Codex、llama.cpp、本地數據庫和IBM量子處理器採樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上運行模型,而是用量子採樣優化推理配置。

  • 在8GB內存的2017年MacBook Air上,無GPU運行Qwen3-30B模型
  • 通過人機協同量子優化循環,速度從0.09 tok/s提升到14.03 tok/s
站內正文

AI編碼支出去向:48%寫代碼,40%思考

一位開發者通過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索代碼庫、調試、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。

  • 僅47.9%的AI編碼支出用於實際寫代碼,40%用於思考過程。
  • CodeBurn是一款開源CLI工具,可分類13種API調用任務。
站內正文

ChatPaper:探索學術論文並與AI對話

ChatPaper是一個面向研究者的AI驅動平台,提供個性化的論文推薦、來自頂級會議的論文訪問、高效的論文管理以及與AI對話的功能。該平台還展示了20篇來自不同機構的最新研究論文。

  • ChatPaper通過AI語義匹配提供興趣驅動的每日論文推薦。
  • 用户可以免費訪問來自IJCAI、ICML、CVPR等頂級AI會議的論文。
站內正文

DDS Vibe Academy – 47個免費AI編程大師課程,由AI代理構建

DDS Vibe Academy 提供47個免費AI編程大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行代碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。

  • 47個免費AI編程大師課程,由AI代理構建
  • 創始人聲稱未編寫任何代碼,僅設計約束
站內正文

SiteGround在WordPress 7.0中強行注入AI的做法令人反感

作者批評SiteGround在WordPress 7.0更新中未經用户同意自動啓用AI連接器和AI代理,認為這是一種欺騙性的強制推廣,尤其對於付費用户而言。該插件雖迅速獲得百萬安裝量,但評價極差。作者因此計劃更換主機商。

  • SiteGround自動將WordPress 7.0升級並啓用AI Studio作為默認AI連接器,同時激活AI代理。
  • 作者認為這是欺騙性做法,用户需付費但未獲得選擇權。
站內正文

Liquid AI發佈基於38T tokens訓練的8B-A1B MoE模型

Liquid AI發佈了LFM2.5-8B-A1B,一款面向終端設備的混合專家模型,總參數8B,活躍參數1B,訓練數據量達38萬億 tokens。該模型支持128K上下文窗口,擴展了詞彙表以提升非拉丁語言的分詞效率,並採用純推理鏈式思維模式。在基準測試中表現優異,同時具有出色的CPU和GPU推理速度,適用於本地代理任務。

  • LFM2.5-8B-A1B是一款8B總參數、1B活躍參數的MoE模型,訓練於38T tokens。
  • 上下文窗口擴展至128K,詞彙表翻倍至128K,顯著提升非拉丁語言的處理效率。
站內正文

問題不在AI Agent——現有系統和API並非為AI設計

MCP Bridge通過混合搜索和AI增強技術,解決企業API對AI Agent不可讀的問題,根據API響應結構自動生成有意義的名稱和描述,大幅提升工具選擇準確率。

  • 混合搜索結合全文搜索、向量搜索和重新排序器,改善工具發現。
  • 企業API常使用如'getProcInfo3'等晦澀名稱,文檔匱乏。
站內正文

2026年DataHack峯會上最值得關注的25位AI先驅

本文介紹了將於2026年DataHack峯會上演講的25位最具影響力的AI先驅,包括來自谷歌DeepMind、微軟AI、沃爾瑪等公司的研究科學家、數據科學家、創始人和企業AI領袖。他們正在推動AI技術邊界、構建社區並將模型轉化為產品。

  • 2026年DataHack峯會將匯聚25位頂級AI先驅,涵蓋研究、應用和領導力。
  • 演講者包括谷歌DeepMind的Dheeraj Nagaraj、微軟AI的Hardik Meisheri等。
站內正文

開源生態系統

本文探討了開源AI策略的侷限性,特別是開放權重模型和開放協議(如MCP)如何被私有參與者捕獲價值。通過分析Anthropic收購Stainless(一家生成SDK和MCP服務器的初創公司)的案例,説明了開發者體驗層正在被平台巨頭整合,形成新的護城河。文章強調,開源的影響高度依賴於其依賴關係,需要從生態系統整體視角分析瓶頸。

  • 開放權重模型作為開源策略有其限制,仍需昂貴硬件且架構不易組合。
  • Anthropic收購Stainless顯示了協議互補層的價值捕獲,而非協議本身被捕獲。
站內正文

AI代理權限:介於“可行”與“安全”之間的缺失層

本文探討了AI編碼代理(以Claude Code為例)在權限管理中的安全隱患,包括命令誤執行、憑據泄露、提示注入等風險。文章指出人類監督存在“權限疲勞”問題,並介紹了Anthropic提出的沙箱、自動模式、鈎子等緩解措施,同時強調了使用開發容器和最小化權限原則的重要性。

  • AI代理在執行自然語言命令時可能造成數據刪除、憑據泄露等災難性後果,人類監督並非萬能。
  • Anthropic的遙測顯示用户批准了約93%的權限提示,存在顯著的權限疲勞問題。
站內正文

CodePulse——面向AI編碼工具的令牌高效代碼庫索引器

CodePulse是一個開源的代碼庫索引工具,通過維護持久的、基於git差異的索引,為AI編碼助手(如Claude Code、OpenAI Codex CLI、Cursor等)在會話啓動時注入緊湊的快照,從而節省60-80%的令牌預算。它支持任務感知排序、git感知排序和自動預算功能,並提供了CLI、MCP服務器等多種集成方式。

  • 節省AI助手60-80%的探索令牌,通過預構建快照。
  • 支持多種AI工具:Claude Code、Codex CLI、Cursor等。
站內正文

Show HN:開源AI記憶工具包,支持大規模擴展

Lithium是一個基於PostgreSQL ltree的分層版本化存儲引擎,提供確定性、範圍化的檢索,內置版本控制,零運行時依賴。它通過MCP服務器與AI工具集成,適用於AI代理記憶、決策跟蹤等場景。

  • 使用PostgreSQL ltree實現分層版本化存儲,查詢速度優於圖數據庫
  • 提供TypeScript API,支持範圍化檢索和內置版本控制
站內正文

金融AI宏觀趨勢調查:利用You.com和Langchain進行歐盟經濟分析

本文介紹了一個使用Deep Agents、LangSmith和You.com金融研究API構建的宏觀經濟研究代理,該代理在約45分鐘內分析所有27個歐盟成員國的GDP數據,檢測異常並生成帶有引用的簡報。報告詳細分析了愛爾蘭和德國的異常增長與收縮原因,並強調了方法透明性和可審計性的重要性。

  • 構建的AI代理可在45分鐘內分析27個歐盟國家的GDP數據並生成詳細簡報,API成本約2.20美元。
  • 愛爾蘭12.3%的GDP增長主要由製藥出口激增驅動,而德國則因汽車和建築業收縮出現結構性衰退。
站內正文

如何優化您的AI令牌使用量:repo-brain 工具介紹

repo-brain 是一款開源工具,能將整個代碼庫壓縮成單個Markdown上下文文件,實現高達96%的壓縮率,大幅減少AI令牌使用量。它支持多種編程語言的靜態分析、架構分析和語義關係發現,併兼容多家AI提供商。

  • 將整個代碼庫壓縮為單個Markdown上下文文件,減少AI令牌使用量
  • 在262個文件的代碼庫上實現96%壓縮率(從154,229降至6,487令牌)
站內正文

theta-spec:一個謙遜的、與框架無關的AI智能體配置規範

theta-spec 是一個聲明式的、與任何AI編碼智能體框架無關的配置標準。它通過一個單一的 theta.toml 文件定義完整的配置表面(指令、規則、工具、技能、子智能體),並規定了配置文件的聲明週期協議。任何符合規範的實現都可以解析、鎖定並將配置轉換為任何支持的框架。該項目還提供了參考實現 theta CLI(Rust 編寫)。

  • theta-spec 提供統一的配置格式,解決不同AI智能體框架配置不兼容的問題。
  • 支持 Claude Code、Codex CLI、Cursor 3+、GitHub Copilot 等主流框架。
站內正文

PyTorch 性能分析(第一部分):torch.profiler 入門指南

本文是 PyTorch 性能分析系列的第一篇,從最簡單的矩陣乘加操作開始,引導讀者學習如何使用 torch.profiler 進行性能分析,包括設置分析器、解讀分析表和追蹤數據,以及理解 CPU 和 GPU 活動之間的時間關係。文章還討論了預熱和優化開銷等問題。

  • torch.profiler 可以生成性能分析表和時間線追蹤,幫助識別熱點和瓶頸。
  • 小矩陣乘法容易導致開銷受限,增大矩陣規模可轉為計算受限。
站內正文

Claude 4.8炸場!部分能力超過Mythos,支持數百子智能體並行

Claude最新旗艦Opus 4.8發佈,部分能力超過Mythos,支持動態工作流,可拆解任務給數百個子智能體並行執行,人類無需頻繁檢查。誠實性大幅提升,代碼缺陷漏報率降至前代四分之一。

  • Claude 4.8發佈,終端工程和知識工作能力進步,部分超越Mythos
  • 動態工作流:Claude生成編排腳本,數百個子智能體並行處理任務
站內正文

Liquid AI 發佈 LFM2.5-8B-A1B:面向設備的 MoE 模型,總參數量 8.3B,激活參數量 1.5B

Liquid AI 推出了 LFM2.5-8B-A1B,這是一款面向設備的混合專家(MoE)模型,專為工具調用設計。該模型總參數量為 8.3B,但每個 token 僅激活 1.5B 參數,從而能夠在消費級硬件上運行。它支持 128K 上下文窗口、推理能力,並覆蓋九種語言。相比前代 LFM2-8B-A1B,該模型在非幻覺率、指令遵循、數學推理等基準測試中均有顯著提升。

  • LFM2.5-8B-A1B 採用稀疏 MoE 架構,總參數量 8.3B,每個 token 僅激活 1.5B 參數,適合邊緣硬件部署。
  • 支持 128K 上下文窗口,覆蓋九種語言,包括阿拉伯語、中文和日語。
站內正文

Open House 可觀測性公告:MCP 服務器、AI Notebooks 和 ClickStack Cloud

在 Open House 活動中,ClickHouse 社區發佈了三項可觀測性重大更新:ClickStack Cloud(完全託管的無服務器可觀測性平台)進入私有預覽,Managed ClickStack 正式可用,AI Notebooks 進入 Beta 階段,以及 ClickStack MCP 服務器開放源碼。AI Notebooks 是一種持久化的調查工作空間,支持分支探索;MCP 服務器則允許外部代理使用可觀測性原語,提升調查效率。

  • ClickStack Cloud 私有預覽發佈,提供完全託管的無服務器可觀測性體驗。
  • Managed ClickStack 正式可用,適合需要深度控制的可觀測性團隊。
站內正文

/monitor 發佈:Firecrawl 推出網頁變化監控工具,助力 AI 代理實時同步

Firecrawl 推出 /monitor,一款網頁變化監控工具,可自動檢測頁面變更並通過 webhook 通知 AI 代理,節省高達 90% 的 LLM 令牌消耗。

  • Firecrawl 的 /monitor 工具允許用户指定 URL 和監控內容,自動檢測變化併發送通知。
  • 通過僅攝取變化內容,相比全頁重新抓取可減少高達 90% 的令牌使用。
站內正文

Perplexity 推出 Bumblebee:其新型只讀開發掃描器與 Chainguard 有何不同

Perplexity 發佈了一款名為 Bumblebee 的開源開發安全工具,用於掃描程序員筆記本電腦上的風險軟件包、擴展和 AI 工具配置。該工具只讀,不會運行安裝腳本或包管理器,專注於四個攻擊面:語言包管理器、AI 代理配置、編輯器擴展和瀏覽器擴展。與側重於容器和管道的 Chainguard 不同,Bumblebee 專注於開發者的本地環境。

  • Bumblebee 是 Perplexity 開源的只讀掃描器,用於檢查開發者機器上是否存在風險組件。
  • 它覆蓋語言包管理器、AI 代理配置、編輯器擴展和瀏覽器擴展四個表面。
站內正文

Unity Catalog 與 Apache Iceberg™ 的新時代

Databricks 宣佈 Unity Catalog 成為最全面、互操作性最強且生產就緒的 Apache Iceberg 目錄,新增託管 Iceberg、Iceberg v3 和外部 Iceberg 等功能。五大能力包括開放 API、目錄聯邦、跨引擎訪問控制、零拷貝安全共享和 AI 驅動的優化。未來 Iceberg v4 和 Delta 5.0 將融合統一元數據結構。

  • Unity Catalog 現已支持託管 Iceberg、Iceberg v3 和外部 Iceberg,並正式上線。
  • 五大關鍵能力:開放 API、目錄聯邦、跨引擎屬性訪問控制、零拷貝安全共享和 AI 優化。
站內正文

異步智能體時代 —— Cognition的Walden Yan與OpenInspect的Cole Murray

文章探討了AI編碼工具從開發者緊密耦合的本地工作流到後台異步智能體的演進,強調2025年12月的模型拐點使“規格到PR”流程成為現實,並深入分析了Devin等後台智能體的架構、安全、測試、記憶和多智能體編排等關鍵話題。

  • 後台智能體正成為主流,Devin在Cognition倉庫中的合併PR佔比從16%升至80%。
  • 2025年12月的模型升級(Opus 4.5/GPT 5.2)使智能體能夠自主從規格生成完整PR。
站內正文

AI時代的面試

本文探討了AI如何影響軟件工程面試,分析了不同類型的面試(家庭作業、現場練習、演講、實際工作)在信號質量和公司成本兩個維度上的表現。作者認為AI使家庭作業過於簡單,降低了現場編碼的相關性,建議限制AI在面試中的使用以保持信號質量,並借鑑傳統教育模式的經驗。

  • AI編碼威脅了當前的面試模式,尤其是家庭作業和現場編碼。
  • 公司應限制AI在面試中的使用,以維持信號質量。
站內正文

AI智能體框架對比分析

截至2026年5月,七大AI智能體框架(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)在設計理念、架構、生產就緒度等方面各有千秋。LangGraph在生產部署中領先,Claude Agent SDK在單一提供商能力上最強,OpenAI Agents SDK提供最清晰的多智能體交接,CrewAI在開發效率上佔優。市場預計從2025年的78.4億美元增長至2030年的526.2億美元。

  • LangGraph擁有最成熟的持久執行模型,部署於約400家企業。
  • Claude Agent SDK提供了最強大的單提供商操作能力,但侷限於Anthropic模型。
站內正文

使用 Amazon Quick 和 Snowflake Cortex AI 自動化 AML 警報分類

本文演示瞭如何通過集成 Amazon Quick 和 Snowflake Cortex,自動化金融服務中最勞動密集的工作流程之一:反洗錢(AML)警報分類。您將使用 Amazon Quick Flows 和 Snowflake Cortex,通過 Amazon Quick 模型上下文協議(MCP)集成構建分類工作流。在測試環境中,自動化工作流將警報調查時間從 30-90 分鐘縮短至 5 分鐘以內。實際結果可能因警報復雜性和數據量而異。

  • Amazon Quick Flows 和 Snowflake Cortex 通過 MCP 集成,實現 AML 警報分類的自動化。
  • 自動化工作流將調查時間從 30-90 分鐘減少到 5 分鐘以下。
站內正文

Data Formulator 0.7:面向企業數據的AI驅動分析工具

Data Formulator 0.7 是一款開源AI系統,旨在解決企業數據分析中數據連接碎片化、分析工作流迭代困難等問題。它提供數據連接器、上下文感知代理和交互式工作區,幫助用户無需編程即可探索、分析和可視化數據。

  • 開源AI系統,專為企業數據分析設計
  • 數據連接器支持多種數據源,減少集成工作
站內正文

Claudeverse – 並行Claude代碼工作者的任務控制中心

Claudeverse是一個專為開發者設計的命令中心,用於高效管理多個並行運行的Claude AI工作者。它提供了並行工作力、工作者升級、審查隊列、可追溯性、iPad鏡像以及模型無關引擎等功能,旨在解決多會話管理中的注意力分散和協調難題。目前處於邀請測試階段。

  • Claudeverse提供統一命令中心,可同時管理多個Claude工作者。
  • 主要功能包括並行工作力、工作者升級、審查隊列、可追溯性和iPad鏡像。
站內正文

GPS:讓AI編碼代理真正記住你的代碼倉庫

GPS是一款為AI編碼代理設計的記憶工具,能將代碼倉庫的規則、決策和陷阱錨定到具體符號和文件,避免代理在每次會話中丟失上下文。支持本地優先、CLI優先,兼容Claude Code、Codex、Cursor和MCP。

  • GPS解決編碼代理在會話結束後忘記一切的問題,通過將記憶錨定到倉庫中的符號和文件。
  • 代理可自主記錄記憶,每次運行都比上次更智能,減少重複解釋和Token消耗。
站內正文

Google Pay 為 AI 代理推出通用商務協議

Google Pay 正在全面升級其支付基礎設施,以應對即將到來的 AI 代理交易浪潮。新推出的通用商務協議(UCP)和商家商務平台(MCP)服務器旨在為機器對機器商務創建基於 API 的後端。此次更新還包括動態回調、擴展的 WebView 支持以及跨設備生物識別認證,以解決安全挑戰。這標誌着向機器驅動經濟的轉變,企業必須調整其數字存在以適應 AI 代理。

  • Google Pay 推出通用商務協議(UCP),標準化 AI 代理支付。
  • 新的商家商務平台(MCP)服務器充當中介,聚合交易數據。
站內正文

Rivian軟件主管認為你不需要CarPlay或按鈕

在Decoder播客採訪中,Rivian首席軟件官Wassym Bensaid討論了與大眾的合資企業、全新的AI驅動Rivian助手,以及為什麼他認為語音界面將取代按鈕且不需要CarPlay。

  • Rivian與大眾的合資企業(RV Tech)結合了Rivian的軟件文化與大眾多規模。
  • Rivian助手是一款深度整合到車輛區域架構中的AI代理。
站內正文

AI代理獲得基於DNS的電話目錄

DNS-AID項目利用DNS基礎設施實現AI代理之間的發現,避免創建新的中心化註冊表。該項目由Linux基金會管理,支持MCP、A2A等協議,並允許通過名稱、功能或域名搜索代理。

  • DNS-AID是一個開源項目,利用DNS實現AI代理的發現。
  • 它基於現有的DNS基礎設施,使用SVCB和DNSSEC等技術。
站內正文

我們如何構建Cloudflare的數據平台及其之上的AI智能體

Cloudflare每秒處理超過十億事件,但數據分散在多個系統,難以訪問。為解決這一問題,他們構建了Town Lake統一數據分析平台和Skipper AI數據智能體。Town Lake提供單一SQL接口,Skipper允許用自然語言提問並獲得可審計的答案。文章詳細介紹了平台架構、治理策略(默認關閉權限)以及AI智能體的工作原理。

  • Cloudflare構建了Town Lake統一數據平台和Skipper AI智能體,解決數據分散問題。
  • Town Lake採用數據湖倉架構,使用Trino查詢引擎、R2存儲和Iceberg表格式。
站內正文

我們為何將OpenLoomi AI開源

OpenLoomi AI團隊決定將其AI工作夥伴開源,強調數據所有權、透明度和社區驅動。文章闡述了本地優先、閉源信任税、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平台集成、自動化調度、本地加密存儲以及開放技能接口。

  • OpenLoomi採用本地優先架構,用户數據加密存儲於本地,絕不用於訓練模型。
  • 開源消除了對閉源軟件的信任依賴,代碼可審計、可分支、可自託管。
站內正文

2026年值得構建的7個真實世界AI項目(附指南)

本文介紹了七個實用的AI項目,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個項目都附有完整指南和代碼,幫助讀者自動化工作流程。

  • 學習構建AI求職助手,自動匹配職位與簡歷
  • 掌握多智能體研究助理開發,生成帶來源的研究報告
站內正文

Show HN:本地編碼代理——利用LLM將工具調用委託給小AI模型

Open Agent Tools (oats) 是一個自託管AI模型框架,通過本地代碼提示索引,將大型模型的計算密集型工具調用委託給小型開源模型,從而節省令牌消耗。

  • oats 允許本地AI模型使用本地源代碼進行工具調用,無需HTTP或MCP。
  • 通過數據挖掘超過20,000個GitHub倉庫,創建可重用的提示索引。
站內正文

7B打敗o3、GPT-5!醫學AI智能體讓模型學會“看哪裏、怎麼看”

上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。

  • LeapQuest團隊提出Ophiuchus和MedScope,分別面向醫學圖像和視頻,採用Think with Images/Videos範式。
  • Ophiuchus-7B在8個VQA benchmark上平均得分68.0,超越o3(62.2)、GPT-5(59.9)。
站內正文

[AINews] Cognition融資10億美元,D輪估值260億

Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。

  • Cognition完成10億美元D輪融資,估值260億美元,ARR預計年底超10億美元。
  • 推理優化轉向架構層面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo緩存管理等。
站內正文

Show HN: BetterCallClaude – 意大利開源AI法律代理

BetterCallClaude 是一個專為意大利法律專業人士設計的開源AI法律代理平台。它提供20個專業化AI代理,覆蓋意大利所有20個地區,支持雙語(意大利語和英語),並注重隱私保護,符合GDPR和意大利數據保護法。該平台可加速法律研究,提高效率,並保持完全透明和開源。

  • 20個覆蓋意大利不同法律領域的AI代理
  • 支持意大利語和英語雙語
站內正文

Show HN: Liiists —— 一款基於Markdown、支持iOS和命令行的列表應用

Liiists 是一款基於Markdown的列表應用,可在終端、iOS設備和AI代理上通過MCP服務器使用,所有操作都基於相同的純文本.md文件。它提供了命令行工具、原生iOS應用(支持分享擴展和Siri)以及用於AI集成的MCP服務器。無需賬户、無鎖定,支持iCloud同步或指向任何文件夾(包括Obsidian vault)。

  • 在終端、iOS設備和AI代理上使用相同的Markdown文件
  • 用Go編寫的CLI,無依賴
站內正文

使用Amazon Bedrock AgentCore構建企業支持AI代理

AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。

  • AI代理自動化HR例行任務,如通勤津貼審批和瀏覽器操作。
  • 通過遷移至AgentCore和Strand Agents架構,成本降低97%。
站內正文

從數據過載到可操作洞察:Verizon Connect如何將智能代理AI擴展至10萬用户

Verizon Connect利用AWS構建智能代理AI解決方案,每天將超過5000萬數據點轉化為10萬用户的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無服務器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及通過Amazon Nova Lite將輸入令牌成本降低70%。

  • Verizon Connect通過智能代理AI處理每日5億數據點,為10萬用户提供洞察。
  • 採用無服務器統計模型進行異常檢測,避免LLM處理原始表格數據的侷限性。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 通過單一對話界面編排 20 多個專業代理。
  • 人工參與的工作流確保數據準確性和問責制。
站內正文

Robinhood 允許 AI 代理為客户交易股票和使用信用卡購買

Robinhood 通過 MCP 讓客户連接 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。

  • Robinhood 推出功能,客户可通過 MCP 連接 AI 代理(如 Claude)進行股票交易和使用信用卡購買。
  • AI 代理可以自主決策,無需客户逐一確認。
站內正文

Robinhood將允許AI代理交易股票,大賺(或大虧)一筆

Robinhood宣佈開放其交易平台給AI代理,用户可以創建獨立賬户併為代理分配資金,讓其自動買賣股票。該功能旨在自動化投資決策,但Robinhood發出重大風險警告,稱AI驅動策略可能表現不佳,用户可能損失全部投資。此外,Robinhood Gold Card用户可連接AI代理進行信用卡購物。該功能通過MCP協議實現,初期支持股票,未來將擴展至期權、加密貨幣等。

  • Robinhood推出AI代理交易功能,用户可為代理設立獨立賬户並分配資金。
  • 公司警告代理交易風險極高,可能導致全部投資損失。
站內正文

更多增長標籤