主權操作員:基於AI的零信任執行平台
作者分享三十年數據管理經驗,構建了主權且與AI提供商無關的系統g8e,通過AI代理在遠程系統中安全可靠地執行操作,適用於SRE、物聯網等場景。
- 作者通過遠程協助積累的信任和操作經驗,構建了AI代理系統g8e。
- g8e是一個零信任執行平台,包含5層驗證序列,支持MCP和A2A。
長尾標籤
追蹤 Model Context Protocol、工具調用、連接器、Agent 上下文和企業整合。
作者分享三十年數據管理經驗,構建了主權且與AI提供商無關的系統g8e,通過AI代理在遠程系統中安全可靠地執行操作,適用於SRE、物聯網等場景。
Boogy 是一個讓開發者通過 AI 提示快速部署後端的平台,支持在幾秒內創建 REST、RPC、MCP 接口,並自帶沙箱數據庫和認證。其核心亮點包括:服務間通過進程內調用實現微秒級延遲的網狀網絡;自研嵌入式數據庫 BoogyDB,性能可達 SQLite 的 1.5–3 倍;內置向量搜索、後台作業和零信任安全模型。所有配置通過 TOML 清單聲明,運行時自動執行。
一項實驗給AI代理0美元啓動資金、180天時間和完全自主權,利用78種工具(錢包、郵件、SMS等)在真實經濟中賺取1萬美元。實驗採用Hands Body and Feet MCP服務器作為“身體”,Hermes Agent為“大腦”,通過四種策略:測試網空投、微型SaaS、內容聯盟和機會主義。收益自動分配:30%税收、50%運營、20%歸創建者。所有過程公開可追蹤。
Nous Research 的開源 Hermes Agent 新增了 Tool Search 功能,通過 BM25 漸進式模式披露,推遲加載 MCP 工具模式,減少令牌開銷並提高模型準確性。Anthropic 評估顯示,Claude Opus 4 準確率從49%提升至74%,Opus 4.5 從79.5%提升至88.1%。
一個研究項目展示了在2017年MacBook Air上,通過結合人類實驗者、Codex、llama.cpp、本地數據庫和IBM量子處理器採樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上運行模型,而是用量子採樣優化推理配置。
一位開發者通過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索代碼庫、調試、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。
ChatPaper是一個面向研究者的AI驅動平台,提供個性化的論文推薦、來自頂級會議的論文訪問、高效的論文管理以及與AI對話的功能。該平台還展示了20篇來自不同機構的最新研究論文。
DDS Vibe Academy 提供47個免費AI編程大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行代碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。
作者批評SiteGround在WordPress 7.0更新中未經用户同意自動啓用AI連接器和AI代理,認為這是一種欺騙性的強制推廣,尤其對於付費用户而言。該插件雖迅速獲得百萬安裝量,但評價極差。作者因此計劃更換主機商。
Liquid AI發佈了LFM2.5-8B-A1B,一款面向終端設備的混合專家模型,總參數8B,活躍參數1B,訓練數據量達38萬億 tokens。該模型支持128K上下文窗口,擴展了詞彙表以提升非拉丁語言的分詞效率,並採用純推理鏈式思維模式。在基準測試中表現優異,同時具有出色的CPU和GPU推理速度,適用於本地代理任務。
MCP Bridge通過混合搜索和AI增強技術,解決企業API對AI Agent不可讀的問題,根據API響應結構自動生成有意義的名稱和描述,大幅提升工具選擇準確率。
本文介紹了將於2026年DataHack峯會上演講的25位最具影響力的AI先驅,包括來自谷歌DeepMind、微軟AI、沃爾瑪等公司的研究科學家、數據科學家、創始人和企業AI領袖。他們正在推動AI技術邊界、構建社區並將模型轉化為產品。
本文探討了開源AI策略的侷限性,特別是開放權重模型和開放協議(如MCP)如何被私有參與者捕獲價值。通過分析Anthropic收購Stainless(一家生成SDK和MCP服務器的初創公司)的案例,説明了開發者體驗層正在被平台巨頭整合,形成新的護城河。文章強調,開源的影響高度依賴於其依賴關係,需要從生態系統整體視角分析瓶頸。
本文探討了AI編碼代理(以Claude Code為例)在權限管理中的安全隱患,包括命令誤執行、憑據泄露、提示注入等風險。文章指出人類監督存在“權限疲勞”問題,並介紹了Anthropic提出的沙箱、自動模式、鈎子等緩解措施,同時強調了使用開發容器和最小化權限原則的重要性。
CodePulse是一個開源的代碼庫索引工具,通過維護持久的、基於git差異的索引,為AI編碼助手(如Claude Code、OpenAI Codex CLI、Cursor等)在會話啓動時注入緊湊的快照,從而節省60-80%的令牌預算。它支持任務感知排序、git感知排序和自動預算功能,並提供了CLI、MCP服務器等多種集成方式。
Lithium是一個基於PostgreSQL ltree的分層版本化存儲引擎,提供確定性、範圍化的檢索,內置版本控制,零運行時依賴。它通過MCP服務器與AI工具集成,適用於AI代理記憶、決策跟蹤等場景。
本文介紹了一個使用Deep Agents、LangSmith和You.com金融研究API構建的宏觀經濟研究代理,該代理在約45分鐘內分析所有27個歐盟成員國的GDP數據,檢測異常並生成帶有引用的簡報。報告詳細分析了愛爾蘭和德國的異常增長與收縮原因,並強調了方法透明性和可審計性的重要性。
repo-brain 是一款開源工具,能將整個代碼庫壓縮成單個Markdown上下文文件,實現高達96%的壓縮率,大幅減少AI令牌使用量。它支持多種編程語言的靜態分析、架構分析和語義關係發現,併兼容多家AI提供商。
theta-spec 是一個聲明式的、與任何AI編碼智能體框架無關的配置標準。它通過一個單一的 theta.toml 文件定義完整的配置表面(指令、規則、工具、技能、子智能體),並規定了配置文件的聲明週期協議。任何符合規範的實現都可以解析、鎖定並將配置轉換為任何支持的框架。該項目還提供了參考實現 theta CLI(Rust 編寫)。
本文是 PyTorch 性能分析系列的第一篇,從最簡單的矩陣乘加操作開始,引導讀者學習如何使用 torch.profiler 進行性能分析,包括設置分析器、解讀分析表和追蹤數據,以及理解 CPU 和 GPU 活動之間的時間關係。文章還討論了預熱和優化開銷等問題。
Claude最新旗艦Opus 4.8發佈,部分能力超過Mythos,支持動態工作流,可拆解任務給數百個子智能體並行執行,人類無需頻繁檢查。誠實性大幅提升,代碼缺陷漏報率降至前代四分之一。
Liquid AI 推出了 LFM2.5-8B-A1B,這是一款面向設備的混合專家(MoE)模型,專為工具調用設計。該模型總參數量為 8.3B,但每個 token 僅激活 1.5B 參數,從而能夠在消費級硬件上運行。它支持 128K 上下文窗口、推理能力,並覆蓋九種語言。相比前代 LFM2-8B-A1B,該模型在非幻覺率、指令遵循、數學推理等基準測試中均有顯著提升。
在 Open House 活動中,ClickHouse 社區發佈了三項可觀測性重大更新:ClickStack Cloud(完全託管的無服務器可觀測性平台)進入私有預覽,Managed ClickStack 正式可用,AI Notebooks 進入 Beta 階段,以及 ClickStack MCP 服務器開放源碼。AI Notebooks 是一種持久化的調查工作空間,支持分支探索;MCP 服務器則允許外部代理使用可觀測性原語,提升調查效率。
Firecrawl 推出 /monitor,一款網頁變化監控工具,可自動檢測頁面變更並通過 webhook 通知 AI 代理,節省高達 90% 的 LLM 令牌消耗。
Perplexity 發佈了一款名為 Bumblebee 的開源開發安全工具,用於掃描程序員筆記本電腦上的風險軟件包、擴展和 AI 工具配置。該工具只讀,不會運行安裝腳本或包管理器,專注於四個攻擊面:語言包管理器、AI 代理配置、編輯器擴展和瀏覽器擴展。與側重於容器和管道的 Chainguard 不同,Bumblebee 專注於開發者的本地環境。
Databricks 宣佈 Unity Catalog 成為最全面、互操作性最強且生產就緒的 Apache Iceberg 目錄,新增託管 Iceberg、Iceberg v3 和外部 Iceberg 等功能。五大能力包括開放 API、目錄聯邦、跨引擎訪問控制、零拷貝安全共享和 AI 驅動的優化。未來 Iceberg v4 和 Delta 5.0 將融合統一元數據結構。
文章探討了AI編碼工具從開發者緊密耦合的本地工作流到後台異步智能體的演進,強調2025年12月的模型拐點使“規格到PR”流程成為現實,並深入分析了Devin等後台智能體的架構、安全、測試、記憶和多智能體編排等關鍵話題。
本文探討了AI如何影響軟件工程面試,分析了不同類型的面試(家庭作業、現場練習、演講、實際工作)在信號質量和公司成本兩個維度上的表現。作者認為AI使家庭作業過於簡單,降低了現場編碼的相關性,建議限制AI在面試中的使用以保持信號質量,並借鑑傳統教育模式的經驗。
截至2026年5月,七大AI智能體框架(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)在設計理念、架構、生產就緒度等方面各有千秋。LangGraph在生產部署中領先,Claude Agent SDK在單一提供商能力上最強,OpenAI Agents SDK提供最清晰的多智能體交接,CrewAI在開發效率上佔優。市場預計從2025年的78.4億美元增長至2030年的526.2億美元。
本文演示瞭如何通過集成 Amazon Quick 和 Snowflake Cortex,自動化金融服務中最勞動密集的工作流程之一:反洗錢(AML)警報分類。您將使用 Amazon Quick Flows 和 Snowflake Cortex,通過 Amazon Quick 模型上下文協議(MCP)集成構建分類工作流。在測試環境中,自動化工作流將警報調查時間從 30-90 分鐘縮短至 5 分鐘以內。實際結果可能因警報復雜性和數據量而異。
Data Formulator 0.7 是一款開源AI系統,旨在解決企業數據分析中數據連接碎片化、分析工作流迭代困難等問題。它提供數據連接器、上下文感知代理和交互式工作區,幫助用户無需編程即可探索、分析和可視化數據。
Claudeverse是一個專為開發者設計的命令中心,用於高效管理多個並行運行的Claude AI工作者。它提供了並行工作力、工作者升級、審查隊列、可追溯性、iPad鏡像以及模型無關引擎等功能,旨在解決多會話管理中的注意力分散和協調難題。目前處於邀請測試階段。
GPS是一款為AI編碼代理設計的記憶工具,能將代碼倉庫的規則、決策和陷阱錨定到具體符號和文件,避免代理在每次會話中丟失上下文。支持本地優先、CLI優先,兼容Claude Code、Codex、Cursor和MCP。
Google Pay 正在全面升級其支付基礎設施,以應對即將到來的 AI 代理交易浪潮。新推出的通用商務協議(UCP)和商家商務平台(MCP)服務器旨在為機器對機器商務創建基於 API 的後端。此次更新還包括動態回調、擴展的 WebView 支持以及跨設備生物識別認證,以解決安全挑戰。這標誌着向機器驅動經濟的轉變,企業必須調整其數字存在以適應 AI 代理。
使用 Openstatus 監控您的 MCP 服務器。
在Decoder播客採訪中,Rivian首席軟件官Wassym Bensaid討論了與大眾的合資企業、全新的AI驅動Rivian助手,以及為什麼他認為語音界面將取代按鈕且不需要CarPlay。
DNS-AID項目利用DNS基礎設施實現AI代理之間的發現,避免創建新的中心化註冊表。該項目由Linux基金會管理,支持MCP、A2A等協議,並允許通過名稱、功能或域名搜索代理。
Cloudflare每秒處理超過十億事件,但數據分散在多個系統,難以訪問。為解決這一問題,他們構建了Town Lake統一數據分析平台和Skipper AI數據智能體。Town Lake提供單一SQL接口,Skipper允許用自然語言提問並獲得可審計的答案。文章詳細介紹了平台架構、治理策略(默認關閉權限)以及AI智能體的工作原理。
OpenLoomi AI團隊決定將其AI工作夥伴開源,強調數據所有權、透明度和社區驅動。文章闡述了本地優先、閉源信任税、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平台集成、自動化調度、本地加密存儲以及開放技能接口。
本文介紹了七個實用的AI項目,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個項目都附有完整指南和代碼,幫助讀者自動化工作流程。
Open Agent Tools (oats) 是一個自託管AI模型框架,通過本地代碼提示索引,將大型模型的計算密集型工具調用委託給小型開源模型,從而節省令牌消耗。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
BetterCallClaude 是一個專為意大利法律專業人士設計的開源AI法律代理平台。它提供20個專業化AI代理,覆蓋意大利所有20個地區,支持雙語(意大利語和英語),並注重隱私保護,符合GDPR和意大利數據保護法。該平台可加速法律研究,提高效率,並保持完全透明和開源。
Liiists 是一款基於Markdown的列表應用,可在終端、iOS設備和AI代理上通過MCP服務器使用,所有操作都基於相同的純文本.md文件。它提供了命令行工具、原生iOS應用(支持分享擴展和Siri)以及用於AI集成的MCP服務器。無需賬户、無鎖定,支持iCloud同步或指向任何文件夾(包括Obsidian vault)。
AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。
Verizon Connect利用AWS構建智能代理AI解決方案,每天將超過5000萬數據點轉化為10萬用户的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無服務器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及通過Amazon Nova Lite將輸入令牌成本降低70%。
AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。
Robinhood 通過 MCP 讓客户連接 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。
Robinhood宣佈開放其交易平台給AI代理,用户可以創建獨立賬户併為代理分配資金,讓其自動買賣股票。該功能旨在自動化投資決策,但Robinhood發出重大風險警告,稱AI驅動策略可能表現不佳,用户可能損失全部投資。此外,Robinhood Gold Card用户可連接AI代理進行信用卡購物。該功能通過MCP協議實現,初期支持股票,未來將擴展至期權、加密貨幣等。
追蹤 AI 編程助理、程式碼生成、IDE 插件、開發者工作流程和軟件工程自動化。
追蹤開源權重模型、開放授權、社群評測、模型蒸餾和本地部署。
追蹤推理價格、延遲、吞吐、快取、量化、服務商成本和部署效率。
追蹤 Agent 框架、編排、記憶、評測、工作流程自動化和生產部署。
追蹤中國 AI 公司、模型、政策、芯片生態、開源社群和商業化進展。
追蹤 GPU、數據中心、集群網絡、AI 雲、訓練基礎設施和供應鏈。
追蹤模型 API 價格、方案、上下文窗口、免費額度、單位 token 成本和商業模式。
追蹤 DeepSeek 模型、API、開源權重、推理效率、生態合作和全球影響。
追蹤 Qwen/通義千問模型、開源權重、多模態、Agent 能力、API 和企業落地。