我們構建了一個執行我們AI資料平臺的智慧體
Encord宣佈推出Merlin——一個代理智慧層,透過MCP整合到Claude、Codex等平臺,讓使用者透過對話管理AI資料基礎設施,涵蓋構建、觀察和最佳化整個資料生命週期。
- Merlin是Encord的代理智慧層,旨在透過對話簡化AI資料管理。
- 它透過MCP協議整合到Claude、Codex等代理編碼平臺,未來將支援Slack等。
日報
2026-06-17 精選 10 條,按主題聚合。其餘新聞折疊歸檔。
Encord宣佈推出Merlin——一個代理智慧層,透過MCP整合到Claude、Codex等平臺,讓使用者透過對話管理AI資料基礎設施,涵蓋構建、觀察和最佳化整個資料生命週期。
此次收購將幫助SpaceX擴大開發者服務,並獲取Cursor的開發者工作流程和使用者分析資料。
透過日常使用AI,作者發現真正的瓶頸不是編碼本身,而是上下文切換導致的精神消耗。AI讓思考更持久,能量從語法和除錯轉向架構和系統思維,但保持判斷力和品味仍是關鍵。
Ctx 是一個為 Claude Code 和自定義 LLM 設計的上下文管理工具,它透過分析當前任務,從包含 102,928 個節點的知識圖譜中推薦最相關的小型技能、代理和 MCP 伺服器集合,從而節省令牌並提高質量。
Factory AI 透過 LangSmith 的可觀測性和反饋 API 最佳化產品反饋迴圈,實現了迭代速度翻倍,並顯著縮短了開發週期。
Open SWE 是一款開源、雲端託管的編碼代理,能夠自主處理 GitHub 任務,包括規劃、編碼、測試和提交拉取請求。它採用多代理架構,包含規劃器、程式設計師和審查器,並支援人類參與迴圈和非同步執行。
Monte Carlo 利用 LangGraph 構建 AI 故障排除代理,並使用 LangSmith 進行除錯,幫助資料團隊更快地解決問題。該代理能夠並行探索多個調查路徑,顯著縮短根因分析時間。
本文探討圍繞人工智慧意識的爭論,區分了兩種觀點:一種是認為AI可能具有意識的“妄想者”,另一種是持哲學懷疑態度的“哲學家”。
今年的亞馬遜Prime Day將於6月23日至26日提前舉行,多款2025年旗艦耳機參與折扣。本文精選了8款經過實測的耳機推薦,涵蓋Bowers & Wilkins、索尼、Bose等品牌,並提供購買建議。
本影片探討了人工智慧對開放網際網路的潛在影響,包括內容生成、資訊驗證和平臺監管等關鍵問題。
LangSmith 推出公開基準測試和評估資料集共享功能,幫助開發者比較不同 LLM 架構在相同任務上的表現。首發資料集為 LangChain 文件問答資料集,併發布了 langchain-benchmarks 包以支援實驗。文章分析了多種模型和架構的效能,並提供了除錯方法。
智慧體工程是一門結合產品思維、工程和資料科學的新學科,旨在透過迭代構建、測試、釋出、觀察和最佳化的迴圈,將非確定性的LLM系統轉變為可靠的工業生產體驗。文章介紹了該學科的核心概念、所需技能、實踐場景以及為什麼現在需要它。
本文介紹瞭如何使用LangSmith評估和比較微調後的開源LLM。作者透過微調Llama2-7b和13b模型來生成SQL,並在LangSmith上建立資料集、執行測試、用GPT-4自動評估。結果顯示,13b模型在使用較少資料時仍接近GPT-3.5水平,證明了開源模型的競爭力。
Android 17與6月Pixel Drop同步推出,為Pixel裝置率先帶來應用氣泡、增強安全、AI新模型等多項更新。
法國總理塞巴斯蒂安·勒科爾努表示,法國國內情報部門將放棄美國科技巨頭Palantir的AI資料工具,轉而採用本土供應商,以避免“戰略依賴”。
Qwen團隊釋出了三種具身AI模型,統稱為Qwen-RobotSuite。包括操作模型RobotManip(基於Qwen3.5-4B)、影片世界模型RobotWorld(60層MMDiT)和導航模型RobotNav(基於Qwen3-VL,提供2B/4B/8B版本)。本文詳細介紹了每個模型的架構、資料管道和基準測試結果。
LangSmith 產品主頁重新劃分為三大板塊:可觀測性、評估和提示工程。同時,資源標籤功能得到增強,支援按應用或自定義標籤靈活分組資源,未來還將引入基於屬性的訪問控制(ABAC)。
AI智慧體在反映團隊積累的知識和判斷時效果最佳。本文探討如何將人類判斷融入智慧體開發的生命週期,以交易員助手為例,講解工作流設計、工具設計和上下文工程,並介紹透過自動化評估和監測來最佳化智慧體的改進迴圈。
Deep Agents SDK透過解除安裝、摘要和檔案系統抽象來管理長時間執行AI任務的上下文,防止上下文腐敗。本文介紹了三種壓縮技術:解除安裝大型工具結果、解除安裝大型工具輸入和摘要,並提供了實踐指導和評估方法。
Databricks 在 Data + AI Summit 2026 上宣佈了 App Spaces、Genie App Builder 和 Serverless Micro Apps 三項新功能,旨在將快速、易用的 vibe coding 引入企業環境,同時不犧牲治理、資料安全和成本控制。
Ito 是一個自動化的 QA 平臺,它在拉取請求中執行程式碼,檢測行為迴歸,無需手動編寫測試指令碼。它整合 GitHub,支援各種技術棧,並直接在 PR 中提供包含影片和截圖的質量報告。
Databricks推出OpenSharing,這是Delta Sharing的下一次進化,也是業界首個為代理時代構建的開放協議。它將開放資料共享擴充套件到完整的AI堆疊,支援模型和代理,併成為Linux基金會下的獨立開源專案。OpenSharing支援跨任何雲、供應商和格式的無縫共享,解決了跨組織資料共享的難題,並引入了Genie Agent Sharing、SecureConnect和Global Distribution等新功能。
本文探討了在代理式軟體開發中,如何系統性地跟蹤AI代理的決策歷史、配置和生成程式碼的譜系。作者提出建立“代理倉庫”以實現可觀測性和規模化,並討論了Git在儲存代理資料方面的侷限性。
Databricks 宣佈 Databricks Marketplace 上的應用程式公開預覽,允許客戶發現、安裝和執行第三方資料及 AI 應用程式,這些應用程式在客戶的安全環境中原生執行,資料無需離開其環境。
蘋果已批准Tiny Corp的TinyGPU驅動程式,允許Nvidia和AMD外接GPU在Apple Silicon Mac上用於計算工作負載。本指南涵蓋了硬體推薦、設定步驟以及執行基於CUDA的本地AI的效能基準測試。
開放共享 SecureConnect 是 Databricks 管理的代理,旨在簡化跨組織資料共享的網路配置。提供者只需一次性設定,無需為每個接收者配置網路。可選私有鏈路連線增強安全性,資料保留在提供者儲存中。現已公開發布預覽版。
本文探討了構建可靠AI代理的核心在於精心設計的迴圈架構,而不僅僅是模型本身。作者介紹了四種巢狀迴圈:代理迴圈、驗證迴圈、事件驅動迴圈和爬山迴圈,並展示瞭如何使用LangChain原語實現每層迴圈。文章強調,透過將代理嵌入生態系統並持續改進,可以構建難以複製的競爭優勢。
前向部署銷售(FDS)是一種面向AI時代的企業銷售方法論,已打包為Claude技能並開源。它基於20年的銷售實踐提煉而成,旨在透過AI輔助將銷售週期壓縮3-10倍。
寶可夢卡牌AI對戰挑戰賽是一項讓AI在寶可夢集換式卡牌遊戲中一決高下的競賽。比賽分為模擬賽和策略賽兩個階段,總獎金池豐厚,決賽將於2026年末舉行。
企業正將智慧體AI從概念驗證轉向生產,下一代AI工廠為此設計。在HPE Discover大會上,NVIDIA和HPE宣佈擴充套件HPE AI Factory,包括NVIDIA Vera CPU和NVIDIA Agent Toolkit。Vera CPU專為智慧體設計,提供確定性低延遲效能。NVIDIA機密計算現覆蓋整個HPE AI Factory產品組合。此外,全棧NVIDIA整合增強,涵蓋網路、DPU和GPU。
本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE,展示如何從 SageMaker JumpStart 目錄中選擇相容模型、配置並行草稿規格,並部署高度最佳化的即時 SageMaker AI 端點以加速生成式 AI 應用。
據彭博社記者馬克·古爾曼報道,蘋果計劃於2027年底推出帶攝像頭的AirPods,以增強Siri的視覺上下文能力,同時還有第二款摺疊iPhone和20週年紀念版iPhone等產品正在研發中。
高通釋出Snapdragon Reality Elite晶片,專為下一波XR裝置設計,效能大幅提升,包括GPU提升60%、CPU提升30%、NPU提升高達160%,並改善散熱和電池續航。該晶片已用於即將推出的Aura眼鏡,預示著更強大、更輕便的AI智慧眼鏡即將到來。
本文分析了資本主義中不同的剝削策略如何導致權力集中,威脅民主政體。透過供應鏈資本主義、平臺重商主義和AI政變三個案例,作者提出了“依賴性的政治經濟學”框架,探討科技巨頭與政治權力的融合,以及AI在這一過程中的關鍵角色。