AI 日報 2026-06-17

今日必讀

Agent

我們構建了一個執行我們AI資料平臺的智慧體

2026-06-16

Encord宣佈推出Merlin——一個代理智慧層，透過MCP整合到Claude、Codex等平臺，讓使用者透過對話管理AI資料基礎設施，涵蓋構建、觀察和最佳化整個資料生命週期。

Merlin是Encord的代理智慧層，旨在透過對話簡化AI資料管理。
它透過MCP協議整合到Claude、Codex等代理編碼平臺，未來將支援Slack等。

SpaceX以600億美元收購Cursor，瞄準智慧編碼領域

2026-06-16

此次收購將幫助SpaceX擴大開發者服務，並獲取Cursor的開發者工作流程和使用者分析資料。

SpaceX以600億美元收購AI編碼工具Cursor
收購旨在擴充套件SpaceX的開發者生態

AI的無聲飛躍：從程式碼到認知

2026-06-16

透過日常使用AI，作者發現真正的瓶頸不是編碼本身，而是上下文切換導致的精神消耗。AI讓思考更持久，能量從語法和除錯轉向架構和系統思維，但保持判斷力和品味仍是關鍵。

AI減少了上下文切換帶來的精神疲勞，使開發者能更長時間保持專注。
AI充當外部工作記憶，允許同時處理不同層次的問題。

Show HN：Ctx——僅載入相關工具，節省令牌

2026-06-16

Ctx 是一個為 Claude Code 和自定義 LLM 設計的上下文管理工具，它透過分析當前任務，從包含 102,928 個節點的知識圖譜中推薦最相關的小型技能、代理和 MCP 伺服器集合，從而節省令牌並提高質量。

Ctx 透過分析使用者當前構建的內容，從大型圖譜中推薦最相關的工具，避免浪費上下文空間。
支援 Claude Code 以及自定義本地/API 模型，提供獨立的配置流程。

Factory 如何利用 LangSmith 自動化反饋迴圈，將迭代速度提升 2 倍

2026-06-16

Factory AI 透過 LangSmith 的可觀測性和反饋 API 最佳化產品反饋迴圈，實現了迭代速度翻倍，並顯著縮短了開發週期。

Factory 將 LangSmith 與 AWS CloudWatch 整合，提升了可觀測性和除錯效率。
利用 LangSmith 的反饋 API，Factory 自動化了提示最佳化過程，減少了人工操作。

推出 Open SWE：一款開源非同步編碼代理

2026-06-16

Open SWE 是一款開源、雲端託管的編碼代理，能夠自主處理 GitHub 任務，包括規劃、編碼、測試和提交拉取請求。它採用多代理架構，包含規劃器、程式設計師和審查器，並支援人類參與迴圈和非同步執行。

Open SWE 是一款開源的非同步雲端編碼代理，可直接與 GitHub 整合。
它使用多代理架構（規劃器、程式設計師、審查器）來確保程式碼質量。

Monte Carlo：使用 LangGraph 和 LangSmith 構建資料 + AI 可觀測性代理

2026-06-16

Monte Carlo 利用 LangGraph 構建 AI 故障排除代理，並使用 LangSmith 進行除錯，幫助資料團隊更快地解決問題。該代理能夠並行探索多個調查路徑，顯著縮短根因分析時間。

Monte Carlo 採用 LangGraph 建立動態圖結構，實現故障排除流程的自動化與並行化。
LangSmith 從開發初期就用於視覺化和迭代提示工程，加速了代理的最佳化。

工具

人工智慧意識：妄想者與哲學家的長椅

2026-06-16

本文探討圍繞人工智慧意識的爭論，區分了兩種觀點：一種是認為AI可能具有意識的“妄想者”，另一種是持哲學懷疑態度的“哲學家”。

“妄想者”認為AI可能發展出意識，但缺乏科學依據
哲學家對AI意識持批判態度，強調定義和證據的重要性

研究

耳機愛好者必看：Prime Day 最佳耳機早期優惠TOP8

2026-06-16

今年的亞馬遜Prime Day將於6月23日至26日提前舉行，多款2025年旗艦耳機參與折扣。本文精選了8款經過實測的耳機推薦，涵蓋Bowers & Wilkins、索尼、Bose等品牌，並提供購買建議。

Prime Day 於6月23日至26日舉行，比往年提前一個月。
Bowers & Wilkins Px7 S3 和索尼 WH-1000XM6 等新款耳機首次打折。

政策

人工智慧會終結開放網際網路嗎？[穿越AI – 第6集] [影片]

2026-06-16

本影片探討了人工智慧對開放網際網路的潛在影響，包括內容生成、資訊驗證和平臺監管等關鍵問題。

AI可能加劇虛假資訊傳播
開放網際網路面臨演算法壟斷風險

其餘更新（24 條）

模型

分享 LangSmith 基準測試

2026-06-16

LangSmith 推出公開基準測試和評估資料集共享功能，幫助開發者比較不同 LLM 架構在相同任務上的表現。首發資料集為 LangChain 文件問答資料集，併發布了 langchain-benchmarks 包以支援實驗。文章分析了多種模型和架構的效能，並提供了除錯方法。

LangSmith 現在支援共享評估資料集和結果，便於社群驅動的基準測試。
首發基準測試是 LangChain 文件問答資料集，測試 RAG 系統的綜合回答能力。

智慧體工程：一門新興學科

2026-06-16

智慧體工程是一門結合產品思維、工程和資料科學的新學科，旨在透過迭代構建、測試、釋出、觀察和最佳化的迴圈，將非確定性的LLM系統轉變為可靠的工業生產體驗。文章介紹了該學科的核心概念、所需技能、實踐場景以及為什麼現在需要它。

智慧體工程是迭代過程：構建、測試、釋出、觀察、最佳化、重複。
結合產品思維（定義範圍與行為）、工程（構建基礎設施）、資料科學（測量與改進）。

在LangSmith中測試微調的開源模型

2026-06-16

本文介紹瞭如何使用LangSmith評估和比較微調後的開源LLM。作者透過微調Llama2-7b和13b模型來生成SQL，並在LangSmith上建立資料集、執行測試、用GPT-4自動評估。結果顯示，13b模型在使用較少資料時仍接近GPT-3.5水平，證明了開源模型的競爭力。

LangSmith提供UI和API來建立評估資料集，方便測試多個模型。
微調了Llama2-7b（78k行）和Llama2-13b（10k行）用於SQL生成。

Android 17正式釋出，同時推出6月Pixel Drop——新功能一覽

2026-06-16

Android 17與6月Pixel Drop同步推出，為Pixel裝置率先帶來應用氣泡、增強安全、AI新模型等多項更新。

Android 17正式推送，首批支援Pixel 6及更新機型
新增應用氣泡、螢幕反應、遊戲模式等實用功能

法國將放棄Palantir的AI資料工具，轉向本土供應商

2026-06-16

法國總理塞巴斯蒂安·勒科爾努表示，法國國內情報部門將放棄美國科技巨頭Palantir的AI資料工具，轉而採用本土供應商，以避免“戰略依賴”。

法國國內情報部門將用ChapsVision取代Palantir的AI工具。
勒科爾努總理強調避免對外國勢力的戰略依賴。

認識Qwen-RobotSuite：三種用於VLA操作、影片世界建模和導航的具身AI模型

2026-06-16

Qwen團隊釋出了三種具身AI模型，統稱為Qwen-RobotSuite。包括操作模型RobotManip（基於Qwen3.5-4B）、影片世界模型RobotWorld（60層MMDiT）和導航模型RobotNav（基於Qwen3-VL，提供2B/4B/8B版本）。本文詳細介紹了每個模型的架構、資料管道和基準測試結果。

Qwen-RobotSuite包含三個獨立的基礎模型：RobotManip、RobotWorld和RobotNav。
RobotManip透過統一對齊框架解決了運算元據的異構性問題，在多個OOD基準上取得了SOTA。

Agent

LangSmith：改版產品主頁與資源標籤，實現更好的組織管理

2026-06-16

LangSmith 產品主頁重新劃分為三大板塊：可觀測性、評估和提示工程。同時，資源標籤功能得到增強，支援按應用或自定義標籤靈活分組資源，未來還將引入基於屬性的訪問控制（ABAC）。

主頁分為可觀測性、評估和提示工程三個部分，每個部分包含相關功能。
資源標籤現在支援按“應用”或其他自定義標籤進行靈活過濾和組織。

智慧體改進迴圈中的人類判斷

2026-06-16

AI智慧體在反映團隊積累的知識和判斷時效果最佳。本文探討如何將人類判斷融入智慧體開發的生命週期，以交易員助手為例，講解工作流設計、工具設計和上下文工程，並介紹透過自動化評估和監測來最佳化智慧體的改進迴圈。

智慧體需要吸收領域專家的隱性知識
透過工作流設計、工具設計和上下文工程融入人類判斷

深度代理的上下文管理

2026-06-16

Deep Agents SDK透過解除安裝、摘要和檔案系統抽象來管理長時間執行AI任務的上下文，防止上下文腐敗。本文介紹了三種壓縮技術：解除安裝大型工具結果、解除安裝大型工具輸入和摘要，並提供了實踐指導和評估方法。

Deep Agents SDK採用上下文壓縮技術管理AI代理的有限記憶，包括解除安裝和摘要。
三種壓縮技術在上下文視窗不同閾值觸發：解除安裝大型結果（>20K令牌）、解除安裝大型輸入（>85%）、摘要（>85%且無可解除安裝內容）。

在 Databricks 上為企業應用實現受治理的 Vibe Coding

2026-06-16

Databricks 在 Data + AI Summit 2026 上宣佈了 App Spaces、Genie App Builder 和 Serverless Micro Apps 三項新功能，旨在將快速、易用的 vibe coding 引入企業環境，同時不犧牲治理、資料安全和成本控制。

App Spaces 提供應用組級別的治理邊界，自動繼承安全策略，實現治理前置。
Genie App Builder 利用 Databricks 的資料上下文和 Unity Catalog 語義層，透過自然語言或截圖輔助構建應用。

Show HN：Ito – 自動執行程式碼的程式碼審查工具

2026-06-16

Ito 是一個自動化的 QA 平臺，它在拉取請求中執行程式碼，檢測行為迴歸，無需手動編寫測試指令碼。它整合 GitHub，支援各種技術棧，並直接在 PR 中提供包含影片和截圖的質量報告。

Ito 提供無需指令碼的、基於執行的 QA 測試，能夠捕捉行為迴歸。
支援多種技術棧，僅需 5 分鐘設定。

隆重推出OpenSharing：代理時代Delta Sharing的下一次進化

2026-06-16

Databricks推出OpenSharing，這是Delta Sharing的下一次進化，也是業界首個為代理時代構建的開放協議。它將開放資料共享擴充套件到完整的AI堆疊，支援模型和代理，併成為Linux基金會下的獨立開源專案。OpenSharing支援跨任何雲、供應商和格式的無縫共享，解決了跨組織資料共享的難題，並引入了Genie Agent Sharing、SecureConnect和Global Distribution等新功能。

OpenSharing是Delta Sharing的進化版，擴充套件了共享範圍到完整的AI堆疊，包括模型和代理。
作為Linux基金會下的獨立開源專案，OpenSharing支援Delta Lake、Apache Iceberg和Parquet等格式，實現跨平臺零複製資料共享。

跟蹤AI代理在程式碼開發中的譜系和狀態的邏輯方法

2026-06-16

本文探討了在代理式軟體開發中，如何系統性地跟蹤AI代理的決策歷史、配置和生成程式碼的譜系。作者提出建立“代理倉庫”以實現可觀測性和規模化，並討論了Git在儲存代理資料方面的侷限性。

代理開發需要記錄代理的後設資料，包括提交SHA、代理版本和會話日誌。
透過從程式碼到部署的譜系跟蹤，可以理解代理行為對終端系統的影響。

Databricks Marketplace 上推出應用程式

2026-06-16

Databricks 宣佈 Databricks Marketplace 上的應用程式公開預覽，允許客戶發現、安裝和執行第三方資料及 AI 應用程式，這些應用程式在客戶的安全環境中原生執行，資料無需離開其環境。

Databricks Marketplace 上的應用程式允許客戶在 Databricks 工作區內直接發現、安裝和執行第三方資料及 AI 應用程式。
應用程式在 Unity Catalog 的安全隔離沙箱中執行，資料無需移動。

如何在2026年使用Nvidia eGPU搭配Mac進行本地AI

2026-06-16

蘋果已批准Tiny Corp的TinyGPU驅動程式，允許Nvidia和AMD外接GPU在Apple Silicon Mac上用於計算工作負載。本指南涵蓋了硬體推薦、設定步驟以及執行基於CUDA的本地AI的效能基準測試。

蘋果已簽署並公證TinyGPU驅動，首次支援Nvidia/AMD eGPU在Mac上進行計算。
最佳eGPU選擇：大多數使用者推薦RTX 4090，執行70B模型可選RTX 5090。

開放共享 SecureConnect 簡介

2026-06-16

開放共享 SecureConnect 是 Databricks 管理的代理，旨在簡化跨組織資料共享的網路配置。提供者只需一次性設定，無需為每個接收者配置網路。可選私有鏈路連線增強安全性，資料保留在提供者儲存中。現已公開發布預覽版。

SecureConnect 是 Databricks 管理的代理，用於路由儲存訪問。
提供者一次性設定後，無需為每個資料接收者更改防火牆規則。

迴圈工程的藝術

2026-06-16

本文探討了構建可靠AI代理的核心在於精心設計的迴圈架構，而不僅僅是模型本身。作者介紹了四種巢狀迴圈：代理迴圈、驗證迴圈、事件驅動迴圈和爬山迴圈，並展示瞭如何使用LangChain原語實現每層迴圈。文章強調，透過將代理嵌入生態系統並持續改進，可以構建難以複製的競爭優勢。

代理迴圈讓模型反覆呼叫工具完成任務，是基礎迴圈。
驗證迴圈透過評分與反饋確保輸出質量。

我將20年的企業AI銷售經驗打包成一個Claude技能

2026-06-16

前向部署銷售（FDS）是一種面向AI時代的企業銷售方法論，已打包為Claude技能並開源。它基於20年的銷售實踐提煉而成，旨在透過AI輔助將銷售週期壓縮3-10倍。

FDS是一種基於20年企業銷售經驗（包括在AWS等公司）打造的AI時代銷售方法論。
它被打包為Claude技能，60秒即可安裝，包含完整的AI輔助銷售手冊。

寶可夢卡牌AI對戰挑戰賽

2026-06-16

寶可夢卡牌AI對戰挑戰賽是一項讓AI在寶可夢集換式卡牌遊戲中一決高下的競賽。比賽分為模擬賽和策略賽兩個階段，總獎金池豐厚，決賽將於2026年末舉行。

比賽模擬賽階段在Kaggle上進行，AI代理自動對戰，即時排名。
策略賽階段需提交AI策略報告，綜合穩定性、卡組設計和模擬賽成績。

HPE與NVIDIA擴充套件AI工廠，迎接智慧體時代

2026-06-16

企業正將智慧體AI從概念驗證轉向生產，下一代AI工廠為此設計。在HPE Discover大會上，NVIDIA和HPE宣佈擴充套件HPE AI Factory，包括NVIDIA Vera CPU和NVIDIA Agent Toolkit。Vera CPU專為智慧體設計，提供確定性低延遲效能。NVIDIA機密計算現覆蓋整個HPE AI Factory產品組合。此外，全棧NVIDIA整合增強，涵蓋網路、DPU和GPU。

NVIDIA Vera CPU將於2027年隨HPE Private Cloud AI上市，專為智慧體工作負載最佳化。
NVIDIA Agent Toolkit現可用於HPE Private Cloud AI，提供智慧體AI作業系統。

晶片

在 Amazon SageMaker AI 上使用 P-EAGLE 實現推測解碼並行化

2026-06-16

本篇文章指導您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE，展示如何從 SageMaker JumpStart 目錄中選擇相容模型、配置並行草稿規格，並部署高度最佳化的即時 SageMaker AI 端點以加速生成式 AI 應用。

P-EAGLE 透過一次前向傳播並行預測所有草稿令牌，消除了傳統推測解碼的序列瓶頸。
相比 EAGLE-3，在真實基準測試中吞吐量提升高達 1.69 倍。

蘋果2027年傳聞：帶攝像頭的AirPods用於AI及第二款摺疊iPhone

2026-06-16

據彭博社記者馬克·古爾曼報道，蘋果計劃於2027年底推出帶攝像頭的AirPods，以增強Siri的視覺上下文能力，同時還有第二款摺疊iPhone和20週年紀念版iPhone等產品正在研發中。

帶攝像頭的AirPods預計2027年底上市，內部測試基於iOS 28。
攝像頭位於耳機柄上，配有指示燈，可為Siri提供視覺上下文。

高通最新晶片暗示更強大的智慧眼鏡即將問世

2026-06-16

高通釋出Snapdragon Reality Elite晶片，專為下一波XR裝置設計，效能大幅提升，包括GPU提升60%、CPU提升30%、NPU提升高達160%，並改善散熱和電池續航。該晶片已用於即將推出的Aura眼鏡，預示著更強大、更輕便的AI智慧眼鏡即將到來。

高通推出Snapdragon Reality Elite晶片，面向XR裝置，效能全面提升。
GPU效能提升60%，CPU提升30%，NPU提升高達160%。

供應鏈資本主義、平臺重商主義與AI政變：依賴性的政治經濟學

2026-06-16

本文分析了資本主義中不同的剝削策略如何導致權力集中，威脅民主政體。透過供應鏈資本主義、平臺重商主義和AI政變三個案例，作者提出了“依賴性的政治經濟學”框架，探討科技巨頭與政治權力的融合，以及AI在這一過程中的關鍵角色。

供應鏈資本主義始於20世紀80年代，透過外包和全球價值鏈重塑全球經濟。
平臺重商主義在21世紀10年代興起，數字平臺透過資料提取和網路效應積累巨大權力。