我们构建了一个运行我们AI数据平台的智能体
Encord宣布推出Merlin——一个代理智能层,通过MCP集成到Claude、Codex等平台,让用户通过对话管理AI数据基础设施,涵盖构建、观察和优化整个数据生命周期。
- Merlin是Encord的代理智能层,旨在通过对话简化AI数据管理。
- 它通过MCP协议集成到Claude、Codex等代理编码平台,未来将支持Slack等。
日报
2026-06-17 精选 10 条,按主题聚合。其余新闻折叠归档。
Encord宣布推出Merlin——一个代理智能层,通过MCP集成到Claude、Codex等平台,让用户通过对话管理AI数据基础设施,涵盖构建、观察和优化整个数据生命周期。
此次收购将帮助SpaceX扩大开发者服务,并获取Cursor的开发者工作流程和用户分析数据。
通过日常使用AI,作者发现真正的瓶颈不是编码本身,而是上下文切换导致的精神消耗。AI让思考更持久,能量从语法和调试转向架构和系统思维,但保持判断力和品味仍是关键。
Ctx 是一个为 Claude Code 和自定义 LLM 设计的上下文管理工具,它通过分析当前任务,从包含 102,928 个节点的知识图谱中推荐最相关的小型技能、代理和 MCP 服务器集合,从而节省令牌并提高质量。
Factory AI 通过 LangSmith 的可观测性和反馈 API 优化产品反馈循环,实现了迭代速度翻倍,并显著缩短了开发周期。
Open SWE 是一款开源、云端托管的编码代理,能够自主处理 GitHub 任务,包括规划、编码、测试和提交拉取请求。它采用多代理架构,包含规划器、程序员和审查器,并支持人类参与循环和异步执行。
Monte Carlo 利用 LangGraph 构建 AI 故障排除代理,并使用 LangSmith 进行调试,帮助数据团队更快地解决问题。该代理能够并行探索多个调查路径,显著缩短根因分析时间。
本文探讨围绕人工智能意识的争论,区分了两种观点:一种是认为AI可能具有意识的“妄想者”,另一种是持哲学怀疑态度的“哲学家”。
今年的亚马逊Prime Day将于6月23日至26日提前举行,多款2025年旗舰耳机参与折扣。本文精选了8款经过实测的耳机推荐,涵盖Bowers & Wilkins、索尼、Bose等品牌,并提供购买建议。
本视频探讨了人工智能对开放互联网的潜在影响,包括内容生成、信息验证和平台监管等关键问题。
LangSmith 推出公开基准测试和评估数据集共享功能,帮助开发者比较不同 LLM 架构在相同任务上的表现。首发数据集为 LangChain 文档问答数据集,并发布了 langchain-benchmarks 包以支持实验。文章分析了多种模型和架构的性能,并提供了调试方法。
智能体工程是一门结合产品思维、工程和数据科学的新学科,旨在通过迭代构建、测试、发布、观察和优化的循环,将非确定性的LLM系统转变为可靠的工业生产体验。文章介绍了该学科的核心概念、所需技能、实践场景以及为什么现在需要它。
本文介绍了如何使用LangSmith评估和比较微调后的开源LLM。作者通过微调Llama2-7b和13b模型来生成SQL,并在LangSmith上创建数据集、运行测试、用GPT-4自动评估。结果显示,13b模型在使用较少数据时仍接近GPT-3.5水平,证明了开源模型的竞争力。
Android 17与6月Pixel Drop同步推出,为Pixel设备率先带来应用气泡、增强安全、AI新模型等多项更新。
法国总理塞巴斯蒂安·勒科尔努表示,法国国内情报部门将放弃美国科技巨头Palantir的AI数据工具,转而采用本土供应商,以避免“战略依赖”。
Qwen团队发布了三种具身AI模型,统称为Qwen-RobotSuite。包括操作模型RobotManip(基于Qwen3.5-4B)、视频世界模型RobotWorld(60层MMDiT)和导航模型RobotNav(基于Qwen3-VL,提供2B/4B/8B版本)。本文详细介绍了每个模型的架构、数据管道和基准测试结果。
LangSmith 产品主页重新划分为三大板块:可观测性、评估和提示工程。同时,资源标签功能得到增强,支持按应用或自定义标签灵活分组资源,未来还将引入基于属性的访问控制(ABAC)。
AI智能体在反映团队积累的知识和判断时效果最佳。本文探讨如何将人类判断融入智能体开发的生命周期,以交易员助手为例,讲解工作流设计、工具设计和上下文工程,并介绍通过自动化评估和监测来优化智能体的改进循环。
Deep Agents SDK通过卸载、摘要和文件系统抽象来管理长时间运行AI任务的上下文,防止上下文腐败。本文介绍了三种压缩技术:卸载大型工具结果、卸载大型工具输入和摘要,并提供了实践指导和评估方法。
Databricks 在 Data + AI Summit 2026 上宣布了 App Spaces、Genie App Builder 和 Serverless Micro Apps 三项新功能,旨在将快速、易用的 vibe coding 引入企业环境,同时不牺牲治理、数据安全和成本控制。
Ito 是一个自动化的 QA 平台,它在拉取请求中运行代码,检测行为回归,无需手动编写测试脚本。它集成 GitHub,支持各种技术栈,并直接在 PR 中提供包含视频和截图的质量报告。
Databricks推出OpenSharing,这是Delta Sharing的下一次进化,也是业界首个为代理时代构建的开放协议。它将开放数据共享扩展到完整的AI堆栈,支持模型和代理,并成为Linux基金会下的独立开源项目。OpenSharing支持跨任何云、供应商和格式的无缝共享,解决了跨组织数据共享的难题,并引入了Genie Agent Sharing、SecureConnect和Global Distribution等新功能。
本文探讨了在代理式软件开发中,如何系统性地跟踪AI代理的决策历史、配置和生成代码的谱系。作者提出建立“代理仓库”以实现可观测性和规模化,并讨论了Git在存储代理数据方面的局限性。
Databricks 宣布 Databricks Marketplace 上的应用程序公开预览,允许客户发现、安装和运行第三方数据及 AI 应用程序,这些应用程序在客户的安全环境中原生运行,数据无需离开其环境。
苹果已批准Tiny Corp的TinyGPU驱动程序,允许Nvidia和AMD外置GPU在Apple Silicon Mac上用于计算工作负载。本指南涵盖了硬件推荐、设置步骤以及运行基于CUDA的本地AI的性能基准测试。
开放共享 SecureConnect 是 Databricks 管理的代理,旨在简化跨组织数据共享的网络配置。提供者只需一次性设置,无需为每个接收者配置网络。可选私有链路连接增强安全性,数据保留在提供者存储中。现已公开发布预览版。
本文探讨了构建可靠AI代理的核心在于精心设计的循环架构,而不仅仅是模型本身。作者介绍了四种嵌套循环:代理循环、验证循环、事件驱动循环和爬山循环,并展示了如何使用LangChain原语实现每层循环。文章强调,通过将代理嵌入生态系统并持续改进,可以构建难以复制的竞争优势。
前向部署销售(FDS)是一种面向AI时代的企业销售方法论,已打包为Claude技能并开源。它基于20年的销售实践提炼而成,旨在通过AI辅助将销售周期压缩3-10倍。
宝可梦卡牌AI对战挑战赛是一项让AI在宝可梦集换式卡牌游戏中一决高下的竞赛。比赛分为模拟赛和策略赛两个阶段,总奖金池丰厚,决赛将于2026年末举行。
企业正将智能体AI从概念验证转向生产,下一代AI工厂为此设计。在HPE Discover大会上,NVIDIA和HPE宣布扩展HPE AI Factory,包括NVIDIA Vera CPU和NVIDIA Agent Toolkit。Vera CPU专为智能体设计,提供确定性低延迟性能。NVIDIA机密计算现覆盖整个HPE AI Factory产品组合。此外,全栈NVIDIA集成增强,涵盖网络、DPU和GPU。
本篇文章指导您如何在 Amazon SageMaker AI 中直接使用 P-EAGLE,展示如何从 SageMaker JumpStart 目录中选择兼容模型、配置并行草稿规格,并部署高度优化的实时 SageMaker AI 端点以加速生成式 AI 应用。
据彭博社记者马克·古尔曼报道,苹果计划于2027年底推出带摄像头的AirPods,以增强Siri的视觉上下文能力,同时还有第二款折叠iPhone和20周年纪念版iPhone等产品正在研发中。
高通发布Snapdragon Reality Elite芯片,专为下一波XR设备设计,性能大幅提升,包括GPU提升60%、CPU提升30%、NPU提升高达160%,并改善散热和电池续航。该芯片已用于即将推出的Aura眼镜,预示着更强大、更轻便的AI智能眼镜即将到来。
本文分析了资本主义中不同的剥削策略如何导致权力集中,威胁民主政体。通过供应链资本主义、平台重商主义和AI政变三个案例,作者提出了“依赖性的政治经济学”框架,探讨科技巨头与政治权力的融合,以及AI在这一过程中的关键角色。