Windsurf 现已更名为 Devin Desktop
Devin Desktop 是 Windsurf 的下一代升级版,集成了 Agent 控制中心,支持通过 Kanban 视图管理本地和云端代理,并引入 Spaces 共享上下文。同时支持 Agent Client Protocol (ACP),兼容第三方代理。
- Windsurf 升级为 Devin Desktop,引入 Agent 控制中心
- 新增 Spaces 功能,用于在代理之间共享上下文
日报
2026-06-03 精选 10 条,按主题聚合。其余新闻折叠归档。
Devin Desktop 是 Windsurf 的下一代升级版,集成了 Agent 控制中心,支持通过 Kanban 视图管理本地和云端代理,并引入 Spaces 共享上下文。同时支持 Agent Client Protocol (ACP),兼容第三方代理。
在Microsoft Build大会上,英伟达与微软宣布扩展合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA开放模型、在GitHub Copilot中集成NVIDIA OpenShell安全运行时,以及下一代NVIDIA驱动的AI工厂。
微软在Build 2026上宣布其多模型智能扫描工具MDASH退出预览,并整合到企业安全控制平面中,连接Defender、GitHub代码安全等。MDASH使用超过100个专门的AI代理对漏洞进行分诊和优先级排序,显著降低安全告警的噪声,帮助开发人员更快修复真实可利用的漏洞。
AI已经在编写销售邮件、更新CRM系统、生成提案和响应RFP。下一阶段可能更具颠覆性:在人类加入对话之前,AI代理之间进行谈判。本文探讨了AI如何改变企业销售、采购和商业关系,以及人类信任和判断力的重要性。
微软在年度Build开发者大会上发布了七款新AI模型,其中包括其首个推理模型MAI-Thinking-1。该模型基于企业级、干净且商业授权的数据进行训练。同时发布的还有新的代码模型、图像模型和语音模型。公司强调所有模型均内置水印,并提升了成本效率。微软还宣布与梅奥诊所合作开发医疗AI前沿模型。
伊戈尔·拉基(Igor Racki)的新书《作者身份的道德现实:我如何拒绝了一百万美元》讲述了他拒绝接受百万美元以认领AI生成证明作者身份的经历,深入探讨了AI时代作者身份的伦理问题。
在Build 2026大会上,微软发布了多款新硬件、AI模型和开发者工具,包括面向AI开发的Surface RTX Spark Dev Box、基于OpenClaw的始终在线助手Scout、首个推理模型MAI-Thinking-1、下一代量子计算芯片Majorana 2等。
德国软件工程师 Dominik Koch 为他的 AI 聊天应用开发了一款盲文加载动画组件,可将公司名称转换为盲文字符,并支持多种动画样式。
谷歌宣布在Android设备上推出虚假来电检测功能,利用AI技术识别深度伪造冒充诈骗,保护用户免受伪装成信任联系人的欺诈电话骚扰。
Anthropic 宣布扩大 Project Glasswing 项目,新增约 150 个合作伙伴,提供更强大的 Claude Mythos Preview 模型访问权限,用于防御性网络安全。该项目已发现超过 10,000 个高危漏洞,但面临透明度不足的批评。
OpenAI正在为Codex添加数据分析、销售和投资银行等角色特定插件。该工具每周有五百万用户使用,其中五分之一不是开发者,且非开发者群体的增长速度是开发者的三倍,表明OpenAI正将Codex定位为通用工作应用。
美国总统特朗普签署行政令,建立“自愿框架”,要求AI公司在发布前沿模型前与联邦政府共享,以促进安全创新并加强关键基础设施的网络安全。该指令要求多家联邦机构制定框架,在模型公开发布前评估其先进网络能力。公司可自愿共享,但若选择共享,将获得保密保护。
微软在Build 2026大会上发布了一系列新的内部AI模型,包括旗舰推理模型MAI-Thinking-1。该模型基于清洁数据从头训练,在关键软件工程基准测试中达到领先水平,未使用第三方蒸馏技术。此外,微软还推出了图像生成、高速转录、多语言语音及编码模型,进一步减少对OpenAI的依赖。
本文深入探讨了在使用 Amazon Nova Forge 进行领域特定任务微调时,如何平衡模型领域性能与通用能力。介绍了数据混合、学习率、检查点选择等关键超参数的优化策略,以及如何避免灾难性遗忘和昂贵的失败训练。
微软在Build 2026大会上发布了Surface RTX Spark Dev Box,一款紧凑型桌面电脑,配备Nvidia Blackwell架构RTX Spark处理器和128GB统一内存,提供1 petaflop AI算力,让开发者可在本地加载和运行超过1200亿参数的大模型,无需支付云API费用。此举直接挑战了自ChatGPT推出以来主导AI行业经济的按token付费模式。
前沿AI模型如Mythos和GPT-5.5能发现真实漏洞,但企业级进攻性安全需要更多:覆盖范围、验证、安全性、治理和运营集成。本文探讨了如何将AI能力转化为可靠的安全系统。
特朗普总统签署一项行政令,建立自愿框架,要求科技公司在公开发布强大AI模型前最多提前30天提交给政府审查,以加强网络安全和国家安全。此举标志着他从之前的放松监管立场转向更严格的控制。
Nvidia在Computex 2026上宣布了其新款RTX Spark CPU,用于笔记本电脑,与英特尔、AMD和高通竞争。该芯片基于Arm架构,提供高达1 petaflop的AI性能和128GB统一内存。微软的Surface Laptop Ultra、戴尔XPS 16 Creator Edition、华硕ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮点机型,预计今年秋季上市,售价超过2000美元。
Anthropic的IPO申请标志着生成式AI从以研究为主的风险投资阶段转向稳定的企业公用事业,对定价、许可和市场整合产生影响。
微软推出Scout,一款基于OpenClaw的始终在线AI助手,集成于Microsoft 365,可自动执行日程安排、费用报告等任务。它能监控交通和日历,从Teams和电子邮件中学习,并推荐行动。桌面预览版现面向美国Frontier客户提供。
TinyFish 推出开源多智能体系统 BigSet,用户只需用一句话描述所需数据,系统便自动推断模式、通过网络搜索和提取、去重并生成可导出的 CSV/XLSX 文件。支持定时刷新,全程无需手动编写爬虫或配置选择器。
由于AI代码生成带来的前所未有的增长,GitHub遭遇频繁宕机。该公司正在扩展基础设施,迁移至Azure,并重建核心系统以恢复可靠性。
在Build开发者大会上,微软推出一系列面向开发者的新功能,包括默认开启深色模式的开发者优化Windows 11体验、预配置开发工具、在PowerShell中原生运行Unix核心工具、WSL容器、智能终端Agent面板、以及用于运行AI Agent的执行容器和本地AI模型。微软旨在通过减少干扰和提供熟悉的环境,吸引Mac和Linux开发者转向Windows。
微软推出智能终端(Intelligent Terminal)实验性功能,将AI智能体直接集成到Windows 11终端中,支持GitHub Copilot、Claude Code等代理,可自动检测错误并建议修复,简化开发者工作流程。
Anthropic的Claude托管代理提供了一个完全托管的平台,用于运行AI代理,无需管理基础设施。本文涵盖了功能、定价、最新更新以及逐步构建代理的实践指南。
Deep Agents 的 RubricMiddleware 通过在智能体运行中添加自我评估循环,使其能够根据预定义的评价标准反复修正输出,直到满足所有条件。该工具特别适用于具有明确可验证成功标准的任务,如通过测试、避免禁止模式、覆盖必要部分等。
微软在Build 2026上宣布了Project Solara,这是一款专为运行AI代理的小工具设计的新操作系统,基于安卓而非Windows。公司展示了两款概念设备:桌面概念(类似亚马逊Echo Show)和徽章概念(可穿戴工作徽章)。微软不计划自行生产这些设备,而是作为参考设计供其他硬件制造商使用。多家企业如AccuWeather、百思买、CVS医疗和塔吉特计划开展硬件试点。
CVE AI Agent是一个自主运行的漏洞情报引擎,能够持续采集、丰富和分类CVE数据,并通过n8n、Jira、Slack、Splunk等第三方工具将发现结果推送到用户选择的平台。其采用令牌高效架构,通过确定性最小化逻辑过滤噪音,平均提示词仅1000个令牌。代理遵循严格的两遍架构:第一遍确定性提取所有可测量数据,第二遍由LLM填充定性部分。支持多种LLM提供商,包括Gemini、OpenAI、Claude等,并提供Web仪表盘。
微软推出Work IQ,专为代理优先的企业设计,让AI代理动态发现数据结构和执行操作,但成本、治理和数据暴露问题令人担忧。
本文深入分析LLM编码基准测试与现实生产环境之间的差距,指出单纯依赖排行榜分数选择模型的弊端。文章分类介绍了HumanEval、SWE-bench等主流基准测试的实际测量内容,并提出一套包含五步的评估框架:定义质量指标、选择匹配任务的基准、运行内部评估、使用加权评分、建立持续评估机制。同时警示了过度依赖单一基准、忽略执行评估、不考虑基础设施开销等常见陷阱。最后强调,内部评估集才是模型选择最可靠的依据。
微软推出Surface RTX Spark Dev Box,这是一款专为开发者设计的迷你PC,搭载英伟达Arm架构RTX Spark芯片,拥有128GB统一内存,支持本地运行高达1200亿参数的AI模型,预装Visual Studio Code、GitHub Copilot等开发工具,将于今年晚些时候在美国上市。
OpenAI宣布Codex的500万周活跃用户中20%是知识工作者而非程序员,因此推出针对他们的新功能:Sites(创建和分享交互式网站)、Annotations(在文档中指定区域让AI修改)以及面向数据分析、销售等领域的插件。
Baseten 与微软 AI 宣布,MAI-Thinking-1 即将在 Baseten 平台上提供。该模型是微软 AI 的旗舰推理模型,结合了开源模型的灵活性与闭源模型的管理便利性,具有干净数据来源、商业级质量和定制化能力。
谷歌为电话应用推出新功能,利用端到端加密的RCS技术检测冒充联系人的AI诈骗电话。诈骗者越来越普遍地使用AI模仿声音进行诈骗,FBI报告2025年美国损失超8.93亿美元。该功能默认开启于Android 12及以上设备,从Pixel手机开始,要求双方使用谷歌电话应用。此外,还推出了儿童安全、AirDrop支持、AI试穿等功能。
本文介绍了如何通过Amazon Nova 2 Lite实现目标检测,无需训练模型或管理基础设施。利用Amazon Bedrock、Lambda和API Gateway构建应用,通过自然语言提示即可检测物体并获取边界框坐标。涵盖制造业、农业和物流等实际应用场景。
Refer Me推出了AI简历定制工具,可根据职位描述自动优化简历,提高通过ATS筛选的几率,让求职者在竞争激烈的市场中脱颖而出。
本文探讨了AI在数据分析领域的实际效用与局限。AI在编写代码和加速数据资产开发方面有显著优势,但在回答临时数据问题、分析指标变化时,误差率较高(约86%准确性),且需要大量前期数据准备。AI无法替代分析师所需的判断力、背景知识和机构记忆。文章建议以清醒的态度使用AI工具,避免过度投资或完全忽视。
研究发现在Android设备上,任何应用都可以静默获取Microsoft 365账户的令牌,从而劫持账户。问题已修复,建议立即更新应用。