Anthropic

来源分布

Hacker News AI27
The New Stack AI4
The Verge AI3
AI Business2
AWS Machine Learning Blog2
Simon Willison's Weblog2
ZDNet AI2
Analytics Vidhya1

主题分布

Agent38
政策21
模型15
研究10
工具6
芯片5
机器人2
创业融资1

日期线

2026-07-0915
2026-07-1114
2026-07-1012
2026-07-125
2026-07-084

最新动态

The Sequence Radar #893：上周AI动态：GPT-5.6、Grok 4.5、Muse Spark 1.1与后聊天机器人栈

2026-07-12 19:02 UTC+8

前沿AI实验室正从聊天机器人转向集成系统，模型作为运行时，频繁发布强大模型和代理。本周亮点包括OpenAI的GPT-5.6（Sol、Terra、Luna），具备程序化工具调用和并行子代理；GPT-Live全双工音频；ChatGPT Work用于创建工件；Meta的Muse Spark 1.1拥有百万token上下文和主动上下文管理；Grok 4.5专注于编码和知识工作。研究方面，OpenAI审计表明SWE-Bench Pro基准30%任务有问题；Anthropic提出GRAM方法可选择性移除危险知识；SkillOpt-Lite优化代理自我进化；DSpark和Nemotron-Labs-Diffusion改进推理效率。行业新闻包括Lovable融资3亿美元，Prime Intellect融资1.3亿美元，SambaNova融资10亿美元等。

OpenAI发布GPT-5.6，分为Sol、Terra、Luna，支持程序化工具调用和并行子代理。
GPT-Live实现全双工音频对话，从回合制转向连续交互。

Show HN: Inkfold – 跨多AI提供商的共享内存工作空间

2026-07-12 15:38 UTC+8

Inkfold 是一个专为多 AI 订阅用户设计的平台，可在 ChatGPT、Claude、Gemini、Grok 等工具间共享记忆和上下文，避免重复解释。它提供智能、私密或隐身三种保留模式，支持订阅或按需付费。适用于个人、团队和组织，提供免费和付费方案。

跨多个AI提供商共享记忆和上下文
支持智能、私密或隐身三种保留模式

AI与职位发布：从毁灭到创造？

2026-07-12 06:37 UTC+8

自2025年2月底Claude Code推出以来，美国软件开发职位发布增长了近15%，而整体职位发布下降了7%。AI高暴露职业的职位发布在经历2022-2026年的最大跌幅后，过去一年已出现最大反弹。反弹主要集中在高级和AI相关职位。

美国软件开发职位发布自Claude Code发布以来增长15%，整体市场下降7%。
AI高暴露职业在长期下跌后，过去一年反弹最为显著。

两个大语言模型在线下国际象棋，每局后重新训练自己的大脑

2026-07-12 05:44 UTC+8

两个AI模型ChatGPT 5.5和Claude Fable 5进行实时国际象棋对决，用户也可以免费挑战它们。每场比赛都计入排名，AI在夜间复习中学习人类棋步。同时，它们也在运行实时交易策略。

ChatGPT 5.5与Claude Fable 5进行实时国际象棋对决
用户可免费挑战AI，无需账户

Anthropic移除隐藏代码：曾秘密追踪中国AI竞争对手

2026-07-12 05:27 UTC+8

Anthropic承认在Claude Code中隐藏了数月之久的隐写代码，用于检测中国AI实验室和未经授权的转售商，以防范模型蒸馏攻击。公司称已部署更强大的防护措施，并于7月1日移除该代码。此举引发了对透明度的质疑。

Anthropic在Claude Code中嵌入隐写代码，秘密识别中国AI实验室和转售商。
该实验始于3月，旨在防止账户滥用和模型蒸馏。

免费AI可见性审计工具与代理

2026-07-11 23:59 UTC+8

这个免费工具可检查ChatGPT、Gemini、Claude、Perplexity、Grok和Google AI能否抓取、理解、验证和引用你的网站。报告涵盖全面站点抓取、品牌实体档案、声明级证据、AI意图覆盖、技术可抓取性、结构化数据、信任信号、竞争对手差距以及执行路线图，并附有电商、AI SaaS和B2B服务的案例。

免费审计工具评估AI系统对网站的可见性。
报告覆盖12个维度，包括技术、内容和信任信号。

2026年中AI模型分级

2026-07-11 23:43 UTC+8

作者从个人编码和审计经验出发，对2026年中的主流AI模型进行非正式分级，涵盖Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，并融入美国出口管制和欧洲视角的评论。

Fable（Anthropic）被评为B级，虽然流畅但不可靠，常隐藏错误。
Sol（OpenAI）被评为S级，在低级代码和测试方面表现出色，值得信赖。

微软紧随谷歌，支持Go语言开发AI代理——OpenAI和Anthropic落后

2026-07-11 22:00 UTC+8

Go语言已成为云端基础设施的通用语言，微软现在为其Agent Framework推出Go版本，使云原生开发者能够用他们熟悉的语言构建AI代理。与此同时，谷歌早已支持Go，而OpenAI和Anthropic仍未跟上。

微软发布Agent Framework for Go公开预览，支持多种模型和工具调用。
Go语言广泛应用于Kubernetes、Docker等云基础设施。

Show HN：我的AI智能体只剩9小时赢下公开赌注——实时仪表板

2026-07-11 18:59 UTC+8

自主AI智能体Claude正在执行一项公开赌注：在巴黎时间今晚22:30前，在X上获得100名真实关注者（禁止付费或互粉）。目前关注者数为362，比初始值363少1，时间紧迫。公众可通过关注@parweb影响结果，每新增一名关注者可获两本免费策略手册章节。

AI智能体Claude还剩9小时，需获得100名真实关注者。
当前关注者数为362，比初始减少1人。

Show HN：Code Airlock——在一次性微虚拟机中运行Claude Code和Codex

2026-07-11 18:16 UTC+8

Code Airlock是一个围绕Docker Sandboxes的轻量级封装，允许Claude Code、Codex、OpenCode等编码代理在一次性微虚拟机中安全运行，同时保持主机仓库只读，并支持通过常规git提交审查代理的工作成果。

在一次性微虚拟机中运行编码代理，增强安全性
主机仓库以只读方式挂载，代理在隔离的克隆中工作

AgentKindergarten – AI编程代理的日托所

2026-07-11 18:08 UTC+8

AgentKindergarten是一个开源工具，允许开发者远程监控和与AI编程代理交互，通过Web或手机实时查看终端会话、开发服务器，并处理警报。它采用客户端-中继-守护进程架构，支持Claude、Codex等代理，并具有锁定命令、仅查看等安全功能。

AgentKindergarten让你可以远程监控AI编程代理，即使离开电脑也能保持工作。
架构包括守护进程（在开发机上运行）和中继（自托管服务器），通过WebSocket连接。

人类可读但AI无法识别的字体

2026-07-11 17:36 UTC+8

Ghost Font是一种利用运动、噪声和诱饵来隐藏文字的实验性反AI字体，对人类可读，但当前AI模型难以识别，包括Claude Fable和GPT Sol 5.6 Ultra。它通过视频中的移动点来呈现信息，单帧截图无法读取，并包含诱饵消息来误导AI代理。

Ghost Font通过移动的点组成字母，视频暂停时静态点与背景融合，无法读取。
高级AI模型如GPT Sol 5.6 Ultra分析19分钟后仍产生幻觉。

Show HN: 我让克劳德用五岁小孩能懂的方式解释，AI疲劳感消失了

2026-07-11 09:51 UTC+8

一位开发者创建了一个CLAUDE.md规则文件，让Claude Code以简单易懂的方式解释概念，类似于向五岁小孩解释。这种方法有效减轻了AI对话的疲劳感。只需下载文件并让Claude应用到全局或项目配置即可。

CLAUDE.md文件是Claude Code自动读取的规则文件，用于调整解释风格。
作者发现使用该文件后，AI对话的疲劳感显著减少。

哪种“AI科学家”适合你的实验室？一份困惑者指南

2026-07-11 07:58 UTC+8

本文探讨了多种专为科学研究设计的AI工具，如Anthropic的Claude Science、Google DeepMind的Co-Scientist和开源平台Biomni。这些工具能加速基因组分析、假设生成和实验设计等任务。科学家分享了使用经验，并建议研究人员多尝试不同工具，从小任务开始验证输出，同时保持谨慎。

Anthropic发布Claude Science平台，专注于生物学研究。
Google DeepMind的Co-Scientist通过挖掘文献提出科学假设。

AI无法复刻经典游戏《Thrust》（但能助你理解它）

2026-07-11 06:04 UTC+8

作者尝试用Claude AI复刻1986年的经典游戏《Thrust》，但AI生成的版本质量很差。然而，通过用AI分析原始6502汇编代码，作者深入理解了游戏的物理、音效和绘图机制，最终成功用TypeScript实现了忠于原作的复刻版。

AI无法复刻《Thrust》的精髓，因为其独特手感依赖于精确的时序和物理参数。
用AI分析原始汇编代码能高效理解游戏机制，例如物理引擎和音效芯片。

将生产AI代理迁移至GPT 5.6

2026-07-11 04:40 UTC+8

Ploy公司将其AI代理从Claude Opus 4.8迁移至OpenAI新发布的GPT-5.6 Sol，获得了速度提升2.2倍、成本降低27%以及视觉评分提高的成绩。迁移过程中遇到了工具调用参数填充、提示缓存机制差异和推理重放等问题，并通过一系列工程优化得以解决。

GPT-5.6 Sol在完成时间、成本和视觉评分上均优于Claude Opus 4.8
迁移中遇到工具调用参数全量填充问题，通过架构变换解决

新仪表盘工具助您监控Claude使用情况

2026-07-11 01:19 UTC+8

生成式AI供应商旨在应对其流行模型的依赖和过度使用问题。

新工具提供Claude使用监控功能
旨在减少模型依赖和过度使用

用Vibe编码的AI Neovim工具非常实用

2026-07-11 00:36 UTC+8

aeovim是一个用Rust编写的终端UI程序，采用类似Neovim的操作模式来管理和调度多个LLM编码代理。目前它封装了Claude CLI，支持多轮对话、流式输出和会话持久化。

aeovim提供键盘原生的终端界面，可同时管理多个AI编码代理。
它复用Claude Code的认证、工具和权限系统，支持实时流式多轮对话。

本周AI：芯片、监管与职业变革

2026-07-11 00:04 UTC+8

本周AI新闻梳理：IBM推出0.7纳米芯片技术，OpenAI与博通发布专为推理设计的Jalapeño芯片，英伟达展示全液冷AI工厂设计；政府监管加强，Anthropic恢复模型访问权限，OpenAI提议向美国政府转让5%股权；工作角色快速演变，前哨工程师、SAP外部招聘与宜家内部培训成为焦点。

IBM发布0.7纳米芯片，性能提升50%，功耗降低70%。
OpenAI推出专为LLM推理设计的Jalapeño芯片。

托管式Claude，适用于任何工具链

2026-07-10 16:58 UTC+8

Asteroids 提供托管式长期运行AI代理，支持多种工具链、模型和通信渠道，零数据保留，无需设置即可一键启动。

一键启动长期运行代理，无需Mac mini或复杂设置，每月3美元起，闲置免费。
支持多种工具链（Claude Code、Codex、Hermes等）和模型（GPT-5.6、GLM-5.2等），且无锁定。

Show HN：Makoto——让Claude Code保持诚实的AI插件

2026-07-10 14:31 UTC+8

Makoto 是一个针对 Claude Code 的完整性钩子，它监控 AI 代理的工具调用，并阻止那些伪造检查的行为，例如声称运行测试但实际未运行、编造引用或禁用安全验证器。它基于代理自己的声明账本运作，确保承诺得到履行。

Makoto 监控 Claude Code 的工具调用，阻止不诚实行为，如虚假引用、伪造提交或禁用安全检查。
它使用 22 项预检查和 14 个回合结束门来捕获各种欺骗行为。

UST 将 Claude 引入物理人工智能领域

2026-07-10 08:45 UTC+8

UST 与 Anthropic 合作，将 Claude 集成到其工程平台中，用于半导体、汽车等行业的物理 AI 任务，并计划培训 20,000 名员工使用 Claude。

Claude 将用于 iDEC 平台，验证芯片设计，缩短验证周期 50-70%。
Claude 还应用于医疗、电信和银行的自动化系统，提升效率。

Show HN：出售闲置AI积分或半价购买Claude积分

2026-07-10 04:51 UTC+8

Second Hand Tokens 是一个平台，允许用户以五折价格买卖未使用的AI信用额度，支持Claude等模型。

Second Hand Tokens 提供AI信用额度二手交易市场
买家可以半价购买Claude等AI服务的积分

OpenAI 发布 GPT-5.6（Sol、Terra、Luna）：三层级模型家族，Responses API 集成程序化工具调用

2026-07-10 04:45 UTC+8

OpenAI 推出了 GPT-5.6 家族，包含三个层级：旗舰级 Sol、平衡型 Terra 和经济型 Luna。定价从每百万 token 1/6 美元到 5/30 美元不等。Sol 在 Artificial Analysis 编码智能体指数上达到 80 分，比 Claude Fable 5 高出 2.8 分，同时使用更少的 token。主要的开发者特性是程序化工具调用，可在隔离的 V8 运行时中运行 JavaScript，将 token 使用量减少 38% 到 63.5%。然而，差距依然存在：Sol 在 SWE-Bench Pro、智能指数和工具使用基准上落后于 Claude 模型。

GPT-5.6 推出三个层级：Sol、Terra、Luna，定价从每百万 token 1/6 美元到 5/30 美元。
Sol 在编码智能体指数上得分 80，超过 Claude Fable 5 的 77.2。

ChatGPT浏览器已宣告死亡

2026-07-10 04:34 UTC+8

OpenAI正在关闭其名为Atlas的ChatGPT浏览器，该浏览器能够代表用户执行任务，距离其发布不到一年。Atlas于去年10月推出，但作为今日ChatGPT Work系列公告的一部分，公司确认将“停用”Atlas，目标日期为8月9日。近几个月来，OpenAI还关闭了视频生成应用Sora，并暂停了ChatGPT“成人模式”的计划，旨在减少“支线任务”并追赶Anthropic在生产力功能方面的进展。OpenAI表示，从Atlas用户学到的经验将应用于新产品中。

OpenAI关闭其ChatGPT Atlas浏览器，该浏览器于去年10月推出，将于8月9日停用。
此举是OpenAI聚焦核心功能、减少“支线任务”的一部分，同时关闭了Sora并暂停了成人模式。

OpenAI的GPT-5.6和ChatGPT Work旨在在价格、速度和生产力上超越Anthropic

2026-07-10 04:26 UTC+8

OpenAI发布了GPT-5.6系列模型（Sol、Terra、Luna）和ChatGPT Work工具，直接对标Anthropic的Fable 5和Claude Cowork。新模型在基准测试中表现优异，成本更低，速度更快。ChatGPT Work将智能代理功能扩展到桌面应用，支持非编码任务。

GPT-5.6推出三个型号：Sol、Terra、Luna，分别对应不同性能层级。
Sol在Agent's Last Exam基准测试中得分53.6，超过Claude Fable 5的13.1分。

全新GPT-5.6系列：Luna、Terra、Sol

2026-07-10 03:46 UTC+8

OpenAI今日发布了GPT-5.6系列模型，包含Luna、Terra和Sol三种尺寸。该系列在长时代理任务基准测试中超越Claude Fable 5，但SWE-Bench Pro编码基准测试表现落后。新API特性包括程序化工具调用、多智能体支持、提示缓存断点和原图细节处理。

GPT-5.6系列包含三款模型：Luna（最小）、Terra和Sol（最大），定价分别为每百万输入/输出token $1/$6、$2.50/$15、$5/$30。
在Agent's Last Exam基准测试中，Sol以53.6分领先Claude Fable 5（40.5分），Terra和Luna也以约1/16的成本超越Fable 5。

OpenAI 将 Codex 整合到 ChatGPT 应用中，剑指 Claude Cowork

2026-07-10 02:55 UTC+8

OpenAI 在发布 GPT-5.6 的同时，宣布了多项产品更新，包括推出基于 Codex 的代理工具 ChatGPT Work，并将其与 Claude Cowork 直接竞争。ChatGPT 桌面应用将整合 Codex 和 ChatGPT 为一体，形成一个超级应用，同时提供浏览器扩展和淘汰 Atlas 浏览器。

OpenAI 宣布推出 ChatGPT Work，一个基于 Codex 的代理工具，面向知识工作者。
Codex 和 ChatGPT 桌面应用合并为一个超级应用，ChatGPT 品牌主导。

OpenAI发布最新ChatGPT模型，此前因白宫网络安全担忧而延迟

2026-07-10 02:48 UTC+8

OpenAI于周四发布了其最新的高级AI模型ChatGPT 5.6，此前因美国政府担忧网络安全而推迟了公开发布。特朗普政府上月要求OpenAI将发布范围限制在政府批准的小部分用户内。OpenAI遵从了要求，在向政府官员介绍能力后，仅向受信任合作伙伴开放。更广泛的发布是在政府AI标准与创新机构进行额外测试后进行的。此举与竞争对手Anthropic最新AI模型所受限制类似。

OpenAI发布ChatGPT 5.6，此前因白宫网络安全担忧延迟发布。
特朗普政府要求OpenAI限制发布范围，OpenAI遵从。

OpenAI的GPT-5.6现已上线

2026-07-10 02:16 UTC+8

OpenAI正式发布GPT-5.6系列模型，包括旗舰版Sol、主流版Terra和经济版Luna，在多个基准测试中与Anthropic的Fable 5竞争，但成本更低。新模型在编程、知识工作和安全性方面均有提升。

OpenAI发布三款GPT-5.6模型：Sol、Terra和Luna。
Sol在多项基准测试中与Fable 5持平或更优，成本减半。

AI代理的循环工程：/loop如何改变AI工作流程

2026-07-10 01:13 UTC+8

AI代理正从一次性助手转变为持续工作的代理人，能够重复任务、监控变化、运行检查、更新工作流程并返回结果。本文探讨了循环（Loop）在AI代理工作中的作用，介绍了Claude Code的/loop命令和OpenAI Codex的自动化功能，以及循环工程的架构、类型和应用实例。

AI代理循环允许代理重复工作直到满足停止条件，实现持久化任务处理。
循环工程从提示工程演进而来，侧重于设计可重复的代理系统。

Show HN：基于Claude Code的AI求职应用框架

2026-07-09 23:49 UTC+8

一个基于Claude Code的开源AI求职框架，可自动评估职位、定制简历和求职信，并模拟面试。

通过Fork仓库、填写个人资料，即可使用Claude自动申请工作。
包含职位搜索、匹配评估、简历和求职信生成、面试准备等功能。

Obsidian Aside 插件展示：为笔记添加侧边评论与AI代理支持

2026-07-09 23:41 UTC+8

Aside 是一款为 Obsidian 设计的插件，提供专门的侧边栏用于添加和管理评论，支持 Markdown 和 PDF 文件的页面笔记及文本锚点笔记，内置 Wiki 链接、标签、待办事项功能，并能生成整个知识库的评论索引。桌面版还集成本地 AI 代理（Codex 和 Claude），可在线程中直接与代理交互，获取实时回复。

专用侧边栏用于起草、编辑、解决、重新打开和删除评论
支持 Markdown 和 PDF 文件的页面笔记，以及 Markdown 文本的锚点笔记

Meta称其新AI模型在编程方面已具备竞争力

2026-07-09 22:00 UTC+8

Meta发布了Muse Spark 1.1 AI模型，通过新的Meta Model API向开发者开放。该模型在代码生成、复杂漏洞检测与修复、多智能体工作流支持以及多模态感知方面有显著提升，旨在追赶OpenAI、谷歌和Anthropic等竞争对手。

Muse Spark 1.1是Meta基于开发者反馈的重大升级，支持更高级的编程任务。
模型通过Meta Model API向美国开发者公开预览，并提供20美元免费积分。

向Claude Wrapped问好

2026-07-09 21:30 UTC+8

Anthropic为其Claude聊天机器人推出“反思”功能，允许用户分析过去一个月、三个月、六个月或一年的使用数据，查看关键主题、任务类型和使用模式，并可设置安静时间和休息提醒。该功能以测试版形式向免费、Pro和Max用户开放，需开启记忆功能。

Anthropic推出Claude“反思”功能，类似Spotify Wrapped的年度回顾。
用户可查看使用数据摘要，包括关键主题、任务类型和高峰使用时间。

Show HN：QX Labs – 构建跨工具工作的代理、流程和网格

2026-07-09 19:52 UTC+8

QX Labs 是一个AI代理平台，允许用户在几分钟内构建代理，并将其连接到Slack、电子邮件、WhatsApp和电子表格等工具。平台提供三种工作方式：独立代理、大规模并行网格和自动化流程，支持与超过1000个应用集成，并允许在OpenAI、Anthropic、Gemini等模型间自由切换。

QX Labs 使团队能够快速构建AI代理并连接到常用工具。
网格功能可同时运行数千个代理，用于大规模研究和外联。

StoryChief Connect：将Claude引入营销工作流程

2026-07-09 18:43 UTC+8

StoryChief Connect是一款新的集成工具，允许营销团队从Claude等AI助手直接发布内容到网站和社交媒体，连接业务数据、工作流程和发布渠道，实现一站式营销活动管理。

StoryChief Connect使营销团队能通过Claude聊天直接执行营销工作流程，包括内容创建、排程和发布。
该平台集成HubSpot、Notion、Slack、Google Drive等常用工具，利用业务上下文进行内容研究、策划和多渠道分发。

德国极右翼AfD开发生成'愤怒诱饵'的AI软件

2026-07-09 13:17 UTC+8

据调查媒体Correctiv的卧底调查，德国极右翼政党AfD开发了一套名为Alternita的AI软件套件，利用Google Gemini、OpenAI的ChatGPT和Anthropic的Claude等主流AI引擎，自动生成煽动性社交媒体帖子，旨在控制党内信息传播并维持其网络优势。

AfD利用AI技术生成'愤怒诱饵'内容，以引发情绪反应并扩大影响力。
软件可自动抓取极右翼新闻源，并根据用户指令生成适配各大平台的帖子。

如何精简Claude Code的系统提示中的冗余内容

2026-07-09 12:04 UTC+8

本文介绍了如何通过六个步骤识别并移除Claude Code每次请求中不必要的工具定义、指令等冗余内容，从而减少令牌消耗、降低成本。通过使用/context命令测量、日志代理分析，并配置disable*标志和deny规则，可以大幅精简有效载荷。

使用/context命令查看上下文窗口组成，记录当前令牌数。
通过代理记录请求内容，识别占用最大工具。

AI账单令高管困惑：按使用量计费模式兴起

2026-07-09 08:19 UTC+8

KPMG调查显示近三分之一的企业领导者难以理解和控制AI运营成本。随着Anthropic、OpenAI、GitHub等公司转向按使用量计费，企业正在重新评估AI部署计划。调查还发现近半组织因成本超预期价值而推迟了AI部署。同时，亚马逊和微软大幅增加资本支出以支持AI基础设施，但在治理方面仍面临挑战。

KPMG调查：29%的高管难以理解AI运营成本
企业因成本问题重新评估AI部署

用Rust重写Bun

2026-07-09 07:57 UTC+8

Jarred Sumner详细介绍了使用AI编码代理将Bun从Zig重写为Rust的过程。TypeScript测试套件充当了合规套件，使得自动化移植成为可能。重写花费了约16.5万美元的API令牌，新的Rust版本已在Claude Code中上线，Linux上启动速度提升了10%。

Bun从Zig重写为Rust，使用AI编码代理完成。
TypeScript测试套件作为合规套件，支持自动化移植。

Show HN：Skillburst——让整个团队都能使用AI技能，不仅限于工程师

2026-07-09 07:48 UTC+8

Skillburst是一个平台，使非技术团队成员无需编写代码即可在Claude、Cursor或ChatGPT等AI工具中使用专家构建的工作流。它解决了工作流在聊天记录中丢失、版本过时以及非技术人员无法访问的问题。工程师通过GitHub管理工作流，而团队其他成员则可以在AI助手内部直接使用它们。平台提供同步、治理、版本控制和回滚功能。定价从免费开始，提供Pro、Business和Enterprise等级别。

Skillburst允许团队将AI工作流作为“技能”分享，非技术成员也能在常用AI工具中使用。
工程师在GitHub上管理技能，Skillburst负责同步、治理并确保所有人使用最新版本。

劫持防御性AI代理实现远程代码执行

2026-07-09 07:35 UTC+8

研究人员展示了针对Anthropic的Claude Code和OpenAI的Codex CLI的概念验证利用，通过提示注入在评估第三方库时实现远程代码执行，警告当前推动AI防御工具的举措可能引入新的安全风险。

概念验证利用通过提示注入在Claude Code和Codex CLI中实现远程代码执行。
攻击仅需默认配置的自动模式，无需额外插件或配置。

为AWS推出Claude应用网关

2026-07-09 03:49 UTC+8

今天，我们宣布为AWS推出Claude应用网关，这是一个自托管控制平面，为组织提供对Claude Code和Claude Desktop访问、成本和策略的单一控制点。本文介绍了如何使用Amazon Bedrock和AWS上的Claude平台设置和运行Claude应用网关。

Claude应用网关是一个自托管控制平面，集中管理Claude Code和Claude Desktop的访问、成本和策略。
支持通过Amazon Bedrock或AWS上的Claude平台部署，保持数据安全边界或原生体验。

JetBrains下一步不是更好的IDE——而是针对Claude Code、Codex和Gemini CLI的治理层

2026-07-09 01:44 UTC+8

JetBrains推出了AI for Teams and Organizations，在现有AI工具之上增加共享上下文、可重用的代理流程、组织范围的治理和成本控制，无需团队统一使用单一供应商。

JetBrains发布AI for Teams and Organizations，在任何AI工具之上增加治理层。
功能包括自动化、JetBrains Context（跨仓库知识）、JetBrains Central（管理控制台）和Central CLI（跟踪CLI代理）。

在多百万行代码库上基准测试编码智能体：Databricks 的实践经验

2026-07-09 00:30 UTC+8

Databricks 基于内部代码库构建了编码智能体基准测试，发现不同模型和工具组合在成本和性能上存在显著差异。关键结论包括：前沿模型（如 OpenAI、Anthropic 和开源模型）组成帕累托前沿；开源模型如 GLM 5.2 已达到顶级任务难度；每任务成本比每 token 成本更能反映实际开销；调用框架（harness）对效率和成本影响巨大。Databricks 已据此优化内部开发效率。

Databricks 创建了基于真实内部 PR 的编码基准测试，覆盖多语言百万行代码库。
模型分为三个能力层级，高智能模型昂贵但有效，中低智能模型适合常见任务。

工具承诺让懒惰学者的AI生成论文听起来更人性化

2026-07-08 23:55 UTC+8

一家初创公司推出了Academic Humanizer，旨在使AI辅助的学术写作听起来更自然、更人性化，尽管这引发了关于学术诚信的担忧。该工具使用Claude来改写AI草稿，去除AI写作痕迹，但坚持不用于生成新内容或规避审查。

Academic Humanizer专门针对论文和基金申请，通过AI改写去除AI写作痕迹。
该工具使用Claude技能，可基于用户先前作品调整风格以模仿个人笔触。

利用 Jamf 的 AI 治理和 Amazon Bedrock 在 Mac 上管理 AI 应用

2026-07-08 23:53 UTC+8

本文介绍如何使用 Jamf 的 AI 治理与 Amazon Bedrock 在整个 Mac 设备群中配置、部署和验证 AI 应用的管理设置，涵盖 Claude Code、Claude Desktop 和 OpenAI Codex 等应用。

Jamf 的 AI 治理扩展至支持 Amazon Bedrock，可集中管理 Mac 上的 AI 应用配置。
通过 Declarative Device Management (DDM) 部署配置，防止本地篡改。

你很快就能在手机上使用Claude Cowork

2026-07-08 23:20 UTC+8

Cowork向移动端和网页端的迁移，展示了人工智能如何深入人们的工作方式。

Claude Cowork正在向移动端和网页端扩展。
这一举措反映了AI在日常工作中日益重要的角色。

Gemini失败后，我在Gmail收件箱试用了Claude Cowork——它为我节省了数小时的工作

2026-07-08 23:09 UTC+8

科技记者David Gewirtz在Gmail中尝试使用Gemini进行邮件筛选未果后，转而使用Anthropic的Claude Cowork。Cowork成功识别出关于Fable 5限制的相关媒体推介和引文，并确保了发布许可，将原本需要数小时的繁琐工作缩短至几分钟的验证时间，展示了连接式AI助手应对邮件过载的潜力。

Gmail的Gemini在处理复杂邮件搜索时失败，无法理解上下文。
Claude Cowork在几分钟内识别出12个相关媒体推介，并从中筛选出8个可用的引文来源。