AI News HubLIVE
站内改写2 分钟阅读

Junie:JetBrains 的 AI 编程代理退出测试阶段

JetBrains 宣布 AI 编程代理 Junie 正式上线,具备高级规划模式、代理调试、远程控制和深度 IDE 集成。Junie 在 SWE-Rebench 基准测试中被评为最佳编程代理。

来源Hacker News AI作者: roflcopter69

Junie 是 JetBrains 推出的一款 AI 编程代理,近日正式退出测试阶段,成为通用产品。它不是简单的重命名或重新包装,而是将最核心的功能稳定化、互联化,为实际开发工作做好准备。Junie 在编码前会进行规划,使用真实的调试器进行调试,在审查拉取请求时会考虑项目上下文,并且可以在你专注于其他事情的同时运行长期任务。

在最新的 SWE-Rebench 独立代理基准测试中,Junie 被评为排名第一的编程代理,解决了 61.6% 的任务,pass@5 达到 72.7%,超越其他代理,与原始前沿模型竞争。JetBrains 强调,将工作委托给代理应该是一种可以经常负担得起的操作,而不是仅用于一次性的英雄任务。因此,Junie 支持任何模型,没有锁定,用户可以通过选择合适的模型来控制成本——无论是使用最新的前沿模型还是本地运行的小模型。

高级规划模式是 Junie 的一大亮点。在编写代码之前,Junie 会生成一份结构化文档,包含产品需求、技术设计、交付阶段和测试策略(如果需要)。用户可以直接在编辑器中阅读、编辑和批准该计划,然后 Junie 才会开始实现。这避免了代理盲目实施错误方案而浪费令牌的问题。规划使用强模型,实现则使用便宜模型,从而降低成本。

代理调试功能让 Junie 能够像人类开发者一样使用 IDE 的调试器。它可以启动或加入调试会话、设置断点、检查运行时状态,包括堆栈帧、线程状态和表达式求值。这使 Junie 能够自主调试,例如“调试并找出为什么测试只在第二次迭代失败”,或者与用户协作。

远程控制功能允许用户从笔记本电脑启动任务,然后在会议期间从手机检查进度,最后审查结果。Junie 异步运行,会话可从任何登录的地方访问。

代码审查方面,Junie 在审查时使用与编写代码时相同的项目上下文,包括构建、测试、惯例和过去的决策。支持从 GitHub Actions、GitLab 或 CLI 触发审查,并提供交互式讲解,突出每个有意义的变化,给出接受/拒绝控制。

深度 IDE 集成基于 Agent Communication Protocol (ACP),使同一个代理引擎驱动 AI 聊天、专用 Junie 工具窗口和 CLI。Junie 使用 IDE 的语义索引、构建配置、测试运行器和调试器,而不是自己的近似版本。此外,Junie 还可以连接到 IDE 中配置的数据库,通过 DataGrip 等工具查询真实数据并编写、修复和验证 SQL。

总的来说,这些功能共同改变了代理的用途:一个理解你的项目、让你在实施前批准工作、在你做其他事情时运行任务、正确调试问题、以完整项目上下文审查拉取请求并查询真实数据的代理,才是真正可以委派的代理。这就是 JetBrains 设定离开测试阶段的门槛。

Junie 现已可在所有 JetBrains IDE 和终端中使用。如果已有 JetBrains AI 订阅,可直接使用。也支持自带密钥,连接本地模型运行时如 LiteLLM、LMStudio、Ollama,提示和代码不会外泄。安装后,打开项目,测试一个实际任务,然后反馈给 JetBrains。