AI News HubLIVE
站內改寫2 分鐘閱讀

Junie:JetBrains 的 AI 程式設計代理退出測試階段

JetBrains 宣佈 AI 程式設計代理 Junie 正式上線,具備高階規劃模式、代理除錯、遠端控制和深度 IDE 整合。Junie 在 SWE-Rebench 基準測試中被評為最佳程式設計代理。

來源Hacker News AI作者: roflcopter69

Junie 是 JetBrains 推出的一款 AI 程式設計代理,近日正式退出測試階段,成為通用產品。它不是簡單的重新命名或重新包裝,而是將最核心的功能穩定化、互聯化,為實際開發工作做好準備。Junie 在編碼前會進行規劃,使用真實的偵錯程式進行除錯,在審查拉取請求時會考慮專案上下文,並且可以在你專注於其他事情的同時執行長期任務。

在最新的 SWE-Rebench 獨立代理基準測試中,Junie 被評為排名第一的程式設計代理,解決了 61.6% 的任務,pass@5 達到 72.7%,超越其他代理,與原始前沿模型競爭。JetBrains 強調,將工作委託給代理應該是一種可以經常負擔得起的操作,而不是僅用於一次性的英雄任務。因此,Junie 支援任何模型,沒有鎖定,使用者可以透過選擇合適的模型來控制成本——無論是使用最新的前沿模型還是本地執行的小模型。

高階規劃模式是 Junie 的一大亮點。在編寫程式碼之前,Junie 會生成一份結構化文件,包含產品需求、技術設計、交付階段和測試策略(如果需要)。使用者可以直接在編輯器中閱讀、編輯和批准該計劃,然後 Junie 才會開始實現。這避免了代理盲目實施錯誤方案而浪費令牌的問題。規劃使用強模型,實現則使用便宜模型,從而降低成本。

代理除錯功能讓 Junie 能夠像人類開發者一樣使用 IDE 的偵錯程式。它可以啟動或加入除錯會話、設定斷點、檢查執行時狀態,包括堆疊幀、執行緒狀態和表示式求值。這使 Junie 能夠自主除錯,例如“除錯並找出為什麼測試只在第二次迭代失敗”,或者與使用者協作。

遠端控制功能允許使用者從筆記型電腦啟動任務,然後在會議期間從手機檢查進度,最後審查結果。Junie 非同步執行,會話可從任何登入的地方訪問。

程式碼審查方面,Junie 在審查時使用與編寫程式碼時相同的專案上下文,包括構建、測試、慣例和過去的決策。支援從 GitHub Actions、GitLab 或 CLI 觸發審查,並提供互動式講解,突出每個有意義的變化,給出接受/拒絕控制。

深度 IDE 整合基於 Agent Communication Protocol (ACP),使同一個代理引擎驅動 AI 聊天、專用 Junie 工具視窗和 CLI。Junie 使用 IDE 的語義索引、構建配置、測試執行器和偵錯程式,而不是自己的近似版本。此外,Junie 還可以連線到 IDE 中配置的資料庫,透過 DataGrip 等工具查詢真實資料並編寫、修復和驗證 SQL。

總的來說,這些功能共同改變了代理的用途:一個理解你的專案、讓你在實施前批准工作、在你做其他事情時執行任務、正確除錯問題、以完整專案上下文審查拉取請求並查詢真實資料的代理,才是真正可以委派的代理。這就是 JetBrains 設定離開測試階段的門檻。

Junie 現已可在所有 JetBrains IDE 和終端中使用。如果已有 JetBrains AI 訂閱,可直接使用。也支援自帶金鑰,連線本地模型執行時如 LiteLLM、LMStudio、Ollama,提示和程式碼不會外洩。安裝後,開啟專案,測試一個實際任務,然後反饋給 JetBrains。