AI News HubLIVE
サイト内リライト3 分で読了

Junie:JetBrainsのAIコーディングエージェントがベータ版を卒業

JetBrainsは、AIコーディングエージェントJunieの一般提供開始を発表。高度な計画モード、エージェントデバッグ、リモートコントロール、深いIDE統合を特徴とする。SWE-Rebenchでトップのコーディングエージェントと評価された。

ソースHacker News AI著者: roflcopter69

JunieはJetBrainsが開発したAIコーディングエージェントで、このたびベータ版を卒業し、一般提供が開始されました。これは単なる名称変更や再パッケージ化ではなく、最も重要な機能が安定化・連携され、実際の開発作業に備えたものです。Junieはコードを書く前に計画を立て、実際のデバッガを使ってデバッグし、プロジェクトのコンテキストを考慮してプルリクエストをレビューし、他の作業に集中している間に長時間のタスクを実行します。

最新のSWE-Rebench独立エージェントベンチマークで、Junieはトップのコーディングエージェントにランクされ、61.6%の解決率、pass@5で72.7%を達成し、他のエージェントを上回り、最先端モデルと競合しました。JetBrainsは、エージェントへの作業委任は、たまの特別なタスクだけでなく、日常的に手軽に行えるべきだと強調します。そのため、Junieは任意のモデルをサポートし、ロックインはありません。ユーザーは最適なモデルを選択してコストを制御できます。

高度な計画モードはJunieの大きな特徴です。コードを書く前に、Junieは製品要件、技術設計、納品段階、テスト戦略を含む構造化ドキュメントを生成します。ユーザーはエディタで直接ドキュメントを読み、編集し、承認した後、Junieが実装を開始します。これにより、エージェントが誤った方向に進んでトークンを無駄にすることを防ぎます。計画は強力なモデルで行い、実装は安価なモデルで行うことでコストを抑えます。

エージェントデバッグ機能により、Junieは人間の開発者のようにIDEのデバッガを使用できます。デバッグセッションの開始や参加、ブレークポイントの設定、ランタイム状態(スタックフレーム、スレッド状態、式評価)の検査が可能です。これにより、「2回目の反復でのみ失敗するテストをデバッグして原因を特定する」といった自律的なデバッグや、ユーザーとの協調作業が実現します。

リモートコントロール機能を使えば、ラップトップからタスクを開始し、会議中にスマートフォンで進捗を確認し、コーヒーを飲みながら結果をレビューできます。Junieは非同期で動作し、セッションはどこからでもアクセス可能です。

コードレビューでは、Junieはコードを書くときと同じプロジェクトコンテキスト(ビルド、テスト、規約、過去の決定)を使用します。GitHub ActionsやGitLabから、あるいはCLIからレビューをトリガーでき、インタラクティブなウォークスルーで各変更の意味を説明し、インラインで承認/拒否のコントロールを提供します。

深いIDE統合はAgent Communication Protocol (ACP)に基づいており、同じエージェントエンジンがAIチャット、専用のJunieツールウィンドウ、CLIを駆動します。JunieはIDEのセマンティックインデックス、ビルド設定、テストランナー、デバッガをそのまま使用します。さらに、IDEで設定されたデータベースに接続し、DataGripなどを通じて実際のデータをクエリし、SQLを記述・修正・検証できます。

これらの機能は個別に特定の問題を解決しますが、組み合わさることでエージェントの役割を変えます。プロジェクトを理解し、作業前に承認を得られ、他のことをしている間にタスクを実行し、問題が起きれば適切にデバッグし、完全なプロジェクトコンテキストでプルリクエストをレビューし、実際のデータをクエリできるエージェントこそ、真に委任可能なエージェントです。これがJetBrainsがベータ版を卒業するための基準でした。

JunieはすべてのJetBrains IDEおよびターミナルで利用可能です。既にJetBrains AIサブスクリプションをお持ちの場合はそのまま使用できます。また、Bring Your Own Keyにも対応し、LiteLLM、LMStudio、Ollamaなどのローカルモデルランタイムに接続でき、プロンプトとコードは外部に共有されません。インストールしてプロジェクトを開き、実際のタスクでテストしてみてください。そして、フィードバックをお寄せください。