GitHub Copilotエージェントハーネスのモデルとタスクにわたる性能と効率の評価
GitHub Copilotエージェントハーネスは、複数のベンチマークでモデルベンダーハーネスと同等のタスク完了率を達成しつつ、トークン消費が少なく、20以上のモデルをサポートします。
- GitHub Copilotエージェントハーネスは、SWE-benchなどのベンチマークでモデルベンダーハーネスと同等の解決率を示し、トークン消費が少ない。
- GPT、Claude、Geminiなど20以上のモデルをサポートし、コストと能力のトレードオフが可能。
仕事を自動化したら、より良いリーダーになれた
GitHubのシニアディレクターが、40の自動化を使ってワークフローを管理し、本当に重要なことに集中できるようになった経験を共有。会議準備、フォローアップ、チームの調整などを自動化することで、特にAuDHD(自閉症スペクトラムと注意欠陥多動性障害の併発)を持つ彼女にとって、自動化は不可欠なアクセシビリティツールとなっている。
- 自動化は人間関係を置き換えるものではなく、リーダーがチームに十分に関わる余裕を作るもの
- 最も摩擦の大きい一点(例:会議準備)から始め、そこから拡張する
内部データ分析エージェントの構築方法
GitHub の社内 Copilot 搭載分析エージェント Qubot は、従業員が自然言語でデータについて質問できるようにします。本記事では、その構築方法と学びを紹介します。
- Qubot は Slack、VS Code、Copilot CLI 経由で利用可能で、探索的なデータ分析を可能にします。
- コンテキストレイヤーが精度と応答速度の鍵であり、構造化されたコンテキストにより Qubot は3倍高速化しました。
各トークンからより多くの価値を引き出す:Copilot がコンテキスト処理とモデルルーティングを改善する方法
GitHub Copilot は、プロンプトキャッシュとオンデマンドツール読み込みにより冗長なコンテキストを削減し、タスクの意図とモデルのリアルタイム健全性に基づいて最適なモデルを選択する Auto モデル選択を導入することで、品質を犠牲にすることなくクレジットを節約します。
- プロンプトキャッシュとツール検索により、ターンごとの冗長なコンテキストが削減されます。
- Auto モデル選択は、タスクの意図とモデルの健全性を使用して適切なモデルを選択します。
初心者向けGitHub Copilot CLI:一般的なスラッシュコマンドの概要
GitHub Copilot CLIのスラッシュコマンドを使用して、モデルの切り替え、コンテキスト管理、セッションの再開、変更の検査、ディレクトリの移動、権限のリセットを行う方法を学びます。
- スラッシュコマンドは、モデル選択、コンテキスト管理、セッション処理を制御します。
- /model を使って、能力、可用性、コストに基づいて適切なモデルを選択します。
多言語AIを構築する研究者と開発者を加速する新しいオープンデータセット
GitHubがGitHub Multilingual Repositories Dataset(CC0-1.0)を公開。4000万以上のリポジトリにわたる8000万以上の分類行を含むメタデータセットで、README、Issue、プルリクエストの言語分類を提供し、多言語開発者コンテンツの発見とAIツールの開発を促進する。
- データセットはREADME、Issue、PRの言語分類を3つの分類器(fastText、gcld3、lingua-py)の信頼度スコアとともに提供。
- 4000万以上のリポジトリ、8000万以上の分類行をカバー。Issueでは韓国語、READMEではポルトガル語が最も多い。
GitHub Copilot CLIの委任の選択性を高めた方法
GitHub Copilot CLIは、よりスマートなサブエージェント委任により、不要な引き継ぎや待機時間を削減しました。本番A/Bテストでは、ツール障害が23%減少し、ユーザー待機時間が5%改善されました。記事では、委任のボトルネックの特定、オーケストレーションポリシーの改良、および検証プロセスを詳しく説明しています。
- Copilot CLIは、真に価値を生む場合にのみサブエージェントに委任するようになった。
- 本番A/Bテストの結果:ツール障害23%減、P95待機時間5%減。
シークレットスキャンの信頼性向上:大規模な誤検出削減
GitHubはLLMベースのコンテキスト検証を導入し、シークレットスキャンの誤検出率を75.76%削減。アラートの信頼性と開発者の信頼を向上させました。
- GitHubはMicrosoft Security & AIと協力し、コンテキスト認識型LLM推論による検証を実装。
- コードベース全体ではなく、API呼び出しや認証ヘッダーなどの高シグナルコンテキストを抽出。
言語サーバーでGitHub Copilot CLIに真のコードインテリジェンスを
GitHub Copilot CLIにLSPサーバーをインストール・設定することで、力任せのgrepや逆コンパイルから脱却し、真のコードインテリジェンスを実現します。LSPセットアップスキルは14の言語に対応し、自動化を提供します。本記事ではその仕組みと開始方法を解説します。
- GitHub Copilot CLIは以前、テキスト検索やバイナリ抽出でコードを理解しており、非効率的で不正確だった。
- LSPセットアップスキルは14言語のLSPサーバーのインストールと設定を自動化する。
単発のプロンプトからワークフローへ:GitHub Copilot CLI でカスタムエージェントを使用する方法
GitHub Copilot CLI にカスタムエージェント機能が導入され、開発者はMarkdownファイルでエージェントプロファイルを定義し、チームのコンテキストを繰り返し可能でレビュー可能なワークフローにエンコードできます。本記事では、カスタムエージェントの概念、作成方法、使用例(セキュリティ監査、IaCコンプライアンス、リリースドキュメント生成)を詳しく説明します。
- カスタムエージェントはYAMLフロントマター付きのMarkdownファイルで定義され、役割、ツール、ガードレール、出力形式を指定します。
- エージェントプロファイルはリポジトリの.github/agentsディレクトリに保存され、バージョン管理とチームレビューが可能です。
GitHubがGartner® Magic Quadrant™エンタープライズAIコーディングエージェント部門で3年連続リーダーに選出
GitHub Copilotは14万組織に利用され、年間成長率100%超。GartnerはGitHubを3年連続リーダーに位置付け、実行能力で最高評価。
- GitHubがGartnerマジッククアドラントで3年連続リーダーに
- GitHub Copilotは14万組織が利用、前年比3倍
ローカルGitHubセッションをどこでも操作
GitHub Copilot CLIセッションのリモートコントロールがgithub.comとGitHub Mobileで一般提供開始。VS CodeやCLIでセッションを開始し、スマートフォンなど他のデバイスから監視・調整できます。リアルタイム監視、途中での指示変更、権限承認など、プライバシーを保ったままクロスデバイスワークフローを実現します。
- GitHub Copilot CLIセッションのリモートコントロールがgithub.comとGitHub MobileでGAに。
- VS CodeとJetBrains IDEでもリモートコントロール対応、複数サーフェスでのワークフローを実現。
汎用アクセシビリティエージェントの構築 – その過程で学んだこと
GitHub は、エンジニアにリアルタイムのアクセシビリティ回答を提供し、本番環境に送られる前に簡単な問題を自動的に修正する実験的な汎用アクセシビリティエージェントを試験運用中です。このエージェントは 3,535 件のプルリクエストをレビューし、68% の解決率を達成。トップ 5 の問題は、構造の明確化、コントロールの命名、通知、テキスト代替、キーボードフォーカスの順序です。記事では、マインドセット、過去の課題の活用、サブエージェントアーキテクチャ、線形命令実行、テンプレート化されたコンテンツの受け渡し、複雑性とリスクパターンの処理に関する教訓を共有しています。
- GitHub が汎用アクセシビリティエージェントを試験運用中。エンジニア支援と一般的な問題の自動修正を目指す。
- エージェントは 3,535 件の PR をレビューし、解決率 68%。主な問題は構造、命名、通知、テキスト代替、キーボード操作。
ダンジョン&デスクトップ:GitHub Copilot CLI で手続き型生成ローグライクを構築する
あるHubberがGitHub Copilot CLIを使って、任意のコードベースをユニークなローグライクダンジョンに変える拡張機能を構築した方法を紹介します。BSPアルゴリズムによる手続き型生成、/delegateコマンドの活用法、インストール方法などを詳しく解説。
- GitHub Dungeons は、リポジトリの最新コミットハッシュをシードとしてBSPでダンジョンを生成するターミナルゲームです。
- Copilot CLI の /delegate を使うと、タスクを非同期で処理でき、開発者はゲームデザインに集中できます。
GitHub Agentic Workflowsにおけるトークン効率の改善
GitHubはAPIプロキシによるログ記録、自動監査・最適化ワークフローの構築、未使用MCPツールの削除、CLIへの置き換えなどを通じて、エージェンティックワークフローのトークン消費を最大62%削減しました。
- GitHubはAPIプロキシを使用してトークン使用状況を統一フォーマットで記録し、毎日の監査・最適化ワークフローを開発した。
- 未使用のMCPツールの除去により、呼び出しごとのコンテキストサイズが8–12KB削減され、数千トークンを節約。
エージェントのプルリクエストはどこにでもあります。そのレビュー方法をご紹介します。
AIコーディングアシスタントの普及に伴い、エージェント生成コードのレビューが新たな課題となっています。CIの弱体化、コードの重複、幻影的な正しさなどの危険信号を特定し、体系的なレビュープロセスを提供する実践的なガイドです。
- エージェント生成コードは一見きれいでも技術的負債を隠しているため、レビュアーはより注意深くチェックする必要がある。
- レビューではCIの弱体化、コードの重複、ロジックの正確性、セキュリティを重点的に確認する。
「正しい」が決定的でない場合のエージェント動作の検証
従来のテスト手法は非決定的環境で誤警報を頻発します。本記事では、支配分析を用いた構造的検証フレームワーク「トラストレイヤー」を提案し、重要な成果と環境ノイズを区別してAIエージェントの信頼性を高める方法を解説します。
- 現在のテストツールは決定的な振る舞いを前提としており、エージェント駆動ワークフローで偽陰性を引き起こす。
- トラストレイヤーはプレフィックスツリーアクセプタと支配分析を用いて必須状態を抽出する。
GitHub Copilot CLI 初心者向け:インタラクティブモードと非インタラクティブモード
CLIのインタラクティブモードと非インタラクティブモードの違いを学びます。インタラクティブモードはチャットのような体験で深いコラボレーションに、非インタラクティブモードは迅速な単発の回答に適しています。
- インタラクティブモードはデフォルトで、対話と反復が可能。
- 非インタラクティブモードは -p フラグを使用し、セッションに入らずに素早く回答を得る。
GitHub Copilot CLI で絵文字リスト生成ツールを作ろう
Rubber Duck Thursday の配信で、GitHub チームが GitHub Copilot CLI を使って AI を活用した絵文字リスト生成ツールを構築しました。ターミナルで動作し、箇条書きを貼り付けて Ctrl+S を押すと、関連する絵文字に変換されてクリップボードにコピーされます。OpenTUI、Copilot SDK、clipboardy を使用して構築されており、オープンソースです。
- Rubber Duck Thursday の配信でライブ構築
- GitHub Copilot CLI のプランモードとオートパイロットモードを使用
GitHub Copilot CLI で個人用組織コマンドセンターを構築する
GitHub エンジニアの Brittany Ellich は、AI のサポートを受け、アイデアから実装までわずか 1 日で個人用組織コマンドセンターを構築し、散在するアプリケーションを統合しました。Copilot を使用した計画と実装の経験、そして使用したツールスタックとアドバイスを共有します。
- Brittany Ellich はデジタル断片化を解決するため、個人用組織コマンドセンターを構築した。
- AI で計画を立て、GitHub Copilot で実装し、v1 を 1 日で完成させた。
AIエージェントをハックせよ:GitHub Secure Code GameでエージェンティックAIセキュリティスキルを構築
GitHub Secure Code Game第4シーズンはエージェンティックAIセキュリティに焦点を当て、5つの段階的なチャレンジを通じて現実世界の脆弱性を発見・悪用する方法を学びます。無料のオープンソースゲームで、すでに10,000人以上の開発者がスキル向上に活用しています。
- 第4シーズンはエージェンティックAIのセキュリティ脆弱性を扱う。
- プレイヤーは自然言語で故意に脆弱なAIアシスタントを操作する。
GitHub Copilot CLI 初心者向けガイド:始め方
このチュートリアルでは、GitHub Copilot CLI の基本概念、インストール方法、認証、フォルダ権限の設定、一般的なユースケースを説明し、開発者がターミナルから直接AIコーディングアシスタントを活用できるようにします。
- GitHub Copilot CLI はエージェント型AIをターミナルに導入し、自律的なコード構築とテストをサポートします。
- npm、WinGet、Homebrewでインストール可能。初回使用時はGitHubアカウントでのログインが必要です。
GitHub Copilot CLI、モデルファミリーを組み合わせてセカンドオピニオンを提供
GitHub Copilot CLI が実験的機能「Rubber Duck」を導入。異なるAIファミリーのモデルを独立したレビュアーとして活用し、エージェントの計画や作業を評価する。評価結果では、Claude Sonnet + Rubber Duck が Sonnet と Opus 単体間の性能差の 74.7% を埋め、複雑なマルチファイルタスクで顕著な改善を示した。
- Rubber Duck は異なるモデルファミリーによるセカンドオピニオンを提供し、単一モデルの盲点を補う。
- Sonnet + Rubber Duck は Opus 単体に対する性能差の 74.7% を達成し、困難なタスクで特に有効。
Copilot CLIの/fleetで複数のエージェントを同時に実行する
GitHub Copilot CLIに/fleetが登場。複数のAIサブエージェントを並列で調整し、異なるファイルに対して同時に作業を行います。効果的なプロンプトの書き方、依存関係の宣言、よくある落とし穴について学びましょう。
- /fleetはタスクを並列作業項目に分解し、サブエージェントをディスパッチします。
- 具体的なプロンプトを書き、ファイルの境界と依存関係を明示します。
Copilot Applied Scienceにおけるエージェント駆動開発
AI研究者がGitHub Copilotを使ってコーディングエージェントを構築し、反復的な分析タスクを自動化しました。主要な戦略として、会話的で冗長なプロンプト、頻繁なリファクタリングとドキュメント更新、プロセスを責める文化を共有。チームは3日未満で11のエージェント、4つのスキル、新しいワークフローを生み出しました。
- Copilot CLIとClaude Opus 4.6モデルを使用してコーディングエージェントを構築し、反復的な分析タスクを自動化。
- 主要戦略:会話的で詳細なプロンプト、定期的なリファクタリングとドキュメント更新、エージェントではなくプロセスを責める反復哲学。
Copilot SDK を使用した AI を活用した GitHub Issue トリアージの構築
この記事では、GitHub Copilot SDK を React Native アプリに統合し、AI による Issue 要約を生成する方法を紹介します。サーバーサイド統合アーキテクチャ、SDK のライフサイクル管理、プロンプトエンジニアリングのコツ、およびグレースフルデグラデーション戦略について詳しく説明します。
- Copilot SDK はサーバーサイドで実行する必要があります。CLI バイナリと Node.js ランタイムに依存するためです。
- プロンプトにラベルや作成者などのメタデータを構造化して含めると、生のテキストよりも要約品質が大幅に向上します。