AI News HubLIVE
站内改写2 分で読了

Headroom:AIエージェントが読み取るすべてのコンテキストをLLM到達前に圧縮、トークンコストを50〜90%削減

Headroomはオープンソースのコンテキスト圧縮レイヤーで、AIエージェントが読み取る全てのコンテンツ(ツール出力、ログ、RAGチャンク、ファイル、会話履歴)をLLMに送る前に圧縮し、トークン使用量を50〜90%削減します。ライブラリ、プロキシ、エージェントラッパー、MCPサーバーなど複数の統合モードを提供し、Claude Code、Codex、Cursorなどの主要エージェントをサポート。ベンチマークでも精度を維持しており、コミュニティ全体で600億トークン以上の削減を達成しています。

ソースHacker News AI著者: mooreds

Headroomは、AIエージェントと大規模言語モデル(LLM)の間で発生するトークン消費を劇的に削減するオープンソースのコンテキスト圧縮レイヤーです。このツールは、AIエージェントが読み取るあらゆる情報(ツール出力、ログ、RAG(検索拡張生成)チャンク、ファイル、会話履歴)をLLMに送信する前に圧縮し、APIコストを大幅に低減しながら回答の品質を維持します。

Headroomは、さまざまな統合方法を提供します。PythonまたはTypeScriptライブラリとして既存のアプリケーションに組み込む(compress(messages)関数)、プロキシモード(headroom proxy --port 8787)でコード変更なしに使用する、headroom wrapコマンドでClaude Code、Codex、Cursor、Aiderなどの人気のコーディングエージェントをラップする、またはMCP(Model Context Protocol)サーバーとして任意のMCPクライアントと連携することができます。

圧縮の仕組みは、コンテンツルーターと複数の専用圧縮アルゴリズムに基づいています。ContentRouterがコンテンツタイプ(JSON、コード、テキストなど)を自動検出し、最適な圧縮器を選択します:SmartCrusherは汎用JSON用、CodeCompressorはAST(抽象構文木)ベースで複数のプログラミング言語のコードを圧縮、Kompress-baseはエージェントトレース向けに学習されたHuggingFaceモデルです。CacheAlignerはプロバイダ(Anthropic、OpenAIなど)のKVキャッシュのヒット率を高めるため、プレフィックスを安定化します。特に注目すべきは、可逆圧縮(CCR)機能です。元のデータは決して削除されず、LLMが必要に応じてheadroom_retrieveツールで取得できます。

性能面では、実際のエージェントワークロードで顕著な圧縮率を示しています。コード検索では17,765トークンから1,408トークン(92%削減)、SREインシデントデバッグでは65,694から5,118(92%削減)、GitHub issueトリアージでは54,174から14,761(73%削減)となりました。標準ベンチマークでは精度が維持され、GSM8K(数学)で0.870、TruthfulQA(事実性)で0.530から0.560に向上しました。さらに、Headroomはエージェント間共有メモリを提供し、Claude、Codex、Geminiなどの複数エージェントがコンテキストを共有し、自動重複排除を行えるため、コラボレーション効率が向上します。

Headroomはchopratejasによってメンテナンスされ、Apache 2.0ライセンスで提供されています。Python 3.10以上が必要で、pip、npm、またはDockerでインストール可能です。コミュニティ全体で600億トークン以上の削減を達成しており、リアルタイムのリーダーボードで節約量を追跡できます。日々AIコーディングエージェントを利用する開発者にとって、コードを変更せずにコストを大幅に削減できる手段として、Headroomは有力な選択肢です。