AI News HubLIVE
サイト内リライト2 分で読了

Headroom – AIエージェントのためのコンテキスト圧縮レイヤー

Headroomは、AIエージェントがツール出力、ログ、RAGチャンク、ファイル、会話履歴を読み取る前に圧縮するオープンソースツールです。トークンを60〜95%削減しつつ、回答の正確性を維持します。ライブラリ、プロキシ、エージェントラップ、MCPサーバーなど複数のモードを提供し、可逆圧縮とクロスエージェントメモリを備えています。

ソースHacker News AI著者: sibellavia

Headroomは、AIエージェントがツール出力、ログ、RAGチャンク、ファイル、会話履歴を読み取る前にコンテキストを圧縮するオープンソースのレイヤーです。これにより、大規模言語モデルに送信されるトークン数を大幅に削減しながら、回答の正確性を維持します。実際のテストでは、コード検索で17,765トークンから1,408トークン(92%削減)、SREインシデントデバッグで65,694トークンから5,118トークン(92%削減)など、60〜95%の圧縮率を達成しています。

Headroomはさまざまな環境に対応する複数のモードを提供します:

  • ライブラリモード:PythonまたはTypeScriptアプリで直接compress(messages)を呼び出します。
  • プロキシモードheadroom proxy --port 8787でHTTPプロキシを起動し、コード変更なしで統合。
  • エージェントラップheadroom wrap claude|codex|cursor|aider|copilotのコマンドで一般的なAIエージェントをラップ。
  • MCPサーバーheadroom_compressheadroom_retrieveheadroom_statsツールを提供し、任意のMCPクライアントから利用可能。

Headroomの核となる仕組みは、コンテンツルーター(ContentRouter)がコンテンツタイプを自動検出し、適切な圧縮器(JSON用SmartCrusher、AST認識CodeCompressor、テキスト用Kompress-base)を選択することです。キャッシュアライナー(CacheAligner)はプロバイダのKVキャッシュを活用するためにプレフィックスを安定化し、可逆圧縮(CCR)は元のデータをローカルに保存し、LLMが必要に応じてheadroom_retrieveで取得できるようにします。

さらに、出力トークン削減(Output Token Reduction)機能により、システムプロンプトに簡潔指示を追加し、ルーチン手順の思考深度を下げることで、モデルが生成する冗長な応答を削減します。この機能はデフォルトでオフですが、環境変数HEADROOM_OUTPUT_SHAPER=1で有効化できます。Headroomは学習機能も備えており、headroom learn --verbosityで過去のセッションからユーザーの好みを自動的に学習し、適切な簡潔レベルを設定します。

HeadroomはAnthropic SDK、OpenAI SDK、Vercel AI SDK、LiteLLM、LangChain、Agnoなど、主要なフレームワークやツールと統合可能です。GitHub Copilot CLIサブスクリプションユーザー向けの専用認証とルーティングもサポートしています。

このプロジェクトはGitHubでオープンソースとして公開されており、45,000以上のスターと3,200以上のフォークを獲得しています。インストールはpipまたはnpmで簡単に行え、Python 3.10+またはNode.js環境が必要です。