2026-06-22 16:50 UTC+9サイト内リライト2 分で読了更新: 2026-06-22 17:02 UTC+9

Headroom – AIエージェントのためのコンテキスト圧縮レイヤー

Headroomは、AIエージェントがツール出力、ログ、RAGチャンク、ファイル、会話履歴を読み取る前に圧縮するオープンソースツールです。トークンを60〜95%削減しつつ、回答の正確性を維持します。ライブラリ、プロキシ、エージェントラップ、MCPサーバーなど複数のモードを提供し、可逆圧縮とクロスエージェントメモリを備えています。

ソースHacker News AI著者: sibellavia

記事インテリジェンス

エンジニア上級

要点

HeadroomはAIエージェントがコンテキストを読み取る前に圧縮し、平均60〜95%のトークンを削減します。
Python/TypeScriptライブラリ、HTTPプロキシ、エージェントラップ（Claude Code、Cursorなど）、MCPサーバーなど、複数の統合方法をサポート。
可逆圧縮（CCR）により、元のデータを正確性を損なうことなく取得可能。
出力トークン削減機能でモデルの冗長な応答をカットし、さらなる節約を実現。

重要な理由

このニュースが重要なのは、HeadroomはAIエージェントがコンテキストを読み取る前に圧縮し、平均60〜95%のトークンを削減しますためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Headroomは、AIエージェントがツール出力、ログ、RAGチャンク、ファイル、会話履歴を読み取る前にコンテキストを圧縮するオープンソースのレイヤーです。これにより、大規模言語モデルに送信されるトークン数を大幅に削減しながら、回答の正確性を維持します。実際のテストでは、コード検索で17,765トークンから1,408トークン（92%削減）、SREインシデントデバッグで65,694トークンから5,118トークン（92%削減）など、60〜95%の圧縮率を達成しています。

Headroomはさまざまな環境に対応する複数のモードを提供します：

ライブラリモード：PythonまたはTypeScriptアプリで直接compress(messages)を呼び出します。
プロキシモード：headroom proxy --port 8787でHTTPプロキシを起動し、コード変更なしで統合。
エージェントラップ：headroom wrap claude|codex|cursor|aider|copilotのコマンドで一般的なAIエージェントをラップ。
MCPサーバー：headroom_compress、headroom_retrieve、headroom_statsツールを提供し、任意のMCPクライアントから利用可能。

Headroomの核となる仕組みは、コンテンツルーター（ContentRouter）がコンテンツタイプを自動検出し、適切な圧縮器（JSON用SmartCrusher、AST認識CodeCompressor、テキスト用Kompress-base）を選択することです。キャッシュアライナー（CacheAligner）はプロバイダのKVキャッシュを活用するためにプレフィックスを安定化し、可逆圧縮（CCR）は元のデータをローカルに保存し、LLMが必要に応じてheadroom_retrieveで取得できるようにします。

さらに、出力トークン削減（Output Token Reduction）機能により、システムプロンプトに簡潔指示を追加し、ルーチン手順の思考深度を下げることで、モデルが生成する冗長な応答を削減します。この機能はデフォルトでオフですが、環境変数HEADROOM_OUTPUT_SHAPER=1で有効化できます。Headroomは学習機能も備えており、headroom learn --verbosityで過去のセッションからユーザーの好みを自動的に学習し、適切な簡潔レベルを設定します。

HeadroomはAnthropic SDK、OpenAI SDK、Vercel AI SDK、LiteLLM、LangChain、Agnoなど、主要なフレームワークやツールと統合可能です。GitHub Copilot CLIサブスクリプションユーザー向けの専用認証とルーティングもサポートしています。

このプロジェクトはGitHubでオープンソースとして公開されており、45,000以上のスターと3,200以上のフォークを獲得しています。インストールはpipまたはnpmで簡単に行え、Python 3.10+またはNode.js環境が必要です。