Highlights
- 1トークンを60〜95%削減
- 2回答品質を維持
- 3library/proxy/MCPサーバー対応
Overview
headroomは、ツール出力、ログ、ファイル、RAGチャンクをLLMに届く前に圧縮してトークン使用量を大幅に削減するプロジェクトです。READMEにある通り「Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.」という方針で、ライブラリとして組み込む方法のほか、プロキシ経由やMCPサーバーとして運用できる実装を提供します。