https://github.com/chopratejas/headroom
官方的说法是它是个给 AI agent 省 token 的"压缩中间层"。
AI agent(比如 Claude Code)干活时,要把一大堆东西塞给大模型读——工具输出、日志、报错、检索结果、文件内容、聊天历史。
这些东西又臭又长,烧token、烧钱、还容易把上下文撑爆。
Headroom 在这些内容到达大模型之前先压缩一遍,号称答案不变、token 砍掉 60–95%。
怎么做到的呢?
它是把本来要发给 api.anthropic.com 的那个 HTTP 请求体,在半路被拿下来压一遍。
你给 agent 的 prompt
工具执行结果(比如一次代码搜索返回 100 条结果)
日志、报错堆栈
RAG 检索出来的文档片段
读进来的源码文件
之前的对话历史
问题是CC是闭源的,这是怎么做到的呢?其实是开了个代理服务器
Claude Code 本身就支持一个官方环境变量 ANTHROPIC_BASE_URL,让你自定义 API 地址(原本是给企业代理/网关用的)。
Headroom 就是钻这个官方留的口子——把这个地址改成本地的127.0.0.1:8787。
于是 CC 以为自己在跟 Anthropic 说话,其实先经过了 Headroom。
Headroom 把请求里的长内容压缩掉,再原样转发给真正的 Anthropic。
它的结果强调的是压缩结构化、重复性高的内容(JSON、搜索结果、日志)压得越狠(90%+),而信息密度高的散文/源码,压得越少(40%多),不算吹,还算是良心。
本地运行,用rust,针对性压缩,数据很华丽,但是具体如何还是要自己做。
https://github.com/affaan-m/ECC
https://github.com/D4Vinci/Scrapling
它是怎么做到高性能的爬虫的,跟别的爬虫框架有什么区别
https://github.com/odoo/odoo
https://github.com/pbakaus/agent-reviews
https://github.com/pbakaus/impeccable
https://github.com/pbakaus/radiant