福生无量摸鱼天尊

每日github项目解析:(一)20260604

2026/06/04
0
0

headroom

https://github.com/chopratejas/headroom

官方的说法是它是个给 AI agent 省 token 的"压缩中间层"。

  • AI agent(比如 Claude Code)干活时,要把一大堆东西塞给大模型读——工具输出、日志、报错、检索结果、文件内容、聊天历史。

  • 这些东西又臭又长,烧token、烧钱、还容易把上下文撑爆。

  • Headroom 在这些内容到达大模型之前先压缩一遍,号称答案不变、token 砍掉 60–95%。

怎么做到的呢?

它是把本来要发给 api.anthropic.com 的那个 HTTP 请求体,在半路被拿下来压一遍。

  • 你给 agent 的 prompt

  • 工具执行结果(比如一次代码搜索返回 100 条结果)

  • 日志、报错堆栈

  • RAG 检索出来的文档片段

  • 读进来的源码文件

  • 之前的对话历史

问题是CC是闭源的,这是怎么做到的呢?其实是开了个代理服务器

flowchart LR CC["Claude Code<br/>(闭源, 不动它)"] HR["Headroom 本地代理<br/>127.0.0.1:8787<br/>压缩 + 缓存对齐"] API["api.anthropic.com<br/>(真正的大模型)"] CC -->|"① 请求 (被 ANTHROPIC_BASE_URL 重定向)"| HR HR -->|"② 压缩后转发"| API API -->|"③ 回复"| HR HR -->|"④ 透传回去"| CC

Claude Code 本身就支持一个官方环境变量 ANTHROPIC_BASE_URL,让你自定义 API 地址(原本是给企业代理/网关用的)。

Headroom 就是钻这个官方留的口子——把这个地址改成本地的127.0.0.1:8787

于是 CC 以为自己在跟 Anthropic 说话,其实先经过了 Headroom。

Headroom 把请求里的长内容压缩掉,再原样转发给真正的 Anthropic。

它的结果强调的是压缩结构化、重复性高的内容(JSON、搜索结果、日志)压得越狠(90%+),而信息密度高的散文/源码,压得越少(40%多),不算吹,还算是良心。

本地运行,用rust,针对性压缩,数据很华丽,但是具体如何还是要自己做。

ECC

https://github.com/affaan-m/ECC

Scrapling

https://github.com/D4Vinci/Scrapling

它是怎么做到高性能的爬虫的,跟别的爬虫框架有什么区别

odoo

https://github.com/odoo/odoo

github robot

https://github.com/pbakaus/agent-reviews

front design

https://github.com/pbakaus/impeccable

https://github.com/pbakaus/radiant