本周GitHub最火AI项目:Agent Skills吞噬一切,Token经济成新战场
从10万星到7千星,这周GitHub上全是有趣的东西 这周GitHub的AI趋势非常集中——几乎清一色是和 AI编程Agent 相关的项目。从94K星的Karpathy编码哲学指南,到7K星的"原始人英语"节省token大法,再到Google官方出手定义DESIGN.md标准——整个生态
从10万星到7千星,这周GitHub上全是有趣的东西
这周GitHub的AI趋势非常集中——几乎清一色是和AI编程Agent相关的项目。从94K星的Karpathy编码哲学指南,到7K星的"原始人英语"节省token大法,再到Google官方出手定义DESIGN.md标准——整个生态的成熟速度令人咋舌。
我整理了本周热度最高的8个项目,按星数排列,逐一拆解。
① andrej-karpathy-skills — 94K⭐,把Karpathy编码哲学塞进一个文件
项目: forrestchang/andrej-karpathy-skills
这是本周最炸的项目,一个月从0冲到94K星。作者Forrest Chang(同时也是Multica的作者)把Andrej Karpathy在X上吐槽LLM编码缺陷的一条推文,变成了一个可以直接用的 CLAUDE.md 文件。
四大原则:
| 原则 | 核心 | 解决什么问题 |
|---|---|---|
| Think Before Coding | 先明确假设、呈现多重解读、困惑时停下来问 | 模型擅做假设、隐藏困惑 |
| Simplicity First | 不写没要求的特性,200行能50行就重写 | 过度复杂化、臃肿抽象 |
| Surgical Changes | 只动必须改的代码,不"顺手改进"相邻代码 | 附带修改无关代码 |
| Goal-Driven Execution | 把指令转成可验证目标,先写测试再实现 | 缺乏目标感、不断澄清 |
怎么用? 一行命令下载到项目根目录:
# Claude Code插件安装(推荐)
/plugin install andrej-karpathy-skills@karpathy-skills
# 或直接下载CLAUDE.md
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md为什么爆火? Karpathy效应 + 单文件零门槛 + 精准击中每个用AI编程的人的痛点——你肯定遇到过AI把你的代码"顺手优化"出bug的情况。
② hermes-agent — 17K⭐,自我进化的AI助手
Hermes Agent是我自己就在用的项目。它最独特的地方是闭环学习系统——它不只是执行任务,而是从每次对话中学习,自动创建技能、跨会话记忆、动态建模用户画像。
最新版v0.11.0的核心特性:
- 闭环学习系统 — 从经验中创建技能,使用中自我改进,跨会话FTS5搜索
- 模型无关 — 支持200+模型(OpenRouter、NVIDIA NIM、智谱GLM、Kimi、MiniMax、OpenAI等),
hermes model一键切换 - 6种终端后端 — 本地、Docker、SSH、Daytona、Singularity、Modal
- 多个聊天平台 — Telegram/Discord/Slack/WhatsApp/Signal/Email/CLI,单一网关全支持
- 40+内置工具 — 浏览器、代码执行、文件操作、图像生成、TTS、MCP、Cron调度
最低门槛:一个$5的VPS就能跑起来,Linux + Python 3.11就够。
③ obra/superpowers — 9.5K⭐,让AI写代码像专业工程师一样
项目: obra/superpowers
作者Jesse Vincent(是的,就是那个做了Request Tracker、K-9 Mail的Perl大神,后被Mozilla收购)在Anthropic发布插件系统的同一天,甩出了这个项目。
核心:一套完整的"AI编码纪律"方法论,7步流水线:
用户需求 → 头脑风暴写Spec → 获审批 → 创建隔离分支
→ 拆分成一口大小的任务 → 子Agent实现 + 两级审查 → TDD + 代码审查 → 完成最关键的创新 — 子Agent流水线:
对每个任务:
├─ 子Agent A: 实现 + 测试 + 提交
├─ 子Agent B: Spec合规审查(做对了的事?)
└─ 子Agent C: 代码质量审查(做得好不好?)
└─ 不通过 → A修复 → 重新审查每次分派全新的子Agent,不继承会话上下文。便宜模型干机械实现,强模型干架构审查。
TDD铁律:没有失败的测试在前,不能写任何生产代码。RED-GREEN-REFACTOR循环,跳过就删除重来。
目前已超过 50万次安装,支持Claude Code、Codex、Cursor、Copilot等所有主流平台。
④ free-claude-code — 把Claude Code的API路由到免费后端
项目: Alishahryar1/free-claude-code
一个Anthropic兼容的代理服务,拦截Claude Code发出的API请求,路由到免费或本地模型后端。
工作原理:
Claude Code CLI → Free Claude Code代理 → NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio/llama.cpp支持的免费后端:
| 后端 | 需要Key? | 说明 |
|---|---|---|
| NVIDIA NIM | ✅ API Key | 有限免费额度 |
| OpenRouter | ✅ API Key | 多种免费模型 |
| DeepSeek | ✅ API Key | 极其便宜 |
| LM Studio | ❌ 本地 | 本地跑模型 |
| llama.cpp | ❌ 本地 | 本地跑模型 |
| Ollama | ❌ 本地 | 本地跑模型 |
还能按模型等级混用——Opus走NVIDIA,Sonnet走OpenRouter,Haiku走本地。
安装一行搞定:
git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code && cp .env.example .env
uv run uvicorn server:app --host 0.0.0.0 --port 8082
ANTHROPIC_BASE_URL=http://localhost:8082 claude⑤ caveman — 7K⭐,"原始人英语"省65-75% Token
一句话:让AI用最少词表达最完整的技术内容。
口号是「why use many token when few do trick」——这句话本身就是个meme。
| 正常模式(69 tokens) | 原始人模式(19 tokens) |
|---|---|
| "The reason your React component is re-rendering is likely because you're creating a new object reference..." | "New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo." |
实测节省:
| 任务 | 正常 | Caveman | 节省 |
|---|---|---|---|
| 解释React重渲染bug | 1180 | 159 | 87% |
| 修复auth中间件 | 704 | 121 | 83% |
| Postgres连接池配置 | 2347 | 380 | 84% |
| 平均 | 1214 | 294 | 65% |
三档强度:Lite(去填充词)→ Full(完整原始人)→ Ultra(电报风格)。还有文言文模式(Wenyan)!
安装:
# Claude Code
claude plugin install caveman@caveman
# 其他40+ Agent
npx skills add JuliusBrussee/caveman有arXiv论文支撑——《Brevity Constraints Reverse Performance Hierarchies in Language Models》证明简洁约束反而让模型更准确。
⑥ FinceptTerminal — 开源版彭博终端,C++20 + Qt6
项目: Fincept-Corporation/FinceptTerminal
100+数据连接器、37个AI投资Agent、原生C++20桌面应用——这是唯一一个不依赖Electron、不依赖浏览器的金融终端。
数据覆盖:
- 宏观数据(DBnomics、FRED、IMF、世界银行)
- 股票/市场(Yahoo Finance、Polygon)
- 加密货币(Kraken WebSocket、HyperLiquid)
- 中国A股(AkShare)
- 16家券商API(IBKR、Alpaca、Tradier等)
37个AI Agent 分三个框架:
- 交易/投资 — 模拟巴菲特、格雷厄姆、林奇等大师的投资框架
- 经济分析 — 宏观经济研判
- 地缘政治 — 风险评估
支持OpenAI、Anthropic、Gemini、DeepSeek等所有主流模型驱动Agent。
一句话技术栈:C++20 + Qt6.8 + CMake + Ninja + 嵌入式Python3.11,单二进制文件发布。
⑦ google-labs-code/design.md — Google官方出手定义DESIGN.md标准
项目: google-labs-code/design.md
还记得我上周写的awesome-design-md吗?Google亲自下场了。这个repo定义了 DESIGN.md的官方格式规范。
格式设计:
DESIGN.md文件分两层:
- YAML front matter — 机器可读的设计Token(精确值)
- Markdown正文 — 人类可读的设计意图(为什么这么设计)
---
name: Heritage
colors:
primary: "#1A1C1E"
secondary: "#6C7278"
tertiary: "#B8422E"
neutral: "#F7F5F2"
typography:
h1:
fontFamily: Public Sans
fontSize: 3rem
---配套CLI工具:
# 验证DESIGN.md是否符合规范,检查WCAG对比度
npx @google/design.md lint DESIGN.md
# 对比两个版本的设计系统差异
npx @google/design.md diff DESIGN.md DESIGN-v2.mdGoogle官方 的定位很明确:DESIGN.md是AI原生的设计系统格式,Markdown是LLM读取效率最高的格式,不需要Figma导出、JSON Schema、特殊工具——一个文件,AI天生就能理解。
这个标准和VoltAgent/awesome-design-md的关系:VoltAgent提供了59个品牌的即用文件,Google提供了标准和工具链——两者互补。awesome-design-md的59个文件遵循的就是这个Google规范。
⑧ mattpocock/skills — TypeScript大神的16个实战技能
Matt Pocock,TypeScript教育领域的全球顶流(Newsletter订阅6万人),把自己的工程方法论打包成16个AI技能。
重点技能一览:
| 技能 | 功能 |
|---|---|
grill-me | 对你的计划穷尽式追问,直到每个分支都考虑周全 |
design-an-interface | 并行子Agent生成多种接口设计方案 |
tdd | 红-绿-重构TDD循环,每个垂直切片构建功能 |
triage-issue | 探索代码库排查Bug,定位根因并提交修复计划 |
ubiquitous-language | 从对话中提取DDD风格的通用语言术语表 |
安装:
npx skills@latest add mattpocock/skills/tdd
npx skills@latest add mattpocock/skills/grill-me本周的3个大趋势
看完这8个项目,几个清晰的趋势浮出水面:
趋势1:Agent Skills正在吞噬一切
前10个项目里7个是给AI编程Agent用的技能包。Karpathy哲学、Superpowers方法论、Pocock的16个实战技能——大家都在做同一件事:给AI套上工程纪律。
这背后的逻辑很简单:AI写代码的能力已经够强了,现在的瓶颈不是"AI能不能写",而是"AI会不会乱写"。这些Skill项目解决的都是同一个问题——让AI从自由发挥变成工程化交付。
趋势2:Token经济成了核心议题
Caveman的"原始人英语"省65-75% token,free-claude-code把API路由到免费后端——省钱省token的项目扎堆出现。这说明开发者已经开始算这个账了:AI编码的token消耗不是小数目。
Caveman的论文支撑更是有意思——简洁约束反而让模型更准确。这给了我们一个反直觉的启示:让AI说话更简洁,不仅省钱,效果可能还更好。
趋势3:Claude生态的开发者心智份额明显领先
8个项目里,Claude Code是每个项目首批支持的平台。Superpowers甚至是在Anthropic发布插件系统的同一天发布的。Claude Code的插件生态已经形成了自我增强的飞轮:用户越多→开发者为它做插件→插件越多→用户越多。
小结
这周的GitHub趋势清晰得令人惊讶——"让AI Agent写出更高质量的代码"是贯穿所有项目的核心主题。无论是Karpathy的编码哲学、Superpowers的工程流水线、Caveman的token压缩,还是DESIGN.md的标准——目的都是一个:让AI从"能写代码"进化到"写好代码"。
而Token经济的出现,标志着一个更务实的阶段:开发者不再只是追逐噱头,而是开始精打细算投入产出比。这是技术走向成熟的标志。
读者评论
0 条暂无评论,来分享你的看法吧
相关推荐
结合当前内容、你的浏览习惯和搜索偏好推荐。
Sim Studio:27K星开源AI Agent编排平台,3分钟搭建你的智能工作流
你是不是也这样:每天在ChatGPT和十几个工具之间来回切换? 写文案要切到Claude,整理数据要跑Python脚本,发邮件要开Gmail,团队协作还要同步飞书……AI再强,如果只能一个任务一个任务地手动操作,效率永远上不去。 更烦的是,你想让AI自动串联多个步骤——比如"先抓取网页数据
ML Intern:HuggingFace开源AI实习生,自动读论文、训模型、写代码
做机器学习的同学,大概都经历过这样的痛苦:想复现一篇论文,光读代码就要花大半天;想微调一个模型,环境配置踩坑一周还没搞定;想找合适的数据集,在HuggingFace上翻了半天还是没头绪。这些"搬砖活"占了ML工程师大量时间,真正有创造力的工作反而被挤没了。 ML Intern 是什么 ML

