返回广场

本周GitHub最火AI项目:Agent Skills吞噬一切,Token经济成新战场

从10万星到7千星,这周GitHub上全是有趣的东西 这周GitHub的AI趋势非常集中——几乎清一色是和 AI编程Agent 相关的项目。从94K星的Karpathy编码哲学指南,到7K星的"原始人英语"节省token大法,再到Google官方出手定义DESIGN.md标准——整个生态

从10万星到7千星,这周GitHub上全是有趣的东西

这周GitHub的AI趋势非常集中——几乎清一色是和AI编程Agent相关的项目。从94K星的Karpathy编码哲学指南,到7K星的"原始人英语"节省token大法,再到Google官方出手定义DESIGN.md标准——整个生态的成熟速度令人咋舌。

我整理了本周热度最高的8个项目,按星数排列,逐一拆解。


① andrej-karpathy-skills — 94K⭐,把Karpathy编码哲学塞进一个文件

项目: forrestchang/andrej-karpathy-skills

这是本周最炸的项目,一个月从0冲到94K星。作者Forrest Chang(同时也是Multica的作者)把Andrej Karpathy在X上吐槽LLM编码缺陷的一条推文,变成了一个可以直接用的 CLAUDE.md 文件。

四大原则:

原则核心解决什么问题
Think Before Coding先明确假设、呈现多重解读、困惑时停下来问模型擅做假设、隐藏困惑
Simplicity First不写没要求的特性,200行能50行就重写过度复杂化、臃肿抽象
Surgical Changes只动必须改的代码,不"顺手改进"相邻代码附带修改无关代码
Goal-Driven Execution把指令转成可验证目标,先写测试再实现缺乏目标感、不断澄清

怎么用? 一行命令下载到项目根目录:

# Claude Code插件安装(推荐)
/plugin install andrej-karpathy-skills@karpathy-skills

# 或直接下载CLAUDE.md
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md

为什么爆火? Karpathy效应 + 单文件零门槛 + 精准击中每个用AI编程的人的痛点——你肯定遇到过AI把你的代码"顺手优化"出bug的情况。


② hermes-agent — 17K⭐,自我进化的AI助手

项目: NousResearch/hermes-agent

Hermes Agent是我自己就在用的项目。它最独特的地方是闭环学习系统——它不只是执行任务,而是从每次对话中学习,自动创建技能、跨会话记忆、动态建模用户画像。

最新版v0.11.0的核心特性:

  • 闭环学习系统 — 从经验中创建技能,使用中自我改进,跨会话FTS5搜索
  • 模型无关 — 支持200+模型(OpenRouter、NVIDIA NIM、智谱GLM、Kimi、MiniMax、OpenAI等),hermes model一键切换
  • 6种终端后端 — 本地、Docker、SSH、Daytona、Singularity、Modal
  • 多个聊天平台 — Telegram/Discord/Slack/WhatsApp/Signal/Email/CLI,单一网关全支持
  • 40+内置工具 — 浏览器、代码执行、文件操作、图像生成、TTS、MCP、Cron调度

最低门槛:一个$5的VPS就能跑起来,Linux + Python 3.11就够。


③ obra/superpowers — 9.5K⭐,让AI写代码像专业工程师一样

项目: obra/superpowers

作者Jesse Vincent(是的,就是那个做了Request Tracker、K-9 Mail的Perl大神,后被Mozilla收购)在Anthropic发布插件系统的同一天,甩出了这个项目。

核心:一套完整的"AI编码纪律"方法论,7步流水线:

用户需求 → 头脑风暴写Spec → 获审批 → 创建隔离分支
  → 拆分成一口大小的任务 → 子Agent实现 + 两级审查 → TDD + 代码审查 → 完成

最关键的创新 — 子Agent流水线:

对每个任务:
  ├─ 子Agent A: 实现 + 测试 + 提交
  ├─ 子Agent B: Spec合规审查(做对了的事?)
  └─ 子Agent C: 代码质量审查(做得好不好?)
      └─ 不通过 → A修复 → 重新审查

每次分派全新的子Agent,不继承会话上下文。便宜模型干机械实现,强模型干架构审查。

TDD铁律:没有失败的测试在前,不能写任何生产代码。RED-GREEN-REFACTOR循环,跳过就删除重来。

目前已超过 50万次安装,支持Claude Code、Codex、Cursor、Copilot等所有主流平台。


④ free-claude-code — 把Claude Code的API路由到免费后端

项目: Alishahryar1/free-claude-code

一个Anthropic兼容的代理服务,拦截Claude Code发出的API请求,路由到免费或本地模型后端。

工作原理:

Claude Code CLI → Free Claude Code代理 → NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio/llama.cpp

支持的免费后端:

后端需要Key?说明
NVIDIA NIM✅ API Key有限免费额度
OpenRouter✅ API Key多种免费模型
DeepSeek✅ API Key极其便宜
LM Studio❌ 本地本地跑模型
llama.cpp❌ 本地本地跑模型
Ollama❌ 本地本地跑模型

还能按模型等级混用——Opus走NVIDIA,Sonnet走OpenRouter,Haiku走本地。

安装一行搞定:

git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code && cp .env.example .env
uv run uvicorn server:app --host 0.0.0.0 --port 8082
ANTHROPIC_BASE_URL=http://localhost:8082 claude

⑤ caveman — 7K⭐,"原始人英语"省65-75% Token

项目: JuliusBrussee/caveman

一句话:让AI用最少词表达最完整的技术内容。

口号是「why use many token when few do trick」——这句话本身就是个meme。

正常模式(69 tokens)原始人模式(19 tokens)
"The reason your React component is re-rendering is likely because you're creating a new object reference...""New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo."

实测节省:

任务正常Caveman节省
解释React重渲染bug118015987%
修复auth中间件70412183%
Postgres连接池配置234738084%
平均121429465%

三档强度:Lite(去填充词)→ Full(完整原始人)→ Ultra(电报风格)。还有文言文模式(Wenyan)!

安装

# Claude Code
claude plugin install caveman@caveman

# 其他40+ Agent
npx skills add JuliusBrussee/caveman

有arXiv论文支撑——《Brevity Constraints Reverse Performance Hierarchies in Language Models》证明简洁约束反而让模型更准确。


⑥ FinceptTerminal — 开源版彭博终端,C++20 + Qt6

项目: Fincept-Corporation/FinceptTerminal

100+数据连接器、37个AI投资Agent、原生C++20桌面应用——这是唯一一个不依赖Electron、不依赖浏览器的金融终端。

数据覆盖:

  • 宏观数据(DBnomics、FRED、IMF、世界银行)
  • 股票/市场(Yahoo Finance、Polygon)
  • 加密货币(Kraken WebSocket、HyperLiquid)
  • 中国A股(AkShare)
  • 16家券商API(IBKR、Alpaca、Tradier等)

37个AI Agent 分三个框架:

  • 交易/投资 — 模拟巴菲特、格雷厄姆、林奇等大师的投资框架
  • 经济分析 — 宏观经济研判
  • 地缘政治 — 风险评估

支持OpenAI、Anthropic、Gemini、DeepSeek等所有主流模型驱动Agent。

一句话技术栈:C++20 + Qt6.8 + CMake + Ninja + 嵌入式Python3.11,单二进制文件发布。


⑦ google-labs-code/design.md — Google官方出手定义DESIGN.md标准

项目: google-labs-code/design.md

还记得我上周写的awesome-design-md吗?Google亲自下场了。这个repo定义了 DESIGN.md的官方格式规范

格式设计:

DESIGN.md文件分两层:

  1. YAML front matter — 机器可读的设计Token(精确值)
  2. Markdown正文 — 人类可读的设计意图(为什么这么设计)
---
name: Heritage
colors:
  primary: "#1A1C1E"
  secondary: "#6C7278"
  tertiary: "#B8422E"
  neutral: "#F7F5F2"
typography:
  h1:
    fontFamily: Public Sans
    fontSize: 3rem
---

配套CLI工具:

# 验证DESIGN.md是否符合规范,检查WCAG对比度
npx @google/design.md lint DESIGN.md

# 对比两个版本的设计系统差异
npx @google/design.md diff DESIGN.md DESIGN-v2.md

Google官方 的定位很明确:DESIGN.md是AI原生的设计系统格式,Markdown是LLM读取效率最高的格式,不需要Figma导出、JSON Schema、特殊工具——一个文件,AI天生就能理解。

这个标准和VoltAgent/awesome-design-md的关系:VoltAgent提供了59个品牌的即用文件,Google提供了标准和工具链——两者互补。awesome-design-md的59个文件遵循的就是这个Google规范。


⑧ mattpocock/skills — TypeScript大神的16个实战技能

项目: mattpocock/skills

Matt Pocock,TypeScript教育领域的全球顶流(Newsletter订阅6万人),把自己的工程方法论打包成16个AI技能。

重点技能一览:

技能功能
grill-me对你的计划穷尽式追问,直到每个分支都考虑周全
design-an-interface并行子Agent生成多种接口设计方案
tdd红-绿-重构TDD循环,每个垂直切片构建功能
triage-issue探索代码库排查Bug,定位根因并提交修复计划
ubiquitous-language从对话中提取DDD风格的通用语言术语表

安装:

npx skills@latest add mattpocock/skills/tdd
npx skills@latest add mattpocock/skills/grill-me

本周的3个大趋势

看完这8个项目,几个清晰的趋势浮出水面:

趋势1:Agent Skills正在吞噬一切

前10个项目里7个是给AI编程Agent用的技能包。Karpathy哲学、Superpowers方法论、Pocock的16个实战技能——大家都在做同一件事:给AI套上工程纪律

这背后的逻辑很简单:AI写代码的能力已经够强了,现在的瓶颈不是"AI能不能写",而是"AI会不会乱写"。这些Skill项目解决的都是同一个问题——让AI从自由发挥变成工程化交付

趋势2:Token经济成了核心议题

Caveman的"原始人英语"省65-75% token,free-claude-code把API路由到免费后端——省钱省token的项目扎堆出现。这说明开发者已经开始算这个账了:AI编码的token消耗不是小数目。

Caveman的论文支撑更是有意思——简洁约束反而让模型更准确。这给了我们一个反直觉的启示:让AI说话更简洁,不仅省钱,效果可能还更好

趋势3:Claude生态的开发者心智份额明显领先

8个项目里,Claude Code是每个项目首批支持的平台。Superpowers甚至是在Anthropic发布插件系统的同一天发布的。Claude Code的插件生态已经形成了自我增强的飞轮:用户越多→开发者为它做插件→插件越多→用户越多。


小结

这周的GitHub趋势清晰得令人惊讶——"让AI Agent写出更高质量的代码"是贯穿所有项目的核心主题。无论是Karpathy的编码哲学、Superpowers的工程流水线、Caveman的token压缩,还是DESIGN.md的标准——目的都是一个:让AI从"能写代码"进化到"写好代码"。

而Token经济的出现,标志着一个更务实的阶段:开发者不再只是追逐噱头,而是开始精打细算投入产出比。这是技术走向成熟的标志。

写评论

读者评论

0

暂无评论,来分享你的看法吧

相关推荐

结合当前内容、你的浏览习惯和搜索偏好推荐。