Hermes Agent:会自我进化的AI助手,69K星的Agent框架手把手教程
你的AI助手,用过就忘?试试这个会自己"长脑子"的框架 每天用ChatGPT聊完就忘,下次还得从头解释你的项目背景;想让它自动跑定时任务,发现只会一问一答;想让AI在Telegram里干活,折腾半天API也对接不上;好不容易写了个自动化脚本,换个模型又得改代码……这些痛点,中国开发者每天在经
你的AI助手,用过就忘?试试这个会自己"长脑子"的框架
每天用ChatGPT聊完就忘,下次还得从头解释你的项目背景;想让它自动跑定时任务,发现只会一问一答;想让AI在Telegram里干活,折腾半天API也对接不上;好不容易写了个自动化脚本,换个模型又得改代码……这些痛点,中国开发者每天在经历。Hermes Agent 项目的理念很明确——AI助手不应该是一个聊完即弃的对话框,它应该像你的搭档一样,越用越懂你。
Hermes Agent 是什么?
Hermes Agent 是由 Nous Research 团队开发的开源AI Agent框架,GitHub 上已有 69K+ Star——它是唯一内置"学习闭环"的 Agent:能从经验中自动创建技能(Skill),在使用中自我改进,主动保存知识,还能跨会话搜索历史对话,逐步构建对你的深度理解。一句话说:一个能越用越懂你的AI助手框架。
核心功能一览
| 功能 | 说明 |
|---|---|
| 自我学习闭环 | 完成复杂任务后自动创建技能,技能在使用中自我改进,主动提醒自己保存记忆 |
| 跨会话记忆 | 通过 MEMORY.md 和 USER.md 持久化记忆,配合 FTS5 全文搜索+LLM摘要,实现跨会话回忆 |
| 用户建模 | 基于 Honcho 方言式建模,逐步构建你的偏好画像,越聊越懂你 |
| 多平台接入 | 一个网关进程同时连接 Telegram、Discord、Slack、WhatsApp、Signal、邮件,还支持语音消息转录 |
| 定时任务(Cron) | 用自然语言描述定时任务,如"每天早上9点汇总AI新闻",自动执行并推送结果 |
| 子Agent委派 | 最多并行3个子Agent处理不同任务流,各自独立上下文,互不干扰 |
| 浏览器自动化 | 支持云端(Browserbase)和本地浏览器,能导航、填表、截图、提取信息 |
| 语音交互 | 麦克风输入 + TTS语音回复,支持 Discord 语音频道实时对话 |
| 40+内置工具 | 涵盖网页搜索、终端执行、文件编辑、内存管理、代码执行、图片生成等 |
| 技能系统 | 按需加载知识文档,兼容 agentskills.io 开放标准,支持社区技能市场 |
| MCP集成 | 可连接任何 MCP 服务器(GitHub、数据库、内部API等),无需写原生工具 |
| API服务器 | 暴露 OpenAI 兼容的 HTTP 端点,可对接 Open WebUI、LobeChat、LibreChat 等前端 |
| 模型自由切换 | 支持 Nous Portal、OpenAI、Anthropic、OpenRouter、智谱Z.AI、月之暗面Kimi、MiniMax、阿里云百炼、DeepSeek、Ollama 等,一行命令切换 |
| 上下文文件 | 自动发现并加载 .hermes.md、AGENTS.md、CLAUDE.md 等项目上下文文件 |
| 上下文引用 | 输入 @ 即可引用文件、文件夹、Git diff、URL,自动注入对话 |
| 安全沙箱 | 支持 Docker、SSH 远程、Daytona、Modal 等多种终端后端,隔离执行环境 |
| 检查点回滚 | 修改文件前自动快照,出问题 /rollback 一键回滚 |
| 代码执行 | execute_code 工具让Agent编写Python脚本并通过RPC调用Hermes工具,多步流程压缩为单轮 |
| 批量处理 | 支持并行数百上千条提示词,生成 ShareGPT 格式轨迹数据,用于模型训练 |
| IDE集成 | 通过ACP协议在 VS Code、Zed、JetBrains 中使用,工具活动、文件差异实时渲染 |
| 微信桥接 | 社区项目 HermesClaw 支持微信接入 |
安装步骤
前置要求
- Python 3.11+
- 需要一个支持至少 64K 上下文窗口的 LLM(如 Claude、GPT-4、Qwen、DeepSeek 等)
macOS / Linux 安装
打开终端,执行一行命令即可:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash安装完成后,重新加载 Shell:
source ~/.bashrc # 如果你用 zsh,则: source ~/.zshrcWindows 安装
Windows 原生不支持,需要先安装 WSL2:
- 打开 PowerShell(管理员模式),执行:
wsl --install- 重启电脑后,打开 WSL2 终端(Ubuntu)
- 在 WSL2 终端内执行安装命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash- 重载 Shell:
source ~/.bashrcAndroid(Termux)安装
手机上也能跑!安装 Termux 后,参考官方的 Termux 指南进行安装。注意 Termux 下使用专门的 .[termux] extra,完整的 .[all] extra 会拉入 Android 不兼容的语音依赖。
详细步骤见:https://hermes-agent.nousresearch.com/docs/getting-started/termux
开发者安装(从源码)
如果你想参与贡献或深度定制:
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv venv --python 3.11
source venv/bin/activate
uv pip install -e ".[all,dev]"
python -m pytest tests/ -q使用方法:从简单到进阶
第一步:配置模型
安装完成后,最关键的是配置你的LLM提供商。Hermes 支持非常多的提供商,对中国开发者友好的选项包括:
# 交互式选择模型提供商(推荐新手使用)
hermes model
# 或者用完整设置向导
hermes setup以下是各提供商的配置方式:
智谱 Z.AI(国产推荐):
# 设置环境变量
export GLM_API_KEY="你的智谱API密钥"
# 或
export ZAI_API_KEY="你的Z.AI密钥"
# 然后通过 hermes model 选择 Z.AI
hermes model月之暗面 Kimi:
export KIMI_API_KEY="你的Kimi密钥"
hermes modelMiniMax(国内版):
export MINIMAX_CN_API_KEY="你的MiniMax国内密钥"
hermes model阿里云百炼(Qwen系列):
export DASHSCOPE_API_KEY="你的阿里云百炼密钥"
hermes modelDeepSeek:
export DEEPSEEK_API_KEY="你的DeepSeek密钥"
hermes modelOpenRouter(200+模型路由):
export OPENROUTER_API_KEY="你的OpenRouter密钥"
hermes model本地部署(Ollama / vLLM / SGLang):
使用自定义端点指向你的本地服务,设置 base URL + API key 即可。注意本地模型上下文窗口至少要 64K(如 --ctx-size 65536 for llama.cpp 或 -c 65536 for Ollama)。
第二步:开始对话
# 启动交互式CLI
hermes你会看到一个欢迎横幅,显示当前模型、可用工具和技能。直接输入消息就能聊:
❯ 帮我看看当前目录下最大的5个文件夹占多少空间Agent 会自动调用终端命令来帮你完成。
第三步:常用 Slash 命令
在对话中输入 / 可以看到所有命令的自动补全列表:
| 命令 | 功能 |
|---|---|
/help | 显示所有可用命令 |
/tools | 列出可用工具 |
/model | 交互式切换模型 |
/personality pirate | 切换个性预设(试试海盗风格!) |
/save | 保存当前对话 |
/new 或 /reset | 开始新对话 |
/compress | 压缩当前上下文 |
/usage | 查看token使用情况 |
/skills | 浏览可用技能 |
/stop | 中断当前任务 |
/rollback | 回滚到最近的检查点 |
/voice on | 开启语音模式 |
/retry | 重试上一轮 |
/undo | 撤销上一轮 |
第四步:多行输入与中断
- 多行输入:按
Alt+Enter或Ctrl+J换行,适合粘贴代码或写详细提示 - 中断Agent:直接输入新消息回车即可,或按
Ctrl+C
第五步:恢复会话
退出后 Hermes 会打印恢复命令:
hermes --continue # 恢复最近一次会话
hermes -c # 简写进阶:配置工具
# 交互式选择启用哪些工具
hermes tools
# 单独设置配置项
hermes config set terminal.backend docker # 使用Docker隔离终端
hermes config set terminal.backend ssh # 使用远程SSH服务器进阶:连接消息平台
让 Hermes 在你的聊天软件里工作:
# 交互式配置消息平台(Telegram、Discord、Slack、WhatsApp等)
hermes gateway setup
# 启动网关
hermes gateway start配置完成后,直接在 Telegram 或 Discord 里给 Bot 发消息即可。
进阶:语音模式
# 安装语音依赖
pip install "hermes-agent[voice]"
# 可选:免费本地语音转文字
pip install faster-whisper
# 在CLI中开启语音
/voice on按 Ctrl+B 开始录音,或用 /voice tts 让 Hermes 语音回复。
进阶:定时任务
直接在对话中用自然语言描述:
❯ 每天早上9点,帮我查一下 Hacker News 上的AI新闻,汇总后发到Telegram。Agent 会自动创建 Cron 定时任务,通过网关定时推送。
进阶:技能安装与搜索
# 搜索技能
hermes skills search kubernetes
hermes skills search react --source skills-sh
# 从索引安装
hermes skills install openai/skills/k8s
hermes skills install official/security/1password
# 从文档URL发现技能
hermes skills search https://mintlify.com/docs --source well-known进阶:MCP 服务器集成
在 ~/.hermes/config.yaml 中添加:
mcp_servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_你的token"重启 Hermes 后,Agent 就能通过 MCP 使用 GitHub 的工具了。
进阶:微信接入
社区项目 HermesClaw 提供了微信桥接,可以在同一个微信号上同时运行 Hermes Agent 和 OpenClaw。
实际场景举例
场景1:智能工作助手
小李是一名后端开发者,每天需要检查服务器日志、排查告警、写运维脚本。他让 Hermes 在 Docker 沙箱里运行:
# 配置Docker沙箱
hermes config set terminal.backend docker
# 在对话中自然地交代理任务
❯ 帮我连上服务器,看看今天nginx的error log有哪些异常,分析一下是什么原因Hermes 会自动执行终端命令、读取日志、分析问题。因为它有持久记忆,下次小李再说"帮我看看昨天的告警",它会想起之前的上下文,不需要重复解释。
场景2:每日AI新闻推送到Telegram
❯ 每天早上8点,搜索一下最近24小时内关于大模型和Agent的最新进展,整理成3-5条摘要,发到我的Telegram。Hermes 会自动创建 Cron 任务,通过网关在指定时间执行并推送。出差在外也能用手机接收摘要。
场景3:多模型切换,成本优化
用贵模型做复杂推理,用便宜模型做简单任务:
# 第一次用 DeepSeek 做代码审查
hermes model # 选择 deepseek
❯ 帮我审查一下这段代码的安全问题
# 切换到 Claude 做深度分析
/model anthropic:claude-sonnet-4-20250514
❯ 帮我从架构层面分析这个系统的瓶颈一行命令切换,无需改代码,无锁入。
场景4:团队知识库+微信机器人
技术团队搭建内部知识Bot:
- 把团队Wiki和技术文档作为上下文文件放到项目目录(
.hermes.md) - 通过 HermesClaw 接入微信
- 团队成员在微信群里艾特Bot提问,Bot基于项目上下文回答
- Bot的技能系统让它在回答过的复杂问题上积累经验,越用越专业
场景5:子Agent并行处理
❯ 帮我同时做三件事:1)检查今天的服务器告警 2)更新项目的依赖版本 3)写一个新API接口的单元测试Hermes 会派出最多3个子Agent(delegate_task),各自独立隔离上下文,并行执行,互不干扰。
跟同类对比
| 特性 | Hermes Agent | OpenHands | AutoGPT | CrewAI |
|---|---|---|---|---|
| 自我学习 | ✅ 自动创建+改进技能 | ❌ | ❌ | ❌ |
| 跨会话记忆 | ✅ MEMORY.md + USER.md + FTS5搜索 | ❌ 基本无 | 有限 | 有限 |
| 消息平台 | ✅ Telegram/Discord/Slack/WhatsApp/Signal/微信 | ❌ | ❌ | ❌ |
| 语音交互 | ✅ 麦克风+TTS+Discord语音 | ❌ | ❌ | ❌ |
| 定时任务 | ✅ 内置Cron | ❌ | ✅ 基础 | ❌ |
| 子Agent并行 | ✅ 最多3个 | ✅ 但串行为主 | ❌ | ✅ |
| 模型切换 | ✅ 一行命令,15+提供商 | ✅ 有限 | ✅ 简单 | ✅ 简单 |
| 国产模型 | ✅ 智谱/Kimi/MiniMax/DeepSeek/阿里云 | ❌ | ❌ | ❌ |
| MCP集成 | ✅ | ✅ | ❌ | ❌ |
| 浏览器自动化 | ✅ 多后端 | ✅ | ❌ | ❌ |
| IDE集成 | ✅ VS Code/Zed/JetBrains | ❌ | ❌ | ❌ |
| 技能市场 | ✅ agentskills.io | ❌ | ❌ | ❌ |
| 微信接入 | ✅ HermesClaw | ❌ | ❌ | ❌ |
| 沙箱执行 | ✅ Docker/SSH/Daytona/Modal | ✅ Docker | ❌ | ❌ |
| 开源协议 | MIT | MIT | MIT | MIT |
| GitHub Star | 69K+ | 42K+ | 172K+ | 28K+ |
Hermes Agent 最大的差异化优势在于"学习闭环"——它不是简单的工具调用框架,而是一个会自己长知识的Agent。其他框架用完即弃,Hermes 越用越懂你。同时,15+模型提供商的一键切换(尤其对国产模型的原生支持)和6大消息平台的网关接入,对中国开发者来说非常友好。
小结
Hermes Agent 不只是一个又一个ChatGPT包装器。它的核心创新在于:
- 学习闭环:自动创建技能、使用中自我改进、主动保存记忆、跨会话搜索——真正实现了"越用越好用"
- 全平台覆盖:CLI + Telegram + Discord + Slack + WhatsApp + Signal + 微信(HermesClaw),一个Agent覆盖所有入口
- 模型自由:15+提供商一键切换,国产模型原生支持,不绑死任何一家
- 安全可控:Docker沙箱、检查点回滚、命令审批,生产环境放心使用
- 技能生态:agentskills.io开放标准 + 社区技能市场,可复用他人经验
对于中国开发者来说,如果你已经厌倦了每次跟AI聊天都要重新解释项目背景,或者想让AI助手真正在微信/Telegram里24小时待命,Hermes Agent 值得一试。
快速开始:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup
hermes三行命令,开始你的AI助手进化之旅。
项目链接:
- GitHub: https://github.com/NousResearch/hermes-agent
- 官方文档: https://hermes-agent.nousresearch.com/docs/
- Discord社区: https://discord.gg/NousResearch
- 技能市场: https://agentskills.io
读者评论
0 条暂无评论,来分享你的看法吧
相关推荐
结合当前内容、你的浏览习惯和搜索偏好推荐。

