返回广场

Hermes Agent:会自我进化的AI助手,69K星的Agent框架手把手教程

你的AI助手,用过就忘?试试这个会自己"长脑子"的框架 每天用ChatGPT聊完就忘,下次还得从头解释你的项目背景;想让它自动跑定时任务,发现只会一问一答;想让AI在Telegram里干活,折腾半天API也对接不上;好不容易写了个自动化脚本,换个模型又得改代码……这些痛点,中国开发者每天在经

你的AI助手,用过就忘?试试这个会自己"长脑子"的框架

每天用ChatGPT聊完就忘,下次还得从头解释你的项目背景;想让它自动跑定时任务,发现只会一问一答;想让AI在Telegram里干活,折腾半天API也对接不上;好不容易写了个自动化脚本,换个模型又得改代码……这些痛点,中国开发者每天在经历。Hermes Agent 项目的理念很明确——AI助手不应该是一个聊完即弃的对话框,它应该像你的搭档一样,越用越懂你。

Hermes Agent 是什么?

Hermes Agent 是由 Nous Research 团队开发的开源AI Agent框架,GitHub 上已有 69K+ Star——它是唯一内置"学习闭环"的 Agent:能从经验中自动创建技能(Skill),在使用中自我改进,主动保存知识,还能跨会话搜索历史对话,逐步构建对你的深度理解。一句话说:一个能越用越懂你的AI助手框架。

核心功能一览

功能说明
自我学习闭环完成复杂任务后自动创建技能,技能在使用中自我改进,主动提醒自己保存记忆
跨会话记忆通过 MEMORY.md 和 USER.md 持久化记忆,配合 FTS5 全文搜索+LLM摘要,实现跨会话回忆
用户建模基于 Honcho 方言式建模,逐步构建你的偏好画像,越聊越懂你
多平台接入一个网关进程同时连接 Telegram、Discord、Slack、WhatsApp、Signal、邮件,还支持语音消息转录
定时任务(Cron)用自然语言描述定时任务,如"每天早上9点汇总AI新闻",自动执行并推送结果
子Agent委派最多并行3个子Agent处理不同任务流,各自独立上下文,互不干扰
浏览器自动化支持云端(Browserbase)和本地浏览器,能导航、填表、截图、提取信息
语音交互麦克风输入 + TTS语音回复,支持 Discord 语音频道实时对话
40+内置工具涵盖网页搜索、终端执行、文件编辑、内存管理、代码执行、图片生成等
技能系统按需加载知识文档,兼容 agentskills.io 开放标准,支持社区技能市场
MCP集成可连接任何 MCP 服务器(GitHub、数据库、内部API等),无需写原生工具
API服务器暴露 OpenAI 兼容的 HTTP 端点,可对接 Open WebUI、LobeChat、LibreChat 等前端
模型自由切换支持 Nous Portal、OpenAI、Anthropic、OpenRouter、智谱Z.AI、月之暗面Kimi、MiniMax、阿里云百炼、DeepSeek、Ollama 等,一行命令切换
上下文文件自动发现并加载 .hermes.md、AGENTS.md、CLAUDE.md 等项目上下文文件
上下文引用输入 @ 即可引用文件、文件夹、Git diff、URL,自动注入对话
安全沙箱支持 Docker、SSH 远程、Daytona、Modal 等多种终端后端,隔离执行环境
检查点回滚修改文件前自动快照,出问题 /rollback 一键回滚
代码执行execute_code 工具让Agent编写Python脚本并通过RPC调用Hermes工具,多步流程压缩为单轮
批量处理支持并行数百上千条提示词,生成 ShareGPT 格式轨迹数据,用于模型训练
IDE集成通过ACP协议在 VS Code、Zed、JetBrains 中使用,工具活动、文件差异实时渲染
微信桥接社区项目 HermesClaw 支持微信接入

安装步骤

前置要求

  • Python 3.11+
  • 需要一个支持至少 64K 上下文窗口的 LLM(如 Claude、GPT-4、Qwen、DeepSeek 等)

macOS / Linux 安装

打开终端,执行一行命令即可:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后,重新加载 Shell:

source ~/.bashrc    # 如果你用 zsh,则: source ~/.zshrc

Windows 安装

Windows 原生不支持,需要先安装 WSL2:

  1. 打开 PowerShell(管理员模式),执行:
wsl --install
  1. 重启电脑后,打开 WSL2 终端(Ubuntu)
  2. 在 WSL2 终端内执行安装命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
  1. 重载 Shell:
source ~/.bashrc

Android(Termux)安装

手机上也能跑!安装 Termux 后,参考官方的 Termux 指南进行安装。注意 Termux 下使用专门的 .[termux] extra,完整的 .[all] extra 会拉入 Android 不兼容的语音依赖。

详细步骤见:https://hermes-agent.nousresearch.com/docs/getting-started/termux

开发者安装(从源码)

如果你想参与贡献或深度定制:

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv venv --python 3.11
source venv/bin/activate
uv pip install -e ".[all,dev]"
python -m pytest tests/ -q

使用方法:从简单到进阶

第一步:配置模型

安装完成后,最关键的是配置你的LLM提供商。Hermes 支持非常多的提供商,对中国开发者友好的选项包括:

# 交互式选择模型提供商(推荐新手使用)
hermes model

# 或者用完整设置向导
hermes setup

以下是各提供商的配置方式:

智谱 Z.AI(国产推荐):

# 设置环境变量
export GLM_API_KEY="你的智谱API密钥"
# 或
export ZAI_API_KEY="你的Z.AI密钥"

# 然后通过 hermes model 选择 Z.AI
hermes model

月之暗面 Kimi:

export KIMI_API_KEY="你的Kimi密钥"
hermes model

MiniMax(国内版):

export MINIMAX_CN_API_KEY="你的MiniMax国内密钥"
hermes model

阿里云百炼(Qwen系列):

export DASHSCOPE_API_KEY="你的阿里云百炼密钥"
hermes model

DeepSeek:

export DEEPSEEK_API_KEY="你的DeepSeek密钥"
hermes model

OpenRouter(200+模型路由):

export OPENROUTER_API_KEY="你的OpenRouter密钥"
hermes model

本地部署(Ollama / vLLM / SGLang):

使用自定义端点指向你的本地服务,设置 base URL + API key 即可。注意本地模型上下文窗口至少要 64K(如 --ctx-size 65536 for llama.cpp 或 -c 65536 for Ollama)。

第二步:开始对话

# 启动交互式CLI
hermes

你会看到一个欢迎横幅,显示当前模型、可用工具和技能。直接输入消息就能聊:

❯ 帮我看看当前目录下最大的5个文件夹占多少空间

Agent 会自动调用终端命令来帮你完成。

第三步:常用 Slash 命令

在对话中输入 / 可以看到所有命令的自动补全列表:

命令功能
/help显示所有可用命令
/tools列出可用工具
/model交互式切换模型
/personality pirate切换个性预设(试试海盗风格!)
/save保存当前对话
/new/reset开始新对话
/compress压缩当前上下文
/usage查看token使用情况
/skills浏览可用技能
/stop中断当前任务
/rollback回滚到最近的检查点
/voice on开启语音模式
/retry重试上一轮
/undo撤销上一轮

第四步:多行输入与中断

  • 多行输入:按 Alt+EnterCtrl+J 换行,适合粘贴代码或写详细提示
  • 中断Agent:直接输入新消息回车即可,或按 Ctrl+C

第五步:恢复会话

退出后 Hermes 会打印恢复命令:

hermes --continue    # 恢复最近一次会话
hermes -c            # 简写

进阶:配置工具

# 交互式选择启用哪些工具
hermes tools

# 单独设置配置项
hermes config set terminal.backend docker    # 使用Docker隔离终端
hermes config set terminal.backend ssh       # 使用远程SSH服务器

进阶:连接消息平台

让 Hermes 在你的聊天软件里工作:

# 交互式配置消息平台(Telegram、Discord、Slack、WhatsApp等)
hermes gateway setup

# 启动网关
hermes gateway start

配置完成后,直接在 Telegram 或 Discord 里给 Bot 发消息即可。

进阶:语音模式

# 安装语音依赖
pip install "hermes-agent[voice]"

# 可选:免费本地语音转文字
pip install faster-whisper

# 在CLI中开启语音
/voice on

Ctrl+B 开始录音,或用 /voice tts 让 Hermes 语音回复。

进阶:定时任务

直接在对话中用自然语言描述:

❯ 每天早上9点,帮我查一下 Hacker News 上的AI新闻,汇总后发到Telegram。

Agent 会自动创建 Cron 定时任务,通过网关定时推送。

进阶:技能安装与搜索

# 搜索技能
hermes skills search kubernetes
hermes skills search react --source skills-sh

# 从索引安装
hermes skills install openai/skills/k8s
hermes skills install official/security/1password

# 从文档URL发现技能
hermes skills search https://mintlify.com/docs --source well-known

进阶:MCP 服务器集成

~/.hermes/config.yaml 中添加:

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_你的token"

重启 Hermes 后,Agent 就能通过 MCP 使用 GitHub 的工具了。

进阶:微信接入

社区项目 HermesClaw 提供了微信桥接,可以在同一个微信号上同时运行 Hermes Agent 和 OpenClaw。

实际场景举例

场景1:智能工作助手

小李是一名后端开发者,每天需要检查服务器日志、排查告警、写运维脚本。他让 Hermes 在 Docker 沙箱里运行:

# 配置Docker沙箱
hermes config set terminal.backend docker

# 在对话中自然地交代理任务
❯ 帮我连上服务器,看看今天nginx的error log有哪些异常,分析一下是什么原因

Hermes 会自动执行终端命令、读取日志、分析问题。因为它有持久记忆,下次小李再说"帮我看看昨天的告警",它会想起之前的上下文,不需要重复解释。

场景2:每日AI新闻推送到Telegram

❯ 每天早上8点,搜索一下最近24小时内关于大模型和Agent的最新进展,整理成3-5条摘要,发到我的Telegram。

Hermes 会自动创建 Cron 任务,通过网关在指定时间执行并推送。出差在外也能用手机接收摘要。

场景3:多模型切换,成本优化

用贵模型做复杂推理,用便宜模型做简单任务:

# 第一次用 DeepSeek 做代码审查
hermes model  # 选择 deepseek
❯ 帮我审查一下这段代码的安全问题

# 切换到 Claude 做深度分析
/model anthropic:claude-sonnet-4-20250514
❯ 帮我从架构层面分析这个系统的瓶颈

一行命令切换,无需改代码,无锁入。

场景4:团队知识库+微信机器人

技术团队搭建内部知识Bot:

  1. 把团队Wiki和技术文档作为上下文文件放到项目目录(.hermes.md
  2. 通过 HermesClaw 接入微信
  3. 团队成员在微信群里艾特Bot提问,Bot基于项目上下文回答
  4. Bot的技能系统让它在回答过的复杂问题上积累经验,越用越专业

场景5:子Agent并行处理

❯ 帮我同时做三件事:1)检查今天的服务器告警 2)更新项目的依赖版本 3)写一个新API接口的单元测试

Hermes 会派出最多3个子Agent(delegate_task),各自独立隔离上下文,并行执行,互不干扰。

跟同类对比

特性Hermes AgentOpenHandsAutoGPTCrewAI
自我学习✅ 自动创建+改进技能
跨会话记忆✅ MEMORY.md + USER.md + FTS5搜索❌ 基本无有限有限
消息平台✅ Telegram/Discord/Slack/WhatsApp/Signal/微信
语音交互✅ 麦克风+TTS+Discord语音
定时任务✅ 内置Cron✅ 基础
子Agent并行✅ 最多3个✅ 但串行为主
模型切换✅ 一行命令,15+提供商✅ 有限✅ 简单✅ 简单
国产模型✅ 智谱/Kimi/MiniMax/DeepSeek/阿里云
MCP集成
浏览器自动化✅ 多后端
IDE集成✅ VS Code/Zed/JetBrains
技能市场✅ agentskills.io
微信接入✅ HermesClaw
沙箱执行✅ Docker/SSH/Daytona/Modal✅ Docker
开源协议MITMITMITMIT
GitHub Star69K+42K+172K+28K+

Hermes Agent 最大的差异化优势在于"学习闭环"——它不是简单的工具调用框架,而是一个会自己长知识的Agent。其他框架用完即弃,Hermes 越用越懂你。同时,15+模型提供商的一键切换(尤其对国产模型的原生支持)和6大消息平台的网关接入,对中国开发者来说非常友好。

小结

Hermes Agent 不只是一个又一个ChatGPT包装器。它的核心创新在于:

  1. 学习闭环:自动创建技能、使用中自我改进、主动保存记忆、跨会话搜索——真正实现了"越用越好用"
  2. 全平台覆盖:CLI + Telegram + Discord + Slack + WhatsApp + Signal + 微信(HermesClaw),一个Agent覆盖所有入口
  3. 模型自由:15+提供商一键切换,国产模型原生支持,不绑死任何一家
  4. 安全可控:Docker沙箱、检查点回滚、命令审批,生产环境放心使用
  5. 技能生态:agentskills.io开放标准 + 社区技能市场,可复用他人经验

对于中国开发者来说,如果你已经厌倦了每次跟AI聊天都要重新解释项目背景,或者想让AI助手真正在微信/Telegram里24小时待命,Hermes Agent 值得一试。

快速开始:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup
hermes

三行命令,开始你的AI助手进化之旅。

项目链接:

  • GitHub: https://github.com/NousResearch/hermes-agent
  • 官方文档: https://hermes-agent.nousresearch.com/docs/
  • Discord社区: https://discord.gg/NousResearch
  • 技能市场: https://agentskills.io
写评论

读者评论

0

暂无评论,来分享你的看法吧

相关推荐

结合当前内容、你的浏览习惯和搜索偏好推荐。