Hermes Agent：会自我进化的AI助手，69K星的Agent框架手把手教程

你的AI助手，用过就忘？试试这个会自己"长脑子"的框架

每天用ChatGPT聊完就忘，下次还得从头解释你的项目背景；想让它自动跑定时任务，发现只会一问一答；想让AI在Telegram里干活，折腾半天API也对接不上；好不容易写了个自动化脚本，换个模型又得改代码……这些痛点，中国开发者每天在经历。Hermes Agent 项目的理念很明确——AI助手不应该是一个聊完即弃的对话框，它应该像你的搭档一样，越用越懂你。

Hermes Agent 是什么？

Hermes Agent 是由 Nous Research 团队开发的开源AI Agent框架，GitHub 上已有 69K+ Star——它是唯一内置"学习闭环"的 Agent：能从经验中自动创建技能（Skill），在使用中自我改进，主动保存知识，还能跨会话搜索历史对话，逐步构建对你的深度理解。一句话说：一个能越用越懂你的AI助手框架。

核心功能一览

功能	说明
自我学习闭环	完成复杂任务后自动创建技能，技能在使用中自我改进，主动提醒自己保存记忆
跨会话记忆	通过 MEMORY.md 和 USER.md 持久化记忆，配合 FTS5 全文搜索+LLM摘要，实现跨会话回忆
用户建模	基于 Honcho 方言式建模，逐步构建你的偏好画像，越聊越懂你
多平台接入	一个网关进程同时连接 Telegram、Discord、Slack、WhatsApp、Signal、邮件，还支持语音消息转录
定时任务（Cron）	用自然语言描述定时任务，如"每天早上9点汇总AI新闻"，自动执行并推送结果
子Agent委派	最多并行3个子Agent处理不同任务流，各自独立上下文，互不干扰
浏览器自动化	支持云端（Browserbase）和本地浏览器，能导航、填表、截图、提取信息
语音交互	麦克风输入 + TTS语音回复，支持 Discord 语音频道实时对话
40+内置工具	涵盖网页搜索、终端执行、文件编辑、内存管理、代码执行、图片生成等
技能系统	按需加载知识文档，兼容 agentskills.io 开放标准，支持社区技能市场
MCP集成	可连接任何 MCP 服务器（GitHub、数据库、内部API等），无需写原生工具
API服务器	暴露 OpenAI 兼容的 HTTP 端点，可对接 Open WebUI、LobeChat、LibreChat 等前端
模型自由切换	支持 Nous Portal、OpenAI、Anthropic、OpenRouter、智谱Z.AI、月之暗面Kimi、MiniMax、阿里云百炼、DeepSeek、Ollama 等，一行命令切换
上下文文件	自动发现并加载 .hermes.md、AGENTS.md、CLAUDE.md 等项目上下文文件
上下文引用	输入 `@` 即可引用文件、文件夹、Git diff、URL，自动注入对话
安全沙箱	支持 Docker、SSH 远程、Daytona、Modal 等多种终端后端，隔离执行环境
检查点回滚	修改文件前自动快照，出问题 `/rollback` 一键回滚
代码执行	`execute_code` 工具让Agent编写Python脚本并通过RPC调用Hermes工具，多步流程压缩为单轮
批量处理	支持并行数百上千条提示词，生成 ShareGPT 格式轨迹数据，用于模型训练
IDE集成	通过ACP协议在 VS Code、Zed、JetBrains 中使用，工具活动、文件差异实时渲染
微信桥接	社区项目 HermesClaw 支持微信接入

安装步骤

前置要求

Python 3.11+
需要一个支持至少 64K 上下文窗口的 LLM（如 Claude、GPT-4、Qwen、DeepSeek 等）

macOS / Linux 安装

打开终端，执行一行命令即可：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后，重新加载 Shell：

source ~/.bashrc    # 如果你用 zsh，则: source ~/.zshrc

Windows 安装

Windows 原生不支持，需要先安装 WSL2：

打开 PowerShell（管理员模式），执行：

wsl --install

重启电脑后，打开 WSL2 终端（Ubuntu）
在 WSL2 终端内执行安装命令：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

重载 Shell：

source ~/.bashrc

Android（Termux）安装

手机上也能跑！安装 Termux 后，参考官方的 Termux 指南进行安装。注意 Termux 下使用专门的 .[termux] extra，完整的 .[all] extra 会拉入 Android 不兼容的语音依赖。

详细步骤见：https://hermes-agent.nousresearch.com/docs/getting-started/termux

开发者安装（从源码）

如果你想参与贡献或深度定制：

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv venv --python 3.11
source venv/bin/activate
uv pip install -e ".[all,dev]"
python -m pytest tests/ -q

使用方法：从简单到进阶

第一步：配置模型

安装完成后，最关键的是配置你的LLM提供商。Hermes 支持非常多的提供商，对中国开发者友好的选项包括：

# 交互式选择模型提供商（推荐新手使用）
hermes model

# 或者用完整设置向导
hermes setup

以下是各提供商的配置方式：

智谱 Z.AI（国产推荐）：

# 设置环境变量
export GLM_API_KEY="你的智谱API密钥"
# 或
export ZAI_API_KEY="你的Z.AI密钥"

# 然后通过 hermes model 选择 Z.AI
hermes model

月之暗面 Kimi：

export KIMI_API_KEY="你的Kimi密钥"
hermes model

MiniMax（国内版）：

export MINIMAX_CN_API_KEY="你的MiniMax国内密钥"
hermes model

阿里云百炼（Qwen系列）：

export DASHSCOPE_API_KEY="你的阿里云百炼密钥"
hermes model

DeepSeek：

export DEEPSEEK_API_KEY="你的DeepSeek密钥"
hermes model

OpenRouter（200+模型路由）：

export OPENROUTER_API_KEY="你的OpenRouter密钥"
hermes model

本地部署（Ollama / vLLM / SGLang）：

使用自定义端点指向你的本地服务，设置 base URL + API key 即可。注意本地模型上下文窗口至少要 64K（如 --ctx-size 65536 for llama.cpp 或 -c 65536 for Ollama）。

第二步：开始对话

# 启动交互式CLI
hermes

你会看到一个欢迎横幅，显示当前模型、可用工具和技能。直接输入消息就能聊：

❯ 帮我看看当前目录下最大的5个文件夹占多少空间

Agent 会自动调用终端命令来帮你完成。

第三步：常用 Slash 命令

在对话中输入 / 可以看到所有命令的自动补全列表：

命令	功能
`/help`	显示所有可用命令
`/tools`	列出可用工具
`/model`	交互式切换模型
`/personality pirate`	切换个性预设（试试海盗风格！）
`/save`	保存当前对话
`/new` 或 `/reset`	开始新对话
`/compress`	压缩当前上下文
`/usage`	查看token使用情况
`/skills`	浏览可用技能
`/stop`	中断当前任务
`/rollback`	回滚到最近的检查点
`/voice on`	开启语音模式
`/retry`	重试上一轮
`/undo`	撤销上一轮

第四步：多行输入与中断

多行输入：按 Alt+Enter 或 Ctrl+J 换行，适合粘贴代码或写详细提示
中断Agent：直接输入新消息回车即可，或按 Ctrl+C

第五步：恢复会话

退出后 Hermes 会打印恢复命令：

hermes --continue    # 恢复最近一次会话
hermes -c            # 简写

进阶：配置工具

# 交互式选择启用哪些工具
hermes tools

# 单独设置配置项
hermes config set terminal.backend docker    # 使用Docker隔离终端
hermes config set terminal.backend ssh       # 使用远程SSH服务器

进阶：连接消息平台

让 Hermes 在你的聊天软件里工作：

# 交互式配置消息平台（Telegram、Discord、Slack、WhatsApp等）
hermes gateway setup

# 启动网关
hermes gateway start

配置完成后，直接在 Telegram 或 Discord 里给 Bot 发消息即可。

进阶：语音模式

# 安装语音依赖
pip install "hermes-agent[voice]"

# 可选：免费本地语音转文字
pip install faster-whisper

# 在CLI中开启语音
/voice on

按 Ctrl+B 开始录音，或用 /voice tts 让 Hermes 语音回复。

进阶：定时任务

直接在对话中用自然语言描述：

❯ 每天早上9点，帮我查一下 Hacker News 上的AI新闻，汇总后发到Telegram。

Agent 会自动创建 Cron 定时任务，通过网关定时推送。

进阶：技能安装与搜索

# 搜索技能
hermes skills search kubernetes
hermes skills search react --source skills-sh

# 从索引安装
hermes skills install openai/skills/k8s
hermes skills install official/security/1password

# 从文档URL发现技能
hermes skills search https://mintlify.com/docs --source well-known

进阶：MCP 服务器集成

在 ~/.hermes/config.yaml 中添加：

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_你的token"

重启 Hermes 后，Agent 就能通过 MCP 使用 GitHub 的工具了。

进阶：微信接入

社区项目 HermesClaw 提供了微信桥接，可以在同一个微信号上同时运行 Hermes Agent 和 OpenClaw。

实际场景举例

场景1：智能工作助手

小李是一名后端开发者，每天需要检查服务器日志、排查告警、写运维脚本。他让 Hermes 在 Docker 沙箱里运行：

# 配置Docker沙箱
hermes config set terminal.backend docker

# 在对话中自然地交代理任务
❯ 帮我连上服务器，看看今天nginx的error log有哪些异常，分析一下是什么原因

Hermes 会自动执行终端命令、读取日志、分析问题。因为它有持久记忆，下次小李再说"帮我看看昨天的告警"，它会想起之前的上下文，不需要重复解释。

场景2：每日AI新闻推送到Telegram

❯ 每天早上8点，搜索一下最近24小时内关于大模型和Agent的最新进展，整理成3-5条摘要，发到我的Telegram。

Hermes 会自动创建 Cron 任务，通过网关在指定时间执行并推送。出差在外也能用手机接收摘要。

场景3：多模型切换，成本优化

用贵模型做复杂推理，用便宜模型做简单任务：

# 第一次用 DeepSeek 做代码审查
hermes model  # 选择 deepseek
❯ 帮我审查一下这段代码的安全问题

# 切换到 Claude 做深度分析
/model anthropic:claude-sonnet-4-20250514
❯ 帮我从架构层面分析这个系统的瓶颈

一行命令切换，无需改代码，无锁入。

场景4：团队知识库+微信机器人

技术团队搭建内部知识Bot：

把团队Wiki和技术文档作为上下文文件放到项目目录（.hermes.md）
通过 HermesClaw 接入微信
团队成员在微信群里艾特Bot提问，Bot基于项目上下文回答
Bot的技能系统让它在回答过的复杂问题上积累经验，越用越专业

场景5：子Agent并行处理

❯ 帮我同时做三件事：1）检查今天的服务器告警 2）更新项目的依赖版本 3）写一个新API接口的单元测试

Hermes 会派出最多3个子Agent（delegate_task），各自独立隔离上下文，并行执行，互不干扰。

跟同类对比

特性	Hermes Agent	OpenHands	AutoGPT	CrewAI
自我学习	✅ 自动创建+改进技能	❌	❌	❌
跨会话记忆	✅ MEMORY.md + USER.md + FTS5搜索	❌ 基本无	有限	有限
消息平台	✅ Telegram/Discord/Slack/WhatsApp/Signal/微信	❌	❌	❌
语音交互	✅ 麦克风+TTS+Discord语音	❌	❌	❌
定时任务	✅ 内置Cron	❌	✅ 基础	❌
子Agent并行	✅ 最多3个	✅ 但串行为主	❌	✅
模型切换	✅ 一行命令，15+提供商	✅ 有限	✅ 简单	✅ 简单
国产模型	✅ 智谱/Kimi/MiniMax/DeepSeek/阿里云	❌	❌	❌
MCP集成	✅	✅	❌	❌
浏览器自动化	✅ 多后端	✅	❌	❌
IDE集成	✅ VS Code/Zed/JetBrains	❌	❌	❌
技能市场	✅ agentskills.io	❌	❌	❌
微信接入	✅ HermesClaw	❌	❌	❌
沙箱执行	✅ Docker/SSH/Daytona/Modal	✅ Docker	❌	❌
开源协议	MIT	MIT	MIT	MIT
GitHub Star	69K+	42K+	172K+	28K+

Hermes Agent 最大的差异化优势在于"学习闭环"——它不是简单的工具调用框架，而是一个会自己长知识的Agent。其他框架用完即弃，Hermes 越用越懂你。同时，15+模型提供商的一键切换（尤其对国产模型的原生支持）和6大消息平台的网关接入，对中国开发者来说非常友好。

小结

Hermes Agent 不只是一个又一个ChatGPT包装器。它的核心创新在于：

学习闭环：自动创建技能、使用中自我改进、主动保存记忆、跨会话搜索——真正实现了"越用越好用"
全平台覆盖：CLI + Telegram + Discord + Slack + WhatsApp + Signal + 微信（HermesClaw），一个Agent覆盖所有入口
模型自由：15+提供商一键切换，国产模型原生支持，不绑死任何一家
安全可控：Docker沙箱、检查点回滚、命令审批，生产环境放心使用
技能生态：agentskills.io开放标准 + 社区技能市场，可复用他人经验

对于中国开发者来说，如果你已经厌倦了每次跟AI聊天都要重新解释项目背景，或者想让AI助手真正在微信/Telegram里24小时待命，Hermes Agent 值得一试。

快速开始：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup
hermes

三行命令，开始你的AI助手进化之旅。

项目链接：

GitHub: https://github.com/NousResearch/hermes-agent
官方文档: https://hermes-agent.nousresearch.com/docs/
Discord社区: https://discord.gg/NousResearch
技能市场: https://agentskills.io

写评论

读者评论

0 条

登录后参与

暂无评论，来分享你的看法吧