claude-mem:让AI编程助手拥有永久记忆,告别每次从零开始的痛苦
claude-mem:让AI编程助手拥有永久记忆,告别每次从零开始的痛苦 你有没有这样的崩溃时刻? 用 Claude Code 写了一下午代码,改了十几个文件,踩了一堆坑,第二天打开新会话——一切归零。你得重新解释项目背景、重新说明技术栈、重新描述昨天遇到的奇葩 bug。AI 助手像个
claude-mem:让AI编程助手拥有永久记忆,告别每次从零开始的痛苦
你有没有这样的崩溃时刻?
用 Claude Code 写了一下午代码,改了十几个文件,踩了一堆坑,第二天打开新会话——一切归零。你得重新解释项目背景、重新说明技术栈、重新描述昨天遇到的奇葩 bug。AI 助手像个失忆患者,每次都是"你好,请问有什么可以帮你?"。更惨的是,你上个会话摸索出来的最佳实践、踩过的坑、做过的重要决策,全部烟消云散。这种"每天重新来过"的体验,用过 AI 编程助手的人都知道有多痛苦。
但现在,有个开源项目彻底解决了这个问题。
claude-mem 是什么?
claude-mem 是 Claude Code 的持久记忆压缩系统插件——它自动保存你每次编程会话中的上下文信息(技术选型、重要决策、踩坑记录等),用 AI 智能压缩后,在下一次会话自动注入回来。简单说:给你的 AI 助手装上一个"大脑",让它记住你教过它的一切。
项目在 GitHub 上已经收获了 58,000+ Star,是目前最火的 Claude Code 生态插件之一。
核心功能一览
| 功能 | 一句话解释 |
|---|---|
| 🧠 持久记忆 | 上下文跨会话持久保存,关掉终端再打开也不会忘 |
| 📊 渐进式展示 | 分层检索记忆,先给你看摘要,需要时再展开详情,省 token 省 |
| 🔍 技能搜索 | 用自然语言查询项目历史,比如"上次那个 Redis 配置问题怎么解决的" |
| 🖥️ Web 查看器 | 浏览器打开 http://localhost:37777,实时查看所有记忆流 |
| 💻 Claude 桌面版支持 | 从 Claude Desktop 对话中也能搜索记忆,不限于终端 |
| 🔒 隐私控制 | 用 <private> 标签包裹的内容不会被记录,保护敏感信息 |
| ⚙️ 上下文配置 | 细粒度控制注入哪些上下文,要什么给什么,不多不少 |
| 🤖 全自动运行 | 5 个生命周期钩子全自动触发,安装后零干预 |
| 🔗 引用系统 | 用 ID 引用过去的观察记录,精准定位历史信息 |
| 🧪 Beta 频道 | 可试用 Endless Mode 等实验功能,尝鲜最新能力 |
安装步骤(手把手教程)
前置条件
在安装 claude-mem 之前,确保你的电脑已经准备好以下环境:
| 条件 | 说明 |
|---|---|
| Node.js 18.0.0+ | JavaScript 运行环境,必须安装。检查方式:终端输入 node -v,版本号 ≥ 18 即可 |
| Claude Code 最新版 | 需要支持插件功能的版本。通过 npm install -g @anthropic-ai/claude-code 更新 |
| Bun | 一个超快的 JavaScript 运行时,安装过程会自动帮你装,不用操心 |
| uv Python 包管理器 | 用于向量搜索功能,同样自动安装,不用手动操作 |
| SQLite 3 | 内置数据库,已经打包在项目里,无需额外安装 |
小白翻译:你只需要自己装好 Node.js 和 Claude Code,剩下的安装过程全自动搞定。
Mac / Linux 安装
打开终端,一行命令搞定:
npx claude-mem install安装完成后,重启 Claude Code 就生效了。就这么简单。
如果你想确认是否安装成功,可以看看这几个标志:
- 终端没有报错(红色的 Error 信息)
- 重启 Claude Code 后,会话开始时能看到记忆注入的提示
- 浏览器访问
http://localhost:37777能看到 Web 查看器页面
Windows 安装
Windows 用户需要额外注意一点:确保 Node.js 已经添加到系统 PATH 环境变量。
步骤如下:
- 安装 Node.js:去 Node.js 官网 下载 LTS 版本安装包,安装时勾选"Add to PATH"
- 验证安装:打开 PowerShell 或 CMD,输入:
``powershell node -v `` 能看到版本号(≥ 18)就说明没问题
- 安装 claude-mem:
``powershell npx claude-mem install ``
- 重启 Claude Code,搞定
⚠️ Windows 常见坑:如果提示"node 不是内部命令",说明 PATH 没配置好。重新运行 Node.js 安装包,勾选"Add to PATH",或者手动把 Node.js 安装目录加到系统环境变量里。
其他 IDE 支持
claude-mem 不止支持 Claude Code,还支持其他 AI 编程工具:
Gemini CLI 用户:
npx claude-mem install --ide gemini-cliOpenCode 用户:
npx claude-mem install --ide opencode在 Claude Code 内部安装(插件市场方式):
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem安装后重启 Claude Code 即可。
使用方法:从入门到进阶
基础用法:装上就忘,全自动运行
claude-mem 最爽的一点就是——安装后什么都不用做。它通过 5 个生命周期钩子全自动工作:
| 钩子名称 | 触发时机 | 做什么 |
|---|---|---|
| SessionStart | 每次打开新会话 | 自动注入历史记忆上下文 |
| UserPromptSubmit | 你发送消息时 | 捕获当前对话意图 |
| PostToolUse | AI 使用工具后 | 记录工具调用和结果 |
| Stop | AI 停止响应时 | 生成摘要快照 |
| SessionEnd | 会话结束时 | 压缩保存完整会话信息 |
你正常写代码,claude-mem 在后台默默记着。下次打开,它自动把相关记忆喂给 AI,你甚至感觉不到它的存在——但 AI 已经"记住"了你的项目。
中级用法:搜索历史记忆
有时候你想主动查历史信息,比如"上次那个支付模块的重构方案是什么?"这时候用 mem-search 技能:
在 Claude Code 中直接输入:
搜索记忆:支付模块重构方案claude-mem 会用自然语言理解你的查询,从历史会话中找到相关记录,用渐进式展示的方式呈现结果——先给你看精简摘要(每个结果约 50-100 token),你看哪个有用再展开详情(约 500-1000 token)。这个设计非常省 token,相比直接加载全量记忆,大约节省 10 倍 token 消耗。
进阶用法:MCP 三层搜索工作流
对于想要精细控制搜索结果的用户,claude-mem 提供了 MCP 搜索工具,采用三层工作流:
第一层:search ——获取紧凑索引
搜索关键词后,返回精简的结果列表,每条记录只有 50-100 token 的摘要。这一步帮你快速扫一眼,判断哪些结果跟你相关。
第二层:timeline ——获取时间线上下文
选中感兴趣的结果后,获取时间线上下文,了解这条记忆前后的时间脉络。比如你找到了一个 Redis 配置的记录,timeline 会告诉你这个配置变更前后发生了什么。
第三层:get_observations ——获取完整详情
只对筛选后的少量结果获取完整内容(每条约 500-1000 token)。避免一次性加载太多数据浪费 token。
为什么要三层? 因为 AI 的 token 是花钱的。如果你直接搜索加载所有历史记录的完整内容,每次可能消耗几万 token。三层工作流让你先看摘要再决定要不要展开,实际使用中节省约 90% 的 token 开销。
实际场景举例
| 场景 | 怎么用 claude-mem |
|---|---|
| 长期项目开发 | 项目持续数周,每天新会话自动恢复项目架构、技术栈、模块关系等上下文,不用每次花 10 分钟重新解释 |
| Bug 调试追踪 | 昨天排查了一半的 bug,今天接着来,AI 知道你已经排除了哪些可能性 |
| 团队接手项目 | 前人用 claude-mem 记录的技术决策和踩坑记录,后来者开会话就能看到 |
| 多项目切换 | 在 A 项目积累的经验(比如某框架的配置方式),切换到 B 项目后搜索记忆即可复用 |
| 代码审查 | 之前审查中提出的问题和建议,下次审查相关代码时自动关联 |
| 学习新框架 | 学习过程中记录的理解和踩坑要点,下次遇到类似问题自动提醒 |
| 隐私敏感项目 | 用 <private> 标签包裹的 API Key、密码等不会被记录到记忆中 |
跟同类工具对比
目前市面上也有一些尝试给 AI 编程助手加"记忆"的方案,我们来看看 claude-mem 的优势:
| 对比维度 | claude-mem | 手动写 CLAUDE.md | 会话历史回看 | 其他记忆插件 |
|---|---|---|---|---|
| 是否自动 | ✅ 全自动,5 个钩子自动触发 | ❌ 需要手动编写维护 | ❌ 需要手动翻找 | 🔶 部分自动 |
| 压缩质量 | ✅ AI 智能压缩,只保留关键信息 | ❌ 纯手工,容易冗余或遗漏 | ❌ 原始对话,信息密度低 | 🔶 简单截断 |
| token 效率 | ✅ 渐进式展示,节省 90% token | 🔶 看写得好不好 | ❌ 每次全量加载 | 🔶 一般 |
| 搜索能力 | ✅ 语义+关键词混合搜索 | ❌ 只能文本匹配 | 🔶 简单关键词搜索 | 🔶 基础搜索 |
| 隐私控制 | ✅ <private> 标签精准排除 | 🔶 手动注意别写进去 | ❌ 全量记录 | 🔶 粗粒度控制 |
| Web 查看器 | ✅ 有,实时可视化 | ❌ 只能看文件 | ❌ 无 | ❌ 大多没有 |
| 多 IDE 支持 | ✅ Claude Code + Gemini CLI + OpenCode | 🔶 看平台 | 🔶 看平台 | ❌ 通常只支持一个 |
| 配置灵活性 | ✅ 多种工作模式 + 中文模式 | 🔶 手动管理 | ❌ 固定 | 🔶 有限 |
| 引用系统 | ✅ ID 精准引用历史记录 | ❌ 无 | ❌ 无 | ❌ 大多没有 |
一句话总结差异:手动写 CLAUDE.md 就像用纸笔记笔记,会话回看就像翻日记本,而 claude-mem 是给你配了一个 AI 秘书——自动记录、智能提炼、精准检索。
配置技巧
claude-mem 的配置文件在 ~/.claude-mem/settings.json,这里分享几个实用配置:
中文模式
如果你主要用中文跟 Claude 交互,开启中文模式会让记忆注入时也用中文,更自然:
{
"CLAUDE_MEM_MODE": "code--zh"
}工作模式选择
不同工作场景适合不同模式:
| 模式 | 适用场景 | 特点 |
|---|---|---|
code | 正常编程 | 平衡记忆量和详细度 |
chill | 轻松闲聊/探索 | 记忆更精简,少打断 |
investigation | 深度调查/研究 | 记录更详细,适合追查复杂问题 |
配置示例:
{
"CLAUDE_MEM_MODE": "investigation--zh"
}隐私保护
在对话中,只要把敏感内容用 <private> 标签包裹,claude-mem 就不会记录这部分内容:
我的数据库连接字符串是 <private>mongodb://admin:P@ssw0rd@prod.db:27017</private>,
请帮我检查配置。这样 AI 能看到并处理你的问题,但密码不会被存到记忆数据库里。
试用实验功能
想尝鲜最新功能?可以在配置中加入 Beta 频道设置,比如试用 Endless Mode(无限上下文模式)等实验功能。不过要注意,实验功能可能不稳定,建议在个人项目中试用,生产环境谨慎使用。
Web 查看器:实时监控你的"AI 记忆"
安装 claude-mem 后,Worker 服务会在后台运行,HTTP API 监听在 37777 端口。打开浏览器访问:
http://localhost:37777你能看到:
- 记忆流:实时查看 claude-mem 正在记录哪些信息
- 搜索端点:提供 10+ 个搜索 API 端点,方便高级用户自定义集成
- 会话历史:所有历史会话的压缩摘要,一目了然
这个功能特别适合想深入了解 claude-mem 工作原理的用户,也方便你检查有没有误记录敏感信息。
技术架构简述(给想深入理解的读者)
claude-mem 的底层技术栈:
- SQLite 数据库:本地存储会话记录、观察(Observation)和摘要,轻量可靠,无需额外部署数据库服务
- Chroma 向量数据库:用于语义搜索,支持"混合语义+关键词搜索"(Hybrid Search),既能理解含义也能精准匹配关键词
- Worker 服务:基于 HTTP API 的后台服务,在端口 37777 上运行,负责记忆的读写和搜索
- MCP 协议:Model Context Protocol,Claude Code 的插件通信协议,claude-mem 通过它跟 Claude Code 对接
整个数据流是这样的:
你的编程对话 → 生命周期钩子捕获 → AI 压缩提取关键信息
→ SQLite + Chroma 存储 → 下次会话自动检索注入所有数据都存在你本地(~/.claude-mem/ 目录下),不会上传到任何云服务器,隐私安全有保障。
常见问题解答
Q:claude-mem 会不会拖慢 Claude Code 的速度?
A:不会。claude-mem 的记忆注入是异步的,不会阻塞你的正常对话。Worker 服务在后台独立运行,记忆的压缩和存储都不影响你的编码体验。实际上,因为 AI 已经有了上下文记忆,响应往往更准确,反而减少了反复沟通的时间。
Q:我的代码和对话数据安全吗?会传到云端吗?
A:所有数据都存在你本地电脑的 ~/.claude-mem/ 目录下,使用的是 SQLite 本地数据库和 Chroma 本地向量数据库。没有任何数据会上传到 claude-mem 的服务器或任何第三方云端。你的代码、对话、技术决策全部留在你自己手里。
Q:记忆数据库会不会越来越大,占满硬盘?
A:不会。claude-mem 用 AI 智能压缩,保存的不是原始对话全文,而是提炼后的关键信息摘要。一个持续使用数周的项目,记忆数据库通常也就几十 MB,跟一张照片差不多。而且你可以通过 Web 查看器管理和清理旧记忆。
Q:我能在多个项目之间独立管理记忆吗?
A:可以。claude-mem 是按项目目录区分记忆的。你在不同项目目录下使用 Claude Code,每个项目有自己独立的记忆库,互不干扰。同时你也可以通过搜索功能跨项目查询经验。
Q:如果我不想让某些对话被记录怎么办?
A:简单,两个办法——第一,用 <private> 标签包裹敏感内容;第二,在配置中调整上下文注入策略,控制需要排除的内容类型。你是自己记忆的主人,完全可控。
Q:支持其他 AI 编程助手吗?比如 Cursor、Windsurf?
A:目前官方支持 Claude Code、Gemini CLI 和 OpenCode。对于 Cursor、Windsurf 等其他工具,暂时没有直接支持,不过项目的 MCP 协议是开放的,社区可能会扩展支持。
为什么 58000 人选择 claude-mem?
58000+ Star 不是偶然。claude-mem 解决的是一个真实且普遍的痛点——AI 编程助手的"金鱼记忆"。在它出现之前,开发者要么忍受每次重新解释的痛苦,要么花大量时间手动维护 CLAUDE.md 文件。claude-mem 把这一切变成了全自动:
- 你不用改变工作习惯——照常写代码,后台自动记忆
- 你不用担心 token 浪费——智能压缩 + 渐进式展示,省 90% token
- 你不用担心隐私泄露——本地存储 +
<private>标签保护 - 你不用手动维护笔记——AI 帮你提炼、整理、检索
这才是"AI 助手"该有的样子——不止能帮你写代码,还能记住你说过的话。
小结
claude-mem 用一行命令安装,全自动运行,给你的 AI 编程助手装上永久记忆,从此告别每次对话从零开始的痛苦。无论是长期项目追踪、bug 调试还是多项目切换,它都能让你省下大量重复解释的时间。58000+ Star 的社区认可,说明这不是一个玩具,而是真正改变工作流的生产力工具。
项目地址:https://github.com/thedotmack/claude-mem
读者评论
0 条暂无评论,来分享你的看法吧
相关推荐
结合当前内容、你的浏览习惯和搜索偏好推荐。

