文章

工程实践

#claude-mem #Claude Code #AI编程 #持久记忆 #开发者工具

claude-mem：让AI编程助手拥有永久记忆，告别每次从零开始的痛苦

claude-mem：让AI编程助手拥有永久记忆，告别每次从零开始的痛苦你有没有这样的崩溃时刻？用 Claude Code 写了一下午代码，改了十几个文件，踩了一堆坑，第二天打开新会话——一切归零。你得重新解释项目背景、重新说明技术栈、重新描述昨天遇到的奇葩 bug。AI 助手像个

5 阅读0 评论

claude-mem：让AI编程助手拥有永久记忆，告别每次从零开始的痛苦

你有没有这样的崩溃时刻？

用 Claude Code 写了一下午代码，改了十几个文件，踩了一堆坑，第二天打开新会话——一切归零。你得重新解释项目背景、重新说明技术栈、重新描述昨天遇到的奇葩 bug。AI 助手像个失忆患者，每次都是"你好，请问有什么可以帮你？"。更惨的是，你上个会话摸索出来的最佳实践、踩过的坑、做过的重要决策，全部烟消云散。这种"每天重新来过"的体验，用过 AI 编程助手的人都知道有多痛苦。

但现在，有个开源项目彻底解决了这个问题。

claude-mem 是什么？

claude-mem 是 Claude Code 的持久记忆压缩系统插件——它自动保存你每次编程会话中的上下文信息（技术选型、重要决策、踩坑记录等），用 AI 智能压缩后，在下一次会话自动注入回来。简单说：给你的 AI 助手装上一个"大脑"，让它记住你教过它的一切。

项目在 GitHub 上已经收获了 58,000+ Star，是目前最火的 Claude Code 生态插件之一。

核心功能一览

功能	一句话解释
🧠 持久记忆	上下文跨会话持久保存，关掉终端再打开也不会忘
📊 渐进式展示	分层检索记忆，先给你看摘要，需要时再展开详情，省 token 省
🔍 技能搜索	用自然语言查询项目历史，比如"上次那个 Redis 配置问题怎么解决的"
🖥️ Web 查看器	浏览器打开 `http://localhost:37777`，实时查看所有记忆流
💻 Claude 桌面版支持	从 Claude Desktop 对话中也能搜索记忆，不限于终端
🔒 隐私控制	用 `<private>` 标签包裹的内容不会被记录，保护敏感信息
⚙️ 上下文配置	细粒度控制注入哪些上下文，要什么给什么，不多不少
🤖 全自动运行	5 个生命周期钩子全自动触发，安装后零干预
🔗 引用系统	用 ID 引用过去的观察记录，精准定位历史信息
🧪 Beta 频道	可试用 Endless Mode 等实验功能，尝鲜最新能力

安装步骤（手把手教程）

前置条件

在安装 claude-mem 之前，确保你的电脑已经准备好以下环境：

条件	说明
Node.js 18.0.0+	JavaScript 运行环境，必须安装。检查方式：终端输入 `node -v`，版本号 ≥ 18 即可
Claude Code 最新版	需要支持插件功能的版本。通过 `npm install -g @anthropic-ai/claude-code` 更新
Bun	一个超快的 JavaScript 运行时，安装过程会自动帮你装，不用操心
uv Python 包管理器	用于向量搜索功能，同样自动安装，不用手动操作
SQLite 3	内置数据库，已经打包在项目里，无需额外安装

小白翻译：你只需要自己装好 Node.js 和 Claude Code，剩下的安装过程全自动搞定。

Mac / Linux 安装

打开终端，一行命令搞定：

npx claude-mem install

安装完成后，重启 Claude Code 就生效了。就这么简单。

如果你想确认是否安装成功，可以看看这几个标志：

终端没有报错（红色的 Error 信息）
重启 Claude Code 后，会话开始时能看到记忆注入的提示
浏览器访问 http://localhost:37777 能看到 Web 查看器页面

Windows 安装

Windows 用户需要额外注意一点：确保 Node.js 已经添加到系统 PATH 环境变量。

步骤如下：

安装 Node.js：去 Node.js 官网下载 LTS 版本安装包，安装时勾选"Add to PATH"

验证安装：打开 PowerShell 或 CMD，输入：

``powershell node -v `` 能看到版本号（≥ 18）就说明没问题

安装 claude-mem：

``powershell npx claude-mem install ``

重启 Claude Code，搞定

⚠️ Windows 常见坑：如果提示"node 不是内部命令"，说明 PATH 没配置好。重新运行 Node.js 安装包，勾选"Add to PATH"，或者手动把 Node.js 安装目录加到系统环境变量里。

其他 IDE 支持

claude-mem 不止支持 Claude Code，还支持其他 AI 编程工具：

Gemini CLI 用户：

npx claude-mem install --ide gemini-cli

OpenCode 用户：

npx claude-mem install --ide opencode

在 Claude Code 内部安装（插件市场方式）：

/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

安装后重启 Claude Code 即可。

使用方法：从入门到进阶

基础用法：装上就忘，全自动运行

claude-mem 最爽的一点就是——安装后什么都不用做。它通过 5 个生命周期钩子全自动工作：

钩子名称	触发时机	做什么
SessionStart	每次打开新会话	自动注入历史记忆上下文
UserPromptSubmit	你发送消息时	捕获当前对话意图
PostToolUse	AI 使用工具后	记录工具调用和结果
Stop	AI 停止响应时	生成摘要快照
SessionEnd	会话结束时	压缩保存完整会话信息

你正常写代码，claude-mem 在后台默默记着。下次打开，它自动把相关记忆喂给 AI，你甚至感觉不到它的存在——但 AI 已经"记住"了你的项目。

中级用法：搜索历史记忆

有时候你想主动查历史信息，比如"上次那个支付模块的重构方案是什么？"这时候用 mem-search 技能：

在 Claude Code 中直接输入：

搜索记忆：支付模块重构方案

claude-mem 会用自然语言理解你的查询，从历史会话中找到相关记录，用渐进式展示的方式呈现结果——先给你看精简摘要（每个结果约 50-100 token），你看哪个有用再展开详情（约 500-1000 token）。这个设计非常省 token，相比直接加载全量记忆，大约节省 10 倍 token 消耗。

进阶用法：MCP 三层搜索工作流

对于想要精细控制搜索结果的用户，claude-mem 提供了 MCP 搜索工具，采用三层工作流：

第一层：search ——获取紧凑索引

搜索关键词后，返回精简的结果列表，每条记录只有 50-100 token 的摘要。这一步帮你快速扫一眼，判断哪些结果跟你相关。

第二层：timeline ——获取时间线上下文

选中感兴趣的结果后，获取时间线上下文，了解这条记忆前后的时间脉络。比如你找到了一个 Redis 配置的记录，timeline 会告诉你这个配置变更前后发生了什么。

第三层：get_observations ——获取完整详情

只对筛选后的少量结果获取完整内容（每条约 500-1000 token）。避免一次性加载太多数据浪费 token。

为什么要三层？ 因为 AI 的 token 是花钱的。如果你直接搜索加载所有历史记录的完整内容，每次可能消耗几万 token。三层工作流让你先看摘要再决定要不要展开，实际使用中节省约 90% 的 token 开销。

实际场景举例

场景	怎么用 claude-mem
长期项目开发	项目持续数周，每天新会话自动恢复项目架构、技术栈、模块关系等上下文，不用每次花 10 分钟重新解释
Bug 调试追踪	昨天排查了一半的 bug，今天接着来，AI 知道你已经排除了哪些可能性
团队接手项目	前人用 claude-mem 记录的技术决策和踩坑记录，后来者开会话就能看到
多项目切换	在 A 项目积累的经验（比如某框架的配置方式），切换到 B 项目后搜索记忆即可复用
代码审查	之前审查中提出的问题和建议，下次审查相关代码时自动关联
学习新框架	学习过程中记录的理解和踩坑要点，下次遇到类似问题自动提醒
隐私敏感项目	用 `<private>` 标签包裹的 API Key、密码等不会被记录到记忆中

跟同类工具对比

目前市面上也有一些尝试给 AI 编程助手加"记忆"的方案，我们来看看 claude-mem 的优势：

对比维度	claude-mem	手动写 CLAUDE.md	会话历史回看	其他记忆插件
是否自动	✅ 全自动，5 个钩子自动触发	❌ 需要手动编写维护	❌ 需要手动翻找	🔶 部分自动
压缩质量	✅ AI 智能压缩，只保留关键信息	❌ 纯手工，容易冗余或遗漏	❌ 原始对话，信息密度低	🔶 简单截断
token 效率	✅ 渐进式展示，节省 90% token	🔶 看写得好不好	❌ 每次全量加载	🔶 一般
搜索能力	✅ 语义+关键词混合搜索	❌ 只能文本匹配	🔶 简单关键词搜索	🔶 基础搜索
隐私控制	✅ `<private>` 标签精准排除	🔶 手动注意别写进去	❌ 全量记录	🔶 粗粒度控制
Web 查看器	✅ 有，实时可视化	❌ 只能看文件	❌ 无	❌ 大多没有
多 IDE 支持	✅ Claude Code + Gemini CLI + OpenCode	🔶 看平台	🔶 看平台	❌ 通常只支持一个
配置灵活性	✅ 多种工作模式 + 中文模式	🔶 手动管理	❌ 固定	🔶 有限
引用系统	✅ ID 精准引用历史记录	❌ 无	❌ 无	❌ 大多没有

一句话总结差异：手动写 CLAUDE.md 就像用纸笔记笔记，会话回看就像翻日记本，而 claude-mem 是给你配了一个 AI 秘书——自动记录、智能提炼、精准检索。

配置技巧

claude-mem 的配置文件在 ~/.claude-mem/settings.json，这里分享几个实用配置：

中文模式

如果你主要用中文跟 Claude 交互，开启中文模式会让记忆注入时也用中文，更自然：

{
  "CLAUDE_MEM_MODE": "code--zh"
}

工作模式选择

不同工作场景适合不同模式：

模式	适用场景	特点
`code`	正常编程	平衡记忆量和详细度
`chill`	轻松闲聊/探索	记忆更精简，少打断
`investigation`	深度调查/研究	记录更详细，适合追查复杂问题

配置示例：

{
  "CLAUDE_MEM_MODE": "investigation--zh"
}

隐私保护

在对话中，只要把敏感内容用 <private> 标签包裹，claude-mem 就不会记录这部分内容：

我的数据库连接字符串是 <private>mongodb://admin:P@ssw0rd@prod.db:27017</private>，
请帮我检查配置。

这样 AI 能看到并处理你的问题，但密码不会被存到记忆数据库里。

试用实验功能

想尝鲜最新功能？可以在配置中加入 Beta 频道设置，比如试用 Endless Mode（无限上下文模式）等实验功能。不过要注意，实验功能可能不稳定，建议在个人项目中试用，生产环境谨慎使用。

Web 查看器：实时监控你的"AI 记忆"

安装 claude-mem 后，Worker 服务会在后台运行，HTTP API 监听在 37777 端口。打开浏览器访问：

http://localhost:37777

你能看到：

记忆流：实时查看 claude-mem 正在记录哪些信息
搜索端点：提供 10+ 个搜索 API 端点，方便高级用户自定义集成
会话历史：所有历史会话的压缩摘要，一目了然

这个功能特别适合想深入了解 claude-mem 工作原理的用户，也方便你检查有没有误记录敏感信息。

技术架构简述（给想深入理解的读者）

claude-mem 的底层技术栈：

SQLite 数据库：本地存储会话记录、观察（Observation）和摘要，轻量可靠，无需额外部署数据库服务
Chroma 向量数据库：用于语义搜索，支持"混合语义+关键词搜索"（Hybrid Search），既能理解含义也能精准匹配关键词
Worker 服务：基于 HTTP API 的后台服务，在端口 37777 上运行，负责记忆的读写和搜索
MCP 协议：Model Context Protocol，Claude Code 的插件通信协议，claude-mem 通过它跟 Claude Code 对接

整个数据流是这样的：

你的编程对话 → 生命周期钩子捕获 → AI 压缩提取关键信息 
→ SQLite + Chroma 存储 → 下次会话自动检索注入

所有数据都存在你本地（~/.claude-mem/ 目录下），不会上传到任何云服务器，隐私安全有保障。

常见问题解答

Q：claude-mem 会不会拖慢 Claude Code 的速度？

A：不会。claude-mem 的记忆注入是异步的，不会阻塞你的正常对话。Worker 服务在后台独立运行，记忆的压缩和存储都不影响你的编码体验。实际上，因为 AI 已经有了上下文记忆，响应往往更准确，反而减少了反复沟通的时间。

Q：我的代码和对话数据安全吗？会传到云端吗？

A：所有数据都存在你本地电脑的 ~/.claude-mem/ 目录下，使用的是 SQLite 本地数据库和 Chroma 本地向量数据库。没有任何数据会上传到 claude-mem 的服务器或任何第三方云端。你的代码、对话、技术决策全部留在你自己手里。

Q：记忆数据库会不会越来越大，占满硬盘？

A：不会。claude-mem 用 AI 智能压缩，保存的不是原始对话全文，而是提炼后的关键信息摘要。一个持续使用数周的项目，记忆数据库通常也就几十 MB，跟一张照片差不多。而且你可以通过 Web 查看器管理和清理旧记忆。

Q：我能在多个项目之间独立管理记忆吗？

A：可以。claude-mem 是按项目目录区分记忆的。你在不同项目目录下使用 Claude Code，每个项目有自己独立的记忆库，互不干扰。同时你也可以通过搜索功能跨项目查询经验。

Q：如果我不想让某些对话被记录怎么办？

A：简单，两个办法——第一，用 <private> 标签包裹敏感内容；第二，在配置中调整上下文注入策略，控制需要排除的内容类型。你是自己记忆的主人，完全可控。

Q：支持其他 AI 编程助手吗？比如 Cursor、Windsurf？

A：目前官方支持 Claude Code、Gemini CLI 和 OpenCode。对于 Cursor、Windsurf 等其他工具，暂时没有直接支持，不过项目的 MCP 协议是开放的，社区可能会扩展支持。

为什么 58000 人选择 claude-mem？

58000+ Star 不是偶然。claude-mem 解决的是一个真实且普遍的痛点——AI 编程助手的"金鱼记忆"。在它出现之前，开发者要么忍受每次重新解释的痛苦，要么花大量时间手动维护 CLAUDE.md 文件。claude-mem 把这一切变成了全自动：

你不用改变工作习惯——照常写代码，后台自动记忆
你不用担心 token 浪费——智能压缩 + 渐进式展示，省 90% token
你不用担心隐私泄露——本地存储 + <private> 标签保护
你不用手动维护笔记——AI 帮你提炼、整理、检索

这才是"AI 助手"该有的样子——不止能帮你写代码，还能记住你说过的话。

小结

claude-mem 用一行命令安装，全自动运行，给你的 AI 编程助手装上永久记忆，从此告别每次对话从零开始的痛苦。无论是长期项目追踪、bug 调试还是多项目切换，它都能让你省下大量重复解释的时间。58000+ Star 的社区认可，说明这不是一个玩具，而是真正改变工作流的生产力工具。

项目地址：https://github.com/thedotmack/claude-mem

写评论

读者评论

0 条

登录后参与

暂无评论，来分享你的看法吧

claude-mem：让AI编程助手拥有永久记忆，告别每次从零开始的痛苦

你有没有这样的崩溃时刻？

claude-mem 是什么？

核心功能一览

安装步骤（手把手教程）

前置条件

小白翻译：你只需要自己装好 Node.js 和 Claude Code，剩下的安装过程全自动搞定。

Mac / Linux 安装

Windows 安装

Windows 用户需要额外注意一点：确保 Node.js 已经添加到系统 PATH 环境变量。

步骤如下：

其他 IDE 支持

Gemini CLI 用户：

使用方法：从入门到进阶

基础用法：装上就忘，全自动运行

claude-mem 最爽的一点就是——安装后什么都不用做。它通过 5 个生命周期钩子全自动工作：

中级用法：搜索历史记忆

在 Claude Code 中直接输入：

进阶用法：MCP 三层搜索工作流

为什么要三层？ 因为 AI 的 token 是花钱的。如果你直接搜索加载所有历史记录的完整内容，每次可能消耗几万 token。三层工作流让你先看摘要再决定要不要展开，实际使用中节省约 90% 的 token 开销。

实际场景举例

跟同类工具对比

一句话总结差异：手动写 CLAUDE.md 就像用纸笔记笔记，会话回看就像翻日记本，而 claude-mem 是给你配了一个 AI 秘书——自动记录、智能提炼、精准检索。

配置技巧

中文模式

工作模式选择

配置示例：

隐私保护

试用实验功能

Web 查看器：实时监控你的"AI 记忆"

安装 claude-mem 后，Worker 服务会在后台运行，HTTP API 监听在 37777 端口。打开浏览器访问：

技术架构简述（给想深入理解的读者）

claude-mem 的底层技术栈：

整个数据流是这样的：

常见问题解答

Q：claude-mem 会不会拖慢 Claude Code 的速度？

Q：我的代码和对话数据安全吗？会传到云端吗？

Q：记忆数据库会不会越来越大，占满硬盘？

Q：我能在多个项目之间独立管理记忆吗？

Q：如果我不想让某些对话被记录怎么办？

Q：支持其他 AI 编程助手吗？比如 Cursor、Windsurf？

为什么 58000 人选择 claude-mem？

小结

项目地址：https://github.com/thedotmack/claude-mem

读者评论

相关推荐

claude-mem：让Claude Code拥有跨会话持久记忆的开源插件

9700万下载量背后：MCP协议如何从实验品变成AI Agent的"USB-C"

AI虚拟细胞：当大模型学会读懂生命，生物学迎来天气预报时刻

GPT-5.4-Cyber发布：AI安全攻防进入身份验证时代

为什么要三层？因为 AI 的 token 是花钱的。如果你直接搜索加载所有历史记录的完整内容，每次可能消耗几万 token。三层工作流让你先看摘要再决定要不要展开，实际使用中节省约 90% 的 token 开销。