> 如果大模型是 Agent 的大脑,那记忆就是它的「笔记本」。
笔记本写在哪、怎么翻、翻多快,决定了 Agent 是「过目不忘」还是「转身就忘」。
今天不用任何表格,用「一句话」带你逛完整个仓库:
1. Agent 要记哪些事?
2. 这些事分别写在哪、用什么格式、拿什么介质?
3. 电商客服、个人助理、跨境货运 3 个案例,直接抄作业。
—
01 先给记忆分个层
一句话总结:
越靠近用户的记忆越贵、越小、越易失;越靠近硬盘越便宜、越大、越永久。
– 工作记忆(秒级)
就像你心算时默念的数字,只活在 Python 变量里,程序重启就清零。
典型容量:几 MB,丢一次代价就是「当前任务直接失败」。
– 短期记忆(分钟–小时)
类似微信聊天窗口里的上下文,关掉窗口就找不到。
容量:几十 MB,丢一次会让 Agent「答非所问」。
– 长期记忆(天–永久)
像你的淘宝收货地址,下次打开还在。
容量:GB 起步,丢一次「个性化归零」。
– 垂类记忆(永久)
行业规则、优惠券互斥、SKU 对照表,全公司共用。
容量:百 GB 级,丢一次直接「业务报错」。
—
02 存储介质「四件套」
同样一句话总结:
速度、容量、成本只能三选二,没有银弹。
– Redis
毫秒级,最贵,容量最小,只放「正在聊的对话上下文」。
就像把外卖单贴在显示器边,随用随撕。
– 向量库(Milvus / Pinecone)
十到百毫秒,价格中等,容量中等,专管「语义回忆」。
类似给每句话拍一张「指纹照片」,靠相似度翻旧账。
– 关系型数据库(MySQL / PostgreSQL)
二十毫秒,最便宜,容量最大,擅长「精确查询」。
像 Excel 总表,订单号、价格、状态一一对应,查一行是一行。
– 知识图谱(Neo4j)
五十毫秒,最贵,容量最大,专治「关系推理」。
像一张蜘蛛网,任意两个节点都能绕出最短路径,优惠券能不能叠加一眼看穿。
—
03 三个真实案例,直接抄作业
1. 电商零食客服
– 正在聊的订单号 → 写 Redis,300 ms 内必达。
– 用户 90 天口味偏好 → 写 Milvus,下次推荐「麻辣味」(99% 命中率)。
– 满减券互斥规则 → 写 Neo4j,一眼识别「A 券和 B 券不能同享」。
结果:促销季响应时间砍半,转化率 +18%。
2. Notion AI 个人助理
– 光标当前位置 → 纯内存变量,关闭页面即丢。
– 项目列表 → 写 PostgreSQL,永久保留。
– 相似历史文档 → 向量库秒级召回,写周报不再从零开始。
3. 跨境货运 Agent
– 各国货运单版式 → 全部向量化存进 Milvus,版式识别准确率 99.8%。
– 版式与字段映射关系 → 写 Neo4j,任意两国单据都能自动对齐。
结果:人工复核成本 ↓70%。
—
04 2025 趋势速览
1. Memory-as-a-Service:Mem0、Zep 把「记忆」做成 API,一行代码接入,不用自己搭库。
2. 分层冷热存储:高频记忆放向量库,低频沉到对象存储,成本再降 50%。
3. 多模态记忆:文本+图像+语音统一向量化,Agent 能「记住」你发过的表情包。
—
05 给开发者的 3 句话
1. 先问「多久用一次」再选介质:秒级用 Redis,天级用向量,永久用关系+图谱。
2. 记忆也要「断舍离」:用时间衰减 + 重要性评分,3 个月无访问自动归档,内存省 30%。
3. 别把向量当万能:需要精确匹配(价格、状态)时,老老实实写 SQL。
—
> 如果觉得有用,点个「赞」和「在看」,我们下篇聊聊「记忆压缩」黑科技。


