新的一年，从Agent的记忆库开始说起

> 如果大模型是 Agent 的大脑，那记忆就是它的「笔记本」。

笔记本写在哪、怎么翻、翻多快，决定了 Agent 是「过目不忘」还是「转身就忘」。

今天不用任何表格，用「一句话」带你逛完整个仓库：

1. Agent 要记哪些事？

2. 这些事分别写在哪、用什么格式、拿什么介质？

3. 电商客服、个人助理、跨境货运 3 个案例，直接抄作业。

—

01 先给记忆分个层

一句话总结：

越靠近用户的记忆越贵、越小、越易失；越靠近硬盘越便宜、越大、越永久。

– 工作记忆（秒级）

就像你心算时默念的数字，只活在 Python 变量里，程序重启就清零。

典型容量：几 MB，丢一次代价就是「当前任务直接失败」。

– 短期记忆（分钟–小时）

类似微信聊天窗口里的上下文，关掉窗口就找不到。

容量：几十 MB，丢一次会让 Agent「答非所问」。

– 长期记忆（天–永久）

像你的淘宝收货地址，下次打开还在。

容量：GB 起步，丢一次「个性化归零」。

– 垂类记忆（永久）

行业规则、优惠券互斥、SKU 对照表，全公司共用。

容量：百 GB 级，丢一次直接「业务报错」。

—

02 存储介质「四件套」

同样一句话总结：

速度、容量、成本只能三选二，没有银弹。

– Redis

毫秒级，最贵，容量最小，只放「正在聊的对话上下文」。

就像把外卖单贴在显示器边，随用随撕。

– 向量库（Milvus / Pinecone）

十到百毫秒，价格中等，容量中等，专管「语义回忆」。

类似给每句话拍一张「指纹照片」，靠相似度翻旧账。

– 关系型数据库（MySQL / PostgreSQL）

二十毫秒，最便宜，容量最大，擅长「精确查询」。

像 Excel 总表，订单号、价格、状态一一对应，查一行是一行。

– 知识图谱（Neo4j）

五十毫秒，最贵，容量最大，专治「关系推理」。

像一张蜘蛛网，任意两个节点都能绕出最短路径，优惠券能不能叠加一眼看穿。

—

03 三个真实案例，直接抄作业

1. 电商零食客服

– 正在聊的订单号 → 写 Redis，300 ms 内必达。

– 用户 90 天口味偏好 → 写 Milvus，下次推荐「麻辣味」(99% 命中率)。

– 满减券互斥规则 → 写 Neo4j，一眼识别「A 券和 B 券不能同享」。

结果：促销季响应时间砍半，转化率 +18%。

2. Notion AI 个人助理

– 光标当前位置 → 纯内存变量，关闭页面即丢。

– 项目列表 → 写 PostgreSQL，永久保留。

– 相似历史文档 → 向量库秒级召回，写周报不再从零开始。

3. 跨境货运 Agent

– 各国货运单版式 → 全部向量化存进 Milvus，版式识别准确率 99.8%。

– 版式与字段映射关系 → 写 Neo4j，任意两国单据都能自动对齐。

结果：人工复核成本 ↓70%。

—

04 2025 趋势速览

1. Memory-as-a-Service：Mem0、Zep 把「记忆」做成 API，一行代码接入，不用自己搭库。

2. 分层冷热存储：高频记忆放向量库，低频沉到对象存储，成本再降 50%。

3. 多模态记忆：文本+图像+语音统一向量化，Agent 能「记住」你发过的表情包。

—

05 给开发者的 3 句话

1. 先问「多久用一次」再选介质：秒级用 Redis，天级用向量，永久用关系+图谱。

2. 记忆也要「断舍离」：用时间衰减 + 重要性评分，3 个月无访问自动归档，内存省 30%。

3. 别把向量当万能：需要精确匹配（价格、状态）时，老老实实写 SQL。

—

> 如果觉得有用，点个「赞」和「在看」，我们下篇聊聊「记忆压缩」黑科技。

{{userData.name}}已认证

新的一年，从Agent的记忆库开始说起

企业级实用本体论与构建指南（3/4）：Palantir Foundry中的对象、事件与时间序列

使用 ChatGPT 面试作弊