新的一年,从Agent的记忆库开始说起

> 如果大模型是 Agent 的大脑,那记忆就是它的「笔记本」。

笔记本写在哪、怎么翻、翻多快,决定了 Agent 是「过目不忘」还是「转身就忘」。

今天不用任何表格,用「一句话」带你逛完整个仓库: 

1. Agent 要记哪些事? 

2. 这些事分别写在哪、用什么格式、拿什么介质? 

3. 电商客服、个人助理、跨境货运 3 个案例,直接抄作业。

01 先给记忆分个层

一句话总结:


越靠近用户的记忆越贵、越小、越易失;越靠近硬盘越便宜、越大、越永久。

– 工作记忆(秒级)

就像你心算时默念的数字,只活在 Python 变量里,程序重启就清零。

典型容量:几 MB,丢一次代价就是「当前任务直接失败」。


– 短期记忆(分钟–小时)

类似微信聊天窗口里的上下文,关掉窗口就找不到。

容量:几十 MB,丢一次会让 Agent「答非所问」。

– 长期记忆(天–永久)

像你的淘宝收货地址,下次打开还在。

容量:GB 起步,丢一次「个性化归零」。

– 垂类记忆(永久)

行业规则、优惠券互斥、SKU 对照表,全公司共用。

容量:百 GB 级,丢一次直接「业务报错」。

02 存储介质「四件套」

同样一句话总结:

速度、容量、成本只能三选二,没有银弹。

– Redis

毫秒级,最贵,容量最小,只放「正在聊的对话上下文」。

就像把外卖单贴在显示器边,随用随撕。

– 向量库(Milvus / Pinecone)

十到百毫秒,价格中等,容量中等,专管「语义回忆」。

类似给每句话拍一张「指纹照片」,靠相似度翻旧账。

– 关系型数据库(MySQL / PostgreSQL)

二十毫秒,最便宜,容量最大,擅长「精确查询」。

像 Excel 总表,订单号、价格、状态一一对应,查一行是一行。

– 知识图谱(Neo4j)

五十毫秒,最贵,容量最大,专治「关系推理」。

像一张蜘蛛网,任意两个节点都能绕出最短路径,优惠券能不能叠加一眼看穿。

03 三个真实案例,直接抄作业

1. 电商零食客服

– 正在聊的订单号 → 写 Redis,300 ms 内必达。 

– 用户 90 天口味偏好 → 写 Milvus,下次推荐「麻辣味」(99% 命中率)。 

– 满减券互斥规则 → 写 Neo4j,一眼识别「A 券和 B 券不能同享」。

结果:促销季响应时间砍半,转化率 +18%。

2. Notion AI 个人助理

– 光标当前位置 → 纯内存变量,关闭页面即丢。 

– 项目列表 → 写 PostgreSQL,永久保留。 

– 相似历史文档 → 向量库秒级召回,写周报不再从零开始。

3. 跨境货运 Agent

– 各国货运单版式 → 全部向量化存进 Milvus,版式识别准确率 99.8%。 

– 版式与字段映射关系 → 写 Neo4j,任意两国单据都能自动对齐。

结果:人工复核成本 ↓70%。

04 2025 趋势速览

1. Memory-as-a-Service:Mem0、Zep 把「记忆」做成 API,一行代码接入,不用自己搭库。 

2. 分层冷热存储:高频记忆放向量库,低频沉到对象存储,成本再降 50%。 

3. 多模态记忆:文本+图像+语音统一向量化,Agent 能「记住」你发过的表情包。

05 给开发者的 3 句话

1. 先问「多久用一次」再选介质:秒级用 Redis,天级用向量,永久用关系+图谱。 

2. 记忆也要「断舍离」:用时间衰减 + 重要性评分,3 个月无访问自动归档,内存省 30%。 

3. 别把向量当万能:需要精确匹配(价格、状态)时,老老实实写 SQL。

> 如果觉得有用,点个「赞」和「在看」,我们下篇聊聊「记忆压缩」黑科技。

Palantir前沿技术新闻资讯

企业级实用本体论与构建指南(3/4):Palantir Foundry中的对象、事件与时间序列

2026-5-5 5:55:28

AI面试企业落地新闻资讯

使用 ChatGPT 面试作弊

2026-5-5 5:58:57

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索