全部标签

RAG技术

别再用向量数据库给AI灌"迷魂汤"了

一场关于"切片"的集体癔症如果未来的数字考古学家翻开2023-2025年的技术史，他们一定会看到一个荒诞的景观：成千上万的天才程序员，正满头大汗地把人类文明精妙的逻辑、厚重的典籍和严密的法典，塞进一台巨大的"赛博碎纸机"里。这台碎纸机有个高级的名字，叫向量数据库（Vector Database）。在那段狂热的日子里，人们坚信只要把知识切成一段段5…
RAG技术
- 4
- 0
charles4月13日
DSPy 3 + GEPA：迄今最先进的 RAG 框架——自动推理与提示

上周，OpenAI 在半夜突发“飙车”，一度全网骚动。GPT-5.2 发布，全球 AI 王座再度易主。四个月左右就迎来一次大版本更新并不常见。导火索是竞争压力。路透社报道(https://www.reuters.com/technology/openai-launches-gpt-52-ai-model-with-improved-capabilities-2025-12-11/) 称，Altma…
RAG技术
- 5
- 0
charles4月13日
Anthropic一夜震撼升级：Claude获得「永久记忆」！全球打工人变天

搅翻整个硅谷的Anthropic，继续甩出新的核弹。就在今天，消息人士爆出：Anthropic正在给Claude Cowork重磅升级，知识库注入永久记忆！也就是说，从此Claude将不再是金鱼记忆，在它的「永存大脑」中，它将开始自动记住一切。从此，Claude将不再是个聊天机器人，这种永久记忆模式的Cowork模式，将会彻底颠覆AI办公革命！此外，Cowork模式将与Chat模式合并，并成为Cl…
RAG技术
- 2
- 0
charles4月13日
Relink：动态构建查询导向的知识图谱推理框架，新一代 GraphRAG

Graph-based Retrieval-Augmented Generation: Relink Framework文章摘要针对大语言模型幻觉问题，现有GraphRAG方法依赖静态知识图谱，面临知识不完整和干扰事实两大挑战。本文提出Relink框架，突破传统"先构建后推理"范式，采用"边推理边构建"策略，动态生成查询专属证据图谱，在五个开放域问答基准上实…
RAG技术
- 3
- 0
charles4月12日
【解密源码】WeKnora 文档切分与 Chunk 构建解析：腾讯生产级 RAG 的底层设计

引言WeKnora 是腾讯开源的一套生产级 RAG 框架，定位非常明确：解决真实业务场景下“文档复杂、类型多样、规模可控但质量要求极高”的知识增强问题。社区中有人将其视为 ima 的开源实现之一，虽然这一说法无从官方考证，但可以确定的是，WeKnora 在工程完整度、边界处理和异常降级策略上，是一套经过实战打磨的系统方案。从文档接入、解析、切分、向量化、多模态增强，到知识图谱、…
RAG技术
- 1
- 0
charles4月12日
Dify 外部知识库最佳实践：基于 InfraNodus 扩展 RAG 图谱能力

dify 的外部知识库功能支持对接第三方知识系统，无需迁移数据即可使用专业的检索技术。本文将介绍如何把 InfraNodus（一个内置 GraphRAG 能力的文本网络分析工具）接入 Dify 工作流。为什么选择 InfraNodus？传统 RAG 依赖向量相似度搜索，处理具体问题时表现不错，但面对宽泛的问题往往力不从心。比如用户问“这个是用来做什么的？”，标准 RAG 很可能检索不到任何内容，或…
RAG技术
- 1
- 0
charles4月12日
多层次理解向量匹配的底层原理

向量匹配原理本质上是：把“对象 / 文本 / 图片 / 行为”等转成向量（一串数字），再用数学方法衡量向量之间的相似度，从而判断它们“有多像”。下面我从直觉 → 数学 → 工程实现 → 应用场景等多层次给大家系统性的讲清楚。一、直觉层理解1️⃣ 向量是什么？向量 = 对一个对象的“特征编码”比如一句话：“LangChain可以构建智能体”会被编码成类似：[0.12, -0.33, 0.…
RAG技术
- 5
- 0
charles4月12日
2026 年你需要了解的 RAG 全解析

核心概念、架构与更多实践…随着2025年的过去，各类基于 LLM 的系统架构已被广泛采用，并在诸多任务上展现出高效性。其中，Retrieval-Augmented Generation (RAG) 无疑是每位 AI 从业者都必须掌握的关键架构。鉴于其重要性以及原始 RAG 框架在研究与生产系统中的快速演进，本文力求兼顾实用与系统性。每当我写这类重要 AI 主题时，都会尽量深入，覆盖核心概…
RAG技术
- 3
- 0
charles4月12日
官宣，Milvus开源语义高亮模型：告别饱和检索，帮RAG、agent剪枝80%上下文

RAG与Agent用到深水区，一定会遇到这个问题：明明架构很完美，私有数据也做了接入，但项目上线三天，不但token账单爆了，模型输出结果也似乎总差点意思。原因在于，针对大模型的RAG、agent架构，其检索模块，本质上可视为传统搜索做的衍生变体。这就导致了一个问题，传统搜索系统，比如搜索引擎、推荐系统等，需要饱和式输出，保证用户能够收到关于检索结果所有召回信息，然后人类会自动在其中选择适合的信息…
RAG技术
- 2
- 0
charles4月12日
从RAG到记忆工程：AI长期记忆系统的架构范式与落地瓶颈

一场关于技术本质、落地挑战与未来展望的深度对话导读 2025年12月25日晚,记忆张量CTO李志宇与两位行业专家——阶跃星辰Agent研发负责人胡晨、OPPO AI高级算法工程师于明,围绕"记忆工程"展开了一场深入对话。这场讨论不仅是为2026年1月16-17日在北京举办的Agent AI Summit超级智能体系统架构大会预热,更是对这一新兴技术领域的系统性思考。记…
RAG技术
- 3
- 0
charles4月12日
索引选不对，成本贵十倍！ScaNN就是电商推荐的最优解

在日常解答Milvus社区中各种用户提问的时候，一个最常见的问题是：Milvus索引这么多，我到底要怎么选？对于常见场景，我们可以参考这两张图但肯定也有用户发现了，Milvus中，还有ScaNN这么一个索引类型怎么没有放进来，这个索引究竟要怎么用？适合什么场景用？先一句话解答，它框架上和IVFPQ非常相似，优点在于改善了PQ编码的一些细节，以及使用了高效的SIMD实现。主要适用于一些中等精度（召回…
RAG技术
- 2
- 0
charles4月12日
Cursor 用文件系统重构上下文工程：5个实践讲透

随着 Agent 能力不断提升，如何高效管理上下文成为关键挑战。Cursor 团队近期发布的"动态上下文发现"工程博客，给出了一套系统性的解法——用文件系统作为外部存储，让 Agent 按需发现、渐进加载。01 从"提前灌输"到"按需发现"Cursor 的核心判断是：预先提供更少的细节，反而能让 Agent 更容易自主地按需提取相关上下文…
RAG技术
- 2
- 0
charles4月12日
CES 2026 | 如何使用 RAG 和安全护栏构建语音智能体

构建智能体不仅仅是“调用 API”，而是需要将检索、语音、安全和推理组件整合在一起，使其像一个统一并互相协同的系统一样运行。每一层都有自己的接口、延迟限制和集成挑战，一旦跨过简单的原型就会开始感受到这些挑战。在本教程中，您将学习如何使用 2026 年 CES 发布的最新 NVIDIA Nemotron 语音、检索增强生成 (RAG)、安全和推理模型，去构建一个带有护栏的语音驱动…
RAG技术
- 1
- 0
charles4月12日
不会做RAG、agent的本地数据管理？都来学Claude Code！附深度拆解

企业级场景中，无论是做RAG还是Agent，我们都会面临一个问题：出于数据隐私以及合规要求，数据必须保留在本地。但传统的本地存储方案往往存在数据隔离性差、崩溃易丢数据、配置管理混乱、操作不可撤销等问题。Claude Code 通过一套精心设计的存储体系，系统性地解决了这些痛点。以下为核心思路的太长不看版：多项目隔离问题：路径编码的项目目录 + Session文件独立存储 → 不同项目数据…
RAG技术
- 1
- 0
charles4月12日
为RAG装上导航：ToPG通过图遍历，破局复杂查询

https://github.com/idiap/ToPGhttps://arxiv.org/pdf/2601.04859A Navigational Approach for Comprehensive RAG via Traversal over Proposition Graphs一、RAG 的三座“大山”传统 RAG 方案擅长不擅长Chunk-RAG（整块召回）简单事实…
RAG技术
- 3
- 0
charles4月12日
高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。而在RAG的诸多场景中，基于多文档高精度智能分析与问答系统，也就是知识库又必然是我们最常遇到，且企业场景最刚需的一类。那么如何做好知识库？本文将以开源项目Paddle-ERNIE-RAG为例，对其关键技术进行说明介绍。项目地址：https://github.com/LiaoYFBH/Paddle-ER…
RAG技术
- 1
- 0
charles4月12日
AIOps探索：做AIOps不要低估运维领域的RAG带来的影响

研究Aiops有一段时间了，目前手里有不少可落地的方案了，接下来会把这些方案全部整理到我的大模型课程里。同时，欢迎大家把你遇到的场景在评论区留言。我会在能力范围内给你提供思路和建议。我发现对AIOps感兴趣的同学大多都聚焦在这几方面：“异常检测”、“智能告警”、“根因分析（RCA）”或者“容量预测”。但很少有人讨论运维领域的RAG。如果你觉得RAG仅仅只是个“高端版全文检索”或者“聊天机器人”，那…
RAG技术
- 1
- 0
charles4月12日
Qwen3-VL 正式开源：多模态 RAG 的关键一环终于补齐

AI模型库 · 今日重点阿里刚刚开源的这套多模态模型，可能会改变“搜索”和“RAG”的底层逻辑如果你最近在关注 AI 模型圈，会发现一个非常明显的变化：大家讨论的不再只是“能不能生成”，而是——能不能真正“理解”。就在 1 月 9 日，阿里通义悄悄扔出了一套重量级开源模型组合：Qwen3-VL-Embedding + Qwen3-VL-Reranker没有铺天盖地的营销，但在开发者圈子里，这套模型…
RAG技术
- 1
- 0
charles4月12日
白嫖一个英伟达的垂直领域 Deep Research 智能体

如果大家玩过类似 cherry stutio, ima 等本地客户端，把自己的专业领域文档导入然后做问答，这很容易做到。但是想要产出一份长篇幅有深度的报告，就力不从心了。如果大家在国内外的网站上体验过 deep research 功能，针对通用话题出一份报告问题不大。但是想要出一份自己专业领域的报告，就无从下手了。好消息，NVIDIA DLI 的在线课程《Build a Deep Research…
RAG技术
- 1
- 0
charles4月12日
Milvus 向量数据库实战：从零构建高性能 RAG 系统

前言在 AI 应用快速发展的今天，向量数据库已成为构建智能检索系统的核心基础设施。Milvus 作为一款开源的高性能向量数据库，在 RAG（Retrieval-Augmented Generation）系统中发挥着关键作用。本文将带你从零开始，基于 Milvus 构建一个完整的 RAG 系统，涵盖数据准备、向量检索、结果重排、位置优化等核心环节，并分享生产环境中的最佳实践和性能优化技巧。1. Mi…
RAG技术
- 1
- 0
charles4月12日
都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

最近一年，互联网上各种为RAG赛博哭坟的帖子不胜枚举。所有内容总结一句话，其实还是那些陈词滥调：大模型上下文已经够长了，可以取代RAG了。但果真如此吗？要知道，上下文再大，本质还是一次性的记忆空间，全量加载token不仅浪费算力，大模型本身的注意力也是有限的，过长的上下文，只会导致上下文输出时模糊重点，反而导致质量下滑。也是因此，RAG不但没死，还从单纯的语义检索进化成了先想清楚该不该检、检什么、…
RAG技术
- 1
- 0
charles4月12日
当 Claude Code 连接 NotebookLM，个人 AI 终于有了“长期记忆”

很多人第一次看到 NotebookLM Skill，都会觉得它是一个挺实用的小工具：让 Claude Code 多了一个可以查资料的能力。这个判断不算错，但严重低估了它的真正威力。因为这件事的本质，不是“多一个工具”，而是个人 AI 架构层级的一次跃迁。一、先别急着谈体验，先看结构我们先把情绪放一边，冷静看一下这套结构本身：一句话概括：这是一个“知识检索 + 本地执行”的闭环系统。注意，这里不是 …
RAG技术
- 4
- 0
charles4月12日
AI 总 “胡说八道”？分类法 + 本体论，让 AI 决策透明可追溯

你有没有遇到过这样的糟心场景：医生对着 AI 辅助诊断报告皱紧眉头，明明患者症状是病毒性感冒，系统却推荐了抗生素治疗方案，稍有不慎就可能误导诊疗；银行客服加班到深夜，几百位客户集中投诉 —— 工资转账被 AI 风控误判为欺诈，账户被临时冻结，影响正常消费；电商运营看着智能客服的回复欲哭无泪，消费者问 “羽绒服能不能机洗”，系统却答非所问扯起面料成分，导致客户流失。AI 越智能，“不可控” 的风险就…
RAG技术
- 3
- 0
charles4月12日
MegaRAG ：用“多模态知识图谱”打破 RAG 的“次元壁”

教科书、财报、PPT 里那些图表，AI 终于能看懂了！你有没有这样的经历？上传一份带流程图的技术白皮书，问：“这个架构的核心模块是什么？”→ AI 只复述文字，完全无视旁边的架构图。丢给大模型一本数学教材扫描件，问：“图3.2 如何证明勾股定理？”→ 它答非所问，甚至编造不存在的“图3.2”。问题根源：传统 RAG（检索增强生成）是纯文本范——它把 PDF 切成一块块文字，视觉信息直接丢弃。而人类…
RAG技术
- 1
- 0
charles4月12日