全部标签

RAG技术

打造你的企业级智能文档问答系统——Everything plus RAG 实战指南

从零开始，用开源技术搭建一个能"读懂"文档的智能问答系统大家好,我是铭毅天下。今天给大家分享一个非常实用的项目——Everything plus RAG 智能文档问答系统。相信大家的电脑上都安装了 Everything，一个磁盘文件快速查找桌面级应用软件。一直以来，我都有个想法，能否做一个 plus 版本，支持文档的全文检索和智能问答？！这个想法萌芽已久，且和同事、朋友做过多次…
RAG技术
- 1
- 0
charles4月12日
LEANN：200GB 压到 6GB，笔记本跑 RAG 不是梦

开篇：做 RAG 应用，向量数据库动辄几十上百 GB，云服务费用一个月小几千。有个开源项目挺有意思，反着来——不存向量，只存关系图，6000 万文档只要 6GB。先说痛点去年给公司搭 RAG 系统，踩了不少坑：云服务贵：Pinecone 免费额度用完，一个月账单 200 刀起本地吃资源：试过 Milvus，100 万文档就要 30 多 GB，服务器内存直接吃满数据出不去：金融客户要求数据不能上云，…
RAG技术
- 2
- 0
charles4月12日
如何用NotebookLM，把枯燥的财报解读成精美的PPT？

Notebook LM，看似是个笔记本，但它绝不是像Notion或Evernote那样，是个只等着我们往里面传文件的空本子。它是Google（全家桶工具Google到底出了多少AI工具？25年Google AI地图！）推出的一款基于RAG（检索增强生成）技术的AI笔记助手，基于我们给的内容，帮我们重新理解、重组和输出。其核心前提是：你先给资料，它再工作。我们可以把它想象成一个超级学霸助手…
RAG技术
- 1
- 0
charles4月11日
这次，RAG记忆被微信AI团队的超图盘活了

https://github.com/Encyclomen/HGMemImproving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling https://arxiv.org/pdf/2512.23959港中大 & WeC…
RAG技术
- 1
- 0
charles4月11日
企业级 RAG + 知识图谱的4 种主流实现路径

前面我们重点讲了 LlamaIndex + Nebula + Milvus 这条“开源组合拳”路线，但它并不是唯一解。在企业级 RAG + 知识图谱的实际落地中，根据业务目标、技术栈偏好、合规要求和团队能力的不同，至少还有 4 种主流实现路径，每种都有成功案例。🧭 企业级 RAG+知识图谱的 5 大实现路径路径核心思想典型用户优势劣势1. 开源组合派（LlamaInd…
RAG技术
- 1
- 0
charles4月11日
企业RAG知识库系统中关于向量数据库的对比选型指南

0 引言选择合适的向量数据库（Vector Store）对 RAG（Retrieval-Augmented Generation，检索增强生成）系统的性能、成本和可扩展性至关重要。本文全面对比了 2024–2025 年最主流的向量数据库选型。1 什么是向量数据库？为什么 RAG 需要它？向量数据库是一种专门用于存储和查询高维嵌入向量（embedding vectors）的数据库。在 RAG 系统中…
RAG技术
- 2
- 0
charles4月11日
EdgeVec：浏览器原生向量数据库，让AI应用彻底摆脱服务器

在浏览器中做向量检索，一直是个麻烦事。原生的IndexDB并不支持向量。之前笔者使用过pglite方案，完成浏览器内的向量检索及问答。我已经将它做为一款书签/桌面/资讯于一体的chrome插件，感兴趣的朋友可以下载使用。https://chromewebstore.google.com/detail/memwink/mpklgnebhehdpdpddabokaocemmalijn?hl=zh-CN…
RAG技术
- 1
- 0
charles4月11日
Claude Code 外挂最强大脑 NotebookLM Skill

这个Skills同样之前也有MCP，也被推翻使用Skills生重做了。一个PG数据库分析Skills用Claude Code 来读取几百个 PDF 和 Markdown目前来说不太现实。Claude Code的上下文就200K，直接挂载大量的外部数据，不可能。但使用传统的本地 RAG 又很弱很麻烦，切片，向量化，检索，这一套流程下来，经常因为切片破碎导致 AI 幻觉。今天这个Skill就完美地解决…
RAG技术
- 1
- 0
charles4月11日
先RAG后KG，还是先KG后RAG？我们试了三种策略

近两年，大模型应用从“能聊两句”走到了“能干活”，而RAG（检索增强生成）与知识图谱（Knowledge Graph，KG）几乎成了构建企业智能问答系统的标配。但问题来了——很多团队“写了文章、拉了框图”，实际项目却效果一般，要么搜索不到关键信息，要么模型一本正经胡说八道。根本原因：你只是把RAG和KG放在一起，而不是让它们互相校验与协同推理。今天我们不仅讲三种融合策略，还带上工作流、示例代码、防…
RAG技术
- 2
- 0
charles4月11日
多层记忆架构：让你的AI“像人一样记忆”

一、困境：记忆越多越聪明，但Token有上限在AI对话系统开发中，我们面临一个经典的矛盾：记忆越多，AI表现越"聪明"，但记忆多了又会触发Token上限。很多开发者会说：“我已经用Redis/数据库存储所有对话历史了。” 但这只解决了服务端存储性能问题，并没有解决核心矛盾——当对话记录积累到一定程度，依然会超过模型的上下文窗口限制。我们恰恰希望存储更多的聊天记录，因为只有这样，…
RAG技术
- 1
- 0
charles4月11日
不到 100 行代码用 LlamaIndex 搞一个“带脑子”的 RAG 系统（RAG + 知识图谱）

一个真实可落地、代码完整、部署简单的教程，手把手教你用 LlamaIndex + Neo4j（知识图谱） + Chroma（向量库）搭建一个“能推理、会回答”的智能问答系统。以一个企业内部 IT 支持场景为例：员工问：“我怎么重置密码？”，系统不仅要返回操作步骤，还要知道“你是哪个部门的”——因为不同部门流程不同！这个案例跑起来，不需要 GPU，普通笔记本就行。🎯 场景设定假…
RAG技术
- 1
- 0
charles4月11日
ASR+LLM+RAG视频内容识别全方案

1 引言：技术背景与核心挑战在视频内容爆发式增长的当下，品牌广告植入场景日益复杂，如何快速精准判断推广品类，成为转转内容运营、竞品分析的核心需求。当前传统方案主要依赖关键词匹配与规则引擎，面临三大技术痛点：ASR 转写准确性不高，输入数据质量低下产品表述异构性模型泛化与迭代能力弱本文提出基于 “ASR+LLM+向量知识库” 的技术方案，通过分层处理、语义修复、历史常见词匹配、知识检索融合，解决上述…
RAG技术
- 1
- 0
charles4月11日
从工单、文档到结构化知识库：一套可复用的 Agent 知识采集方案

我们构建了一套“自动提取 → 智能泛化 → 增量更新 → 向量化同步”的全链路自动化 pipeline，将 Agent 知识库建设中的收集、提质与维护难题转化为简单易用的 Python 工具，让知识高效、持续、低门槛地赋能智能体。一、项目概述定位：知识刮削助手旨在补齐知识从原始位置（工单/文档）到向量知识库之间的自动化链路的空缺。核心能力：📥 多源接入 → 🤖 智能提取 → 🔄 知识泛化 → 💾 …
RAG技术
- 1
- 0
charles4月11日
RAG知识库-文档过滤和检索

RAG完整流程文档过滤检索阶段拆分为：检索前、检索时、检索后。检索前预检索阶段负责处理和优化用户的原始查询，以提高后续检索的质量。Spring AI提供了多种查询处理组件。Spring AI提供了多种查询处理组件。查询转换-查询重写当用户查询含糊不清或包含无关信息时，使用RewriteQueryTransformer大模型语言对用户的原始检查进行改写。Query query =…
RAG技术
- 2
- 0
charles4月11日
RAG落地实践：知识库三层架构和关键组件

在当前LLM（大型语言模型）的应用浪潮中，检索增强生成（RAG）已成为相对成熟且应用最广的落地模式之一。但无论是从最初的Naive RAG演进到Advanced RAG，还是最新的Agentic RAG，其核心都离不开一个关键底座：知识库管理系统。对于面向落地应用RAG的产品经理和工程化技术人员而言，如果只是停留在对LLM能力或RAG流程的表面理解，很难在真实复杂的业务场景中建立起高效、稳定的智能…
RAG技术
- 2
- 0
charles4月11日
Dify x 阿里云 Tablestore：向量检索与结构化数据统一存储方案

今天，dify 正式适配阿里云 Tablestore 向量索引能力，并依托阿里云计算巢提供一键部署体验。企业无需重构现有架构，就能获得更轻的运维负担、更灵活的按需计费，以及面向百亿级数据增长的扩展能力，让生产级 RAG 更容易落地。挑战：Dify 用户在构建生产级 RAG 时，常需额外部署和维护独立向量数据库，面临高昂内存成本、百亿级扩展困难、多系统数据同步复杂等难题，严重制约应用规模化落地。开源…
RAG技术
- 1
- 0
charles4月11日
RAG检索增强是在给大模型“喂”数据？不，你是在为它构建一整套物流体系

“ RAG就像一套完善的物流管理体系，其核心困难点永远在我们看不到的地方。”在很多人看来，做检索增强生成的难点在于提升检索召回的效率和准确率，因，因此很多人把大量的时间花在优化检索方案上。但作者作为一个对RAG有深入了解的开发人员，恰恰认为RAG真正的难点并不在检索端，而在于知识库的管理。为什么会说RAG的难点在知识库的管理，而不是数据召回？知识库管理很多人都知道RAG是检索增强生成，从…
RAG技术
- 2
- 0
charles4月11日
ChatGPT VS Claude ，Agent记忆用对话压缩还是RAG按需检索

在高质量 AI Agent 系统里，记忆模块的设计远比看起来复杂，它要解决三个关键问题：怎么存历史对话？什么时候检索？该检索哪些内容？这些问题直接决定了 Agent 的响应速度、资源占用和能力天花板。而我们常用的 ChatGPT、Claude 这类大模型，之所以能记住用户的长期偏好，越用越顺手，本质上是因为它们也算一种极简版 AI Agent。但在记忆模块的设计上，两者走了完全不同的路。最近，一位…
RAG技术
- 2
- 0
charles4月11日
上下文不等于记忆：从单Agent到多Agent协作，记忆系统是关键

开篇在Agent的浪潮中，我们经历了一次又一次的认知迭代。最初是提示工程，我们学习如何更好地提问；随后是上下文工程，随着窗口从8k卷到1M，我们误以为塞进去就是记住了。但当Manus、Anthropic 等团队开始引入file system和agent skill等概念后，上下文工程的边界又变得日益模糊。😳最近看了AWS re:Invent 2025 中关于memory的一场技术演讲以及Mongo…
RAG技术
- 3
- 0
charles4月11日
为什么Claude Code不用RAG？

引言最近看到有一些文章提出了“RAG已死”的观点。核心论据是 Claude Code 开发负责人 Boris Cherny 在一档播客节目[1]中，披露现在的 Claude Code已不再使用RAG，而改用 Agentic Search。他的主要观点如下：起初采用RAG路线，将整个代码库索引一遍，然后用 Voyage 这类检索器上，让模型用提示去查找信息，用的是标准模板。但到最后，团队放弃了结构化…
RAG技术
- 3
- 0
charles4月11日
图索引性能提升 400%：详解 VSAG 向量检索框架

VSAG 是蚂蚁集团开源的图索引向量检索框架。本文源自 VSAG 团队在 VLDB'25 发表的《VSAG: An Optimized Search Framework for Graph-based Approximate Nearest Neighbor Search》，介绍 VSAG 框架如何通过缓存优化、自动调参和距离计算加速，在保证高召回率前提下将检索性能提升最高 …
RAG技术
- 1
- 0
charles4月11日
告别关键词高亮，语义高亮才是解决搜索 / Agent噪音的标准答案

今天聊一聊怎么在RAG、Agent场景中实现语义高亮（Semantic Highlight）。在AI落地的过程中，我们不管是用电商搜东西、用RAG查文档，还是靠AI Agent做信息挖掘，大家做检索最核心的需求其实就一个：快速找到有用的信息。而高亮功能，就是帮我们快速定位信息的关键。但传统基于关键词匹配的传统高亮，无法根据语义信息做内容定位，市面上已有的Semantic Highlight方案，又…
RAG技术
- 2
- 0
charles4月11日
让RAG像人类一样“扫视全文”：上下文检索技术详解

尽管大语言模型本身的能力在快速演进，但它依然无法凭空获取训练数据之外最新或专有知识。检索增强生成（RAG, Retrieval-Augmented Generation）正是为解决这一问题而生：在回答问题前，先从知识库中检索相关资料，再让模型参考这些资料生成答案。换言之，RAG让大模型从“闭卷考试”变成了“开卷考试”。但“开卷”也不一定更容易。如果检索到的资料不完整、不准确，能力再强的大模型也无法…
RAG技术
- 0
- 0
charles4月11日
Uber 如何利用 OpenSearch 实现十亿级向量搜索

介绍在 Uber，我们的系统每天处理海量数据，涵盖从拼车到外卖的各个环节。我们传统上使用基于关键词的 Apache Lucene ^™^搜索。然而，我们需要超越简单的关键词匹配，转向语义搜索，才能理解搜索背后的含义。为了实现这一目标，我们采用了 Amazon® ^OpenSearch^作为向量搜索引擎。其可扩展性、性能和灵活性是我们做出这一决定的关键因素。这篇博文将探讨我们…
RAG技术
- 4
- 0
charles4月11日