全部标签

新闻资讯

大模型增强检索优化之——用智能体去重构你的RAG系统

“ 不论是RAG，还是智能体都仅仅只是一门技术；而不同的业务场景需要选择合适的技术实现。”最近这段时间一直在做一个RAG检索增强的系统，但由于前期对需求了解不足，导致目前系统开发遇到一些问题，那就是目前使用纯粹的RAG技术很难解决业务需求问题。目前的需求是在一个大的业务场景下有三个子场景，但这个三个场景的入口只有一个对话框，因此需要根据用户的意图来进行识别，然后判断属于哪个子场景。因此，…
RAG技术
- 0
- 0
charles4月3日
大模型RAG实战｜基于ThinkDoc文档解析与融合检索能力，提升RAG效果

最近ThinkDoc智能知识库上线了。个人与开发者都可以用。对于个人，作为知识工作者或专业人士，我们可以把 ThinkDoc 作为自己的个人知识库。在上传文档资料之后，我们可以通过智能对话、检索分析和专业写作等智能体直接交互，提升个人的工作效率。对于开发者，我们可以把 ThinkDoc 作为团队或企业的知识库平台。通过 ThinkDoc 丰富的 API 接口，调用强大的文档上传…
RAG技术
- 0
- 0
charles4月3日
当AI学会“查资料”：RAG如何让智能回答更靠谱？

你有没有过这样的经历：问智能助手一个专业问题，它看似自信满满地给出答案，结果细究之下却发现漏洞百出？比如问“2024年诺贝尔物理学奖得主是谁”，它可能搬出2022年的名单；聊一部刚上映的电影，它却描述着十年前的老剧情。这不是AI故意“撒谎”，而是传统大语言模型存在一个致命短板——知识“过时”且“有限”。不过，如今一种叫RAG（检索增强生成）的技术正在改变这一局面。简单说，RAG让AI学会了“查资料…
RAG技术
- 0
- 0
charles4月2日
检索增强生成（RAG）：让AI拥有“知识库”能力

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将信息检索与大语言模型生成相结合的技术框架。其核心思想是：在生成回答或文本前，先从外部知识库中动态检索与用户查询相关的信息，再基于检索结果生成更准确、更可靠的答案。简单来说就是，RAG让大模型能像“开卷考试”一样，先查资料再答题。尽管大语言模型已展现出令人瞩目的理解和生成能力，但在实际应用中还面临着幻觉、时效…
RAG技术
- 0
- 0
charles4月2日
从 RAG 到 KAG ：结构化思考范式下的复杂推理

导语 |随着人工智能技术的迅速发展，基于大语言模型（LLMs）的应用逐渐成为主流。然而，这些大模型在实际应用中仍像在“闭卷考试”，一旦题目超纲便只能凭空编造，即便后来引入 RAG 让其“开卷”，也常因翻不到正确的页码而答非所问。尤其在垂直领域的应用中，单纯依靠大模型往往无法满足复杂业务对精准问答、实时知识更新和推理深度的需求。因此，技术正从 RAG (Retrieval Augmente…
RAG技术
- 0
- 0
charles4月2日
构建端到端的高级RAG AGENT

在本文中我们将介绍如何使用 LangGraph 实现复杂的 RAG 智能体。该智能体能够重写用户问题、对其进行分类、验证文档相关性，甚至在最终优雅放弃前，还能用优化后的查询进行重试。在我们深入构建高级 RAG 智能体之前，重新审视如何将 RAG 用作 LangGraph 智能体中的工具会很有帮助。介绍传统的 RAG（检索增强生成）系统适用于简单的问题，但难以处理复杂的对话场景。当用户提出…
RAG技术
- 0
- 0
charles4月2日
手搓系列｜MAS+RAG实现博客搜索与问答

序最近正好在研究RAG，虽然RAG有很多问题被诟病，但预计未来三年仍然是构建Agent扩展知识库的关键技术，RAG的问题也会逐一被弥补或完善，就像MAS的问题目前最佳解法是构建个性化的Context engineering一样。本文记录构建Agentic RAG系统的过程，结合了LangChain (文档处理), LangGraph (Agent流程控制), Google Gemini (LLM)…
RAG技术
- 0
- 0
charles4月2日
RAG 还能不用 Embedding？OpenAI 给出了新玩法

如果你在用LLM构建应用，你很可能已经和RAG打过交道。RAG 对于用外部数据来增强LLM的能力很棒，但其中的检索——往往很复杂。我自己就曾花上好几个小时纠结：切分块的大小、重叠的策略、该用哪种向量嵌入模型。至于管理向量数据库？那更是一个完整的基础设施挑战。所以，当我在 OpenAI 的 Cookbook 中偶然看到他们关于另一种 RAG 思路的最新研究时——一种号称可以绕过传统嵌入的方案——我的…
RAG技术
- 0
- 0
charles4月2日
基于 pgvector 构建企业级 RAG 系统的实战指南

1. 背景在 AI 驱动的企业知识管理与自动化运维领域，RAG（Retrieval-Augmented Generation）模式已经成为提升大模型回答准确度和上下文理解能力的关键方案。传统大模型（LLM）仅依赖训练语料回答问题，而 RAG 在推理前引入外部知识检索，可显著减少幻觉（Hallucination），提升对领域专属知识的掌握能力。在向量数据库的选择上，pgve…
RAG技术
- 0
- 0
charles4月2日
使用RAG构建高质量知识库（二）- 数据分块

上一篇文章我们介绍了RAG的基本概念和原理，感兴趣的同学也可以回去补补课。使用RAG构建高质量知识库（一）今天咱们就继续来聊聊知识库的数据清洗与分块策略。为啥要分块为了精准召回知识库的内容！事实上，如果我们不做分块，直接把整个知识库丢给大模型，让他参照执行，在知识内容较少的情况下，是完全可行的。但在真实使用场景，往往知识库都非常复杂，比如在AI医疗场景，知识库会收录上万本权威医疗指南，每个指南都…
RAG技术
- 0
- 0
charles4月2日
使用RAG构建高质量知识库 (一)

在AI应用领域，各种新技术新名词层出不穷，但最实用的技术莫过于RAG了。相信稍微接触过AI的同学都不会陌生，但要想用好RAG，还是有一定门槛。今天咱们就来聊一聊RAG。RAG是什么？检索增强生成Retrieval-Augmented Generation一般用户在使用大模型的时候，其实只需要使用自然语言问问题，大模型就会返回相应的答案。所以只要掌握好提示词工程，大多数场景就已经可以让大模型乖乖给你…
RAG技术
- 0
- 0
charles4月2日
RAG vs 微调：AI测试知识库构建的两种路线之争

你是不是也被这种"AI智商税"折腾过？花了半个月搭建AI测试助手，喂了几千条历史用例，结果AI生成的测试用例要么是去年的旧需求，要么就是完全不存在的功能。你怀疑人生：明明训练了这么多数据，为什么AI还是一问三不知？或者，你尝试了RAG（检索增强生成），把所有文档塞进向量数据库，结果AI回答问题时，要么检索不到相关内容，要么检索到一堆八竿子打不着的历史文档，最后拼出来…
RAG技术
- 0
- 0
charles4月2日
RAGFlow 实践：SQL Assistant 工作流搭建

工作流简介本教程通过搭建一个 SQL Assistant 工作流，实现自然语言查询 SQL 数据库的功能。企业内的市场运营、产品经理等非技术背景人员可以使用此助手独立查询企业的业务数据，减少对数据分析师的依赖；学校和编程教育机构也可以使用它作为 SQL 的教学工具。该工作流编排完成后，如下：工作流编排思路：将数据库的 Schema、数据库表的每个字段…
RAG技术
- 0
- 0
charles4月2日
RAG中召回率和召回准确度的区别和联系

“ RAG的优化方向只有两个，召回率和准确率也就是精度。”在前面的文档中简单介绍过RAG的几种优化方式，因为从本质上来说RAG的目的只有一个，那就是快速并且准确的召回数据。但在实际的RAG系统中，我们往往会面临着一个问题，那就是召回率和准确率的问题；如果RAG系统的召回率太低，那么RAG就没有了存在的意义。以作者目前遇到的实际问题为例，就是数据召回率不足，更不用说召回的准确率了，也就是精…
RAG技术
- 0
- 0
charles4月2日
使用 Milvus 快速搭建 RAG 服务

使用 Milvus 快速搭建 RAG 服务总结一下我使用 Milvus 做 RAG 时踩过的坑，如果你在正在给老师做项目，然后项目里又要求有知识检索（RAG）的功能，然后又愁不知道怎么做，可以看看我的总结。一、云端 or 本地Milvus提供了本地部署的方式，也就是用 docker 去部署一个 Milvus 数据库，然后把你的数据存进去就可以实现检索。但是用 docker 部署太重了，你需要写很多…
RAG技术
- 0
- 0
charles4月2日
你每天用的AI，可能被“投毒”了！

如今，人工智能（AI）技术飞速发展，我们在享受便捷的同时，也可能会遭遇“AI幻觉”，即AI生成一些看似合理但实际上错误、虚构的信息。更严重的是，AI还可能会因为被“投毒”而出错。当AI能写诗、作画，甚至替你处理工作邮件时，你是否想过，它也可能被恶意投喂“毒数据”，沦为一场技术暗战的牺牲品？“毒数据”，具体是指与色情、赌博、欺诈相关的有害信息，以及错误、虚假信息等。那么，AI是怎么被“投毒”的呢？我…
RAG技术
- 0
- 0
charles4月2日
大模型私有化部署安全防护策略（下）

本期将为您介绍大模型检索增强生成（RAG）应用的相关安全防护策略（完整思维导图如下）。（可点击查看大图并保存）大语言模型普遍存在“幻觉”问题，当用户问题涉及未被明确训练过的内容时，模型可能会产生不真实、错误或虚构的信息。而通过模型训练和微调解决幻觉问题的方法容易受到垂直领域知识更新快、迭代迅速的影响，存在成本高、效率低的问题。因此，RAG凭借即插即用、检索技术成熟的优势，成为了大模型在垂直领域落地…
RAG技术
- 0
- 0
charles4月2日
打造企业专属知识大脑！用Dify构建RAG智能能问答系统，让知识检索像聊天一样简单

引言公司有成千上万份技术文档、培训资料，员工找个信息要翻半天？传统搜索只能找到文件名，找不到答案？今天教你用dify打造一个企业专属的"知识大脑"！基于RAG技术，让几万份文档瞬间变成智能助手，员工提问秒得答案，知识管理从此告别"大海捞针"！一、什么是RAG？为什么它这么强大？RAG技术解析RAG（Retrieval-Augmented Gene…
RAG技术
- 0
- 0
charles4月2日
检索增强生成（RAG）：其架构、演进与变革性影响的全面解析

引言人工智能的范式转移近年来，大语言模型（LLM）的发展标志着人工智能领域的一次重大飞跃。然而，这些模型在很大程度上是“闭卷”系统，其能力完全依赖于其庞大参数中存储的知识 (1)。这种架构带来了固有的挑战，最突出的是知识的静态性和不可靠性。为了克服这些障碍，人工智能领域正在经历一场深刻的范式转移：从“闭卷”考试转向“开卷”考试。这种转变的核心是让大语言模型能够访问和利用外部的、动态的信息源进行推理…
RAG技术
- 0
- 0
charles4月2日
检索增强生成（RAG）技术的架构、工作流与实际应用

1 引言在当今动态的商业环境中，检索增强生成（Retrieval-Augmented Generation, RAG）代表着AI模型处理复杂任务的革命性转变。通过将实时数据检索能力与先进文本生成技术相结合，RAG能够提升决策效率、自动化业务流程，并生成高度精准且具备上下文感知能力的响应。这种集成化方案为寻求在客户服务、内容创作、市场情报等领域拓展业务的企业提供了强有力的解决方案。 2 RAG的工…
RAG技术
- 0
- 0
charles4月2日
关于RAG和智能体的区别，从某方面来说智能体也是RAG的一种实现方式

“ 智能体和RAG技术有交集，但智能体功能更强，应用范围更广。”在大模型的应用场景中，RAG和智能体是其两个主要应用方向；在之前对RAG和智能体不够了解的时候，一直认为RAG技术和智能体技术完全是两个不同方向的应用场景。但随着对RAG和智能体认识的加深，现在发现RAG和智能体有一定的重合部分；记得之前在一篇文章中看到过，意思大概是基于大模型构建的应用，本质是一种数据增强技术，原因就在于大…
RAG技术
- 0
- 0
charles4月2日
响应速度提升300%、检索准确率90%：RAG如何让企业知识“活”起来赚钱？

响应速度提升 300%：RAG 如何激活企业知识价值？2025 年 Q2，某头部新能源车企客服中心出现反常现象：人工接线量下降 47%，客户满意度却提升 22%。背后秘密在于 6 个月前上线的 RAG（检索增强生成）智能客服系统 —— 过去需人工翻查 5 份手册、耗时 15 分钟的售后问题，现在 AI 能直接调取最新维修手册和零部件库存数据，3 秒内给出解决方案。这不是个例。Gartner《202…
RAG技术
- 0
- 0
charles4月2日
关于在RAG检索增强中文档处理的解决方案——针对中小企业

“ RAG技术成本最低的方式就是把非结构化文档转换成markdown格式进行处理。”在大模型应用领域中——RAG技术应该属于一项基础技术，不论做什么业务基本都离不开RAG的存在；但RAG技术属于典型的入门五分钟，想做好却需要花费大量时间和精力，以及成本。所以，今天我们就来讨论一下RAG技术在企业应用中的解决方案，既要考虑技术问题，也要考虑成本问题。怎么做好RAGRAG技术从整体上来说主…
RAG技术
- 0
- 0
charles4月2日
RAG与MenoBase长期记忆：让AI从“短期记忆”走向“深度认知”的进化之路

在人工智能技术快速迭代的今天，大语言模型（LLM）的能力边界不断被突破，但一个长期困扰行业的问题始终存在：当用户与AI对话时，模型往往“记不住过去”——上一轮提到的关键信息下一轮就遗忘，复杂任务需要反复重复背景，个性化交互更是难以实现。这种“短期记忆”的局限，让AI始终像一位“健忘的专家”，知识渊博却难以建立深度连接。为了解决这一问题，检索增强生成（RAG）与长期记忆系统（如MenoBase）的结…
RAG技术
- 0
- 0
charles4月2日