全部标签

RAG技术

快速上车！RAGflow 保姆级安装指南！小白也能轻松搞定！

前面已经介绍了很多dify的内容，也有很多朋友问了我很多Dify平台的内容。但是在工作中，很多客户提出了一些内部知识库管理问题，这部分的内容，明显在Dify这里是一个短板。那这里接触了RAGflow，在文档管理方面RAGflow确实有自己的优势。RAGFlow 是一款开源检索增强生成（RAG, Retrieval-Augmented Generation）引擎，致力于通过深度文档理解技术，帮助用户…
RAG技术
- 20
- 0
charles25年5月22日
RAG系统中的向量数据库怎么选？很多人都忽视了

引言向量数据库（Vector Database）是专门为存储、索引和管理高维向量数据设计的数据库，广泛应用于人工智能（AI）、机器学习（ML）和大数据分析场景。随着非结构化数据（如图像、文本、音频等）的爆炸式增长，向量数据库通过将这些数据转化为向量嵌入（embeddings），并支持高效的相似性搜索，成为AI应用（如RAG、推荐系统、语义搜索等）的核心基础设施。本文将对比当前流行的向量数据库，包括…
RAG技术
- 16
- 0
charles25年5月22日
综述：从零构建RAG系统全面指南（含代码）

尽管大语言模型具备出色的推理能力和广泛的通用知识，但它们在检索精确信息、获取最新数据或提供可验证的回答时常常遇到困难。检索增强生成（Retrieval-Augmented Generation，RAG）应运而生，这一创新性方法通过将大语言模型与外部知识源相结合，有效提升了其性能。本文将深入探讨RAG的概念、重要性，并使用Python和流行的开源库从零开始构建一个完整的RAG系统。一、RAG是什么R…
RAG技术
- 11
- 0
charles25年5月22日
当RAG拥有“大脑”：揭秘Agentic RAG的进化之路

前2天我们介绍了有关RAG分块策略，通过优化文本切割方式（如按段落、语义或滑动窗口），让AI更精准地定位资料。但传统RAG仍有硬伤：被动检索、机械拼接答案、缺乏深度推理。那接下来我们就介绍下Agentic RAG，在技术上对传统RAG进行突破。01RAG限制检索增强生成（RAG）是一种用于构建 LLM 驱动的应用程序的技术。它利用外部知识源为 LLM 提供相关上下文并减少幻觉。Naive RA…
RAG技术
- 12
- 0
charles25年5月22日
RAG常见的坑：如何让AI有效的考试作弊

春节 DeepSeek 火爆，不知道为啥带火了个人 AI 知识库。这篇我们不讲那种 “把文章拖进去就库库问 AI ”的玩具，因为讲了也没人听。我们讲讲“企业知识库”的搭建和应用，也就是 RAG，这项工作的常见盲点。RAG 是如何工作的RAG 的三个字母分别是检索-增强-生成，它的原理其实很简单，就是三个单词对应的字面意思，按顺序做一遍：1. 当用户提出问题时，不发给大模型，…
RAG技术
- 10
- 0
charles25年5月22日
人人都能看懂的预训练、微调、提示词工程和 RAG(我保证)

这篇文章，我们用一个所有人都熟悉的案例，帮大家彻底理解大语言模型的那些"高大上"概念：• 预训练• 微调• 提示词工程• RAG（检索增强生成）。这个案例就是我们每个人都经历过的学习考试过程。看完这篇文章，你会对AI的工作原理有全新的认识，以后使用AI时也会更加得心应手。Tips：本文由 DeepSeek 基于我的录音稿整理润色，我只做了“微调”。预训练每学期开学，老师都会发给…
RAG技术
- 18
- 0
charles25年5月22日
DeepSeek接入个人知识库，回答速度飞快，最新安装包即将发布！

你好，我是郭震DeepSeek等大模型接入本地文件知识库，查询内容并生成大模型总结，很多朋友都有这方面的使用需求，过去四个多月到现在，我们开发了DeepSeekMine软件，专门给大家提供这方面的需求。今天这篇文章给大家汇报下过去两周我们最新开发进度，即将支持所有主流操作系统：Windows10/11，Mac intel和M系列，Linux等系统，感兴趣的朋友可以看下。1 功能更新有些朋友可能是第…
RAG技术
- 7
- 0
charles25年5月22日
RAG创始人关于RAG Agent的10个思考(上)

现在AI应用落地常用的方式是RAG（Retrieval-Augmented Generation），即检索增强生成。和Agent结合更是让RAG的应用场景更为广泛。很多企业包括我自己都在尝试使用它来提高AI在企业中落地的效果。最近RAG的创始人Douwe Kiela 在LinkedIn上分享了他对RAG Agent在企业中的10个教训，对我自己也很有启发。今天结合他的视频内容和我自己的实践体会来分…
RAG技术
- 9
- 0
charles25年5月22日
RAG提升召回准确率的解决方案——关于相似度计算与Rerank重排序的问题研究

“ RAG中文档拆分方式直接影响到召回效果，因此RAG中文档处理和召回策略同等重要。”最近在做RAG召回时遇到了一个问题，我们在项目中使用的是milvus向量数据库；具体的需求是把excel表中的数据导入到milvus数据库中，然后使用search方法从向量数据库中召回数据。由于业务需求问题，导致向量表中(collection)不仅仅只保存excel数据，同时还有word，markdow…
RAG技术
- 8
- 0
charles25年5月22日
支付宝搜索中基于LLM的生成式检索幻觉缓解技术方案

基于LLM的生成式检索（GR）在进行文档知识检索时或多或少的会引入幻觉，在一些对精度要求比较高的场景（如：金融等）如何缓解幻觉，下面来看下支付宝生成式检索缓解幻觉方案，供参考。方法如上图所示，框架分为两部分：知识蒸馏推理和决策Agent知识蒸馏推理目的：通过利用更大规模的LLM生成显式的推理数据，增强较小规模的LLM-based GR模型的训练。知识蒸馏推理模块提升了GR模型的检索精度，减少了幻觉…
RAG技术
- 9
- 0
charles25年5月22日
关于RAG应用中怎么高质量的进行数据召回——召回策略的研究

“ 数据召回是RAG技术的重要领域，而不同的召回策略甚至会产生完全不同的效果。”RAG技术的核心原理很简单，本质上就是在外部维护一个资料库，在进行大模型问答之前，先从资料库中找到相关的内容，然后一起输入到大模型中。但由于文档的复杂性，在进行文档处理时很难真正做到高质量的数据处理；因此，在做数据召回时就会面临着各种各样的问题。所以，怎么进行高质量的数据召回，就成为RAG必须要研究的一个课题…
RAG技术
- 14
- 0
charles25年5月22日
阿里云基于本地知识库构建RAG应用

本文主要描述阿里云人工智能大模型基于本地知识库构建RAG应用。与阿里云一起轻松实现数智化让算力成为公共服务：用大规模的通用计算，帮助客户做从前不能做的事情，做从前做不到的规模。让数据成为生产资料：用数据的实时在线，帮助客户以数据为中心改变生产生活方式创造新的价值RAG（检索增强生成，Retrieval-Augmented Generation）是一种结合了检索和生成技术的框架，旨在通过外部知识库的…
RAG技术
- 10
- 0
charles25年5月22日
用Coze知识库+RAG技术，给AI装上「企业知识外挂」

企业知识库是培训咨询机构的核心竞争力，但这些内部资料往往无法被公开网络和大语言模型（LLM）获取。如何让AI精准解答企业内部问题？关键在于用RAG技术为AI赋能！本文手把手教你通过Coze知识库打造「智能知识外挂」，让咨询顾问的考研答疑效率提升200%——无需训练模型，一键构建专属AI助手。1创建智能体首先，在Coze平台(https://www.coze.cn)点击左侧的加号(+)创建智能体，输…
RAG技术
- 20
- 0
charles25年5月22日
《RAG、MCP、Agent傻傻分不清AI概念？一文让新人秒变专家！》

让我们一起探索 AI 世界的三个好朋友：MCP、RAG 和 Agent！今天我们将带您轻松了解这些令人兴奋的技术。这三个小伙伴最近在 AI 圈子里可火了！特别是 MCP，它带来了好多有趣的新玩法，让大家都跃跃欲试呢～不过呢，我知道有些小伙伴可能觉得这些概念有点难懂。别担心，这很正常！毕竟现在的资料都写得比较"正经"，看起来不太亲民。所以今天，我们打算用简单易懂的方式，跟大家聊聊…
RAG技术
- 9
- 0
charles25年5月22日
RAG15种分块策略进行汇总介绍。

上一篇我们介绍了5种常见的分块策略，那这一篇我们来介绍下15种分块策略进行汇总介绍。固定大小分块01固定大小的分块将文档拆分为预定义大小的块，通常按字数、标记数或字符数。当您需要一种简单明了的方法并且文档结构并不重要时。它在处理较小、不太复杂的文档时效果很好。优势：易于实施。一致的块大小。快速计算。弊：可能会断开句子或段落，从而丢失上下文。对于保持含义很重要的文档来说，这并不理想。基于句子分块02…
RAG技术
- 8
- 0
charles25年5月22日
通用RAG：通过路由模块对多源异构知识库检索生成问答思路

如何在多个语料库（多源异构知识库，如：文本、图片、视频）中检索和整合来自不同模态和粒度的知识？UniversalRAG：一个多模态RAG框架，用于从多个模态和粒度的语料库中检索和整合知识。下面来看看思路，供参考。方法从上图可以看到，UniversalRAG的核心思想是通过动态识别和路由查询到最合适的模态和粒度知识源来进行检索。模态感知检索（Modality-Aware Retrieval）：多模态…
RAG技术
- 14
- 0
charles25年5月22日
DeepChat+RAGFlow 强强联合！配置知识库实现智能问答效率提升 300%

准备参考《RAGFlow实践：快速实现知识库的智能检索》部署RAGFlow并创建知识库。DeepChat是通过MCP方式调用RAGFlow，所以，部署的RAGFlow需要支持MCP。RAGFlowAPI服务器地址点击账户图标：点击“API”：将API服务器地址保存备用。创建Key点击“API KEY”：点击“创建新密钥”：点击“复制”按钮保存密钥：然后点击“确定”，关闭对话框。数据集ID数据集ID…
RAG技术
- 14
- 0
charles25年5月22日
两年了，你的RAG知识库落地了吗？一场价值数百万的AI智商税实验

我们是不是拿着公司的项目预算做了两年所谓的技术研究？？这两天翻到了两年前ChatGPT刚爆发时候画的一张PPT，很有些感慨。是的，两年前，GenAI刚爆发的时候，微调 / 向量 / 知识库这些词缀就已经进入大家的视野了，然而两年过去了，AI技术确实也越来越成熟了，我想问问大家，你们的RAG知识库项目建好了吗？效果超过基于上一代全文检索技术的知识库了吗？得到客户认可了吗？在经手几个企业级…
RAG技术
- 6
- 0
charles25年5月22日
探讨如何构建具有可扩展长时记忆AI Agents相关的技术实现

探讨 AI Agents 长期记忆相关的技术实现，核心在于解决大型语言模型 (LLM) 固定上下文窗口的内在限制，使其能够在长时间、多轮次的对话中保持连贯性和一致性。缺乏这种持久性记忆能力导致 AI 代理遗忘用户偏好、重复信息并否定先前的事实。构建一个能够超越有限上下文窗口的鲁棒 AI 记忆系统，需要选择性地存储重要信息、整合相关概念并在需要时检索相关细节，这模仿了人类的认知过程。（底层…
RAG技术
- 8
- 0
charles25年5月22日
建议收藏！重温RAG的5种分块策略

在构建高效的大语言模型（LLM）应用时，数据分块是至关重要的预处理步骤。通过将大型数据文件智能分割为适当大小的片段，我们能够为LLM精准提供执行特定任务所需的信息量 - 既不会因信息过载而影响性能，也不会因信息不足而降低输出质量。为了方便大家更好了解RAG的分块，将分块策略进行一些回顾和总结。 AgentLight" data-from="0" data-headi…
RAG技术
- 8
- 0
charles25年5月22日
关于人工智能应用场景中前期数据处理的业务场景和技术分析——包括结构化数据和非结构化数据

“ 文档处理是人工智能应用领域中的重要环节，其业务需求复杂，技术实现难度高；因此，怎么处理复杂文档是每个技术人员都需要考虑的问题。”文档处理在当前人工智能行业下是一个非常基础也非常重要的工作，不论是模型的训练和微调，还是以RAG检索增强，亦或者是在传统的搜索引擎(包括百度，谷歌这种搜索引擎；以及电商等内部平台的搜索需求)中都是必不可少的一个重要环节。但面对复杂的文档格式和类型，文档处理的…
RAG技术
- 9
- 0
charles25年5月22日
拆解智能体系统的能力和构成，我们需要的是可靠的AI系统，而不是Agents

全面讨论了检索增强生成（RAG）、其向 GraphRAG 的演进、记忆在智能 Agent 中的关键作用以及构建复杂 Agent 系统的架构模式。1. 检索增强生成 (RAG) 和 GraphRAG- RAG 的核心概念：RAG 解决了 LLM 并非无所不知的局限性，通过在生成响应之前向它们提供来自特定数据集的相关上下文来实现。- “检索增强生成（RAG）是一种有效的方法，可以让 AI 从…
RAG技术
- 8
- 0
charles25年5月21日
如何构建基于n8n的RAG日报工作流（手把手教程）

过去两周，又是在昏天暗地项目实施和咨询中度过，计划发的文章也略微耽搁了两篇，后续补上。接触业务场景越多，愈发觉得应该埋头苦干的同时，除了日常翻些公众号和知乎的水文外，还是应该多浏览些国内外优质信息源的不同行业最佳实践。说到这里也就要引出“AI 日报”（自动化信息/内容汇总推送）这个概念。虽然市面上有不少“AI 日报”类的信息推送，但实测了些发现，大多还是偏向于泛化内容，比如新模型发布动态、新奇产品…
RAG技术
- 13
- 0
charles25年5月21日
“深度搜索”远不止搜索，更像人人都能用的Agent

很多翻译限制了有关技术的想象。比如 DeepSearch，被叫做深度搜索，听起来就是“深的搜索引擎”，似乎和百度都没有多大区别，一点也不性感。但我今年最惊喜、最高频使用的AI能力，还真就是 DeepSearch。海外同类功能大多需要付费，而且次数非常受限。看到昨天夸克全量免费上线了“深度搜索”，我只觉得，这是一个被名字暂时封印的“全能Agent”。一、DeepSearch和AI搜索啥区别…
RAG技术
- 10
- 0
charles25年5月21日