-
基于 RAG 和 Claude 的智能文档聊天系统实战指南
最近我和一个律师亲戚聊AI时,问了我应该怎么对现在律师事务所庞大的文档做AI检索,从技术上讲用现在的LLM+RAG可以满足需求,但细想不太对劲,因为这里面涉及到很多专业知识,还有律师的专有思维路径,一个不懂律师业务的程序员肯定是做不好的,于是有幸跟他们合伙人进行了深入沟通,合伙人说了一堆但我总结下来就这么一句话“一个能回答我们所有文档相关问题的工具”。比如:1)描述法庭上发生的事件,2…- 7
- 0
-
万字长文的叹息:搭建一个生产级RAG系统,80%的工作量都在AI之外
如果你点开这篇文章,大概率你已经被RAG(检索增强生成)这个词轰炸了很久。它听起来就像是AI领域的“圣杯”:把公司所有的文档、PDF、聊天记录往里一扔,然后一个无所不知的AI就能像人类专家一样对答如流。 我见过太多项目的启动会,每个人眼里都闪烁着这种“魔法即将发生”的光芒。PPT里的演示总是那么丝滑,demo看起来天衣无缝。但当我们这些一线工程师卷起袖子,真正开始把这个“魔法”搬进现实世界时,…- 4
- 0
-
RAG实战:借助RAGFlow做一个员工智能助理
最近体验了一下RAGFlow的RAG能力,体验下来,它给我的感觉总结两点:1)知识检索方面能力很强;2)Agent工作流搭建很反人性,跟Coze或者dify比,有点复杂。本文主要包含两部分:RAGFlow部署和RAG项目实操。声明下:为了节省字数,内容为精简版,整体较为粗糙,但保真!一、RAGFlow部署软硬件要求(生产环境)CPU >= 4 coresRAM >= 16 GBDisk…- 7
- 0
-
解读|生产级RAG系统落地的10个经验教训
点击上方蓝字加入我们本文为大家解读Contextual AI 联合创始人兼CEO,也是著名的RAG技术先驱,Douwe Kiela 分享的他在企业级 RAG 系统实施与落地中的十大经验教训 。解读纯属个人观点,欢迎探讨。本次分享主要针对企业AI系统转化为商业价值的关键难题:根据麦肯锡的估计,当前企业AI总规模高达4.4万亿美元 ,但同时福布斯的调查指出只有约四分之一的企业真正从AI中获益 。为什么…- 4
- 0
-
RAG 技术演进:从朴素检索到智能代理增强
LLM 具备强大的分析能力、推理能力、生成能力,但它仍然无法记得上个月的今天发生了什么,哪怕你曾经在上个月告诉过它。究其原因,是因为 LLM 基于静态语料库训练,你的个人经历并不在其中。它只具备短期记忆,这种记忆依靠一次对话的上下文维持(历史信息会被携带到下一次对话,且信息量有限)。当然,现在的诸多协议已经能够为 LLM 提供很多"外挂",比如 MCP 协议、A2A 协议,它们…- 3
- 0
-
告别RAG:这套认知记忆系统让AI真正像人一样思考
告别RAG:这套认知记忆系统让AI真正像人一样思考 RAG的价值与三大挑战 RAG(检索增强生成)为AI记忆开辟了新路径,让AI能够访问外部知识库,这是一个重要突破。然而,随着应用的深入,我们发现RAG在构建真正智能体方面面临三个根本性挑战。 第一大挑战:精度损失,信息失真 RAG的核心是向量化存储和相似度检索。这个过程本质上是"有损压缩"。 想象一下,你对AI说:&quo…- 7
- 0
-
爆改RAG!用“自动提问”让你的AI检索像开挂一样精准
❝你还在用传统RAG?那你就OUT了!今天,咱们聊聊如何用“自动生成问题”给RAG加点猛料,让你的AI检索和问答能力直接起飞! 一、前言:RAG的烦恼与突破 RAG(Retrieval-Augmented Generation)是AI问答界的“卷王”,但它也有自己的烦恼: 检索不准:用户问一句,RAG检索一堆不相关的内容,AI答得云里雾里。 上下文迷失:文本切块后,AI常常“只见树木不见森林”。 …- 7
- 0
-
DeepEval使用自定义模型评估RAG实例
直接上代码吧,理论参见历史文章Deepeval 指标库详解Rag评估框架1、导入依赖包 #导入依赖包import timeimport requestsimport jsonfrom services.ChatService import ChatServicefrom deepeval.models import DeepEvalBaseLLMfrom deepeval.test_case i…- 31
- 0
-
用 LangGraph 打造了一个迷你 RAG:150 行代码跑通知识库问答
你是不是厌倦了在低代码平台上,拖拉拽一通操作搭建RAG系统?是不是想深入学习RAG,自己实现RAG的每一个步骤?今天我们将用最精简的方式,带你从零实现一个完整的RAG系统!通过LangChain+LangGraph实战,深入拆解RAG的每个核心模块,告别"黑箱"操作,真正理解检索增强生成的运行机制。速览 MiniRAG体积:不到 150 行核心代码向量存储:PGVector,一…- 3
- 0
-
RAG文档处理的一种优化方案——问答对的转换技巧
“ 在RAG中根据不同的场景有多种不同的优化方案,因此我们需要根据场景选择合适的解决方案。” 在RAG文档检索增强中,文档预处理是相当重要的一环;以目前大模型的能力来说,已经能够很好的根据参考文档回答用户问题,但现在的问题是在RAG的前期阶段——也就是文档预处理阶段却是一个技术难点。 而且针对不同的文档类型和文档内容,处理方式也不尽相同,因此RAG的文档处理效果也参差不齐。 而今天我们就来提供一个…- 7
- 0
-
【精读】构建和扩展 RAG 系统的实践经验总结
本文是一份关于构建和扩展检索增强生成(RAG)系统的实践经验总结。原文作者 Jakob 基于他在谷歌设计和部署了超过 50 个 RAG 应用、服务约 500 万用户的经验,提炼出一套可复用的 RAG 设计决策蓝图 文章旨在帮助开发者理解 RAG 的核心概念,并指导他们如何围绕知识库构建、内容检索和响应生成这三大关键环节做出明智的设计决策,从而构建出实用且高效的 RAG 系统。 RAG 基本概念…- 4
- 0
-
聊聊在Dify上如何做高效RAG&集成Milvus向量库存储检索的原理
向量模型的配置 在 Nvidia A10 等机器上,基于 Ollama、xinference 等中间件部署向量模型,目前向量模型的选型暂定为 bge-m3、bge-reranker-v2-m3;然后在 dify 内引入即可。 Dify 写入 Milvus 原理 基于配置的向量模型,通过特定的中间件 SDK 或是标准的 OpenAPI,Dify 将文档数据实时写入到 Milvus 中存储,并用于后续…- 5
- 0
-
基于Dify 知识库的实验demo:从0到1构建智能商品分类系统
大家好,我是 dify 实验室的阿亚。最近接到了一个新的任务,就是实现一个商品自动分类的功能,根据商家提供的商品名称,实现商品的自动归类,本篇文章记录了各种踩坑的过程,直到实现一个验证可行demo的实验过程。一、最初的挑战:为成千上万的商品自动“安家”想象一下,你面对着成千上万个商品,需要为它们精准地打上三级分类标签,比如把“新款纯棉透气T恤”分到“服装 > 男装 > T恤”下。手动操…- 9
- 0
-
Dify智能体开发:RAG 技术深度解析与知识库实战指南
检索增强生成(RAG, Retrieval-Augmented Generation)技术通过 "动态检索 + 智能生成" 的黄金组合,让 AI 系统既能调用实时知识库,又能生成自然语言回答,彻底改写了大模型的应用范式。本文从原理到实战,全面拆解 RAG 技术如何让 AI 告别 "胡编乱造",在企业知识库、智能客服等场景中实现 90% 以上的回答准确率提升。…- 7
- 0
-
爆改RAG!Relevant Segment Extraction(RSE)让你的AI检索“有头有尾”,不再碎片化
❝你还在用传统RAG(Retrieval-Augmented Generation)检索一堆“东一榔头西一棒槌”的文本碎片,然后让大模型自己拼拼凑凑?别闹了,AI都快被你玩成拼图大师了!今天,咱们聊聊如何用Relevant Segment Extraction(RSE)让你的RAG系统“上下文连贯”,让大模型如虎添翼,输出更靠谱、更有逻辑的答案! 1. 传统RAG的“碎片化”困境 先来个灵魂拷问:…- 5
- 0
-
从知识检索到自主决策:传统RAG与Agent搜索的深度对比
传统RAG:知识检索与生成的结合 检索增强生成(RAG)是当前最热门的大型语言模型应用方案之一,其核心思想是通过自有垂域数据库检索相关信息,然后将其作为提示模板的一部分提供给大语言模型,以提升生成内容的准确性和相关性。这一技术本质上是将检索模型(设计用于搜索大型数据集或知识库)和生成模型(如大型语言模型)的优势相结合,为用户提供更高质量的回答。 RAG的核心原理 检索增强生成(RAG)是一种使用来…- 8
- 0
-
RAG彻底爆了!一文读懂其架构演进及核心要点
👉目录 1 引言 2 RAG演变流程 3 总结 4 一些思考本文系统梳理了检索增强生成(RAG)架构的演进历程,从基础架构到智能化解决方案的迭代路径。文章通过对比Naive RAG、Advanced RAG、Modular RAG和Agentic RAG四代架构的核心特点与技术突破,揭示了RAG技术如何通过模块化设计、智能体协同等创新解决知识更新、语义对齐和复杂任务处理等关键问题,为LLM应用落地…- 6
- 0
-
长上下文在大语言模型检索增强生成(RAG)中的作用:全面综述
点击“蓝字” 关注我们一、长上下文与RAG的协同演进 随着大型语言模型(LLMs)的飞速发展,检索增强生成(Retrieval-Augmented Generation,RAG)技术已成为解决模型幻觉、提升输出可靠性的核心方案。RAG通过将外部知识库与模型生成能力结合,使LLMs能够基于真实数据生成准确回答,而非单纯依赖预训练阶段的固有知识。在这一架构中,长上下文处理能力被视为突破RAG性能瓶颈的…- 6
- 0
-
重新思考RAG的相关性:相似≠相关
最近,我在阅读一些关于 RAG系统的资料时,发现了一个有趣的现象:RAG 的相关性问题远比我们想象的要复杂。无论是从数据检索的角度,还是从大模型对相关性的理解来看,RAG 的表现都充满了挑战和机遇。 今天,我想和大家分享一下我的思考,希望能给大家带来一些启发,如有不对的地方欢迎讨论交流。 1. RAG 与相关性:不仅仅是向量嵌入当我们谈论 RAG 时,很多人会立刻想到向量嵌入和相似性度量。确实,向…- 4
- 0
-
亲测成功!小白用AI工具0代码搭建RAG问答系统全过程揭秘
前几天突发奇想,看看能不能在一行代码都不会写的情况下,弄一个可用的基于RAG 的 AI 问答网站。结果着实让我震惊了一下,仅仅用了2 个小时,AI 就做出了一个可用的产品。AI 完成了网站的客户端和服务端的所有文件创建,代码编写,实现了真正的基于 RAG 的问答。我是 cursor 来实现的,让我们看看整个过程是如何完成的。前端首先,我告诉 cursor 帮我创建一个网页,很快,它就帮我建好了一个…- 9
- 0
-
RAG(检索增强生成)科普介绍
点击蓝字 关注我们 RAG(检索增强生成)科普介绍 RAG(检索增强生成):作为大模型的动态知识引擎,它能突破模型静态知识的边界,有效解决知识时效性不足、输出可信度有限等问题。 Agent(智能代理):作为大模型的智能执行中枢,它赋予模型自主规划任务、做出决策及调用各类工具的能力,让模型具备更主动的行动能力。 今天带来的是系列分享的第六篇:RAG的科普介绍。 1. RAG是什…- 4
- 0
-
文档太长模型“吃不下”?15种Chunking神技,助你打造聪明绝顶的RAG系统!
❝你以为RAG系统的“聪明才智”全靠大模型?错!真正的高手,都是切块(Chunking)切得好!一、前言:RAG系统的“吃饭哲学”大家好,我是你们的AI技术侃侃君。今天我们聊点硬核又接地气的:RAG系统里的文档切块(Chunking)。你是不是也遇到过这种尴尬:明明有一份厚厚的文档,想让大模型帮你总结、问答、检索,结果模型一脸懵逼——“对不起,token太多,我吃不下!”别急,这不是模型太菜,而是…- 5
- 0
-
RAG检索不准?99%的人都忽略了这一步!
大家好,我是你们的AI技术技术博主许泽宇。今天我们要聊一个让RAG(检索增强生成)系统“脱胎换骨”的秘密武器——语义切分(Semantic Chunking)。别急,听起来高大上,其实它的本质就是:如何把一大坨文本,切成AI最爱吃的“小块”,让它检索起来又快又准。 你是不是也遇到过这种尴尬:明明知识库里啥都有,AI一问三不知,检索出来的内容不是驴唇不对马嘴,就是答非所问?别怀疑,问题很可能就出在“…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

















