-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 4
- 0
-
最新|Milvus_local_RAG,笔记本也能跑的本地知识库&RAG来了
多数前端开发工程师可能都面临这样一个困境:每天需要查阅大量技术文档、项目规范和学习资料。传统的文件夹分类和搜索方式效率低下,经常为了找一个API用法翻遍整个项目文档。一些大公司,可能会采用企业级知识库方案,通过智能问答来解决这个问题。但问题是:1、不是所有公司都有这个预算2、个人部署一套企业级知识库,环境配置复杂、学习门槛高,对新手极不友好3、使用企业级知识库的平替,在线服务又会出现数据隐私泄露风…- 4
- 0
-
GraphRAG 在 CVTE 多业务场景下的探索与应用
导读 本文将分享视源股份(CVTE)利用 GraphRAG 技术在智能教育与智能客服两大核心场景的探索与应用,从技术原理、框架选型到落地实践,全方位呈现其创新路径与显著成效。文章主要包括以下几大部分:1. GraphRAG 简介及框架2. 智能教育场景3. 智能客服场景4. 未来工作5. 问答环节分享嘉宾|张世鸣 视源股份(CVTE) 研…- 6
- 0
-
Dify+Firecrawl本地部署RAG知识库chatbot
本文用于记录和描述如何在本地通过配置dify+firecral+Ollama的方式来实现RAG知识库chatbot。整个配置流程在macos15.5下完成,其他操作系统还请依据实际情况更改对应内容。安装difygit clone git@github.com:langgenius/dify.git配置dify环境变量 cd dify/docker …- 5
- 0
-
赢得企业RAG挑战赛的秘诀 —— 冠军方案剖析与感悟
RAG 的魔力在于细节The magic of RAG lies in the detailsIlya Rice前不久看到一篇技术博客,是名为 Ilya Rice 的工程师所著(OS:想念另一位Ilya大佬的第N天),文中记录了作者在一次RAG挑战赛中,尝试过的有效方法,及踩过的坑。最终获得比赛第一名后,吐露真言,有感而发地说出了做好RAG的秘诀:「细节」作者虽不是中土人士,但…- 4
- 0
-
提升AI问答准确率:请在RAG前先做RAR,超越意图识别
在RAG(检索增强生成)落地的过程中,存在一个效果显著,却常被忽视的技术方法 —— RARRAR:推理增强检索(Reasoning-Augmented Retrieval) R(检索)与G(生成):谁才是胜负手从搜索引擎到智能助手,从笔记工具到AI知识库,输入框背后几乎都依赖RAG技术。当大模型让“生成”能力在聚光灯下闪耀发光时,我们往往低估了“检索”的决定性作用。尤其在当前大…- 6
- 0
-
RAG不好用?试试MCP这个“知识库优化大师”
在企业数字化转型浪潮中,如何有效管理和利用内部知识资产已成为关键挑战。随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。然而,传统RAG实现常面临检索质量不佳、实时更新困难等痛点问题。本文将通过实战案例,详细介绍如何基于模型上下文协议(MCP)构建一套高性能企业RAG系统,帮助企业快速打造智能知识库应用。MCP与传统RAG对比优…- 5
- 0
-
RAG系统文本切分算法选型指南
RAG系统文本切分算法选型指南简介在构建企业级检索增强生成(RAG)系统时,文本切分算法的选择至关重要。切分策略直接影响检索的质量和生成结果的准确性。本文档将介绍常用的文本切分方法,分析其优缺点,并结合不同检索器给出最佳实践方案。RAG系统通常包含两个主要组件:1. 索引阶段:加载数据、切分文档、存储向量2. 检索和生成阶段:基于用户输入检索相关内容,利用LLM生成…- 7
- 0
-
如何创建具有自我评估机制的Agent RAG
随着大语言模型(LLMs)的发展,模型已经能够理解大量数据并进行逻辑推理。这些发展带来的最重要成果之一是检索增强生成(Retrieval-Augmented Generation,简称RAG)系统。LLMs 在非常大的数据集上进行训练,但它们受限于训练数据的范围。假设您拥有一家公司,并有一些政策文档。为了让员工找到正确的答案,他们要么需要非常熟悉这些文档,要么需要在文档中搜索答案。您希望通过一个聊…- 7
- 0
-
RAG效果炸裂,亲测EasyDoc文档解析,结构化输出太香了
在构建 RAG(检索增强生成)系统时,光有文档远远不够,一份结构清晰、可被理解的知识库才是模型“打怪升级”的关键。很多解析方案只是简单提取文字,忽略了段落、标题、表格、图表等结构信息,导致内容碎片化、上下文丢失,检索结果不准、回答效果不佳。最终喂给大模型的是一堆“看不懂”的无结构输入,Attention 无法聚焦重点,RAG 效果自然大打折扣。如果你也遇到这些坑,不妨给自己点个赞:你已经意识到——…- 3
- 0
-
一分钟读懂RAG的切分策略
RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段。在RAG系统的构建中,文档切分策略…- 4
- 0
-
RAG-embedding篇
1.前言RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段一分钟读懂RAG的切分策略。…- 3
- 0
-
RAG 信息检索:如何让模型找到‘对的知识’
1.前言RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段一分钟读懂RAG的切分策略。…- 4
- 0
-
从零开始学 Dify – Dify 的 RAG 系统如何有效地处理和检索大量文档?
一、整体架构1.1 架构概述dify 的 RAG(检索增强生成)架构是一个完整的文档处理、索引和检索系统,旨在提高大语言模型生成内容的准确性和相关性。该架构由三个主要模块组成:文档处理模块、向量化与索引模块、检索与重排模块。整个系统的数据流如下:用户上传文档或提供URL文档处理模块提取文本内容并进行清洗文本被分割成适当大小的段落(chunks)向量化模块将这些段落转换为向量表示并存储在向量数据库中…- 5
- 0
-
通过 RAG如何扩展提示词Prompting?
在这个AI深度介入软件开发的时代,作为一名测试工程师,如果你还停留在“自动化测试脚本怎么写”的阶段,那就已经有点落后了。如今,我们已经进入了一个“如何与大模型合作”的新纪元。今天,我想带大家深入了解一个可能听过但不太熟悉的技术名词——RAG(Retrieval-Augmented Generation,检索增强生成),以及一个你今后绕不开的重要概念:上下文窗口(context window)。别急…- 3
- 0
-
什么是RAG?一文搞懂检索增强生成技术
在大语言模型(LLM)如ChatGPT、Claude、Gemini日益强大的今天,人们希望它们不仅能“生成”,还要“准确生成”。然而,LLM训练的数据往往是静态的、封闭的,这使得它们在面对时效性强、专业性高、上下文复杂的问题时,力不从心。在有些时候,企业内部或者事业部门内部的数据是不允许公开上传的,那么也就没有办法享受到大模型的服务,生产力也得不到解放。这时,RAG(Retrieval-Augme…- 2
- 0
-
AI开发实战:解决RAG的召回不准问题
在AI开发的路上,我们总会遇到各种技术难题。今天想和大家分享一个最近解决的RAG(检索增强生成)项目难题。最近接手了一个企业级AI项目,面临的第一个难题就是文件格式混乱:PDF文档Excel表格 Word文件网页内容各种格式混杂传统的RAG架构在处理这些异构数据时表现不佳,召回精度始终达不到理想效果。RAG的召回质量直接决定了大模型生成的质量。召回不准确,再强大的生成模型也会"…- 2
- 0
-
揭开RAG的神秘面纱:90%的人不知道腾讯IMA底层原理
周末参加了冯帅和Mary姐的线下组局,之前我也写过总结贴子,在这就不赘述了。今天我想说说腾讯IMA的底层逻辑RAG,RAG的内容还是比较多,我将分几次内容把它介绍一下吧。RAG 是什么在AI飞速发展的时代,特别是今年DeepSeek大火之后。我们与智能系统的交互日益频繁。当你向各种智能助手询问 “高考作文,你应该怎么写时。” 时,有没有想过它是如何快速准确地给出答案的呢?这背后,RAG 技术发挥着…- 3
- 0
-
金融智脑:破解RAG系统在金融场景中常见失败的七大陷阱
目录1.检索模块的固有局限1.1 嵌入向量与检索质量不匹配1.2 文档切分与语义碎片化1.3 检索时机与触发机制不灵活2.生成模块与检索结果融合不充分2.1 浅层拼接导致语义失真2.2 生成模块对数值与逻辑推理支持不足2.3 生成模块易受“虚构(Hallucination)”影响3.领域适应性与专业知识缺失3.1 预训练模型缺乏专业领域知识3.2 数据源多样性与混合格式处理困难4.系统架构与运行环…- 4
- 0
-
大模型:多种RAG组合优化(langchain实现)
大模型RAG优化:Adaptive RAG 这篇文档整合了多种rag优化策略,并且使用langchain实现。可以有效的解决幻觉的问题。概要我们将把RAG论文中的想法整合到RAG代理中:• Routing: Adaptive RAG (paper). 将问题路由到不同的检索方法• Fallback: Corre…- 4
- 0
-
深入使用 Deep Research 后,我确信 RAG 的未来是 Agent
Deep Research 是什么当我们要研究一个话题时,离不开搜索引擎。传统搜索费时费力,新兴AI搜索(如Perplexity)也流于表面、缺乏深度。但是 Deep Research 出现了:它能拆解研究任务,通过搜索、筛选、反思迭代,最终呈现一份条理清晰、内容详实的研究报告。Deep Research 的核心在于其自主思考的智能体(Agent)形态。目前,OpenAI 与 Google Gem…- 5
- 0
-
从传统 RAG 到知识图谱 + Agent,知识库 AI 问答成功率终于达到 95% 了,来自蚂蚁集团的经验
引言本文来源于5月底参加的 #QECon 深圳站上,来自蚂蚁集团的知识库专家关于「领域知识管理和 AI 问答」的分享。介绍了从传统 RAG 到知识图谱再到 Search Agent,一步一步把 RAG 的正确率从 60% 最终提升到 95%。收获非常大,强烈推荐!知识库问答业务场景专家分享的 AI 助手是基于企业内研发知识库,主要目标是降低研发参与咨询工单带来的人力成本消耗,月…- 6
- 0
-
GraphRAG变种这么多,该采用哪种?九大GraphRAG评估参考
系统的评估总是有趣的,在前文,我们通过一个类似的benchmark得出结论:GraphRAG在需要多跳推理和上下文综合的任务中表现优异,但在简单事实检索任务中不如传统RAG。见《什么时候用GraphRAG?RAG VS GraphRAG综合分析》本文,再来看一个评估工作,同样是一个GraphRAG-bench,也再次通过评估得出GraphRAG适合多跳推理场景,并且系统的评估了九大GraphRAG…- 4
- 0
-
知识库太乱找不到资料?5个工具提升你的RAG检索!
这次这篇文章会先简单回顾元数据、标签、知识目录这三种工具。然后,针对读者留言的问题,重点聊聊知识目录、文件目录、知识地图之间的关系,以及什么时候构建,如何构建,如何提升RAG的效果。很干,但很实用。工具1:元数据(系统统一标注标准)元数据是关于数据的数据,主要给管理员用,用来描述文件的客观属性,或设置访问权限。也可以开放一些专用类型给用户进行精确指定问答范围,比如文件名、适用对象等。元数据需要统一…- 6
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















