-
讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token
导读:搞RAG开发,一个被普遍忽视却又至关重要的痛点是:如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术,巧妙解决了这一难题。它不是RAG的替代,而是RAG的强力前置增强层,通过确保每个文本块的语义完整性,显著降低下游生成的幻觉风险。正如ContextGem文章中所提及的,高质量的输入是避免"垃圾进,垃圾出"的关键第一步。本文将深入…- 5
- 0
-
拆解智能体系统的能力和构成,我们需要的是可靠的AI系统,而不是Agents。
全面讨论了检索增强生成(RAG)、其向 GraphRAG 的演进、记忆在智能 Agent 中的关键作用以及构建复杂 Agent 系统的架构模式。1. 检索增强生成 (RAG) 和 GraphRAG- RAG 的核心概念:RAG 解决了 LLM 并非无所不知的局限性,通过在生成响应之前向它们提供来自特定数据集的相关上下文来实现。- “检索增强生成(RAG)是一种有效的方法,可以让 AI 从…- 5
- 0
-
全网最全国内Agent平台深度测评:扣子、Dify、FastGPT,谁是你的Agent开发首选?
上一篇文章我们按照时间先后顺序,梳理了国内的9个Agent开发平台,分别是Dify、FastGPT、文心智能体平台、千帆AppBuilder、智谱智能体中心、天工SkyAgents、扣子、讯飞星火智能体平台、腾讯元器。面对繁多的Agent平台,到底该如何选择呢?那个最好用?本篇就系统地做一个Agent开发平台深度测评。一 国内Agent开发平台综合对比我们从模型支持、Agent核心能力、…- 4
- 0
-
一文彻底搞懂大模型 – RAG(检索、增强、生成)
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次…- 6
- 0
-
RAGFlow:基于OCR和文档解析的下一代 RAG 引擎
一、前言在人工智能的浪潮中,检索增强生成(Retrieval-Augmented Generation,简称RAG)技术以其独特的优势成为了研究和应用的热点。RAG技术通过结合大型语言模型(LLMs)的强大生成能力和高效的信息检索系统,为用户提供了一种全新的交互体验。然而,随着技术的深入应用,一系列挑战也逐渐浮现。首先,现有的RAG系统在处理海量数据时面临着效率和准确性的双重压力。尽管LLMs能够…- 5
- 0
-
GraphRAG+Ollama 本地部署,保姆教程,踩坑无数,闭坑大法
最近RAG热度不减,微软开源了GraphRAG,很是火爆呀,本着学习的态度,我也部署使用了一下,无奈没有梯子,不能用openAI,于是想着能不能使用本机的模型,替换openAI的 llm和embedding模型,说干就干,整个过程真是曲折,踩坑不少,但最终 结果还是好的,终于完美部署到本机使用了,哈哈,下面来给大家分享一下,自己也记录一下,…- 7
- 0
-
RAG框架,都在这了!
RAG 很多人都听说过,或者实践过,目前最直接的应用就是构建智能问答系统。什么是 RAG?RAG 是 Retrieval Augmented Generation 的简写,翻译过来就是检索增强生成。从名字就可以拆分出 RAG 的三大部分,检索、增强、生成,表面意思就是:1、去知识库检索相关的各种东西2、把检索出来的信息,融合到 prompt 中,增强输入信息3、最后是大模型生成更符合事实性的回答为…- 3
- 0
-
RAG 高效应用指南:Embedding 模型的选择和微调
构建一个检索增强生成 (Retrieval-Augmented Generation, RAG) 应用的概念验证过程相对简单,但要将其推广到生产环境中则会面临多方面的挑战。『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨,提供一系列具体的方法和建议。同时读者也需要记住,提高 RAG 系统性能是一个持续的过程,需要不断地评估、优化和迭代。本文将对如何选择向量召回模型和…- 7
- 0
-
深入解析 Graph RAG:提升语言模型问答能力的创新策略
引言之前的文章已经深入探讨了 RAG(检索增强生成)。今天,我们要介绍一篇名为 Graph RAG 的新论文。大语言模型(LLM)问世后不久,RAG 就成为了生成式 AI 领域的热门话题。但这些系统并非没有挑战。虽然它提升了 LLM 的功能,同时也带来了一系列新问题,每个问题都需要独特的解决方案。去年以来,已经发展出多种策略,让 RAG 系统变得更稳定、更灵活。今天,我们同样努力地将介绍 Grap…- 9
- 0
-
微软开源的GraphRAG解读
微软在7 月 2 日开源了 GraphRAG,一种基于图的检索增强生成 (RAG) 方法,可以对私有或以前未见过的数据集进行问答。通过 LLM 构建知识图谱结合图机器学习,GraphRAG 极大增强 LLM 在处理私有数据时的性能,同时具备连点成线的跨大型数据集的复杂语义问题推理能力,其基于前置的知识图谱、社区分层和语义总结以及图机器学习技术可以大幅度提供此类场景的性能。GraphRAG 方法可以…- 6
- 0
-
基于Llama 3 构建RAG语音助手:将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成
基于Llama 3 构建RAG语音助手:将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成语音启用的人工智能应用将永远改变我们与技术的互动方式。大家都听说过 OpenAI 和 Google 的最新消息,多模态系统是未来。拥有人类般的声音,语音助手将扩展任何对话任务,无论是入站销售、客户支持还是数据收集和验证。这就是为什么 OpenAI 和 Google 在 GPT 和 …- 6
- 0
-
Prompt工程师必备:复旦重磅 | 最佳RAG实践长什么样的?
一段时间以来,我们发现,任何AI应用几乎都离不开RAG,检索增强生成(Retrieval-Augmented Generation,RAG)技术正在静默而深刻的影响着生成式AI行业的进步。假如你是一位prompr工程师,如果不了解几种RAG技术,那你一定不合格。01RAG:突破AI的认知界限传统的大语言模型,尽管在处理各种任务时表现出色,但仍然存在固有的局限性。它们的知识仅限于训练数据,无法实时更…- 6
- 0
-
解锁AI时代的核心通关密码——为什么你必须搞懂RAG、Agent、MCP?
AI时代背景下,AI 大模型凭借其强大的语言理解与生成能力,在诸多应用场景中展现出显著优势,呈现出无所不知的表象。然而,深入剖析后不难发现,当前AI大模型看似无所不知,实则面临三大致命短板:幻觉制造机:没有实时知识库支撑,容易编造错误信息→ 例:问ChatGPT“2024年最新医保政策”,它可能虚构条款纸上谈兵者:能分析问题却无法执行具体操作→ 例:AI能推荐旅游路线,但不会自动订机票酒店数据孤岛…- 3
- 0
-
如何设计 AI 与人的交互?以及为什么真正的创新必然是集中式的?
真正的产品创新不可能靠跨部门协作,只能是集中式创造。先上“暴论”,在结尾会点题。因为我们不需要模棱两可的漂亮话,我们需要观点的锋利。否则分享的意义就丢失了,何谈思想的交锋。文章结构:一、我们先谈如何设计 AI 与人的交互二、更好的设计是什么三、为什么“真正的产品创新不可能靠跨部门协作,只能是集中式创造。”四、后记&彩蛋五、联系方式我们先谈如何设计 AI 与人的交互。这个话题很大,所以这篇文…- 4
- 0
-
随着大模型技术的发展——RAG技术有可能会被淘汰吗?
“ RAG技术未来并不会被淘汰,只不过会随着技术的迭代而不断升级。”关于RAG技术有很多不同的观点,有人认为RAG技术是大模型的阶段性解决方案,最终会被淘汰;但也有人认为RAG技术仍不能被替代,其作用依然无可代替;而还有观点认为RAG技术会随着大模型技术的迭代进行升级,更多的是会形成协同发展。而从企业的角度来说,由于RAG技术未来的不确定性,因此有些人对RAG还存在各种各样的顾虑问题。所…- 7
- 0
-
AI知识库到底是什么?不同应用场景如何调参数配置?
如果你发现AI经常「一本正经胡说八道」,尤其是对于严肃的场景:企业内部工作、科研项目等,根本没办法直接用大模型的结果。此时,你就需要用到「知识库」,它能让AI输出更符合你需求的结果。我在网上看了很多AI知识库的文章,都很复杂,都是讲原理,但对于大多数的我们,不需要知道太多原理,而是需要「喂饭」,告诉我怎么做就行了。所以今天我就要给大家「喂饭」,前面还是要先简单讲清楚知识库的原理,以及包含什么。最后…- 6
- 0
-
AI 全栈工程体系中,Prompt Engineering、AI Agent 和 RAG 如何协同工作?
1、AI 全栈工程体系中,Prompt Engineering、AI Agent 和 RAG 如何协同工作?LLMs、Prompt Engineering、AI Agent 和 RAG 在构建复杂的AI应用(可以视为“AI 全栈工程体系”的一部分)中扮演着相互关联、协同工作的关键角色。基础:大型语言模型 (LLM)首先,大型语言模型 (LLM) 是整个体系的…- 4
- 0
-
一文读懂RAG:AI的“外部知识库”如何让回答更精准?
您是否也曾遇到这样的困扰:满怀期待地向AI提问,结果它要么回答得牛头不对马嘴,仿佛在一本正经地“胡说八道”;要么给出的信息早已是明日黄花,甚至当问及公司内部的具体事务或最新动态时,它更是一问三不知。这无疑是大语言模型(LLM)目前面临的常见挑战之一。今天我们就来深入聊聊一项能有效化解这些“尴尬时刻”的关键技术——检索增强生成(Retrieval-Augmented Generation,简称RAG…- 6
- 0
-
25种RAG架构大揭秘:AI项目如何选型?
在当今的AI时代,你是否想过,如果AI能够每次都从全球知识中精准地提取完美答案,那会是怎样的体验?检索增强生成(Retrieval-Augmented Generation,简称RAG)正是实现这一目标的幕后英雄。从ChatGPT引用来源的能力到企业AI扫描数千份文件,RAG为语言模型提供了现实世界的根基。然而,RAG并非“一刀切”的解决方案。随着时间的推移,AI研究人员设计了多种专门的RAG架构…- 5
- 0
-
【论文解读】Agentic-RAG:RAG发展调研
一、RAG RAG(Retrieval-Augmented Generation):检索增强生成,是一个系统化的框架,通过对外部知识库进行检索、整合,辅助大语言模型(LLM)生成更可靠、更具上下文信息的响应。解决LLM知识静态、幻觉、上下文限制等问题。RAG主要步骤如下:Indexing:数据预处理和准备;主要包含数据预处理、分块、嵌入、存储等过程,最终数据以向量形式存放在向…- 6
- 0
-
究极方案:油猴脚本实现RAG问答前端图片流式体验
一个月前发了篇文章介绍了基于 MiniO 存储的 RAGFlow+Dfiy 图片处理方案,之后有几个知识星球内的星友提问,如何优化上一版方案中不能流式输出的问题。这篇试图说清楚,三种 RAG 图片问答的方案迭代过程,油猴脚本 (Tampermonkey)的具体实现方式,以及项目架构梳理。以下,enjoy:1 多阶段方案演进在现有开源框架基础上,不改动核心代码,又要达到较好的…- 8
- 0
-
RAG 挑战赛冠军方案解析:从数据解析到多路由器检索的工程实践,推荐阅读!
公司年报智能问答比赛任务简介比赛的任务是基于公司年度报告构建一个问答系统。简单来说,比赛当天的流程如下:我们会收到来自随机挑选公司的 100 份年度报告,并需要在 2.5 小时内解析这些报告并构建一个数据库。这些报告是 PDF 格式,每份最长可达 1000 页。然后,系统会生成 100 个随机问题(基于预设模板),我们的系统必须尽可能快速地回答这些问题。所有问题都必须有确定的答案,例如:是/否;公…- 5
- 0
-
一文搞懂基于大模型快速搭建本地RAG知识库应用实践
学习AI大语言模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。大语言模型本身存在一些局限性,而RAG就像那种上学时的“开卷小天才”——会查资料,还会加工,能有效减少产生误导性信息的可能,它是AI大模型应用的创新方法,为AI的回答能力打开了新世界的大门,为企业搭建知识库提供了全新的解决方案(即通过结合信息检索、增强和文本生成能力,有效提升大模型…- 9
- 0
-
【LLM应用框架】DSPy构建RAG
一、前言在本文中,我们将基于DSPy构建一个简单的关于Linux应用的技术问答系统,并探索使用和不使用检索增强生成(RAG)的效果。二、DSPy基本模块(1)本地环境配置安装DSPy:需要python3.9及以上版本,这里我们从git工程地址下载所需的版本:conda create —name py39 python=3.9conda activa…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























