-
阿里RAG全链路评估框架之CoFE-RAG
CoFE 论文学习CoFE-RAG是一种面向检索增强生成(RAG)系统的全链路综合评估框架研究背景与动机RAG显著提升了回答的准确性与可靠性,有效缓解了传统生成模型中的“幻觉”问题。然而,现有RAG评估方法存在三大核心挑战:Ø 数据多样性不足:知识来源和查询类型的多样性不足限制了RAG系统的适用性。【现有评价方法的外部知识库基本来源于从HTML中抓取的格式良好的纯文本,缺乏数据多样性,难…- 0
- 0
-
从“黑盒”到“白盒”:Dify 2.0 知识管道,赋予企业RAG前所未有的可控性
摘要:dify 2.0 beta版带来不少新的升级,知识管道(Knowledge Pipeline)是我认为目前最有价值的升级。知识管道打破企业 RAG 数据瓶颈,可视化搞定非结构化数据处理。做企业级 RAG(检索增强生成)时,你是不是也遇到过这些头疼问题?PDF 里的表格、PPT 里的图表一解析就丢;ERP、Notion、云盘里的分散数据,整合一次要写一堆适配代码;数据处理全程像 “黑箱”,出了…- 0
- 0
-
打破RAG局限!意图+语义双检索框架来了
1.背景 Science Technology在数字化转型的浪潮中,智能客服和智能外呼(邀约)已成为企业降本增效、提升客户体验的核心工具。它们通过多轮对话技术,模拟真人交互,实现了全天候的即时答疑、业务办理以及主动的客户触达与需求挖掘,应用前景十分广阔。目前,主流的智能对话系统通常基于以下典型的技术方案来实现,其核心流程如下图所示:语音输入与转写系统首先通过ASR技术,将客户的语音实时、…- 0
- 0
-
为什么我不再折腾RAG了
我已经很久很久没折腾RAG了。其实我的账号最初就是靠RAG、个人知识库的内容收获了第一批流量、第一批社群成员。但是后来我逐渐不再关注这个技术和相关产品。两个原因。第一,技术局限性。一年前,当我看倒GraphRAG的时候,眼前一亮,因为它解决了传统RAG的严重不足。传统RAG的基础是分块。这会切断知识之间的内在联系,造成上下文孤立。举个例子,有三个分块。A提到了张三,B提到了李四,C提到了张三和李四…- 0
- 0
-
ppt检索的RAG方案(多模态、OCR、混合检索)评估结论
ppt RAG主要分下面3种:基于layout+OCR的pipline的以文本主导的RAG方案。基于VLMs+图片向量模型(如:ColPali与Qwen2.5-VL的文档多模态RAG技术流程)的多模态RAG方案。综合上述两种的混合检索那么哪种方式更好?下面主要记录一下评估结论。数据集SlideVQA:是一个为推动演示文稿VQA研究而开发的数据集,包含来自SlideShare 的2619个ppt,包…- 0
- 0
-
RAG系统优化大揭秘:让你的AI从学渣变学霸的进化之路
大家好啊,今天我要跟各位聊一个有趣的话题:为什么有的RAG系统像学霸,知道的越来越多,而有的却像学渣,天天"编、抄、混"?想象一下,你刚刚给一家书店部署了一个智能助手系统。刚上线那天,老板信心满满,结果第一个顾客问:"你们有《百年孤独》的简体中文新版吗?",AI助手自信地回答:"有的,就在科幻小说区。"老板:......AI也需要&quo…- 0
- 0
-
Meta超级智能实验室首篇论文:重新定义RAG
Meta超级智能实验室的首篇论文,来了——提出了一个名为REFRAG的高效解码框架,重新定义了RAG(检索增强生成),最高可将首字生成延迟(TTFT)加速30倍。毕竟算是超级智能实验的“开山之作”,研究一出,就已经在网上掀起了不少的热议。例如Reddti网友表示:若效果真如研究所说的那样,那对RAG来说是相当不错的改进,看起来可以做到在不牺牲准确性的情况下,能显著提高速度和上下文大小。天下苦RAG…- 0
- 0
-
关于相似度计算和rerank重排序的区别和作用
“ 相似度召回的作用是快速从海量文档中召回相关文档,而rerank重排序的作用是在这些相关文档中找到相关性最高的文档。”这段时间在完成基于RAG的聊天对话系统之后,开始优化各个环节的功能;这时才真正发现,RAG做出来不难,想做好真的不容易。这次在优化上下文结构时发现了一个问题,那就是相似度计算和重排序;在刚开始对相似度计算和重排序的理解就是,通过相似度进行数据召回,然以后再通过重排序找到…- 0
- 0
-
给RAG打分:小白也能懂的AI系统评测全攻略
你是不是经常被这些问题困扰:"我搭的RAG系统,到底靠不靠谱?""花了大价钱部署的RAG应用,效果怎么还不如直接问ChatGPT?""为啥有时候回答超准,有时候却离谱到天际线?"别担心,今天我们就要聊聊如何给RAG系统打分,就像我们平时给外卖评星一样简单!RAG评测:从"感觉良好"到"有理有据"先来…- 0
- 0
-
向量化与嵌入模型:RAG系统背后的隐形英雄
为什么搜索总是不懂你的心?你是不是也有这种经历?在电商平台上搜索"轻薄笔记本",系统却推荐你"笔记本纸"。这就像你对暗恋对象说:"我喜欢听你说话",结果对方回答:"哦,我也喜欢听歌"。两个人说的都是中文,却完全不在一个频道上。或者更惨的是,你问智能客服:"我的订单什么时候能到?",它回答:"…- 0
- 0
-
当“相似度 ≠ 相关性”:PageIndex 带来的 RAG 新范式
过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成为了所有 AI 应用的标配。无论是智能客服、企业知识库,还是财务分析、法律文档问答,大家都在用同一套逻辑:把文档切块、向量化,然后通过余弦相似度去匹配,再把检索到的内容丢给大模型进行回答。这套方案简单有效,但问题也显而易见——当问题变得复杂、跨页甚至涉及多层逻辑时,向量相似度检索往往“南辕北辙”。举…- 0
- 0
-
解锁RAG高阶密码:自适应、多模态、个性化技术深度剖析
当你走进一家智能咖啡厅,第一次来,但AI店员已经知道你是口味偏重的咖啡爱好者,面对你含糊的"来杯日常喝的",它准确推荐了一款中度烘焙的单品。更神奇的是,当你拍下杯中拉花发给朋友时,AI还能告诉你这是什么花式,出自哪位咖啡大师的创意,甚至建议你下次尝试口感更接近的另一款。这,就是我们今天要聊的高级RAG技术在生活中的应用场景。从RAG小白到RAG大神,就差这三项"高级技…- 0
- 0
-
你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库
最近大家关注dify的进展的话,应该知道它的版本更新直接从1.8.0--->2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的门槛,未来也许能高效处理 80% 的相对标准的文档。但是,仍然会有20%,还是要依赖于我们人来手动处理。我们都知道,现阶段来说,对于知识库,仍然是一个垃圾进垃圾出的…- 0
- 0
-
应对知识管理挑战:RAG技术如何驱动企业智能化升级
在人工智能技术迅速发展的背景下,检索增强生成(Retrieval-Augmented Generation, RAG)作为一种融合信息检索与自然语言生成的关键技术,正逐步成为企业推进数字化转型的重要工具。近年来,基于 RAG 的解决方案市场需求显著增长,多个行业积极引入该技术以提升知识管理及应用效率。据多家权威机构报告,企业对于 RAG 相关技…- 0
- 0
-
RAG彻底爆了!一文掌握其效果优化的架构设计及核心要点
RAG技术全解析:让大模型告别"胡说八道",构建企业级AI知识库的终极指南你是否遇到过这样的场景:向大模型询问公司最新的产品规格,它却给出了2021年的过时信息?或者让AI助手帮你查找内部文档,它却开始"一本正经地胡说八道"?根据Stanford的最新研究,即使是GPT-5这样的顶级大模型,在处理特定领域知识时的准确率也仅有47%。而当企业试图将AI应用于实…- 0
- 0
-
Meta如何给RAG做Context Engineering,让模型上下文增加16倍
最近一段时间,Context Engineering(上下文工程)的热度已无需多言,而 Meta 超级智能实验室发布的首篇论文,便聚焦于该领域的核心议题——模型上下文智能压缩,展开了深度研究。相信在开发 RAG与 Agent时,上下文太长导致输出效果崩掉,几乎做AI 应用人的家常便饭。其具体体现有二:长上下文导致了更高内存成本,模型的首 token 生成时间(TTFT)会随之呈二次方增加。冗余计算…- 0
- 0
-
检索器江湖:那些让RAG神功大成的武林绝学
你是否曾有过这样的经历?在AI上输入一个问题,结果返回的内容让你怀疑自己是不是在火星上网?或者问AI一个问题,它给你的答案却南辕北辙?别担心,这不是你的问题,而是背后的"检索器"没有练好内功!在RAG(检索增强生成)这门武功中,检索器就像是掌门人的左膀右臂,它的好坏直接决定了最终的武功效果。今天,我们就来聊聊这个看似简单实则暗藏玄机的检索器江湖。为什么要学习检索器?想象一下,你…- 0
- 0
-
Dify + Oracle + MCP:轻松构建 RAG 与 MCP Agent 智能应用
在 AI 应用开发领域,检索增强生成(RAG)已成为构建智能问答、文档分析等场景的核心技术。通过 RAG,AI 应用能够结合现有知识库,在生成回答时引入外部信息,从而为用户提供更准确、更智能的响应。同时,通过组合 AI Agent + DB MCP Server,从而实现通过 AI 与数据库的交互操作也是数据库系统接入 AI 应用的一个常见场景。本文将通过一个实践案例,展示如何使用 Oracle …- 0
- 0
-
做好 RAG 落地最后环节 —— 评估 RAG 应用
一、为什么RAG应用需要评估随着大模型技术的发展,我们已经具备了开发完整 RAG(Retrieval-Augmented Generation,检索增强生成)应用的技术能力。借助 LlamaIndex、LangChain 等成熟框架,可以在较短时间内实现从原型到应用的快速构建。然而,真正将 RAG 应用推向生产环境,远不只是“搭建起来”那么简单,仍有许多问题值得提前思考与应对。1. 大模型输出的不…- 0
- 0
-
企业级RAG系统实战心得:来自10多个项目的深度总结
在Reddit的AI_Agents版本刷到一个帖子,讲的RAG系统在企业中的落地,觉得写的不错,翻译共享给大家,英文原文直接让DeepSeek翻译后有些生硬,手动润色了一下。配图:Google Nano Banana【原贴】Building RAG systems at enterprise scale (20K+ docs): lessons from 10+ enterprise implem…- 0
- 0
-
您应该为您的 RAG 系统使用哪种分块技术?
在人工智能领域迅猛发展的今天,检索增强生成(RAG)系统已成为构建可靠且上下文感知应用的基石,这些应用由大型语言模型(LLM)驱动。RAG 系统通过检索外部知识库(如向量数据库)中的相关信息,来弥合 LLM 与外部知识之间的差距,从而提升模型的响应质量。然而,在实现高效 RAG 系统时,一个最关键却常常被忽略的步骤是“分块”(chunking)——即将大型文档分解成更小、更易消化的片段的过程。为什…- 0
- 0
-
关于多模态应用的几个疑问,以及多模态应该怎么应用于RAG?
“ 多模态与RAG的结合是一个应用的实践过程,其实际操作远比理论要复杂得多。”这段时间一直在搞RAG和Agent,然后使用的基本上都是基于文本处理的推理模型,基本上没用过多模态模型;而最近突然有个想法,那就是把多模态应用于当前的RAG系统。虽然说之前对多模态有些基础认识,但并没有在真实的业务系统中实践过;然后网络上关于多模态应用的内容又很少,因此等真正尝试去做的时候才发现,多模态应用好像…- 0
- 0
-
MiniMax RAG 技术:从推理、记忆到多模态的演进与优化
导读 在智能体与大模型应用不断深入的背景下,检索增强生成(RAG)技术正经历从“检索+生成”向“检索+推理+记忆+多模态”一体化的跃迁。本文首先剖析 RAG 系统在推理链构建和 Agent Layer 中引入知识图谱、MCTS 及强化学习的优化路径,继而探讨记忆层在动态检索、注意力过滤与多智能体协作中的实现方式;最后聚焦多模态场景下的张量化检索与延迟交互模型(COL),并针对存储膨胀、重…- 0
- 0
-
告别新手级RAG!一文掌握专业级后检索优化流水线
众所周知,检索是检索增强生成 (RAG) 系统的核心。它直接决定哪些文档片段给到大语言模型(LLM)来生成最终答案。不过,并不是所有的检索结果都是理想的。比如,在返回的前K个文档结果中,并不是最相关的。还有返回的结果过于冗长或已经过时,也会影响最终答案的质量。在前面我们通过两篇文章学习了两种预检索优化策略:查询路由(Query Routing)和查询构建(Query Construction)。它…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!























