全部标签

新闻资讯

阿里RAG全链路评估框架之CoFE-RAG

CoFE 论文学习CoFE-RAG是一种面向检索增强生成（RAG）系统的全链路综合评估框架研究背景与动机RAG显著提升了回答的准确性与可靠性，有效缓解了传统生成模型中的“幻觉”问题。然而，现有RAG评估方法存在三大核心挑战：Ø 数据多样性不足：知识来源和查询类型的多样性不足限制了RAG系统的适用性。【现有评价方法的外部知识库基本来源于从HTML中抓取的格式良好的纯文本，缺乏数据多样性，难…
RAG技术
- 0
- 0
charles4月7日
从“黑盒”到“白盒”：Dify 2.0 知识管道，赋予企业RAG前所未有的可控性

摘要：dify 2.0 beta版带来不少新的升级，知识管道（Knowledge Pipeline）是我认为目前最有价值的升级。知识管道打破企业 RAG 数据瓶颈，可视化搞定非结构化数据处理。做企业级 RAG（检索增强生成）时，你是不是也遇到过这些头疼问题？PDF 里的表格、PPT 里的图表一解析就丢；ERP、Notion、云盘里的分散数据，整合一次要写一堆适配代码；数据处理全程像 “黑箱”，出了…
RAG技术
- 0
- 0
charles4月6日
打破RAG局限！意图+语义双检索框架来了

1.背景 Science Technology在数字化转型的浪潮中，智能客服和智能外呼（邀约）已成为企业降本增效、提升客户体验的核心工具。它们通过多轮对话技术，模拟真人交互，实现了全天候的即时答疑、业务办理以及主动的客户触达与需求挖掘，应用前景十分广阔。目前，主流的智能对话系统通常基于以下典型的技术方案来实现，其核心流程如下图所示：语音输入与转写系统首先通过ASR技术，将客户的语音实时、…
RAG技术
- 0
- 0
charles4月6日
为什么我不再折腾RAG了

我已经很久很久没折腾RAG了。其实我的账号最初就是靠RAG、个人知识库的内容收获了第一批流量、第一批社群成员。但是后来我逐渐不再关注这个技术和相关产品。两个原因。第一，技术局限性。一年前，当我看倒GraphRAG的时候，眼前一亮，因为它解决了传统RAG的严重不足。传统RAG的基础是分块。这会切断知识之间的内在联系，造成上下文孤立。举个例子，有三个分块。A提到了张三，B提到了李四，C提到了张三和李四…
RAG技术
- 0
- 0
charles4月6日
ppt检索的RAG方案（多模态、OCR、混合检索）评估结论

ppt RAG主要分下面3种：基于layout+OCR的pipline的以文本主导的RAG方案。基于VLMs+图片向量模型（如：ColPali与Qwen2.5-VL的文档多模态RAG技术流程）的多模态RAG方案。综合上述两种的混合检索那么哪种方式更好？下面主要记录一下评估结论。数据集SlideVQA：是一个为推动演示文稿VQA研究而开发的数据集，包含来自SlideShare 的2619个ppt，包…
RAG技术
- 0
- 0
charles4月6日
RAG系统优化大揭秘：让你的AI从学渣变学霸的进化之路

大家好啊，今天我要跟各位聊一个有趣的话题：为什么有的RAG系统像学霸，知道的越来越多，而有的却像学渣，天天"编、抄、混"？想象一下，你刚刚给一家书店部署了一个智能助手系统。刚上线那天，老板信心满满，结果第一个顾客问："你们有《百年孤独》的简体中文新版吗？"，AI助手自信地回答："有的，就在科幻小说区。"老板：......AI也需要&quo…
RAG技术
- 0
- 0
charles4月6日
Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室的首篇论文，来了——提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。毕竟算是超级智能实验的“开山之作”，研究一出，就已经在网上掀起了不少的热议。例如Reddti网友表示：若效果真如研究所说的那样，那对RAG来说是相当不错的改进，看起来可以做到在不牺牲准确性的情况下，能显著提高速度和上下文大小。天下苦RAG…
RAG技术
- 0
- 0
charles4月6日
关于相似度计算和rerank重排序的区别和作用

“ 相似度召回的作用是快速从海量文档中召回相关文档，而rerank重排序的作用是在这些相关文档中找到相关性最高的文档。”这段时间在完成基于RAG的聊天对话系统之后，开始优化各个环节的功能；这时才真正发现，RAG做出来不难，想做好真的不容易。这次在优化上下文结构时发现了一个问题，那就是相似度计算和重排序；在刚开始对相似度计算和重排序的理解就是，通过相似度进行数据召回，然以后再通过重排序找到…
RAG技术
- 0
- 0
charles4月6日
给RAG打分：小白也能懂的AI系统评测全攻略

你是不是经常被这些问题困扰："我搭的RAG系统，到底靠不靠谱？""花了大价钱部署的RAG应用，效果怎么还不如直接问ChatGPT？""为啥有时候回答超准，有时候却离谱到天际线？"别担心，今天我们就要聊聊如何给RAG系统打分，就像我们平时给外卖评星一样简单！RAG评测：从"感觉良好"到"有理有据"先来…
RAG技术
- 0
- 0
charles4月6日
向量化与嵌入模型：RAG系统背后的隐形英雄

为什么搜索总是不懂你的心？你是不是也有这种经历？在电商平台上搜索"轻薄笔记本"，系统却推荐你"笔记本纸"。这就像你对暗恋对象说："我喜欢听你说话"，结果对方回答："哦，我也喜欢听歌"。两个人说的都是中文，却完全不在一个频道上。或者更惨的是，你问智能客服："我的订单什么时候能到？"，它回答："…
RAG技术
- 0
- 0
charles4月6日
当“相似度 ≠ 相关性”：PageIndex 带来的 RAG 新范式

过去两年，RAG（Retrieval-Augmented Generation，检索增强生成）几乎成为了所有 AI 应用的标配。无论是智能客服、企业知识库，还是财务分析、法律文档问答，大家都在用同一套逻辑：把文档切块、向量化，然后通过余弦相似度去匹配，再把检索到的内容丢给大模型进行回答。这套方案简单有效，但问题也显而易见——当问题变得复杂、跨页甚至涉及多层逻辑时，向量相似度检索往往“南辕北辙”。举…
RAG技术
- 0
- 0
charles4月6日
解锁RAG高阶密码：自适应、多模态、个性化技术深度剖析

当你走进一家智能咖啡厅，第一次来，但AI店员已经知道你是口味偏重的咖啡爱好者，面对你含糊的"来杯日常喝的"，它准确推荐了一款中度烘焙的单品。更神奇的是，当你拍下杯中拉花发给朋友时，AI还能告诉你这是什么花式，出自哪位咖啡大师的创意，甚至建议你下次尝试口感更接近的另一款。这，就是我们今天要聊的高级RAG技术在生活中的应用场景。从RAG小白到RAG大神，就差这三项"高级技…
RAG技术
- 0
- 0
charles4月6日
你的 RAG 还在“垃圾进，垃圾出”？我用这套流程，把“废料”文档变成了黄金知识库

最近大家关注dify的进展的话，应该知道它的版本更新直接从1.8.0--->2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的门槛，未来也许能高效处理 80% 的相对标准的文档。但是，仍然会有20%，还是要依赖于我们人来手动处理。我们都知道，现阶段来说，对于知识库，仍然是一个垃圾进垃圾出的…
RAG技术
- 0
- 0
charles4月6日
应对知识管理挑战：RAG技术如何驱动企业智能化升级

在人工智能技术迅速发展的背景下，检索增强生成（Retrieval-Augmented Generation, RAG）作为一种融合信息检索与自然语言生成的关键技术，正逐步成为企业推进数字化转型的重要工具。近年来，基于 RAG 的解决方案市场需求显著增长，多个行业积极引入该技术以提升知识管理及应用效率。据多家权威机构报告，企业对于 RAG 相关技…
RAG技术
- 0
- 0
charles4月6日
RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

RAG技术全解析：让大模型告别"胡说八道"，构建企业级AI知识库的终极指南你是否遇到过这样的场景：向大模型询问公司最新的产品规格，它却给出了2021年的过时信息？或者让AI助手帮你查找内部文档，它却开始"一本正经地胡说八道"？根据Stanford的最新研究，即使是GPT-5这样的顶级大模型，在处理特定领域知识时的准确率也仅有47%。而当企业试图将AI应用于实…
RAG技术
- 0
- 0
charles4月6日
Meta如何给RAG做Context Engineering，让模型上下文增加16倍

最近一段时间，Context Engineering（上下文工程）的热度已无需多言，而 Meta 超级智能实验室发布的首篇论文，便聚焦于该领域的核心议题——模型上下文智能压缩，展开了深度研究。相信在开发 RAG与 Agent时，上下文太长导致输出效果崩掉，几乎做AI 应用人的家常便饭。其具体体现有二：长上下文导致了更高内存成本，模型的首 token 生成时间（TTFT）会随之呈二次方增加。冗余计算…
RAG技术
- 0
- 0
charles4月6日
检索器江湖：那些让RAG神功大成的武林绝学

你是否曾有过这样的经历？在AI上输入一个问题，结果返回的内容让你怀疑自己是不是在火星上网？或者问AI一个问题，它给你的答案却南辕北辙？别担心，这不是你的问题，而是背后的"检索器"没有练好内功！在RAG（检索增强生成）这门武功中，检索器就像是掌门人的左膀右臂，它的好坏直接决定了最终的武功效果。今天，我们就来聊聊这个看似简单实则暗藏玄机的检索器江湖。为什么要学习检索器？想象一下，你…
RAG技术
- 0
- 0
charles4月6日
Dify + Oracle + MCP：轻松构建 RAG 与 MCP Agent 智能应用

在 AI 应用开发领域，检索增强生成（RAG）已成为构建智能问答、文档分析等场景的核心技术。通过 RAG，AI 应用能够结合现有知识库，在生成回答时引入外部信息，从而为用户提供更准确、更智能的响应。同时，通过组合 AI Agent + DB MCP Server，从而实现通过 AI 与数据库的交互操作也是数据库系统接入 AI 应用的一个常见场景。本文将通过一个实践案例，展示如何使用 Oracle …
RAG技术
- 0
- 0
charles4月6日
做好 RAG 落地最后环节 —— 评估 RAG 应用

一、为什么RAG应用需要评估随着大模型技术的发展，我们已经具备了开发完整 RAG（Retrieval-Augmented Generation，检索增强生成）应用的技术能力。借助 LlamaIndex、LangChain 等成熟框架，可以在较短时间内实现从原型到应用的快速构建。然而，真正将 RAG 应用推向生产环境，远不只是“搭建起来”那么简单，仍有许多问题值得提前思考与应对。1. 大模型输出的不…
RAG技术
- 0
- 0
charles4月6日
企业级RAG系统实战心得：来自10多个项目的深度总结

在Reddit的AI_Agents版本刷到一个帖子，讲的RAG系统在企业中的落地，觉得写的不错，翻译共享给大家，英文原文直接让DeepSeek翻译后有些生硬，手动润色了一下。配图：Google Nano Banana【原贴】Building RAG systems at enterprise scale (20K+ docs): lessons from 10+ enterprise implem…
RAG技术
- 0
- 0
charles4月6日
您应该为您的 RAG 系统使用哪种分块技术？

在人工智能领域迅猛发展的今天，检索增强生成（RAG）系统已成为构建可靠且上下文感知应用的基石，这些应用由大型语言模型（LLM）驱动。RAG 系统通过检索外部知识库（如向量数据库）中的相关信息，来弥合 LLM 与外部知识之间的差距，从而提升模型的响应质量。然而，在实现高效 RAG 系统时，一个最关键却常常被忽略的步骤是“分块”（chunking）——即将大型文档分解成更小、更易消化的片段的过程。为什…
RAG技术
- 0
- 0
charles4月6日
关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

“ 多模态与RAG的结合是一个应用的实践过程，其实际操作远比理论要复杂得多。”这段时间一直在搞RAG和Agent，然后使用的基本上都是基于文本处理的推理模型，基本上没用过多模态模型；而最近突然有个想法，那就是把多模态应用于当前的RAG系统。虽然说之前对多模态有些基础认识，但并没有在真实的业务系统中实践过；然后网络上关于多模态应用的内容又很少，因此等真正尝试去做的时候才发现，多模态应用好像…
RAG技术
- 0
- 0
charles4月6日
MiniMax RAG 技术：从推理、记忆到多模态的演进与优化

导读在智能体与大模型应用不断深入的背景下，检索增强生成（RAG）技术正经历从“检索＋生成”向“检索＋推理＋记忆＋多模态”一体化的跃迁。本文首先剖析 RAG 系统在推理链构建和 Agent Layer 中引入知识图谱、MCTS 及强化学习的优化路径，继而探讨记忆层在动态检索、注意力过滤与多智能体协作中的实现方式；最后聚焦多模态场景下的张量化检索与延迟交互模型（COL），并针对存储膨胀、重…
RAG技术
- 0
- 0
charles4月6日
告别新手级RAG！一文掌握专业级后检索优化流水线

众所周知，检索是检索增强生成 (RAG) 系统的核心。它直接决定哪些文档片段给到大语言模型（LLM）来生成最终答案。不过，并不是所有的检索结果都是理想的。比如，在返回的前K个文档结果中，并不是最相关的。还有返回的结果过于冗长或已经过时，也会影响最终答案的质量。在前面我们通过两篇文章学习了两种预检索优化策略：查询路由（Query Routing）和查询构建（Query Construction）。它…
RAG技术
- 0
- 0
charles4月6日