-
知识增强图(KAG)在LLM检索中的应用
在人工智能领域蓬勃发展的当下,生成式人工智能技术不断取得新的突破,其中基于大语言模型(LLM)的检索技术更是成为众多应用场景的核心。检索增强生成(RAG)和 GraphRAG 作为该领域的重要探索成果(2024 年 RAG 的崛起和演变:一年回顾综述(1.25万字+46参考文献+18张图)),曾为连接外部文档与大语言模型进行问答任务提供了有力支持,但它们也存在着不可忽视的局限性。在此背景下,知识增…- 8
- 0
-
哈啰:构建智能出行RAG,ES还是向量数据库?
在2024年的Inclusion·外滩大会上,哈啰集团宣布已经构建了全面的AI布局,以迎接大模型时代的到来。如同一匹黑马,哈啰在智能时代脱颖而出,其服务版图从最初的单车扩张到如今的本地出行及生活服务平台。在技术探索的征途上,哈啰通过构建基于向量数据库的RAG(Retrieval-Augmented Generation)应用,不断强化业务效能。大模型应用,如海螺机器人、交易机器人、光子引擎、贾维斯…- 6
- 0
-
企业级LLM独角兽 Cohere 发布 North:集成 RAG、搜索及 Agent 的企业级 AI 工作空间
Cohere,一家领先的基础模型公司,近日发布了其最新的企业级 AI 平台 North。North 集成了基于 RAG 的强大搜索功能、高性能 Command R 系列模型以及便捷的 Agent 构建工具,打造出一个安全、易用且高度可集成的 AI 工作空间。North 采用私有化部署,确保数据安全,并通过低代码平台简化 AI 助手开发。North 的推出标志着 Cohere …- 7
- 0
-
2025年这7种用于构建Agentic RAG系统的架构不可或缺
2024年,随着 LLM 和 RAG 技术的发展,AI Agent 系统成为焦点。AI Agent 是能够在最小人工干预下进行复杂决策和任务执行的自主系统,这些系统通过增强生产力,重新定义了个人和组织解决问题的方式。2025 年将是“Agent 之年”!今天,我们将探讨 Agentic RAG 系统的类型及其架构,并深入了解其运作机制。Agentic RAG系统:RAG与AI …- 8
- 0
-
使用RAG技术构建企业级文档问答系统:切分(3)使用Jina API进行语义切分
概述Jina AI是一家成立于2020年的人工智能公司,专注于开发用于搜索和智能分析的开源软件。提供了非常多好用的API,例如Jina Reader可以将网页解析为Markdown文档、Reranker可以对RAG的向量模型检索到的文档进行重排序等,除了在线API,在HuggingFace上也开源了若干模型。今天我们要使用的,是Jina提供的文本切分工具,它是以REST API形式提供服务的,主页…- 7
- 0
-
使用RAG技术构建企业级文档问答系统:切分(2)使用Embedding进行语义切分
1 概述以往我们使用的文本切分方式,都是基于特定字符、或者特定长度的,而完全不考虑语义,这未免有点奇怪,而且从实践经验来看,使用特定字符或特定长度的切分方式,导致片段语义不连贯是非常明显的一个问题。langchain-experimental库中有一个SemanticChunker,可以将句子转换为向量,并计算不同向量之间的相似性,来决定是否需要切分,由于向量可以代表句子的语义,因此这样切分也是语…- 6
- 0
-
RAG在智能问答系统中的应用
什么是RAG? RAG是一种将信息检索与生成模型相结合的混合架构。首先,检索器从外部知识库或文档集中获取与用户查询相关的内容片段;然后,生成器基于这些检索到的内容生成自然语言输出,确保生成的内容既信息丰富,又具备高度的相关性和准确性。RAG 模型由两个主要模块构成:检索器(Retriever)与生成器(Generator)。这两个模块相互配合,确保生成的文本既包含外部的相关知识,又具备自然流畅的语…- 6
- 0
-
CAG能取代RAG吗?别被表面现象迷惑!
近年来,RAG(Retrieval-Augmented Generation,检索增强生成)一直是LLM领域的重要方向。它通过实时检索文档并结合生成模型的能力,为用户提供了动态且准确的答案。然而,最近一篇关于 CAG(Context-Aware Generation)的论文引发了热议。它以 “别用 RAG!” 的挑衅性标题(原文标题是《Don’t Do RAG: WhenCache-A…- 5
- 0
-
Agentic AI 系统设计:第四部分 数据获取和 Agent RAG
到目前为止,我们已经讨论了 Agent 系统架构,如何将系统组织成子Agent以及如何构建统一机制来标准化通信。今天,我们将把注意力转向工具层以及代理系统设计中你需要考虑的最重要的方面之一:数据检索。数据检索与Agent RAG有可能创建不需要数据检索的Agent系统。这是因为有些任务仅使用你的语言模型所训练的知识就可以完成。例如,你很可能能够创建一个有效的Agent来撰写关于历史事件(如罗马帝国…- 5
- 0
-
3.7K Star!GraphRAG不香了~
RAG技术通过外部检索系统为大型语言模型(LLMs)提供领域特定知识,有效减少了答案幻觉现象,但在多跳和跨段落任务中仍存在不足,尤其是在需要逻辑推理的专业领域,如法律、医学和科学等。KAG在多跳问答任务中显著优于现有RAG方法,在HotpotQA和2wiki数据集上的F1分数分别提高了19.6%和33.5%KAG解决的问题KAG框架通过充分利用知识图谱(KG)和向量检索的优势,从五个关键方面双向增…- 5
- 0
-
分块的艺术:提升 RAG 效果的关键
聪明人往往很“懒”,但这种“懒”其实是高效的体现。他们总能找到解决复杂问题的最佳路径,用最少的力气获得最大的成果。在RAG系统中,这种高效的实现往往是通过“分块”来实现的。你可以把它想象成把一本厚书分成几章——这样一来,阅读和理解就轻松多了。同样地,分块技术把大段复杂的文本拆分成更小、更容易处理的片段,让AI能更快、更准确地理解和处理信息。不过,在深入探讨分块之前,咱们得先聊聊它背后的“大框架”—…- 7
- 0
-
从RAG到RAG+:让大模型更懂业务的权威指南
每当我向非技术背景的朋友解释大语言模型时,我常常用"博学但缺乏实践经验的应届生"作比喻。这些模型确实掌握了海量的知识,但在特定领域的实际应用中,常常会暴露出"经验不足"的问题。就像一位刚毕业的法学生,虽然能流畅地背诵法条,但面对真实的案件时可能会觉得无从下手。微软亚洲研究院的研究团队近期发布的这篇综述,正是致力于解决这个"经验不足"的问题…- 6
- 0
-
Java开发者LLM实战——使用LangChain4j构建本地RAG系统
1、引言由于目前比较火的chatGPT是预训练模型,而训练一个大模型是需要较长时间(参数越多学习时间越长,保守估计一般是几个月,不差钱的可以多用点GPU缩短这个时间),这就导致了它所学习的知识不会是最新的,最新的chatGPT-4o只能基于2023年6月之前的数据进行回答,距离目前已经快一年的时间,如果想让GPT基于近一年的时间回复问题,就需要RAG(检索增强生成)技术了。此外,对于公司内部的私…- 6
- 0
-
RAG的技术困境:为何单纯依赖向量嵌入不可靠?
在 RAG 系统中,其核心任务是找出那些与查询内容相似度最高的存储信息。然而,向量相似度搜索并不能实现这一点,这也是 RAG 在实际应用中遭遇挫折的原因。01选错了工具RAG 在生产环境中的失败,归咎于使用了向量嵌入来衡量信息的相似度,这显然不是一个恰当的选择。我们可以通过一个简单的例子来说明这一点。假设有三个词汇:King(国王)Queen(王后)Ruler(统治者)“国王”和“统治者”可能指的…- 5
- 0
-
Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案
随着人工智能(AI)技术的不断进步,知识密集型任务在AI应用中变得越来越核心。这些任务要求AI系统能够无缝地整合和利用外部信息,以提供更加准确和有用的回答。为了实现这一目标,检索增强生成(Retrieval-Augmented Generation,RAG)技术应运而生,它通过将外部知识与大型语言模型(Large Language Models,LLMs)相结合,显著提升了模型的性能。然而,RAG…- 8
- 0
-
搭建RAG架构,如何选择向量数据库产品?
搭建RAG架构应用时,选择合适的向量数据库是关键。向量数据库是RAG系统的核心组件,负责存储和检索高维向量数据,从而支持高效的语义搜索和信息检索功能。那么今天与大家分享下如何选择向量数据库,以及主流向量数据库产品的推荐,供您参考学习。如何选择向量数据库?性能与延迟:向量数据库需要在召回率(即相关结果的比例)和响应时间之间进行权衡,对于实时应用程序,如对话式AI,延迟和吞吐量的需求尤为重要,因为性能…- 6
- 0
-
搭建RAG应用,Embedding模型如何选?
在搭建RAG系统时,选择合适的Embedding模型是至关重要的一步,下面是我对选择Embedding模型时需要考虑的关键因素和建议,供您参考:明确应用场景首先,需要明确RAG系统的具体应用场景和需求。例如,是处理文本数据、图像数据还是多模态数据?不同的数据类型可能需要不同的Embedding模型。例如,对于文本数据,可以参考HuggingFace的MTEB(Massive Text Embedd…- 7
- 0
-
EdgeRAG: 检索增强生成的新篇章,开启边缘智能新时代
今天分享的是一种面向边缘设备的检索增强生成方法:EdgeRAG。论文链接: https://arxiv.org/pdf/2412.21023简介随着大型语言模型 (LLM) 和检索增强生成 (RAG) 技术的兴起,将它们部署在资源受限的边缘设备上成为一项挑战,因为边缘设备的内存和计算能力有限。传统的 RAG 系统需要将整个嵌入向量数据库加载到内存中,这在边缘设备上是不现实的,会导致内存抖动和性能下…- 4
- 0
-
抛弃 RAG!缓存增强生成或成知识任务新宠
在自然语言处理领域,检索增强生成(RAG)一直是增强语言模型能力的热门方法,但它存在检索延迟、文档选择错误和系统复杂等问题。今天要给大家介绍的这篇论文 “Don’t Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks” 提出了一种新的范式 —— 缓存增强生成(CAG),为知识任务提供了更高效的解决方…- 8
- 0
-
案例解析:RAG的尽头是Agent
AI进化论:从RAG到Agent,智能体如何重塑未来世界©作者|Blaze来源|神州问学引言随着ChatGPT、ChatGPT-4等的发布,我们彻底被大模型(LLM)的魅力所征服,越来越多的公司和企业开始聚焦大模型技术的研发和使用,为我们的日常生活带来了极大的便利。但是,大模型同样面临着时效性、准确性等各种问题,如何让LLM变得更好?如何解决LLM所面临的挑战?如何构建高级的LLM应用?逐渐成为A…- 6
- 0
-
关于RAG你不得不了解的17个技巧
最近在写文章,想补上去年RAG(Retrieval-Augmented Generation)遗留的一些坑,希望能分享一些RAG的技巧帮到大家。还是那句老话:构建一个大模型的原型很容易,但把它变成一个能真正投入生产的产品却很难。这篇文章适合那些在过去一个月里刚刚构建了第一个LLM(大语言模型)应用程序,并开始考虑如何将其产品化的朋友们。我们将介绍17种技术,帮助你们避免在RAG开发过程中重复踩坑—…- 5
- 0
-
LLM 幻觉:现象剖析、影响与应对策略
当下大语言模型(LLM)如 ChatGPT 等已广泛应用于各个领域,从日常聊天到专业的医疗、法律和科研辅助等。然而,LLM 的幻觉现象却如影随形,给其应用带来了诸多挑战和潜在风险。深入理解 LLM 幻觉的类型、成因、影响以及应对策略,对于推动 AI 技术的健康发展至关重要。今天我们一起了解一下LLM幻觉。一、LLM幻觉的多样奇观LLM幻觉(基于验证链(Chain of Verification)的…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


























