-
Dynamic RAG实战:解决知识增强中的动态更新挑战
在探讨大模型在垂直领域的落地实践时,我们往往会遇到这样一个关键问题:如何在保证模型输出质量的同时,又能够让模型具备领域专业知识?目前业界主流的技术路线包括:Prompt Engineering、RAG(检索增强生成)、微调以及预训练等方案。每种方案都有其适用场景和技术边界:Prompt Engineering:是大模型应用的入门级选择,适合资源有限且需要快速验证的场景。虽然其技术难度低、投入少,但…- 9
- 0
-
构建行业RAG应用系统:金融、财务、保险、医疗等行业该怎么做?
金融、财务、保险和医疗行业创建 RAG 应用系统的意义RAG 应用系统在金融、财务、保险和医疗行业中具有重要意义,可高效识别 PDF 和图片中的表格信息,如财务报表、资产负债表、保险理赔单和医疗化验结果等。通过将这些表格转化为结构化数据并存储于向量数据库,RAG 系统能快速检索和分析数据,支持智能决策、优化规划、提升效率,并实现个性化服务。既然RAG系统在这些行业这么有意义,那该怎么构建RAG应用…- 5
- 0
-
构建基于多智能体RAG的企业的AI应用程序
本文重点介绍了多智能体RAG如何利用如AWS Bedrock和SingleStore等先进科技增强实时AI交互。让我们从理解朴素的RAG方法开始。理解基础的RAG(检索增强生成)朴素的RAG(或简单的RAG)构成了更为复杂系统的基础概念。它涉及通过检索机制增强语言模型的能力,使其能够访问外部数据源,从而提供更为详尽的响应。虽然朴素的RAG在基本应用中可能有效,但它通常缺乏企业级应用所需的复杂性。这…- 6
- 0
-
必读!RAG好用的3种Router
本公众号主要关注NLP、CV、LLM、RAG、Agent等AI前沿技术,免费分享业界实战案例与课程,助力您全面拥抱AIGC。目前开源了很多LLMs大模,虽然GPT4o一直占据第一位的宝座,但是并不是在每个领域都很强。例如:写代码的Code-LM、做数学的meta-math,做图文多模态的Macaw-llm等等。都有自己的强项。PolyRouter提供了一个多LLM路由系统,该系统根据特定需求动态将…- 1
- 0
-
GraphRAG0.5.0:从安装到高效应用的全方位指南
Graphrag 介绍GraphRAG(基于知识图谱检索增强生成)是一种新型的检索增强生成(RAG)技术,它通过将知识图谱(KGs)或图形数据库与大型语言模型(LLMs)集成,显著增强了传统的检索增强生成方法。以下是对 GraphRAG 的详细介绍:GraphRAG 的基本原理GraphRAG 旨在通过知识图谱和图机器学习技术来提升大语言模型(LLM)的能力。它利用从大型语言模型中提取的知识图谱,…- 9
- 0
-
大模型之深入探索RAG流程
前言在上一章【大模型之初识RAG】中,我们初步了解了RAG的基本概念和原理,并通过代码实践了一个简单的RAG流程。本章我们将基于RAG的基本流程,深入了解文档读取(LOAD)、文档切分(SPLIT)、向量化(EMBED) 和 存储(STORE) 的每个环节,并结合代码进行常见场景的实践。RAG流程回顾回顾RAG的流程如上所示,具体代码见RAG代码,本章不再赘述。文档读…- 6
- 0
-
如何构建一个可信的联邦RAG系统
今天给大家分享一篇论文。题目是:C-RAG:如何构建一个可信的联邦检索RAG系统。论文链接:https://arxiv.org/abs/2412.1316301论文概述尽管大型语言模型 (LLM) 在各种应用中展现出令人印象深刻的能力,但它们仍然存在可信度问题,例如幻觉和偏差。检索增强语言模型 (RAG) 被提出通过接地外部知识来增强生成的可靠性,但对其生成风险的理论理解仍未探索。当前RAGt可信…- 7
- 0
-
语义缓存:提升 RAG 性能的关键策略
检索增强生成(Retrieval-Augmented Generation,简称RAG)(RAG综述:探索检索增强生成技术的多样性与代码实践)技术已经成为构建高性能AI模型的重要基石。RAG通过结合先进的语言模型与外部知识检索,能够生成既准确又富含上下文的响应。然而,尽管RAG功能强大,但它也伴随着一系列挑战,如高令牌消耗(token consumption)、运营成本的增加以及响应时间的延长。这…- 1
- 0
-
熬了几个夜,终于让Agentic RAG工作流正常运行了,特来分享一下
一直以来都在想用 LLM + Agent + RAG + FastAPI 搭建一套完整的智能检索增强生成工作流(Agentic RAG Workflow)。我选择了一个客服支持项目来学习,经过一段时间的学习(主要是踩坑),大致上是跑通了这个工作流。赶紧总结分享起来。Agentic RAG(代理型 RAG) 只是与 AI 智能体架构一起使用的 RAG(检索增强生成)。使用传统 RAG 和 Agent…- 3
- 0
-
[RAG] ChunkRAG: 用于RAG系统的新型LLM分块过滤方法
ChunkRAG的方法论ChunkRAG的方法论旨在通过细粒度的过滤机制来提高检索增强生成(RAG)系统的精确性和事实准确性。该方法论分为两个主要阶段:语义分块和混合检索及高级过滤。语义分块语义分块是ChunkRAG的基础步骤,将输入文档转换为语义上有意义的单元,以促进有效的检索和评估。这一阶段包括以下三个子过程:1. 输入准备:使用NLTK的sent_tokenize函数将文档D分词为句子。每个…- 6
- 0
-
15种典型RAG框架:卡内基梅隆大学最新RAG综述
▌1. 引言1.1 检索增强生成(RAG)概览RAG(Retrieval-Augmented Generation)融合了两大核心组件:-(i)检索模块,负责从外部知识库中检索相关文档或信息,利用密集向量表示从大型数据集,如维基百科或私有数据库中识别相关文档。-(ii)生成模块,负责处理这些信息,产出类似人类语言的文本,检索到的文档随后被送至生成模块,该模块通常基于 transformer 架构构…- 12
- 0
-
RAG效果不好怎么办?试试这八大解决方案(含代码)
随着自然语言处理(NLP)技术的飞速发展,构建高效的信息检索系统已成为许多企业和开发者的重要需求。LangChain 是一个强大的框架,旨在帮助开发者快速构建和优化基于大型语言模型(LLM)的应用程序。其中检索器是 LangChain 提供的一个核心接口,它可以根据用户的非结构化查询返回相关的文档。每种检索器都有其独特的应用场景和优势,本文将详细介绍 LangChain 中的几种检索器及其应用场景…- 6
- 0
-
RAG 架构图解:从基础到高级的7种模式
「RAG 技术通过在 AI 生成过程中引入外部知识检索,从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构,让 AI 回答更准确、更全面」「核心组件」嵌入模型: 将文本转换为向量表示生成模型: 负责最终的内容生成重排序模型: 优化检索结果的相关性向量数据库: 存储和检索向量化的内容提示模板: 规范化…- 8
- 0
-
什么是相似性搜索?大模型的底座技术
“ 语义分析是人工智能实现的基础,而语义分析实现的基础却是向量 ”说到相似性搜索可能有些人听说过这个词,而有些人可能都没听过这个词;相似性搜索可能很多人都不清楚,但语义搜索应该很多人都听说过;在某种条件下,可以把相似性搜索等价于语义搜索;但相似性搜索又不完全等价于语义搜索。今天,我们就来一起聊一下什么是相似性搜索,这个RAG技术中的大杀器,也是人工智能时代不可或缺的一个技术。…- 5
- 0
-
揭秘RAG:一文带你轻松区分交叉编码器与双编码器的精髓
在人工智能世界的拼图中,RAG(Retrieval-Augmented Generation)扮演着至关重要的角色。这个名字对我们许多人来说既熟悉又神秘:我们经常听到它,因为它是AI领域的核心组成部分;但同时,我们对它的实际应用和背后的技术细节又知之甚少。别担心,本文将通过直观的图解,带你深入浅出地探索RAG的奥秘,让你不仅认识RAG,还能理解它是如何成为AI世界中不可或缺的力量。让我们一起揭开R…- 16
- 0
-
人民大学研究团队发布FlashRAG工具包,为RAG研究提供标准化高效解决方案,赋能研究全流程
今天给大家带来一篇最新的前沿AI论文解读。这篇论文介绍了一个名为FlashRAG的开源工具包,旨在帮助研究人员更有效地进行检索增强生成 (RAG) 研究。FlashRAG由中国人民大学高瓴人工智能学院的研究团队开发,其目标是解决当前RAG研究中缺乏标准化框架、工具包笨重难以定制等问题。什么是RAG?简单来说,RAG是一种将大语言模型 (LLM) 与外部知识库结合的技术。LLM就像一个见多识广的语言…- 7
- 0
-
RAG必备武器:Embedding与Rerank的协同召回作战
在信息爆炸的 AI 时代,如何快速而精准地从海量数据中找到最相关的信息,成为了一个关键挑战。传统的关键词匹配方法虽然简单直接,但在面对复杂查询和语义理解时显得力不从心。为了突破这一瓶颈,现代搜索引擎和技术开发者们引入了两种先进的技术:Embedding模型和重排序(Rerank)策略。下面我们将详细探讨这两个技术的概念,以及它们是如何共同作用以提高RAG检索系统性能的。一、了解编码器特性Bi-En…- 3
- 0
-
Scaling Test-Time Compute:向量模型上的思维链
自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在推理阶段(也就是大语言模型生成输出的时候)多花点计算资源。o1 模型将一个大问题拆分为一系列小问题(即思维链,Chain-of-Thought),让模型像人一样一步步思考,评估不同的可能性、做更细致的…- 5
- 0
-
Alibaba发布:可编辑CoT,超越ReAct20%
本期介绍的是一个Cot思维连框架Verify-and-Edit (VE)。该框架通过根据外部知识对推理链进行后期编辑来提高预测的事实性。Cot思维连的作用 思维链 (CoT) 能够改善需要复杂推理的任务的性能,例如数学文字题、常识推理和符号操作。 同时,它能够生成可解释的推理链。为什么要编辑CoT思维连 提高 CoT 的质量可以有利于提高可解释性和最终任务的性能。人类认为好的解释通常意味着更准确的…- 4
- 0
-
使用RAG技术构建企业级文档问答系统:切分(1)Markdown文档切分
1 概述在解析(1)使用MinerU将PDF转换为Markdown中我们提到了将各种文档解析为Markdown的好处,本文我们接着上一篇文章处理后的Markdown,讲解如何对Markdown文档进行切分。在很多文档中,标题都是非常重要的信息,例如企业内部的办理流程,稍微规范点的文档,标题里面都会体现重点信息的。既然转成了Markdown,标题肯定是保留下来了,本文将首先介绍基于Markdown标…- 6
- 0
-
模型上下文协议:一个可以让你的AI更聪明的协议
AI是如何“记住”你说过的话的?揭开模型上下文协议的神秘面纱。在与AI交互时,你是否好奇它为什么会记住你的需求,甚至在对话中主动提供个性化建议?这种“记忆力”的背后,依赖于一种叫做模型上下文协议的技术。本篇文章将用浅显的语言解读这项协议的核心逻辑,探讨它如何提升用户体验,同时也分析它的局限性与未来发展方向。从咖啡店点单开始:AI如何理解你想象你在一家智能咖啡店点单。你告诉服务员:“我要…- 1
- 0
-
ChatOllama-本地大模型+RAG知识库
本文将介绍用ChatOllama这个项目实现与本地大语言模型的对话并通过这个项目搭建本地知识库进行问答项目地址:https://github.com/sugarforever/chat-ollama现在有很多支持本地运行大预言模型的项目和使用知识库的项目或者平台,之所以想介绍ChatOllama是因为个人使用过后感觉比其他项目好用。特别是它的本地知识库,也就是RAG问答效果,是我到现在用过的几个知…- 3
- 0
-
58同城如何通过RAG与Tool Use技术提升AI能力
导读 在当前人工智能技术迅猛发展的背景下,智能助手的应用场景愈加广泛,涵盖了从 B 端商家服务到销售培训及大数据分析等多个领域。本文将深入探讨智能助手在 58 同城实际应用中的案例,包括招聘助手和销售陪练的设计与实施,还将分析知识库管理和工具使用对智能助手性能的影响。通过对这些案例的剖析,将揭示如何利用先进的 AI 技术,提升工作效率、优化用户体验,并推动企业数字化转型的进程。主要内容包…- 5
- 0
-
GNN-RAG:低成本提升 LLM 效率与效果的革新性 AI 方法
“AI 的最终目的是让机器真正理解世界,而不仅仅是模仿语言。”——这一技术愿景始终推动着自然语言处理的不断创新。然而,即使拥有强大的语言理解能力,LLM(大型语言模型)在面对新兴知识或特定领域内容时,仍显现出适应性不足的问题,导致准确性下降。与此同时,知识图谱(KG)作为信息的结构化载体,以其在知识更新和问答任务中的卓越表现,为解决这些问题提供了突破方向。检索增强生成(RAG)框架通过引入知识图谱…- 6
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















