-
RAG往后发展的三点感触及语言文化分析的两个工作
今天是2025年5月16日,星期五,北京,晴。我们说已经过许多关于知识图谱,RAG,文档智能方面的事情,这些都在2024年得到了很好的发展,也涌现出了许多细化的方案,GraphRAG,DeepResearch等层出不穷,Mineru、Mistralocr等文档解析工作也出现了不少,Qwen3也发布了。但是,目前已经进入到5月份了,仿佛都静了下来?许多github项目都不怎么更新了?模型发布也没那么…- 1
- 0
-
基于LangChain实现RAG的技术原理
前面为大家介绍过大模型相关的专业术语,比如AGI、RAG、LLM。也提到了当前阶段AI大模型存在的一些不足,比如对训练数据的数量和质量要求、对算力和电力的开支,以及大模型最大的问题:信息幻觉。目前业内对大模型信息幻觉的处理方法,一般都采用了RAG的方法,即Retrieval-Augmented Generation,检索增强生成。简单来说就是通过大模型+知识库的方式,从广泛的知识库中检索相关片段,…- 1
- 0
-
所有AI工具共享记忆!MCP协议让知识库进化成‘活’的智能中枢
在日常工作中,我们越来越习惯于组合使用多种AI工具来提升效率。但一个常见的困扰是,这些工具往往各自为战,“记忆”无法共享,导致我们的工作流被打断。设想这样一个场景:你首先在腾讯IMA知识库中查阅了大量关于某行业最新的政策文件和市场分析报告,对项目背景和关键数据有了初步掌握。接着,你想让AI写作助手(比如 Gemini 或 文心一言)帮你基于这些信息起草一份项目建议书的初稿。这时,你不得不手动复制粘…- 1
- 0
-
快速上车!RAGflow 保姆级安装指南!小白也能轻松搞定!
前面已经介绍了很多dify的内容,也有很多朋友问了我很多Dify平台的内容。但是在工作中,很多客户提出了一些内部知识库管理问题,这部分的内容,明显在Dify这里是一个短板。那这里接触了RAGflow,在文档管理方面RAGflow确实有自己的优势。RAGFlow 是一款开源检索增强生成(RAG, Retrieval-Augmented Generation)引擎,致力于通过深度文档理解技术,帮助用户…- 0
- 0
-
RAG系统中的向量数据库怎么选?很多人都忽视了
引言向量数据库(Vector Database)是专门为存储、索引和管理高维向量数据设计的数据库,广泛应用于人工智能(AI)、机器学习(ML)和大数据分析场景。随着非结构化数据(如图像、文本、音频等)的爆炸式增长,向量数据库通过将这些数据转化为向量嵌入(embeddings),并支持高效的相似性搜索,成为AI应用(如RAG、推荐系统、语义搜索等)的核心基础设施。本文将对比当前流行的向量数据库,包括…- 0
- 0
-
综述:从零构建RAG系统全面指南(含代码)
尽管大语言模型具备出色的推理能力和广泛的通用知识,但它们在检索精确信息、获取最新数据或提供可验证的回答时常常遇到困难。检索增强生成(Retrieval-Augmented Generation,RAG)应运而生,这一创新性方法通过将大语言模型与外部知识源相结合,有效提升了其性能。本文将深入探讨RAG的概念、重要性,并使用Python和流行的开源库从零开始构建一个完整的RAG系统。一、RAG是什么R…- 1
- 0
-
当RAG拥有“大脑”:揭秘Agentic RAG的进化之路
前2天我们介绍了有关RAG分块策略,通过优化文本切割方式(如按段落、语义或滑动窗口),让AI更精准地定位资料。但传统RAG仍有硬伤:被动检索、机械拼接答案、缺乏深度推理。那接下来我们就介绍下Agentic RAG,在技术上对传统RAG进行突破。01RAG限制检索增强生成 (RAG) 是一种用于构建 LLM 驱动的应用程序的技术。它利用外部知识源为 LLM 提供相关上下文并减少幻觉。Naive RA…- 1
- 0
-
RAG不好用?试试MCP这个“知识库优化大师”
在企业数字化转型浪潮中,如何有效管理和利用内部知识资产已成为关键挑战。随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。然而,传统RAG实现常面临检索质量不佳、实时更新困难等痛点问题。本文将通过实战案例,详细介绍如何基于模型上下文协议(MCP)构建一套高性能企业RAG系统,帮助企业快速打造智能知识库应用。MCP与传统RAG对比优…- 1
- 0
-
RAG常见的坑:如何让AI有效的考试作弊
春节 DeepSeek 火爆,不知道为啥带火了个人 AI 知识库。这篇我们不讲那种 “把文章拖进去就库库问 AI ”的玩具,因为讲了也没人听。我们讲讲“企业知识库”的搭建和应用,也就是 RAG,这项工作的常见盲点。RAG 是如何工作的RAG 的三个字母分别是 检索-增强-生成,它的原理其实很简单,就是三个单词对应的字面意思,按顺序做一遍:1. 当用户提出问题时,不发给大模型,…- 1
- 0
-
人人都能看懂的预训练、微调、提示词工程和 RAG(我保证)
这篇文章,我们用一个所有人都熟悉的案例,帮大家彻底理解大语言模型的那些"高大上"概念:• 预训练• 微调• 提示词工程• RAG(检索增强生成)。这个案例就是我们每个人都经历过的学习考试过程。看完这篇文章,你会对AI的工作原理有全新的认识,以后使用AI时也会更加得心应手。Tips:本文由 DeepSeek 基于我的录音稿整理润色,我只做了“微调”。预训练每学期开学,老师都会发给…- 1
- 0
-
DeepSeek接入个人知识库,回答速度飞快,最新安装包即将发布!
你好,我是郭震DeepSeek等大模型接入本地文件知识库,查询内容并生成大模型总结,很多朋友都有这方面的使用需求,过去四个多月到现在,我们开发了DeepSeekMine软件,专门给大家提供这方面的需求。今天这篇文章给大家汇报下过去两周我们最新开发进度,即将支持所有主流操作系统:Windows10/11,Mac intel和M系列,Linux等系统,感兴趣的朋友可以看下。1 功能更新有些朋友可能是第…- 1
- 0
-
RAG创始人关于RAG Agent的10个思考(上)
现在AI应用落地常用的方式是RAG(Retrieval-Augmented Generation),即检索增强生成。和Agent结合更是让RAG的应用场景更为广泛。很多企业包括我自己都在尝试使用它来提高AI在企业中落地的效果。最近RAG的创始人Douwe Kiela 在LinkedIn上分享了他对RAG Agent在企业中的10个教训,对我自己也很有启发。今天结合他的视频内容和我自己的实践体会来分…- 2
- 0
-
RAG提升召回准确率的解决方案——关于相似度计算与Rerank重排序的问题研究
“ RAG中文档拆分方式直接影响到召回效果,因此RAG中文档处理和召回策略同等重要。”最近在做RAG召回时遇到了一个问题,我们在项目中使用的是milvus向量数据库;具体的需求是把excel表中的数据导入到milvus数据库中,然后使用search方法从向量数据库中召回数据。由于业务需求问题,导致向量表中(collection)不仅仅只保存excel数据,同时还有word,markdow…- 2
- 0
-
支付宝搜索中基于LLM的生成式检索幻觉缓解技术方案
基于LLM的生成式检索(GR)在进行文档知识检索时或多或少的会引入幻觉,在一些对精度要求比较高的场景(如:金融等)如何缓解幻觉,下面来看下支付宝生成式检索缓解幻觉方案,供参考。方法如上图所示,框架分为两部分:知识蒸馏推理和决策Agent知识蒸馏推理目的:通过利用更大规模的LLM生成显式的推理数据,增强较小规模的LLM-based GR模型的训练。知识蒸馏推理模块提升了GR模型的检索精度,减少了幻觉…- 1
- 0
-
关于RAG应用中怎么高质量的进行数据召回——召回策略的研究
“ 数据召回是RAG技术的重要领域,而不同的召回策略甚至会产生完全不同的效果。”RAG技术的核心原理很简单,本质上就是在外部维护一个资料库,在进行大模型问答之前,先从资料库中找到相关的内容,然后一起输入到大模型中。但由于文档的复杂性,在进行文档处理时很难真正做到高质量的数据处理;因此,在做数据召回时就会面临着各种各样的问题。所以,怎么进行高质量的数据召回,就成为RAG必须要研究的一个课题…- 1
- 0
-
阿里云基于本地知识库构建RAG应用
本文主要描述阿里云人工智能大模型基于本地知识库构建RAG应用。与阿里云一起轻松实现数智化让算力成为公共服务:用大规模的通用计算,帮助客户做从前不能做的事情,做从前做不到的规模。让数据成为生产资料:用数据的实时在线,帮助客户以数据为中心改变生产生活方式创造新的价值RAG(检索增强生成,Retrieval-Augmented Generation)是一种结合了检索和生成技术的框架,旨在通过外部知识库的…- 1
- 0
-
用Coze知识库+RAG技术,给AI装上「企业知识外挂」
企业知识库是培训咨询机构的核心竞争力,但这些内部资料往往无法被公开网络和大语言模型(LLM)获取。如何让AI精准解答企业内部问题?关键在于用RAG技术为AI赋能!本文手把手教你通过Coze知识库打造「智能知识外挂」,让咨询顾问的考研答疑效率提升200%——无需训练模型,一键构建专属AI助手。1创建智能体首先,在Coze平台(https://www.coze.cn)点击左侧的加号(+)创建智能体,输…- 1
- 0
-
《RAG、MCP、Agent傻傻分不清AI概念?一文让新人秒变专家!》
让我们一起探索 AI 世界的三个好朋友:MCP、RAG 和 Agent!今天我们将带您轻松了解这些令人兴奋的技术。这三个小伙伴最近在 AI 圈子里可火了!特别是 MCP,它带来了好多有趣的新玩法,让大家都跃跃欲试呢~不过呢,我知道有些小伙伴可能觉得这些概念有点难懂。别担心,这很正常!毕竟现在的资料都写得比较"正经",看起来不太亲民。所以今天,我们打算用简单易懂的方式,跟大家聊聊…- 1
- 0
-
RAG15种分块策略进行汇总介绍。
上一篇我们介绍了5种常见的分块策略,那这一篇我们来介绍下15种分块策略进行汇总介绍。固定大小分块01固定大小的分块将文档拆分为预定义大小的块,通常按字数、标记数或字符数。当您需要一种简单明了的方法并且文档结构并不重要时。它在处理较小、不太复杂的文档时效果很好。优势:易于实施。一致的块大小。快速计算。弊:可能会断开句子或段落,从而丢失上下文。对于保持含义很重要的文档来说,这并不理想。基于句子分块02…- 1
- 0
-
通用RAG:通过路由模块对多源异构知识库检索生成问答思路
如何在多个语料库(多源异构知识库,如:文本、图片、视频)中检索和整合来自不同模态和粒度的知识?UniversalRAG:一个多模态RAG框架,用于从多个模态和粒度的语料库中检索和整合知识。下面来看看思路,供参考。方法从上图可以看到,UniversalRAG的核心思想是通过动态识别和路由查询到最合适的模态和粒度知识源来进行检索。模态感知检索(Modality-Aware Retrieval):多模态…- 1
- 0
-
DeepChat+RAGFlow 强强联合!配置知识库实现智能问答效率提升 300%
准备参考《RAGFlow实践:快速实现知识库的智能检索》部署RAGFlow并创建知识库。DeepChat是通过MCP方式调用RAGFlow,所以,部署的RAGFlow需要支持MCP。RAGFlowAPI服务器地址点击账户图标:点击“API”:将API服务器地址保存备用。创建Key点击“API KEY”:点击“创建新密钥”:点击“复制”按钮保存密钥:然后点击“确定”,关闭对话框。数据集ID数据集ID…- 1
- 0
-
两年了,你的RAG知识库落地了吗?一场价值数百万的AI智商税实验
我们是不是拿着公司的项目预算做了两年所谓的技术研究??这两天翻到了两年前ChatGPT刚爆发时候画的一张PPT,很有些感慨。是的,两年前,GenAI刚爆发的时候,微调 / 向量 / 知识库这些词缀就已经进入大家的视野了,然而两年过去了,AI技术确实也越来越成熟了,我想问问大家,你们的RAG知识库项目建好了吗?效果超过基于上一代全文检索技术的知识库了吗?得到客户认可了吗?在经手几个企业级…- 1
- 0
-
探讨如何构建具有可扩展长时记忆AI Agents相关的技术实现
探讨 AI Agents 长期记忆相关的技术实现,核心在于解决大型语言模型 (LLM) 固定上下文窗口的内在限制,使其能够在长时间、多轮次的对话中保持连贯性和一致性。缺乏这种持久性记忆能力导致 AI 代理遗忘用户偏好、重复信息并否定先前的事实。构建一个能够超越有限上下文窗口的鲁棒 AI 记忆系统,需要选择性地存储重要信息、整合相关概念并在需要时检索相关细节,这模仿了人类的认知过程。(底层…- 0
- 0
-
建议收藏!重温RAG的5种分块策略
在构建高效的大语言模型(LLM)应用时,数据分块是至关重要的预处理步骤。通过将大型数据文件智能分割为适当大小的片段,我们能够为LLM精准提供执行特定任务所需的信息量 - 既不会因信息过载而影响性能,也不会因信息不足而降低输出质量。 为了方便大家更好了解RAG的分块,将分块策略进行一些回顾和总结。 AgentLight" data-from="0" data-headi…- 1
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页
联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!