-
通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统
随着大数据时代的到来,信息检索技术在各个领域中扮演着越来越重要的角色。阿里云向量检索服务 Milvus 版作为一款高性能的向量检索引擎,100%兼容开源 Milvus,凭借其开箱即用、灵活扩展和全链路告警能力,成为企业大规模 AI 向量数据相似性检索服务的理想选择。其最新版本 2.5 在全文检索、关键词匹配以及混合检索(Hybrid Search)方面实现了显著的增强,在多模态检索、RAG等多场景…- 5
- 0
-
本地部署DeepSeek R1 + Ollama + XRAG:三步搭建RAG系统,并解锁全流自动化评测
引言如何科学的评估RAG系统,对于RAG系统的性能优化至关重要。为此,本文提供了一个详细操作指南,帮助用户使用Ollama本地部署最新的DeepSeek R1模型,并使用最新的XRAG1.0框架来构建RAG系统并评估你的本地RAG知识库系统。这一过程分为三个主要步骤:Ollama安装下载启动DeepSeek R1模型配置XRAG使用本地模型和知识库,运行评估以解锁全流程自动化评测能力。RAG技术核…- 5
- 0
-
Graph RAG 迎来记忆革命:“海马体”机制如何提升准确率?
随着生成式 AI 技术的快速发展,RAG(Retrieval-Augmented Generation)和 Agent 成为企业应用大模型的最直接途径。然而,传统的 RAG 系统在准确性和动态学习能力上存在明显不足,尤其是在处理复杂上下文和关联性任务时表现不佳。近期,一篇论文提出了 HippoRAG 2,这一新型 RAG 框架在多个方面取得了显著进步,为企业级 AI 应用提供了更强大的解…- 8
- 0
-
Windows 部署 DeepSeek 本地 RAG 保姆教程:低配秒变AI工作站,断网也能稳如老狗!
一、二步为介绍,如果想要看怎样接入本地知识库,可直接从 第三步:AnythingLLM 安装 开始一、RAG介绍RAG 知识库概述1. 定义RAG(Retrieval-Augmented Generation)是一种结合检索技术与生成模型的自然语言处理方法,通过引入外部知识库提升系统回复的准确性与信息量。2. 核心原理• 检索优先:生成回答前,先从知识库中检索相关信息(类似“开…- 4
- 0
-
DeepSearcher深度解读:Agentic RAG的出现,传统RAG的黄昏
前言准备好迎接搜索3.0时代了吗?随着这几年AI技术的革新,“搜索应用”成为了AI应用层的第一个共识。从海外的OpenAI、微软Bing Copilot、Perplexity AI,再到国内的豆包、Kimi,都是这一共识下的代表产品。技术上,从传统的关键词检索,到RAG,大家已经不满足于只是生成对应的简单回答而是期待大语言模型能够更好地应用于企业级场景,产生更大的价值。不久前,OpenAI推出了最…- 5
- 0
-
dify案例分享-知识库增强检索
1.前言RAG(检索增强生成,Retrieval-Augmented Generation)增强检索知识库是一种结合信息检索与生成式人工智能的技术框架,旨在通过动态调用外部知识库提升大语言模型(LLM)回答的准确性、相关性和时效性。其核心在于将传统检索系统与生成模型结合,解决大模型自身训练数据局限性、知识过时及“幻觉”(虚构信息)等问题。以下是具体解析。技术原理与流程检索(Retrieval)根据…- 10
- 0
-
微软 GraphRAG 解析:知识图谱如何提升 AI 检索能力
大多数 RAG 技术的检索步骤都依赖于我们从向量数据库中获取相关文档的能力。尽管大多数向量数据库都采用了高效的相似性计算算法,加上我们运用了最佳的分块、排序及重排序策略,基线 RAG 仍然难以处理那些查询与源文内容不完全匹配(即查询在语义上应与语料库保持高度相似)的情况。并且,它不具备回答全局问题或得出高级结论的能力,无法理解数据实体之间关系背后的深层次含义。其他 RAG 技术主要集中…- 4
- 0
-
AI 大模型 + 本地知识库=安全隐患?你的隐私可能在「向量化」里裸奔
AI 大模型 + 本地知识库=安全隐患?你的隐私可能在「向量化」里裸奔当「贴心助手」变成「泄密特工」,只需一个 RAG 流程——本文通过复现 Cherry Studio 与 LM Studio 的联动实验,揭露本地知识库中敏感信息可能通过向量化建模、提示词拼接两大漏洞流向云端服务器的技术真相,并附赠一份「数字时代防 AI 背刺指南」。场景分析你选择本地目录作为知识库,目录内有 1 个含…- 7
- 0
-
深度解析AI大模型RAG框架Dify
一、背景与发展历程 Dify 是面向开发者的开源大语言模型(LLM)应用开发平台,诞生于生成式 AI 技术爆发期(约 2023 年前后)。 其目标是通过 低代码化 和 模块化设计,简化 AI 应用的开发流程,让开发者无需从零搭建复杂架构即可快速部署生产级应用 。 &nb…- 6
- 0
-
谷歌放大招!RAG 技术已死?
谷歌最近发布了 Gemini 2.0 Flash 版本模型,这可能是当前性价比最高的 AI 模型了。这个模型除了性价比之外,还有何魔力呢?为什么我会说 RAG 即将被淘汰呢?RAG 究竟是什么?RAG 全称是 Retrieval-Augmented Generation,即检索增强生成技术。这项技术常被用于帮助 ChatGPT 等 AI 模型访问其原始训练数据之外的外部信息。你可能在不知不觉中就体…- 7
- 0
-
大模型应用开发平台Dify推出1.0版本,基于向量数据库Milvus实现RAG
用 Dify 和 Milvus 搭建 RAG 系统实战指南。在生成式人工智能(GenAI)的应用领域,检索增强生成,即 RAG,是当之无愧的热门技术。RAG 能够赋能企业充分挖掘大语言模型(LLM)的潜力,依托企业内部的知识库,如各类文档、报告和手册等,精准且高效地解答用户的各种问题。不过,搭建 RAG 系统并非易事,颇具挑战性,相关技术知识储备是绕不开的 “门槛”。正因如此,很多技术爱好者和企业…- 9
- 0
-
DeepSeek+ragflow构建企业知识库:高级应用篇,越折腾越觉得ragflow好玩
常见误解误解一:使用本地知识库以后,大模型是不是能够自学习在之前的文章 DeepSeek+dify 本地知识库:真的太香了中已经说了。误解二:使用了知识库以后一定能够检索到• 首先:向量是不确定性的,它是对某个对象的模糊描述,• 比如广东和广西这两个字在我们的认知里这两个词语是完全不一样的• 但是在向量的认知里,他们就相近• ragflow中不管是关键词还是知识图谱都是为了解决这些问题•…- 3
- 0
-
2025 年的 RAG 之推理篇
DeepSeek R1 在 2025 年初引发的震撼,让我们过去对于 LLM 关于推理和决策的预测时间点提早了大半年。如何让 LLM 具备更好的推理能力已经是 LLM 最热的研究方向之一。那么伴随着 LLM 的推理,RAG 需要做哪些调整?这正是我们在当前写下本文的主要动机。中文的推理对应两个不同的英文词汇,一个是 Inference,对应的概念是 Training(训练),另一个是 Reason…- 4
- 0
-
企业实施RAG过程中:常见误解与澄清,内含项目升级预告
春节之后的一个月的时间内,微信和小红书上数了下大概有 150 多个过来咨询 RAG 在企业落地的网友,一路聊下来按照对方的诉求大概分为三类,第一种是最多的就是年后返工公司领导让落地 RAG,但是一时没有头绪的过来咨询的;第二种是看过我公众号上的相关案例后,想外包给我来做具体实施的;第三种有点出乎意料的是,相关的媒体来交流行业观察的。第一种类型也是最开始比较多的,最初我也是问啥答啥,但是大概聊了五六…- 4
- 0
-
知识库对决:知乎、钉钉、腾讯、谷歌,谁更懂你的资料?
AI 越来越强,但很多人只把它当聊天工具,其实它最大的潜力在知识库!今天我们就来实测知乎、钉钉、腾讯、谷歌的知识库功能,看看谁能成为你的得力助手。知识库既拉近了与 AI 的距离,又让它真正融入到我们的学习和工作中。通过知识库,我们可以为 AI 提供特定领域的专业知识,使 AI 能够针对特定问题给出更精准的回答。知识库里的内容可以是我们要学习的东西,也可以是我们长期积累的经验。专业知识 + AI 强…- 6
- 0
-
工具调用×大模型思考=超级智能体:ReAct 策略如何改变AI能力
想象一下,如果普通AI是一个只会机械执行指令的机器人,那么采用ReAct策略的智能体就像是一个会先思考后行动的侦探。 在解决问题时,它不会匆忙跳入结论的深渊,而是沿着"观察-思考-行动-观察"的螺旋阶梯,一步步接近真相。这就是ReAct(Reasoning + Acting)策略的魅力所在。 ReAct策略:智能体的"内心独白"与"外在行动&q…- 2
- 0
-
颠覆直觉:Top N 越大,RAG效果可能越差
颠覆直觉:Top N 越大,RAG效果可能越差一、RAG 系统的背景与挑战在自然语言处理(NLP)领域,大型语言模型(LLMs)如 GPT、BERT 等已经展现出了强大的文本生成、问答和摘要能力。然而,这些模型也存在一些显著的局限性。• 首先,LLMs 的知识是静态的,这意味着它们无法及时更新以反映新信息,导致生成的回答可能过时。• 其次,LLMs 有时会生成听起来合理但事实上错误的回答,这种现象…- 4
- 0
-
AI“落地”系列-RAG前置文档解析
为何需要对非结构化文档进行解析RAG(Retrieval-Augmented Generation)时,对非结构化文档进行解析是至关重要的步骤,因为有多种优势。 此图是整体的RAG流程,供参考,本文主要讲的是数据准备阶段。提高检索准确性**结构化信息提取:非结构化文档解析可以将文档中的文本、表格、图像等信息提取并转换为结构化数据。这使得RAG系统能够更准确地定位和检索相关信息。例如,将PDF文档中…- 9
- 0
-
HippoRAG 2发布,GraphRAG退位~
为解决现有检索增强生成(RAG)系统在模拟人类长期记忆的动态和关联性方面的局限性,一种新型框架HippoRAG 2提出并将开源~在三个关键维度上评估持续学习能力:事实记忆、感知构建和关联性。HippoRAG 2在所有基准类别中均超越了其他方法(RAPTOR、GraphRAG、LightRAG、HippoRAG),使其更接近真正的长期记忆系统。HippoRAG 2框架的核心思想:HippoRAG 2…- 11
- 0
-
DeepRAG:智能检索+MDP,精准秒杀事实幻觉,准确率飙升21.99%!
❝LLMs 在推理过程中存在的事实幻觉问题,尤其是在时间性、准确性和参数知识的覆盖范围方面。此外,将推理与 RAG 结合仍然具有挑战性,主要由于任务分解不有效和冗余检索,这可能会引入噪声并降低响应质量。本文提出了 DeepRAG,这是一个将检索增强型推理建模为马尔可夫决策过程(Markov Decision Process, MDP)的框架,能够实现策略性和适应性的检索。通过迭…- 7
- 0
-
直接拿大模型当搜索页(SERP)会怎样?
反其道而行 模型即搜索自检索增强生成 (RAG) 技术兴起后,利用大型语言模型 (LLM) 改进搜索已成为行业共识。从 Perplexity 到 DeepSearch 和 DeepResearch,将搜索引擎结果融入 LLM 的内容生成过程已是业内普遍做法。很多用户表示,现在已经不怎么用 Google 了,觉得传统的翻页搜索既麻烦又过时。相比之下,他们更喜欢聊天式的搜索界面,能够直接给出高精度、高…- 7
- 0
-
使用RAG技术构建企业级文档问答系统:切分(5)Late Chunking
概述Jina在2024年推出了一种新的文本切分方法,在论文Late chunking: contextual chunk embeddings using long-context embedding models中做了系统阐述。来源:https://jina.ai/news/late-chunking-in-long-context-embedding-models/对中文实现Late Chun…- 13
- 0
-
知识Agent检索:让RAG迸发智慧的五个架构跃迁点
❝作为经历过从零搭建企业级RAG系统的老兵,我深知开发者们在面对复杂问题时"知道该优化,但不知从何下手"的迷茫。本文将用最直白的语言,拆解传统RAG升级为智能Agent的必经之路。读完你会发现,那些看似高深的概念,背后都是工程实践中摸爬滚打出的智慧结晶。一、问题出在哪?从真实故障说起去年我们接了个电商客户案例:他们的客服系统用RAG处理用户咨询时,遇到这样一个问题:"…- 7
- 0
-
服务器繁忙?动手做:满血版DeepSeek R1+Agentic RAG 构建联网搜索智能体(附源码)
要说当下什么最热,DeepSeek绝对是当仁不让。凭借其强大的语言理解和生成能力,以及免费开放的策略,DeepSeek迅速吸引了大量用户,成为全球关注的焦点。然而,随着用户数量的激增,DeepSeek官网的联网搜索和深度思考功能经常出现“服务器繁忙”的提示,严重影响了用户体验。除了官方,还有办法拥有满血、可联网的 DeepSeek 吗?答案是肯定的。比如近期移动云就推出了DeepSeek系列模型的…- 7
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























