-
RAG 实践-Ollama+AnythingLLM 搭建本地知识库
什么是 RAGRAG,即检索增强生成(Retrieval-Augmented Generation),是一种先进的自然语言处理技术架构,它旨在克服传统大型语言模型(LLMs)在处理开放域问题时的信息容量限制和时效性不足。RAG的核心机制融合了信息检索系统的精确性和语言模型的强大生成能力,为基于自然语言的任务提供了更为灵活和精准的解决方案。RAG与LLM的关系RAG不是对LLM的替代,而是对其能力的…- 10
- 0
-
Milvus × RAG助力快看漫画多业务应用
01.快看介绍快看漫画创办于2014年,集漫画阅读、创作互动、线下漫画沉浸体验、周边衍生品购买等体验于一体,是年轻人的一站式漫画生活方式平台。截止到2023年底,快看总用户超过3.8亿,在中国漫画市场渗透率超过50%。经过9年的创作者生态建设,快看已汇聚超过12万注册创作者,发表漫画作品超13000部。目前,快看漫画已有超过500部作品登陆全球近200个国家和地区,成为中国文化出海的代表。除了线上…- 5
- 0
-
详解 BGE-M3 与 Splade 模型
在之前的文章《详解如何通过稀疏向量优化信息检索》中,我们已经讨论了信息检索技术从简单的关键词匹配到复杂的情境理解的发展,并提出了稀疏 Embedding 向量可以通过“学习”获得的观点。这些巧妙的 Embedding 技术融合了稠密和稀疏向量检索方法的优点。学习型的(Learned)稀疏向量不仅解决了密集检索中常见的跨领域问题,还通过融合更多的上下文信息,增强了传统稀疏向量搜索的能力。在了解学习型…- 7
- 0
-
掌握 RAG:使用 Langchain 和 Ollama 创建本地智能应用程序
引言随着大型语言模型(LLMs)的兴起,我们见证了一种新的工具类别的诞生。然而,LLMs 也存在局限性,尤其是当面对需要最新信息或专有数据的商业用例时。本文将介绍如何通过微调和 RAG 来解决这些问题。LLMs 的局限性传统 LLMs 训练成本高昂,且只能访问公共信息。对于商业用途,需要模型能够提供基于内部知识的最新回应。文章介绍了两种解决这一问题的方法:微调和 RAG。微调微调是针对特定数据集进…- 5
- 0
-
GraphRAG 详解
一、引言以 ChatGPT 为代表的大语言模型出圈后,企业级 LLM 的应用也越来越热,这其中一大部分应用都使用了 RAG 技术。关于 RAG 技术的介绍,可以参考之前的这篇文章:《高级 RAG 技术——图解概览》。传统 RAG 技术在某些场景下,可能存在以下几个问题,即使使用高级 RAG 方法通常也较难克服。1. 效率问题:基于向量的搜索方法采用数学方法,如聚类,树形结构或 HNSW 等近似最近…- 10
- 0
-
RAPTOR 检索树再次进一步提升RAG性能的设计思路
大多数现有方法仅从检索语料库中检索短的连续块,限制了对整个文档上下文的整体理解。RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval)引入了一种新方法,即递归嵌入、聚类和总结文本块,从下往上构建具有不同总结级别的树。在推理时,RAPTOR 模型从这棵树中检索,整合不同抽象级别的长文档中的信息。RAPTOR(Recu…- 3
- 0
-
为什么你的RAG不起作用?如何解决语义失谐
本文分享Meduim深度好文《Why Your RAG Doesn’t Work[1]》,本文主要探讨了检索增强生成(RAG)系统在实际应用中存在的问题,以及如何通过解决语义失谐等问题,提高RAG的性能,使其更接近生产环境。以下为翻译全文,这篇文章中依然透露出一个观点,即嵌入是否与你的领域匹配的问题,与上篇《为何RAG应用在生产中难以成功?》分享的一致。无数企业正在尝试使用检索增强生成 (RAG)…- 3
- 0
-
RAG优化: 非结构化文档解析方案汇总
一、背景RAG(Retrieval-Augmented Generation)是一种先进的人工智能技术,由Facebook AI Research(FAIR)团队在2020年提出。它结合了检索(Retrieval)和生成(Generation)两个步骤,通过从大量数据中检索相关信息来辅助语言模型生成更准确、更丰富的文本。RAG技术的优势在于:- 能够利用外部知识库,提供更准确、深入的回答。- 实现…- 3
- 0
-
【查漏补缺】10个关于RAG的冷知识,你知道几个?
1. 什么是RAG(retrieval-augmented-generation)技术?RAG(Retrieval-Augmented Generation)技术是一种结合信息检索和生成模型的混合方法,旨在提高文本生成任务的质量和准确性。具体来说,RAG将检索(Retrieval)和生成(Generation)两个步骤融合在一起:检索阶段(Retrieval Stage):在生成文本之前,系统首先…- 4
- 0
-
自定义 RAG 工作流:在 IDE 中结合 RAG 编排,构建可信的编码智能体
构建编码智能体并非一件容易的事。结合我们在 AutoDev、ArchGuard Co-mate、ChocoBuilder 等智能体项目的经验,我们开始思考在 Shire 语言中提供一种新的 RAG 工作流。结合我们先前构建的 IDE 基础设施(代码生成、代码校验、代码执行等接口),现在你可以构建出更可信的编码智能体。TL;DR(太长不看)版现在,你可以使用 Shire + 自定义的 RAG 流程智…- 7
- 0
-
提升AI编程助手上下文理解能力:集成RAG与SEM-RAG技术
基本的 AI 编程助手虽然很有帮助,但由于它们依赖于对软件语言的一般理解和编写软件的最常见模式,因此通常无法提供最相关和上下文准确的代码建议。这些编程助手生成的代码适合解决他们所承担的问题,但通常与单个团队的编码标准、约定和风格不一致。这通常会导致需要修改或优化其建议,以便代码被应用程序接受。AI 编程助手通常依靠特定大型语言模型 (LLM) 中包含的知识,并在各种场景中应用通用编码原则来发挥作用…- 5
- 0
-
为何RAG应用在生产中难以成功?
RAG常常陷入一周出Demo、半年用不好的窘境。本文分享Meduim深度好文《Why RAG Applications Fail in Production[1]》探讨RAG应用程序常见的陷阱和成功部署的见解,以下为翻译全文。检索增强生成 (RAG) 应用程序已成为大型语言模型 (LLM) 领域的强大工具,通过集成外部知识增强了其功能。尽管 RAG 应用程序前景光明,但在从原型过渡到生产环境时,它…- 4
- 0
-
GraphRAG新增文件会重新索引所有文件吗?探究缓存何时生效
GraphRAG索引消耗Token巨大,所以你可能会问?新增文件后,我之前的文件会不会重新索引一次啊?什么情况下会利用缓存呢?本文带你一探究竟。GraphRAG默认使用文件缓存,配置如下。当然你也可以考虑使用Azure云端的缓存。cache: type: file # or blob base_dir: …- 8
- 0
-
GraphRAG 为什么能增强生成式 AI ?一篇文章告诉你
检索增强生成(RAG)支持大型语言模型(LLMs)使用外部知识源回答问题。这个功能相信只要你用过一些 AI 工具可能都用到过。尽管如此,它在回答涉及整个文本语料库的全局问题时,例如识别主要主题、总结全文内容,仍存在一些挑战。这是因为这类问题往往要求模型具备对整体语料库内容的深度理解和全局视角,而不仅仅是依赖于局部检索到的信息。因此,在处理这类问题时,RAG 框架下的 LLMs 可能还需要额外的帮助…- 3
- 0
-
项目解析:GraphRAG是RAG的下一场
GraphRAG:如何将传统的文档检索转变为智能知识图谱分析的下一代工具©作者|Blaze来源|神州问学引言随着技术的不断进步,信息检索和生成模型的结合已经成为提升模型性能的关键方法。RAG(Retrieval-Augmented Generation)作为这一领域的先驱,通过将检索和生成相结合,大大提高了模型的回答准确性和相关性。然而,RAG并不是故事的终点,而是一个全新的起点。今年4月份,微软…- 8
- 0
-
手把手教程,改造 GraphRAG 支持自定义 LLM
导语:最近 GraphRAG 在社区很火,作者亲自体验后,发现了一些可以探讨和改进的地方,本文主要介绍了如何改造 GraphRAG 以支持自定义的 LLM。01为什么在 RAG 中引入知识图谱?传统的 RAG 在处理复杂问题时往往表现不理想,主要是传统 RAG 未能有效捕捉实体间的复杂关系和层次结构,且通常只检索固定数量的最相关文本块:缺少事情之间关系的理解:当需要关联不同信息以提供综合见解时,传…- 12
- 0
-
Exa.ai:人工智能搜索引擎
01。Exa使用基于嵌入的搜索技术,Exa能够精确地在网络中找到您所需的内容。Exa通过API端点提供三项核心功能:1. 网页搜索:使用自然语言查询在网络上查找任何网页。如果您需要,Exa还支持类似谷歌的关键词搜索。2. 页面内容获取:从Exa搜索结果中获取干净、最新、解析过的HTML内容。可以使用我们的“高亮显示”功能进行语义定位。3. 查找相似页面:基于一个链接,查找并返回在意义上相似的页面。…- 5
- 0
-
Mem0:增强LLM的记忆功能,实现跨应用的个性化AI体验
Mem0作为一项创新的技术解决方案,为AI应用程序的内存管理带来了革命性的变革。通过提供智能、自我改进的内存层,Mem0让AI能够在跨越多个交互和会话的过程中保持上下文,并实现高度个性化的互动体验。这种新兴的能力对于打造真正个性化的AI应用至关重要,它不仅有助于提高用户体验,还能适应用户的动态需求。Mem0的核心功能Mem0主要提供了以下核心功能:用户、会话和AI代理内存:通过在不同用户、会话和A…- 23
- 0
-
从RAG到ReST:揭秘AI语言模型的进化之路,颠覆你的知识观!
在人工智能的迅猛发展浪潮中,语言模型的进化从未停歇。随着技术的不断突破,RAG(检索增强生成)技术以其独特的优势,正引领着一场关于知识获取和生成内容的革命。随着ReST(检索到序列转换)技术的崛起,一个新的竞争者进入了人们的视野。这不仅是技术的较量,更是对未来智能对话系统发展方向的探索。在这个充满变革的时代,我们不禁要问:RAG和ReST,这两种先进技术将如何塑造大型语言模型的未来?它们在提升模型…- 8
- 0
-
Daily Papers | RAG-Fusion:检索增强生成的新视角
GEO AIDaily Papers论文标题:RAG-Fusion: a New Take on Retrieval-Augmented Generation [2024.02.21]《RAG-Fusion:检索增强生成的新视角》论文创新点:• 提出了RAG-Fusion方法,结合了检索增强生成(RAG)和互补排名融合(RRF)。• 生成多个查询,通过互补分数重新排序并融合文档…- 8
- 0
-
[重磅]图数据库厂商Neo4j CTO详解GraphRAG:为生成式人工智能增添知识
我们正在进入RAG的“Blue Link”时代我们正处于意识到这样一个阶段:为了真正有效地利用GenAI,你不能仅仅依赖自回归LLM来做出决策。我知道你在想什么:"RAG就是答案"。或者微调,或者GPT-5。是的。像基于向量的RAG和微调这样的技术可以帮助。它们在某些用例中足够好。但是在另一整类用例中,这些技术都会遇到瓶颈。基于向量的RAG - 就像微调一样 - 增加了对许多种…- 6
- 0
-
RAG 企业级应用落地框架细节差异对比
—1—什么是 RAG ?RAG 检索增强生成本质上来讲,就三件事情:第一、Indexing 索引。即如何更有效地存储知识。第二、Retrieval 检索。即在庞大的知识库中,如何筛选出少量的有益知识,供大模型参考。第三、Generation 生成。即如何将用户的提问与检索到的知识相结合,使得大模型能够生成有价值的回答。这三个步骤表面上看似乎并不复杂,然而在 RAG 从构建到实际部署的整个流程中,包…- 3
- 0
-
15K star!超越RAG,让大模型拥有个性化记忆
通过RAG来增强LLM已经是目前很多的首选,但是最近有一个新的开源项目让大家看到了更好的选择的可能。今天我们分享一个开源项目,它号称是RAG的下一代技术,让大模型可以拥有个性化的记忆,它就是:mem0mem0 是什么Mem0,前身为 EmbedChain, 是一款由 YC 孵化的开源技术,致力于为 AI 代理提供长期记忆能力。Mem0 旨在为大型语言模型 (LLM) 和 AI…- 5
- 0
-
聊聊文档解析测评工具中表格指标
文档解析测评工具中表格指标的意义关注TechLead,复旦AI博士,分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,上亿营收AI产品研发负责人。TextIn发布了文档解析测评工具,https://github.com/intsig/markdown_tester ,定量测评文档解析还原的效果。本文来解析…- 8
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!























![[重磅]图数据库厂商Neo4j CTO详解GraphRAG:为生成式人工智能增添知识](https://s3.ap-east-1.amazonaws.com/zhishi.iyunxuan.com/wp-content/uploads/2025/05/20005106/20250519_682b611d71772.png)

