全部标签

RAG技术

RAG | (牛津大学Nature发文的RAG超简单幻觉检测器) 使用语义熵检测大型语言模型中的幻觉

1 研究问题本文研究的核心问题是: 如何在大型语言模型(LLMs)中检测幻觉，特别是检测"胡说八道"型的幻觉。假设在医疗领域使用LLM回答问题"Sotorasib的靶点是什么?"。LLM可能有时会回答KRASG12C(正确)，有时会回答KRASG12D(错误)，尽管指令相同。这种不一致和错误的回答就是一种幻觉，需要被检测出来以确保LLM的可靠性。本文研究问题…
RAG技术
- 6
- 0
charles5月6日
更高级的 RAG 架构：提升 AI 大模型回答准确性的前沿技术

“检索增强生成” (Retrieval Augmented Generation)，简称 RAG，这一概念首次出现在 2020 年 Meta 发布的一项学术研究中。RAG 通过将大量外部数据与基础模型相结合，增强了 LLM 的能力，使 AI 的回应更加真实、个性化和可靠。可以说 RAG 是一个旨在提高 LLM 性能的框架。短短三年内，RAG 在企业领域的 LLM 应用中取得了显著的增长。本文将对 …
RAG技术
- 6
- 0
charles5月6日
首发支持！Rerank 3模型：高效企业搜索和检索的新基础模型

今天，将推出最新的基础模型 Rerank 3，该模型旨在增强企业搜索和检索增强生成 Retrieval Augmented Generation (RAG) 系统。模型与任何数据库或搜索索引兼容，也可以插入任何具有本机搜索功能的遗留应用程序中。只需一行代码，Rerank 3 就可以提高搜索性能或降低运行 RAG 应用程序的成本，而对延迟的影响可以忽略不计。Rerank 3基本介绍Rerank 3 …
RAG技术
- 5
- 0
charles5月6日
NLTK vs LLM：GraphRAG实体提取方法深度大比

书接上文《75% 成本和时间削减：优化微软 GraphRAG 索引的秘密》，我们在修复一些bug和缩减大量成本后，使得GraphRAG更易于使用。其实在缩减成本上，GraphaRAG还有一个隐藏的功能，那就是使用NLTK来提取实体。NLTK，全称Natural Language Toolkit（自然语言工具包），是一个开源的Python库，主要用于自然语言处理（NLP）的研究和开发。这篇文章主要讨…
RAG技术
- 2
- 0
charles5月6日
基于GraphRAG的SEO智能助手实战案例 – 解锁大模型和知识图谱结合的力量

摘要Unlocking The Power Of LLM And Knowledge Graph (An Introduction)，by Sylvain Peyronnet ，CEO at Babbar / yourtextguru本文介绍了如何利用LLM和知识图谱的强大功能制作AI助手，并详细解释了RAG和GraphRAG的应用。通过整合外部API，构建了名为VictorI…
RAG技术
- 5
- 0
charles5月6日
下一代 RAG 技术来了！微软正式开源 GraphRAG：大模型行业将迎来新的升级？

这标志着在提升大型语言模型能力方面迈出了重要一步，同时也为企业私有数据的分析带来了革命性的变革。 7月2日，微软宣布开源GraphRAG项目，这是一种创新的基于图的检索增强生成（RAG）系统，专为问答私有或独特数据集而设计。自其在GitHub上的发布以来，该项目迅速获得了2700个星标关注。开源链接：https:/…
RAG技术
- 7
- 0
charles5月6日
普林斯顿大学重磅 | RAG前你如何判断LLM先验知识，用马尔可夫链蒙特卡洛prompt来洞察边界

我们每天都在与大语言模型交互，试图通过精心设计的Prompt来引导它们产生期望的输出。然而，一个关键问题始终困扰着我们：这些模型在做出决策时，究竟依赖了哪些隐含的先验知识？更让我们焦躁的事情是，在RAG前究竟应该如何判断这些模型隐含先验知识的分布？这对于下一步选择RAG甚至向量数据库都将至关重要。近期，普林斯顿大学的研究人员提出了一种突破性方法，通过马尔可夫链（Markov Chain）和蒙特卡洛…
RAG技术
- 5
- 0
charles5月6日
又来一个RAG：RankRAG，英伟达RAG新思路

又来一个RAG：RankRAG，英伟达RAG新思路发布时间：2024 年 07 月 02 日RAGRankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs我们提出了一种名为 RankRAG 的创新指令微调框架，该框架使单个 LLM 能够同时进行上下文排序和答案生成，显著提升了 RAG 的性能。通过在训…
RAG技术
- 4
- 0
charles5月6日
LLM｜利用Ollama搭建个人本地知识库

最近一直想基于RAG（检索增强生成，Retrieval-Augmented Generation）和大语言模型（Large Language Model, LLM）技术搭建一套属于自己的个人知识库，以为会涉及到诸多复杂的流程，包括模型调用、界面开发等。今天找到了一点资料，发现特别简单，花了几分钟实现了一下，主要用到了三个软件：OllamaDockerAnythingLLM1 基本资料介绍大预言模型…
RAG技术
- 5
- 0
charles5月6日
将生成式AI项目投入运营：在生产环境中部署和管理RAG流水线的最佳实践

在生产环境中使用RAG：将生成式AI项目投入运营检索增强生成（Retrieval Augmented Generation, RAG）为组织提供了一个机会，可以通过应用生成式AI（Generative AI, GenAI）功能来利用大型语言模型（LLMs）处理自己的专有数据。使用RAG可以减少风险，因为我们依赖于受控数据集作为模型回答的基础，而不是依赖可能不可靠、不相关或错误的训练数据。然而，您必…
RAG技术
- 8
- 0
charles5月6日
RankRAG：通过 fine-tuning 方式来实现检索文本的排序和答案生成

之间介绍过几种LLM+RAG框架：1）self-RAG：引入特殊token来实现检索的控制；2）过滤不相关检索片段：训练一个过滤模型，实现对RAG中检索片段的噪声过滤；3）FIT-RAG：从过滤检索信息+提高检索信息+query是否需要检索判断这三个方面来优化LLLM+RAG框架；上述三种方式的存在的缺点：1）self-RAG引入特殊token，导致训练数据标注难度加大，而且在解码中增加额外的判断…
RAG技术
- 7
- 0
charles5月5日
微软最新力作Graph RAG：颠覆革新传统AI检索

摘要通过采用检索增强生成（RAG）技术，我们能够让大型语言模型（LLMs）从外部知识库中检索相关信息，从而有效回答来自私有或未曾见过的文档集合的问题。然而，当面对诸如“该数据集涵盖了哪些核心主题？”这样的全局性问题时，RAG就显得力不从心了，因为这类问题本质上是以查询为中心的摘要（QFS）任务，而非简单的检索任务。与此同时，现有的QFS方法在处理RAG系统所能索引的海量文本时，却显得捉襟见肘（算法…
RAG技术
- 6
- 0
charles5月5日
谷歌Speculative RAG：多打草稿少出错，效果优于Self-RAG、CRAG

当前RAG进展集中在通过迭代的LLMs精细化处理或通过LLMs的额外指令调整获得的自我批评能力来改善检索与生成结果。谷歌多部门（Google Cloud AI Research、Google DeepMind、Google Cloud AI）联合加利福尼亚大学圣迭戈分校提出一个新的框架Speculative RAG，它利用一个更大的通用语言模型（LM）来高效地验证由一个更小的、经过蒸馏的专家LM并…
RAG技术
- 6
- 0
charles5月5日
TaD+RAG-缓解大模型“幻觉”的组合新疗法

本文导读本文入选顶会IJCAI2024，京东技术团队联合清华大学提出缓解大模型“幻觉”新技术！ChatGPT的横空出世标志着人工智能正式进入大模型时代，大模型也正逐步成为推动企业发展的新引擎。然而，大模型带来无与伦比创造力的同时，其“幻觉”，即“胡说八道”的坏毛病也让大批应用者苦不堪言。业内主要通过检索增强生成（RAG）技术，通过引入并检索第三方知识库缓解幻觉。但即便召回正确的信息，大模型依然可能…
RAG技术
- 3
- 0
charles5月5日
一文详谈20多种RAG优化方法

大规模语言模型（LLMs）已经成为我们生活和工作的一部分，它们以惊人的多功能性和智能化改变了我们与信息的互动方式。然而，尽管它们的能力令人印象深刻，但它们并非无懈可击。这些模型可能会产生误导性的“幻觉”，依赖的信息可能过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。在现实世界的应用中，数据需要不断更新以反映最新的发展，生成的内容必须是透明可追溯的，以便控制成本并保…
RAG技术
- 4
- 0
charles5月5日
手搓KIMI的机会来了！蚂蚁首个Graph RAG 框架开源啦！

著名的检索增强生成应用kimi,估值已经达到了180亿美元。现在，你也有机会手搓一个属于自己的kimi啦！KIMI走的是检索增强生成路线，简称RAG：Retrieval Augmented Generation，它就是把信息检索与大模型结合，以缓解大模型推理“幻觉”的问题。RAG的目标是通过知识库增强内容生成的质量，通常做法是将检索出来的文档作为提示词的上下文，一并提供给大模型让其生成更可靠的答案…
RAG技术
- 7
- 0
charles5月5日
有趣的“分而治之RAG”- Speculative RAG实现策略：兼看20240713大模型技术总结回顾

今天是2024年7月14日，星期日，北京，天气雨。我们来看两个问题，一个是回顾20240713大模型进展早报，看看有哪些可以跟进的技术点。另一个是Speculative RAG框架思路，可以看看其分而治之的设计思路。供大家一起参考并思考。1、问题1:回顾20240713大模型进展早报我们先来回顾昨日大模型进展早报（社区每日例行事宜），主要涉及到RAG、GraphRAG相关以及老刘说NLP线上交流总…
RAG技术
- 4
- 0
charles5月5日
复旦大学AI团队：检索增强生成最佳实践搜索

吴一心，徐志波，石天远，王正远，李世正，齐谦，尹瑞成，吕昌泽，郑晓晴∗，黄选静。复旦大学计算机学院，中国上海上海智能信息处理重点实验室{xiaohuawang22,zhenghuawang23}@m.fudan.edu.cn {zhengxq,xjhuang}@fudan.edu.cn摘要检索增强生成（RAG）技术已被证明在整合最新信息、减轻幻觉并增强响应质量方面…
RAG技术
- 6
- 0
charles5月5日
RAG落地环节的15个控制点及优化思路：兼看KG-RAG技术总结线上分享

今天是2024年7月12日，星期五，北京，天气晴。我们来看两个问题，一个是关于知识图谱遇见RAG-基本认知、实现思路及代表工作剖析线上分享，感兴趣的可以参加。另一个是RAG落地环节的15个控制点及优化点，是一个经验工作，也可看看，尤其是在安全方面的控制。供大家一起参考并思考。问题1：关于知识图谱遇见RAG-基本认知、实现思路及代表工作剖析线上分享实际上，关于KG-RAG这块的内容，我们已经讲了很多…
RAG技术
- 5
- 0
charles5月5日
RAG |（爱立信经验总结）关于构建技术文档类RAG系统的经验总结

原文：OBSERVATIONS ON BUILDING RAG SYSTEMS FOR TECHNICAL DOCUMENTS地址：https://arxiv.org/abs/2404.00657v1代码：未知出版：ICLR 2024机构: 爱立信研发1 研究问题本文研究的核心问题是: 如何有效地构建针对技术文档的检索增强生成(RAG)系统。假设一家电信公司正在为其工程师开发一个基于RAG的智能助…
RAG技术
- 4
- 0
charles5月5日
【AI大模型应用开发】RAT原理与实现：又是一个提高大模型生成能力的方法（附完整代码）

如果你对大模型应用有一定了解，一定听说过下面的几个词儿：COT（思维链）、TOT（思维树）、RAG（检索增强生成）、LATS（Language Agent Tree Search）...大模型相关的领域真的是在高速发展，现在竟然又出现了一个RAT。本文我们来看下RAT是什么，能用来解决什么问题，以及其实现思路和原理。0. 什么是RATRAT，全称是 Retrieval Augmented Thou…
RAG技术
- 5
- 0
charles5月5日
RAG应用要如何吃到大模型长上下文的红利？-LongRAG

碎碎念去年底的时候，笔者写过，与其在RAG系统上雕花，可以重新思考一下，自己的业务场景是否非RAG不可吗？随着去年大模型的蓬勃发展，长度外推、更长的上下文模型，更厉害的中文底座大模型，都可以让整个系统的压力往生成部分上迁移。后来笔者造了一个词，文档片段化。对于常规的pdf问答档问答，基本上都能使用单一的大模型覆盖到了。但是对于知识库，文档库的问答，似乎RAG还是必不可少的。但是如果生成模型能力更强…
RAG技术
- 2
- 0
charles5月5日
一站式解决方案：Cognita框架让RAG定制化触手可及

01。CognitaCognita 是一个开源框架，专为组织 RAG 代码库而设计，并配备了一个前端界面，以便用户能够轻松尝试不同的 RAG 定制化设置。该框架提供了一种简化的代码库组织方式，使得在本地测试变得简单，同时也能够部署到生产就绪的环境中。将 RAG 系统从 Jupyter Notebook 转换为生产环境时，需要解决以下关键问题：数据分块与嵌入作业：通常需要将数据分块和嵌入代码抽象出来…
RAG技术
- 5
- 0
charles5月5日
Microsoft 的 GraphRAG实践

前言：微软正式开源GraphRAG后重磅 - 微软官宣正式在GitHub开源GraphRAG，引起了业界热烈的讨论，公众号文章一天阅读量达到一万以上，后续也分享了进一步的解析开源GraphRAG解读：微软的人工智能驱动知识发现方法和揭示微软开源的RAG策略：GraphRAG。今天摘取分享实践介绍，共同学习。我们也在医药和工业领域利用GraphRAG落地，解决通用RAG缺乏行业上下文语…
RAG技术
- 7
- 0
charles5月5日