全部标签

RAG技术

GraphRAG效果太差？快用自动Prompt Tuning并结合手动微调大幅提升效果！

在之前，我分享了几篇关于GraphRAG的科普和实践文章，得到了群友们的良好反馈。但是最近我注意到越来越多的群友提出GraphRAG在实体和关系提取上并不尽如人意，影响了问答效果。针对这个情况，我首先问的是：你们是否进行了prompt tuning操作？很遗憾，许多回答是没做，有些人甚至把prompt tuning和模型的finetune混淆了。因此，我计划写一篇专门介绍GraphRAG prom…
RAG技术
- 14
- 0
charles25年4月14日
RAG 应用效果不太理想？试试以下RAG优化策略大幅提升问答效果

自从2022年12月 ChatGPT 横空面世以来，AI 领域获得了十足的关注和资本，其实AI的概念在早些年也火过一波，本轮 AI 热潮相比于之前的 AI，最大的区别在于：生成式。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。GPT、LLaMA、Mistral、BERT等都是LLM，LLM是对训练文本信息的压缩，同时拥有了泛化能力，不同于数据库和搜索引擎…
RAG技术
- 7
- 0
charles25年4月13日
AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。一、前言什么是 AI Agent随着大模型技术的快速发展，越来越多的公司在实际业务中落地了大模型应用。但是人们逐渐发现了大模型能力的不足。例如：由于大模型的训练数据是有限的，因此一些垂直领域的知识，如金融，医疗等等，大模型无法回答，或者容易出现幻觉。并且随着业务的复杂度提高，如何能让大模…
RAG技术
- 2
- 0
charles25年4月13日
从GraphRAG最新论文综述探究如何改进微软 GraphRAG

最近北大、浙大等高校和蚂蚁集团等机构发布了一篇 GraphRAG 综述论文《Graph Retrieval-Augmented Generation: A Survey[1]》。本文首先对论文进行简单介绍，然后对论文中 GraphRAG 提到的三个阶段进行分别介绍，探索当前业界都在尝试哪些方法优化 GraphRAG，以及有哪些较为流行的GraphRAG框架。我也会穿插讲解微软 GraphRAG 中…
RAG技术
- 6
- 0
charles25年4月13日
RAG检索：最新研究成果，内存MemLong增强检索

在这篇文章中，作者介绍了 MemLong：用于长文本生成的记忆增强检索（MemLong），一种旨在通过利用外部检索器进行历史信息检索来增强长上下文语言建模能力的方法。大型语言模型(LLMs)近年来在各个领域取得了显著成功，但在处理长文本方面仍面临着严峻挑战。这些挑战主要源于两个方面：注意力机制的计算复杂度和生成过程中的内存消耗。传统的注意力机制具有二次时间和空间复杂度，可表示为：O(n^2)，其…
RAG技术
- 6
- 0
charles25年4月13日
15种先进的检索增强生成（RAG）技术

01。概述在人工智能领域，从原型到生产的旅程充满挑战。虽然构建大型语言模型（LLM）、小型语言模型（SLM）或多模态应用的过程充满了兴奋，但要将这些原型转化为可扩展、可靠且生产就绪的解决方案，需要对其复杂性有深入理解。这个过程不仅仅涉及硬件扩展或算法优化，更是对数据、模型架构和实际应用需求之间关系的深度探讨。02。RAG技术在本文中，我们将深入探讨15种先进的检索增强生成（…
RAG技术
- 7
- 0
charles25年4月13日
重磅惊雷，用结构化RAG约束JSON响应格式化，复合AI系统输出成功率高达82.55%

近期，很多朋友在用Dify、Coze、元器等Workflow时能明确感受到：最先进的人工智能结果越来越多地通过具有多个组件的复合AI系统才能获得，而不仅仅是单一模型。但这些组件通常需要特定的输出格式才能被解析并发送到下一个组件或流程当中。然而，如何让这些模型能够可靠地生成结构化输出，如JSON格式的数据，一直是一个挑战。在这个关键时刻，由向量数据库巨头Weaviate团队主导的Structured…
RAG技术
- 7
- 0
charles25年4月13日
Kotaemon：本地 Graph RAG UI，用Graph RAG 和 Hybrid RAG与文档畅聊（支持Ollama）

今年夏天，我们首先迎来了Graph RAG的发布，这是一个用于高级搜索和嵌入的终极RAG引擎。Graph RAG是一个数据管道和转换套件，旨在利用LLM的强大功能从非结构化文本中提取有意义的结构化数据。?接着，我们迎来了目前最好的RAG引擎——Hybrid RAG，它能够简单地结合知识图谱和向量检索。HybridRAG：混合 RAG 引擎 - 知识图谱 + 向量检索！比 GraphRAG 更好！这…
RAG技术
- 4
- 0
charles25年4月13日
智能 AI 应用为什么需要知识库

智能 AI 应用为什么需要知识库上回我们讲到如何在 Dify 上搭建企业知识库，并引入大语言模型应用中，实现企业内部知识助手。使用 Dify 快速搭建企业内部知识助手。其中提到的企业知识库，正是 "检索增强生成(Retrieval-Augmented Generation)" 技术的一种具体实现方式。在深入探讨 RAG 之前，我们先来了解一下大型…
RAG技术
- 5
- 0
charles25年4月13日
搭建大模型知识库流程，以及基于langchain实现大模型知识库案例

“ RAG检索增强生成是为了解决大模型知识不足的问题 ”大模型主要面临三个问题：垂直领域内的知识不足‍‍‍‍‍大模型知识有时间限制‍大模型幻觉问题第一个问题产生的原因是因为，没有经过垂直领域数据训练的大模型普遍表现不好；其次是目前的大模型采用的是预训练模式，也就是说需要先收集训练数据进行训练，但只能收集之前的数据，不能收集当前和以后的数据；最后就是大模型幻觉问题，幻觉问题产生的…
RAG技术
- 6
- 0
charles25年4月13日
GraphRAG与传统RAG怎么选？二者的融合方案是什么

最近工作比较忙，一直在重构公司现有的RAG推荐系统。在给GraphRAG提交了几个PR并成功合并后，暂时没有继续对GraphRAG做出更多贡献。然而，最近同事和粉丝纷纷私信我，他们最常问的问题有："什么时候应该使用GraphRAG？"，"在哪些场景下应该使用传统的RAG"以及"我们目前在公司使用的是传统RAG，那要如何与GraphRAG相结合呢？&…
RAG技术
- 4
- 0
charles25年4月13日
基本RAG vs 高级RAG

当前，大型语言模型（LLMs）已经改变了我们对生成文本的理解。这些模型实在厉害，可以像人类一样写出文本、创造新内容，还能给出聪明的回答，这让人工智能的发展更进一步。不过，尽管这些模型接受了很多数据的训练，它们只能知道这些数据中的信息，这就让它们很难提供最新的内容。这样，模型可能会给出过时的答案或错误的信息，这种现象叫做信息幻觉。为了改进这个问题，出现了一种叫做“检索增强生成”（RAG）的新方法，它…
RAG技术
- 4
- 0
charles25年4月13日
使用 Milvus Lite、Llama3 和 LlamaIndex 搭建 RAG 应用

大语言模型（LLM）已经展示出与人类交互并生成文本响应的卓越能力。这些模型可以执行各种自然语言任务，如翻译、概括、代码生成和信息检索等。为完成这些任务，LLM 需要基于海量数据进行预训练。在这个过程中，LLM 基于给定的词，预测句子中的下一个词来学习自然语言。这种方法被称为标记预测，帮助 LLM 生成连贯且富含上下文的响应。然而，由于模型更专注于预测最可能的下一个词而非验证事实，因此其输出有时可能…
RAG技术
- 3
- 0
charles25年4月13日
RAG高级优化：基于问题生成的文档检索增强

我们将在本文中介绍一种文本增强技术，该技术利用额外的问题生成来改进矢量数据库中的文档检索。通过生成和合并与每个文本片段相关的问题，增强系统标准检索过程，从而增加了找到相关文档的可能性，这些文档可以用作生成式问答的上下文。实现步骤通过用相关问题丰富文本片段，我们的目标是显著提高识别文档中包含用户查询答案的最相关部分的准确性。具体的方案实现一般包含以下步骤：文档解析和文本分块:处理PDF文档并将其划分…
RAG技术
- 9
- 0
charles25年4月13日
RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow等

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐1.MaxKBMaxKB = Max Knowledge Base，是一款基于 LLM 大语言模型的开源知识库问答系统，旨在成为企业的最强大脑。它能够帮助企业高效地管理知识，并提供智能问答功能。想象一下，你有一个虚拟助手，可以回答各种关于公司内部…
RAG技术
- 8
- 0
charles25年4月13日
你的工作流程被 AI 颠覆了吗？

导语：对 AI 的态度，就是不主动使用 AI，不主动学习提示词工程；各大厂商推广 AI 的时候，不拒绝听一听，也不拒绝用一用；对于使用 AI 生成的结果不负责，结果不好都是 AI 的问题，跟我无关。你是不是也这么想的？那么你的工作流程现在被 AI 颠覆了吗？在将于 2024 年 10 月 18-19 日举办的 QCon 全球软件开发大会（上海站），我们设置了【AI 重塑技术工作流程】这一专题，旨在…
RAG技术
- 7
- 0
charles25年4月13日
【一文读懂】RAG的重要组成-Embedding Model

根据我的观察，在各个热门的RAG引擎（如AnythinRAG，RAGFlow，Dify）中，都包含了Embedding Model（嵌入模型），那嵌入模型这个强大的工具，在RAG引擎中究竟起到什么作用呢？本篇我将会通过通俗易懂的方式，为各位同学揭开它的神秘面纱。01什么是Embedding在学习嵌入模型之前，首先要搞明白什么是Embedding ？Embedding 是将离散的非结构化数据转换为连…
RAG技术
- 6
- 0
charles25年4月13日
RAG 升级版-MemLong: 基于记忆增强检索的长文本建模方法

1. 研究背景与问题大型语言模型(LLMs)近年来在各个领域取得了显著成功，但在处理长文本方面仍面临着严峻挑战。这些挑战主要源于两个方面：注意力机制的计算复杂度和生成过程中的内存消耗。传统的注意力机制具有二次时间和空间复杂度，可表示为：O(n^2)，其中n为序列长度。这导致在处理长序列时计算资源需求呈平方增长。同时，在生成过程中，模型需要缓存key-value对，其内存占用随序列长度线性增长。为了…
RAG技术
- 11
- 0
charles25年4月13日
揭秘AI领域中的RAG：软件测试人员的必备指南

引言在人工智能（AI）和机器学习（ML）系统日益成为现代软件开发中不可或缺的一部分时，确保这些系统的质量和可靠性变得尤为重要。RAG，即“Reference and Augmentation of Ground-truth”，虽然不是一个广泛使用的术语，但其概念对于理解如何评估和测试AI系统至关重要。本文将深入探讨RAG的概念，以及软件测试人员为何需要了解它，并通过具体案例来阐述其重要性。RAG概…
RAG技术
- 7
- 0
charles25年4月13日
AI安全黑科技”短路技术”问世，让有害输出自动失效

最近有研究团队搞出了一个叫"短路"（Short Circuiting）的新技术，能让AI系统更安全、更强悍，还能抵御那些企图让AI说坏话的"坏蛋攻击"。这个技术可不是简单地告诉AI"不许说坏话哦"，而是直接掐断AI内部那些可能导致有害输出的神经通路。想象一下，就好比AI脑子里有条线路专门用来说脏话，这个技术直接把这条线路给剪断了，让AI想…
RAG技术
- 6
- 0
charles25年4月13日
LLM对于行业术语出现幻觉怎么解？快来试试Golden Retriever 指代消歧

今天来分享一篇深度好文：《Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base》，我们知道企业落地RAG系统有以下常见痛点：技术公司维护着大量的专有文档，如培训材料、设计文档和研究成果。工程师，尤其是新员工，需要快速查询这些文档或吸收其中的新知识。这些…
RAG技术
- 8
- 0
charles25年4月13日
RAG 详解-数据预处理

引言在最近一些 B 端、G 端的大模型项目中，大家都把 RAG 作为了应用大模型的起点。本篇文章旨在从 RAG 实施流程的中的数据预处理出发，介绍 RAG 数据预处理过程中，尤其是文档分割这一环节的一些细节。一、数据采集（Data Ingestion）数据采集是 RAG 系统的基础工作。在具体实施过程中，可初步划分为“数据源识别”、“数据治理”、“数据清洗”三个步骤。1. 数据源识别包括内部、外部…
RAG技术
- 6
- 0
charles25年4月13日
RAG 进阶：零成本 chat_with_readthedocs

Readthedocs 是知名的文档托管平台，通常用于免费存放 GitHub 和 GitLab 的项目文档。当项目文档较多时，简单的搜索难以满足读者需求，此外在 AI 2.0 时代，“主动寻找答案”这类用户体验已经逐渐落后。本文将介绍如何基于 HuixiangDou 在 readthedocs 中做源码检索，同时不需要自备 GPU 服务器和域名。HuixiangDou，开源的适合群聊场景的 LLM…
RAG技术
- 4
- 0
charles25年4月13日
使用 MyScale 和 Dify 构建 RAG 聊天机器人

在当今快节奏的 AI 时代，各种规模的企业都在积极探索将大型语言模型 (LLM) 融入日常运营。LLM 无论是在提升客户服务、自动化例行任务，还是打造个性化体验方面，都潜力巨大，带来显著效益。然而，LLM 应用从概念到落地的过程往往困难重重，尤其是对缺乏深厚技术背景的用户而言，传统方法需要大量的编程知识，这成了许多人难以逾越的障碍。Dify 应运而生，它是一个开发者友好的平台，致力于简化 LLM …
RAG技术
- 6
- 0
charles25年4月13日