全部标签

RAG技术

【RAG】GraphRAG开源：查询聚焦摘要的图RAG方法

前言传统的 RAG 方法在处理针对整个文本语料库的全局性问题时存在不足，例如查询：“数据中的前 5 个主题是什么？”对于此类问题，是因为这类问题本质上是查询聚焦的摘要（Query-Focused Summarization, QFS）任务，而不是传统的显式检索任务。Graph RAG 通过使用 LLM 构建基于图的文本索引，从源文档构建知识图谱。通过构建知识图谱，能够将复杂的、大规模文本数据集转化…
RAG技术
- 0
- 0
charles5月4日
你想要的GraphRAG的内容都在这了

你想要的GraphRAG的内容都在这了发布时间：2024 年 04 月 24 日From Local to Global: A Graph RAG Approach to Query-Focused Summarization摘要：通过检索增强生成（RAG），大型语言模型（LLM）能够从外部知识源检索信息，从而回答涉及私有或未见文档的问题。然而，RAG 在处理全局问题（如“数据集的主要主题是什么？…
RAG技术
- 1
- 0
charles5月4日
【文档智能 & RAG】RAG增强之路：增强PDF解析并结构化技术路线方案及思路

前言现阶段，尽管大模型在生成式问答上取得了很大的成功，但由于大部分的数据都是私有数据，大模型的训练及微调成本非常高，RAG的方式逐渐成为落地应用的一种重要的选择方式。然而，如何准确的对文档进行划分chunks，成为一种挑战，在现实中，大部分的专业文档都是以 PDF 格式存储，低精度的 PDF 解析会显著影响专业知识问答的效果。因此，本文将介绍针对pdf，介绍一些pdf结构化技术链路供参考。一、可…
RAG技术
- 1
- 0
charles5月4日
TorchV的RAG实践分享(二)：基于ElasticSearch的混合检索实战&原理分析

概述在昨天员外分享的《TorchV的RAG实践分享（1）——RAG的定位、技术选型和RAG技术文章目录》一文中介绍了TorchV的由来，也分享了我们的几个基线产品和应用架构的方向，我们想的是在创业的过程中，将我们自己的一些产品理念、技术心得都通过公众号发文的方式分享出来，更多的和行业内的专家们共同交流，这对我们自己也是一种提升和锻炼，也期待和客户一起共创成长，逐步把产品打磨好。在目前大模型应用技术…
RAG技术
- 1
- 0
charles5月4日
RAG在企业应用中落地的难点与创新

1、前言在6.28/29的稀土掘金开发者大会RAG专场上，我们公司CEO员外代表TorchV分享了我们在《RAG在企业应用中落地的难点与创新》其中最后分享了两个观点：AI在应用场景落地时有三个特点：功能小、质量高、价值大如果说做产品是把一横做好的话，那么去做企业落地服务就是一竖，从需求和方案，再到 POC，和最后交付。对于AI应用的三个特点，我们在落地的时候，其实碰到的问题蛮多的，但是用过大模型或…
RAG技术
- 2
- 0
charles5月4日
RAG工程实践拦路虎之一：PDF格式解析杂谈

背景PDF（Portable Document Format）是一种广泛用于文档交换的文件格式，由Adobe Systems开发。它具有跨平台性、固定布局和易于打印等特点，因此在商业、学术和个人领域广泛应用。然而，PDF文件的解析一直是一个具有挑战性的问题，因为其内部结构的复杂性和多样性，使得提取其中的文本、图片和表格等内容并不是一件容易的事情。技术方案在目前的PDF文件解析领域中，我们可以将其大…
RAG技术
- 1
- 0
charles5月4日
创业：大模型RAG系统三个月的开发心得和思考

1. 前言自从和员外上家公司离职后，我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中，这中间有一个春节，前后的总时间大概是三个月左右，在这三个月期间，基本是昼夜兼程啊，到今天3月底结束，产品目前看是有了一个基础的雏形。在这期间，员外负责整个产品的营销、商业客户的洽谈等方面的内容，我和阿包负责整体的技术架构搭建，代码从0-1的编写，我们是在24年1月26，产品初步上线了一个版本，开始接受企…
RAG技术
- 1
- 0
charles5月4日
GraphRAG：终极 RAG 引擎 – 语义搜索、嵌入、矢量搜索等等！

解锁 GraphRAG 的力量：用于高级语义搜索、嵌入、矢量搜索等的终极 RAG 引擎！github：https://github.com/microsoft/graphragHi，这里是Aitrainee，欢迎阅读本期新文章。我刚刚发现了目前最好的完全开源的RAG系统，微软AI推出的GraphRAG。GraphRAG是一个数据管道和转换套件，利用各种大型语言模型的强大功能，从非结构化文本中提取有…
RAG技术
- 1
- 0
charles5月4日
10个AI 搜索产品: 企业搜索,网络搜索,数据库搜索,文档搜索与分析

上周把年假休了,一直就没更新文章, 这周刚好看到2024 Forbes 50AI 榜单, 根据目前我关注的 ai 方向, 专门挑了 4 个侧重 ai 信息检索的产品, 包括今年出现的 AI 更精准的检索上亿文档和 AI 在线搜索引擎这篇文章我分类的AI搜索类型,包括大模型加持下的网络搜索, 如 perplexity、秘塔搜索 ;文档知识库搜索+分析, hebbia数据database搜索+分析, …
RAG技术
- 2
- 0
charles5月3日
一文读懂 Agentic RAG 数据检索范式

Hello folks，我是 Luga，今天我们来聊一下人工智能（AI）生态领域相关的技术 - 基于代理的 RAG 实现- Agentic RAG 。众所周知，LLM （大型语言模型）的出现彻底改变了我们与信息互动的传统方式，为信息获取和知识学习带来了全新的途径。然而，…
RAG技术
- 1
- 0
charles5月3日
RAG生成任务：Base LLM竟然比Instruct LLM高出20%

检索增强生成（RAG）将检索阶段与生成阶段结合起来，后者通常由大型语言模型（LLMs）驱动，RAG中的当前常见实践是使用“指导”的LLMs，这真的是最优选择吗？对RAG系统中的“instruct”模型及其模板与基础版本（base）进行了原则性评估。这些“instruct”模型通常经过监督训练来提高遵循指令的能力，并使用最先进技术与人类偏好对齐。使用了两个任务指令来评估模型，任务指令I要求模型从未提…
RAG技术
- 3
- 0
charles5月3日
微软近日开源了新一代RAG框架GraphRAG

微软近日开源了新一代RAG框架GraphRAG[1]，以解决当前RAG在大型语料库上全局理解问题。当前RAG主要聚焦于局部检索能力，即根据查询语句在向量库中匹配部分知识，然后通过大型语言模型合成这些检索到的信息，生成一个自然流畅的回答。相信大部分同学看过《仙逆》这部小说，如果你问王林这一生有几个相好？如果让RAG来回答，它能回答出来吗？而GraphRAG通过两个阶段构建基于图的文本索引：首先从源文…
RAG技术
- 1
- 0
charles5月3日
本地定制化大模型！Llama 3 + RAG！

我们将探索如何使用Meta AI的尖端Llama 3语言模型构建一个强大的检索增强生成（RAG）应用程序。通过利用Llama 3的功能和RAG技术，我们将创建一个应用程序，允许用户与网页进行交互式对话，检索相关信息并对用户查询生成准确的响应。在本教程中，我们将深入了解设置开发环境、加载和处理网页数据、创建嵌入和矢量存储以及实现RAG链以提供卓越用户体验的分步过程。什么是Llama 3？…
RAG技术
- 4
- 0
charles5月3日
RAG 工业落地方案框架（Qanything、RAGFlow、FastGPT、智谱RAG）细节比对

所谓 RAG，简单来说，包含三件事情。第一，Indexing。即怎么更好地把知识存起来。第二，Retrieval。即怎么在大量的知识中，找到一小部分有用的，给到模型参考。第三，Generation。即怎么结合用户的提问和检索到的知识，让模型生成有用的答案。这三个步骤虽然看似简单，但在 RAG 应用从构建到落地实施的整个过程中，涉及较多复杂的工作内容（细节上是魔鬼）。架构几乎按照这个模块设计，但是各…
RAG技术
- 2
- 0
charles5月3日
支付宝+清华FoRAG：用创作的思路解决RAG生成逻辑问题！

RAG通过结合LLMs和检索器，利用搜索引擎增强了长篇问答（Long-form Question Answering）的质量。尽管存在多种开源方法和商业系统，如Bing Chat，但生成的长形答案中存在两个关键问题：事实性不足和逻辑清晰度不够。为了解决这些问题，提出了一种新颖的大纲增强生成器（outline-enhanced generator），以实现多面性答案的清晰逻辑生成，并构建了两个相应的…
RAG技术
- 1
- 0
charles5月3日
Graph RAG 在LLM 中的应用

一、背景2022 年 11 月 30 日，OpenAI 正式发布了其面向消费用户的产品——ChatGPT。ChatGPT 在对话，上下文理解，内容生成上展现了前所未有的准确性和知识表示能力，带动了市场对人工智能领域（AI）的火热。一经发布便激起了圈内、圈外的广泛讨论——毕竟已经很长时间没有一种类似的技术可以引起如此广泛的讨论，ChatGPT 的发布也标志着大语言模型（LLM: Larg…
RAG技术
- 1
- 0
charles5月3日
Self-RAG 是另外一种形式的 RAG（Retrieval Augmented Generation

Self-RAG 是另外一种形式的 RAG（Retrieval Augmented Generation），它与其他 RAG 检索策略不同，它并不是在 RAG 流程上对某个模块进行增强，而是在 RAG 不同的模块上进行优化改进，从而达到改进整体 RAG 流程的目的。如果你对 Self-RAG 比较陌生或者只是听说它的名字，那么今天请跟我一起来了解 Self-RAG 的实现原理，以及通过学习 Se…
RAG技术
- 2
- 0
charles5月3日
RAG 标准和腾讯云 ES 的技术实践

导读本文将介绍 RAG 标准和腾讯 ES 的技术实践。主要内容包括以下四大部分：1. RAG 背景及标准制定2. ES RAG 解决方案和优势3. 腾讯云 ES RAG 能力增强4. 腾讯云 ES RAG 应用实践分享嘉宾｜任翔腾讯腾讯云大数据ES产品负责人编辑整理｜张彬内容校对｜李瑶出品社区｜DataFun0…
RAG技术
- 2
- 0
charles5月3日
检索增强生成(RAG)应用中的文本分块(Chunking)策略

检索增强生成(Retrieval Augmented Generation, RAG)是大语言模型应用构建的常用技术。RAG将专有知识检索与通用文本生成相结合,根据用户输入的查询,从专门搭建的外部知识库中检索出相关信息,并将其作为附加的上下文输入到大语言模型中,从而生成更加符合特定语义场景，信息丰富、语义连贯的响应输出。这项技术显著提高了预训练大语言模型在非训练集领域对话、问答、知识抽取等任务中的…
RAG技术
- 1
- 0
charles5月3日
实用指南｜如何提升 RAG Pipeline 效果？

01.背景介绍随着RAG应用逐渐的普及，如何提高RAG应用的回答效果正在被越来越多的人关注。本文列出了各类优化RAG pipeline的方法和对应的图例说明，以帮助你快速了解目前主流的RAG优化策略。最简单的RAG流程如下图所示，首先将文档块导入到向量数据库（如Milvus, Zilliz cloud）中去，然后通过向量数据库的向量检索功能，检索出top k 个与query相关的文档块。这些rel…
RAG技术
- 2
- 0
charles5月3日
Pistis-RAG: 面向可信检索增强生成(RAG)的可扩展级联框架

1. 引言在人工智能和自然语言处理领域,大型语言模型(LLMs)的发展日新月异。然而,即使是最先进的LLMs也面临着一些固有的局限性,如知识更新滞后、领域专业知识不足等问题。为了克服这些挑战,检索增强生成(Retrieval-Augmented Generation, RAG)技术应运而生。本文将详细解读一篇名为《Pistis-RAG: A Scalable Cascading Framework…
RAG技术
- 1
- 0
charles5月3日
重磅 – 微软官宣正式在GitHub开源GraphRAG

今年早些时候，微软推出了GraphRAG: 解锁大模型RAG知识增强，并预告开源重磅-微软发表GraphRAG论文并即将开源项目，这是一种基于知识图谱的检索增强生成方法（RAG），可以实现对私有或以前未见过的数据集进行问答。昨天晚上，微软正式宣布，GraphRAG 现已在GitHub( https://github.com/microsoft/graphrag&n…
RAG技术
- 0
- 0
charles5月3日
PDF智能解析：RAG策略下的技术架构与实现

尽管大型模型在生成式问答领域已经取得了显著的成果，但因为大量数据是私有的，这些模型的训练和微调成本依旧高得惊人。因此，使用RAG（Retrieval-Augmented Generation）方法逐渐成为实现应用的一种关键途径。然而，对文档进行精确的chunk划分却是一项挑战。现实中，多数专业文档以PDF格式保存，若解析精度不高，将严重影响专业问答系统的性能。本文旨在深入探讨PDF文档的智能解析与…
RAG技术
- 1
- 0
charles5月3日
谷歌提出的LOFT工具：可能取代RAG的新技术革命

【行客按】在人工智能领域，长上下文语言模型（LCLMs）的发展正引领着一场潜在的技术革命。谷歌最近推出的LOFT（Long-Context Frontiers）基准测试，是为了评估这些模型在执行传统依赖特定工具如信息检索、问答和数据库查询等任务的能力。随着LOFT的推出，一些最先进的LCLMs在某些任务上已显示出与专门训练的系统相匹敌的性能。传统的A…
RAG技术
- 1
- 0
charles5月3日