全部标签

RAG技术

QAnything 1.4.1 中的文档解析

2024年初我们开源了QAnything，一个基于检索增强生成式应用（RAG）的本地知识库问答系统。对于本地知识库，QAnything支持多种格式的文档输入，允许用户上传包括PDF、图片、Word、PowerPoint、Excel、TXT，甚至音频等多种格式的数据。用户可以针对知识库进行互动问答，所有答案均能精准溯源，帮助用户确认问答的准确性。四个月时间中，QAnything于Github的开源项…
RAG技术
- 1
- 0
charles4月29日
DB-GPT X TuGraph 会带来怎样的新惊喜？蚂蚁首个开源 Graph RAG 框架设计全解读

摘要：在 DB-GPT v0.5.6版本中，已经支持 Graph RAG 框架, 实现TuGraph上的知识图谱构建与检索。本文将带大家系统了解Graph RAG的关键实现细节，一睹为快吧～检索增强生成（RAG：Retrieval Augmented Generation）技术旨在把信息检索与大模型结合，以缓解大模型推理“幻觉”的问题。近来关于RAG的研究如火…
RAG技术
- 0
- 0
charles4月29日
一文把 RAG 每步的技术难点说明白

大模型效果让人惊艳，但是还是存在知识更新不及时，容易幻觉，没有内部知识的原因，所以带火了 RAG 技术。根据现在调查，目前超过 80% 的落地应用基本都是 RAG，这个主要还是这块比较成熟，像大家期待的 Agent 技术还在发展中，没有特别成功的范例。RAG 是检索增强生成（Retrieval-augmented Generation）。利用向量相似度检索技术搜索文档，然后组合成 prompt 喂…
RAG技术
- 1
- 0
charles4月29日
【大比武08】利用RAG技术构建档案智能问答系统

# 大比武2024本篇是参加“华夏伟业”杯第二届档案信息化公司业务与技术实力大比武（简称“大比武 2024”）的投稿文章，来自燕山大学档案馆（校史馆）的实际项目，由河北科怡科技开发有限公司联合南京兰征信息科技有限公司与燕山大学共同研究实施。除了河北科怡的宁飞之外，燕山大学档案馆的柯铁军对本文也有重要贡献。在数字化时代背景下，随着ChatGPT的出现，档案管理正经历着一场由数字化到能化的革命。RAG…
RAG技术
- 2
- 0
charles4月29日
摆弄AI agent后的一些思考（一）

最近上手体验了很多智能体，觉得AI还是有使用门槛，对使用者的某些知识素养、表达能力都有要求。AI目前可以替代一定的技能和操作，但是不能补充使用者的知识和经验。所以，该学习还是要学习，该练习也还是得练习。要不然AI做错了你也不知道，做不出来你还不知道怎么骂他。而且大部分人都是从商业角度看大模型，觉得遍地都是商机，如果从用户角度看，很多机会就不成立了。举个?，用LLM做线上问诊，看似提升患…
RAG技术
- 3
- 0
charles4月29日
RAG | (支付宝+清华KDD24论文)FoRAG: 基于大语言模型的网络增强型长篇问答系统

大家好！今天我分享的文章是来自蚂蚁和清华的最新工作，文章所属领域是自然语言处理和信息检索，作者针对网络增强型长篇问答系统中存在的事实性和逻辑性问题，提出了一种名为FoRAG的新方法，通过大纲增强生成和多粒度事实性优化来提高回答质量。研究问题和思路具有一定的借鉴意义。原文：FoRAG: Factuality-optimized Retrieval Augmented Generation for W…
RAG技术
- 3
- 0
charles4月29日
如何构建“agent;类人的认知模型？

深度agent解析< 第三篇 >Creating a new species of intelligence is the greatest mission of our generation（上期回顾）这篇文章是“深度agent解析”系列的第三篇。我们探讨如何通过“感知流”结构再现人类认知思维的一般模式。传统的RAG通过向量化外界知识库创造检索，在对话中通过向量检索创造…
RAG技术
- 1
- 0
charles4月29日
探索Graph RAG：知识图谱与大语言模型的智能融合！

01。概述自然语言与知识图谱的交互已成为热门话题，备受瞩目。而且这一趋势将持续存在，并深刻改变我们所熟悉的计算机系统交互方式。而这一变革的起点，便是自然语言查询（NLQ），如今，人们纷纷渴望利用自己的数据提出自然语言问题。在企业中，直接运用现成的大型语言模型（LLM）聊天机器人进行问题解答往往收效甚微，因为它们缺乏针对特定领域和组织活动的专有知识，而这些知识恰恰能够为对话式信息提取接口带来真正的价…
RAG技术
- 1
- 0
charles4月29日
大模型“补丁”合规：提示工程、微调和RAG

‍在大模型系统中，提示工程（Prompt Engineering）、微调（Fine-tuning）和检索增强生成（Retrieval Augmented Generation，RAG）分别扮演了不同但互补的角色，共同组成了大模型产品的三叉戟补丁升级路径。虽然他们在大模型开发和运营的地位非常重要，但在数据及人工智能法律合规领域，似乎鲜有人深入讨论。当我们深入研究这些不同技术背后的运行原理后，才有机会…
RAG技术
- 1
- 0
charles4月29日
高级RAG：纠正检索增强生成（CRAG）与LangGraph

CRAG通过引入检索评估器来评估检索到的文档与查询之间的关系，从而增强了传统的RAG。那么，让我们了解它的工作原理。我会给你一个小型场景，假设我们正在参加一个开卷考试。我们遵循的策略，比如说对于每个主题，我们查阅书籍并确定相关部分。在形成观点之前，将收集到的信息分为三组：正确，错误和模糊。分别处理每种类型的信息。然后，根据这些处理过的信息，进行编译和总结。在考试试卷上写下我们的答复。这就是CRAG…
RAG技术
- 1
- 0
charles4月29日
Jina AI + Milvus Lite：搭建 RAG 问答机器人

开发人员特别重视那些易于设置、启动迅速且能在生产环境中无缝扩展的基础组件。针对这一需求，我们推出了最新的轻量级向量数据库产品——Milvus Lite。对于 Python 开发者而言，Milvus Lite 是一个极具价值的工具，尤其适用于追求高质量、易用性的搜索应用。本文将介绍如何使用 Milvus Lite、Jina Embeddings v2 和 Jina Reranker v1 搭建检索增…
RAG技术
- 1
- 0
charles4月29日
RAG未来的出路

总有人喊RAG已死，至少看目前不现实。持这个观点的人，大多是Long context派，老实说，这派人绝大多数不甚理解长上下文的技术实现点，就觉得反正context越长，越牛B，有点饭圈化，当然我并不否认长上下文对提升理解力的一些帮助，就是没大家想的那么牛B而已（说个数据，达到128K以上的语料数据，不到百分之5。尤…
RAG技术
- 2
- 0
charles4月29日
一文读懂为什么需要 Agentic RAG ？

Hello folks，我是 Luga，今天我们来聊一下人工智能（AI）生态领域相关的技术 - 基于代理的 RAG 实现- Agentic RAG 。众所周知，LLM （大型语言模型）的出现彻底改变了我们与信息互动的传统方式，为信息获取和知识学习带来了全新的途径。然而，…
RAG技术
- 2
- 0
charles4月29日
Docs2KG：基于大模型的非结构化异构文档统一知识图谱自动构建

目前市场上的一些工具专注于检索增强生成 (RAG) 流程或如何让大型语言模型 (LLM) 在本地运行。更广泛的社区包括个人用户、小型企业，甚至大型企业。其中一些人可能已经开发了知识库，这些数据都是非结构化的，并且分布在不同的地方。通过结合PDF文件和Excel文件，演示查询“显示所有与2011年和2021年发生的事件相关的文档及其组成部分。” PDF文件包含2011年至2021年香港的人口规模和结…
RAG技术
- 0
- 0
charles4月29日
解码RAG：智谱 RAG 技术的探索与实践

作者 | 柴思远智谱 AI 长期专注于大模型技术的研究，从 23 年开始，大模型受到了各行各业的关注，智谱 AI 也深度的参与到各种场景的大模型应用的建设当中，积累了丰富的模型落地应用的实战经验，其中 RAG 类应用占据了较大的比重。所谓 RAG，简单来说，包含三件事情。第一，Indexing。即怎么更好地把知识存起来。第二，Retrieval。即怎么在大量的知识中，找到一小部分有用的，给到模型参…
RAG技术
- 0
- 0
charles4月29日
【11/100个AI应用体验】国内团队开源的知识库项目QAnything（基于本地Ollama）

“AI 模型，最终目标只有一个，就是模仿人类的思维”——by Ruanyf](github一名贡献者)┃任务说明Ollama作为个人电脑上的大模型应用，已经成为我在mac笔记本电脑和windows pc上体验开源LLM大模型的首选服务，上一篇基于第三方插件把Ollama服务集成到了开源笔记软件Obsidian中，实现了笔记内的LLM问答。但RAG在Macbook中应用时性能开销始终比较大，同时我又…
RAG技术
- 1
- 0
charles4月29日
我做了一个Agent和RAG结合的机器人控制系统：这会是机器人控制的新思路么

人工智能在数字领域的辉煌成就已是众所周知，而现在，各大科技巨头正将焦点转向机器人技术的实体世界应用。Google的PaLM项目和特斯拉的Optimus机器人便是其中的佼佼者。01—基于Agent的机械臂控制去年末，我创建了一个集成了智能代理Agent的机械臂演示程序（详情见《当AI进入物理世界：让你用嘴而不是用程序操作机械臂》），并将这段简单的演示视频分享到了B站。它的火速流行超出了我的预期——那…
RAG技术
- 2
- 0
charles4月29日
长上下文窗口干不掉RAG，正如内存没有干掉硬盘

“ 在短期内，人们往往会高估技术的影响力，而在长期内，人们往往会低估它的影响力。-- 比尔·盖茨”01—比比谁更长：上下文窗口的竞赛Google推出能够处理高达一百万Token上下文的Gemini 1.5 Pro，我们似乎站在了一个技术的新纪元门槛上。想象一下，整本书籍、小时长的视频资料，都可以直接输入这样的系统，迎来即时、精准的答案。回顾这一进展的关键时刻：GPT-3和Llama2以4…
RAG技术
- 0
- 0
charles4月29日
从Function Call到零样本分类：意图识别阶段性总结

为什么需要进行意图识别RAG 的召回、生成过程逻辑是不够灵活的，无法解决用户的所有问题。在实际过程中，RAG 更适合作为一个子流程。即业务中往往需要首先识别用户 query 中的意图，再进入不同的分支流程进行响应（如图：semantic routing[1]）。这样总的 RAG 应用程序就是更具鲁棒性了。意图识别也称作路由，可能作用于以下场景：路由，如可能进行RAG，也可能进行Text2SQL，也…
RAG技术
- 1
- 0
charles4月29日
运行 Dashboard

文章内容主要有：• RAG 流程回顾，• 语句窗口检索（SWR）的概念，• SWR 详细实现，• 如何优化和评估 SWR基础RAG概念回顾一下基础的 RAG 架构，这个架构下对于较小的内容块效果比较好。刚刚提到，由于RAG对于较小块效果比较好，第一步还是将文件拆成比较小的块，当查询到相关的块之后，我们围绕之前的语句，进行上下文窗口的扩展，讲较小语…
RAG技术
- 0
- 0
charles4月29日
一文带你掌握RAG的第一步-文本分块！人人都能看懂的AI技术原理科普，数据处理、文本切割到底是怎么回事？

小纸条的之前的章为大家介绍过RAG对于模型优化的作用之大，接着概念科普后，今天这篇文章会带着大家直白的搞懂RAG真正落地的过程涉及到的技术，去掉一些RAG技术的复杂滤镜构建一个检索增强生成 (Retrieval-Augmented Generation, RAG) 应用的初步模型可能看起来不难，但要真正把它用在实际工作中，我们会遇到不少难题。这主要是因为 RAG 系统涉及多个不同的组件，每个部分都…
RAG技术
- 0
- 0
charles4月28日
你的大模型真的需要微调吗？

通过构建知识库，上半年很多企业落地了基于大模型的垂类应用，随之而来的也是越来越多的优化需求，除了RAG本身，我们是否也需要考虑下其他技术手段？上半年我是一个RAG或Agent的拥簇者，我坚信只要足够参数规模的强力大模型，加上知识库或者智能体plan及工具调用即可完成大部分应用场景。事实证明确实可以完成，但是能完美地完成吗？如果仅仅考虑及格落地，那是可以，但如果考虑优秀落地，那还是差点意思。为什么呢…
RAG技术
- 1
- 0
charles4月28日
RichRAG框架：为用户提供丰富全面且令人满意的回答

检索增强型生成（RAG）使LLMs能够利用检索到的可靠信息，从而返回更可靠的响应。现有研究主要关注需要简洁明确答案的特定问题，但用户意图通常是复杂和多方面的，需要丰富和全面的答案。一个多方面查询需要全面回答的情境示例为了解决这一重要但未被充分探索的问题，提出了一种名为RichRAG的新型RAG框架：子方面探索器：识别输入问题潜在的子方面。多方面检索器：构建与这些子方面相关的多样化外部文档候选池。生…
RAG技术
- 1
- 0
charles4月28日
LLM中的应用程序中存在的问题

背景构建基于大型语言模型（LLM）的应用程序需要将LLM的回答与我们行业的特定领域数据结合起来。尽管微调LLM可以使其更了解特定领域，但仍可能存在不准确和幻觉的问题。因此，出现了检索增强生成（RAG）技术，以便让LLM的回答基于具体数据并提供来源支持。RAG的工作原理RAG的工作原理是为你想使用的数据片段创建文本嵌入，这样可以将源文本的一部分放入LLM用来生成回答的语义空间中。同时，RAG系统还能…
RAG技术
- 2
- 0
charles4月28日