全部标签

RAG技术

RAG维保案例分享：如何实现”文+图”的答案呈现

RAG一直被看成是大模型在企业应用落地的标准配置，基于企业内部文档的问答，已经解锁出大量使用需求和场景。在这些众多类型的文档中，有相当一部分包含了各类复杂图表，也就是所谓的多模态数据。本篇以近期实施项目中的一个挖掘机维修场景为例，试图给出一个针对标准化排版PDF 文档（本文演示的固定格式维修手册），使用基于坐标区域截取方法，结合Markdown 语法在回答中显示图片的示例,供大家参考。演示视频与文…
RAG技术
- 12
- 0
charles25年5月12日
RAG检索不过关？试试这些优化策略，精准度飙升！

近来，RAG成了大语言模型的“救命稻草”，可让大语言模型回答更准确、更靠谱。可问题来了，很多 RAG 应用的检索系统还是有点“笨”：要么漏掉关键信息，要么抓回一堆无关紧要的“噪声”，搞得最终答案质量参差不齐。那么，我们该怎么优化 RAG 的检索算法，让它既精准又高效呢？今天就来聊聊这个话题，带你一步步解锁 RAG 检索的“进阶玩法”！为什么非得优化检索算法不可？RAG 的工作流程其实很简单：用户丢…
RAG技术
- 9
- 0
charles25年5月12日
RAG检索全攻略：Embedding与Rerank模型的终极指南

在构建基于检索增强生成（RAG）的系统时，Embedding Model和Rerank Model扮演着至关重要的角色。比如你正在搭建一个智能搜索引擎，Embedding Model就像是帮你快速找到相关书籍的“图书管理员”，而Rerank Model则像是一位经验丰富的“资深书评人”，负责从一堆书里精准挑选出最符合你需求的那几本。两者配合，就像一对完美搭档，确保RAG系统既能找到大量信息，又能精…
RAG技术
- 11
- 0
charles25年5月12日
5.6K+ Star！R2R：一个支持RAG的AI检索系统

R2R 简介R2R[1] （Reason to Retrieve）是一个先进的 AI 检索系统，支持检索增强生成（Retrieval-Augmented Generation，RAG）功能，并具备生产级特性。它基于 RESTful API 构建，提供多模态内容摄取、混合搜索、知识图谱以及全面的文档管理功能。此外，R2R 还包含一个深度研究 API，能够从知识库和互联网中获取相关数据，为复…
RAG技术
- 13
- 0
charles25年5月12日
这就是AI智能体的记忆机制原理

一般来说，Agent（智能体）的记忆是通过在传递给 LLM 的 Prompt（提示）中提供上下文实现的，使 Agent 能够基于过去的交互或无法立即获取的数据更好地规划和响应。我们通常将记忆分为四种类型：1. 情景记忆（Episodic Memory）这种记忆类型包含 Agent 过去的交互和执行的动作。当 Agent 执行某个操作后，控制 Agent 的应用程序会将该操作存储到某种持久化存储中，…
RAG技术
- 7
- 0
charles25年5月12日
数据处理+Embedding+Re-rank等：提升RAG等AI应用的精准性与效率

使用 RAG提升回答准确性需要从数据质量、检索策略、生成优化三个核心环节入手。以下是具体优化方案，涵盖技术细节和落地实践：一、数据预处理阶段：构建高质量知识库1. 文档清洗与结构化去噪：过滤HTML标签、广告文本、重复内容（如使用正则表达式或工具BeautifulSoup）。关键信息提取：使用NLP模型（如LayoutLMv3、olmOcr）解析PDF/扫描件中的表格、公式…
RAG技术
- 11
- 0
charles25年5月12日
Ragflow技术栈分析及二次开发指南

❝Ragflow是目前团队化部署大模型+RAG的优质方案，不过其仍不适合直接部署使用，本文将从实际使用的角度，对其进行二次开发。1. Ragflow 存在问题Ragflow 开源仓库地址：https://github.com/infiniflow/ragflowRagflow 当前版本： v0.17.0Ragflow 目前主要存在以下问题：登录页开放注册当前版本，在login页面，用户可直接进行注…
RAG技术
- 6
- 0
charles25年5月12日
RagFlow和Dify如何选择

在当今的AI应用开发领域，检索增强生成（Retrieval-Augmented Generation, RAG）技术已成为构建知识密集型应用的关键方法。RAGFlow和dify作为两个备受关注的开源框架，各自在RAG实现上有着独特的优势和局限性。本报告将深入分析这两款工具的表现，帮助开发者和企业根据具体需求做出明智选择。RAGFlow与Dify的核心定位与设计理念RAGFlow和Dify在设计理念…
RAG技术
- 11
- 0
charles25年5月12日
RAG太折磨人啦，试一下pip install rankify，检索、重排序、RAG三合一，完美。| 独家

编者按编者按：现有RAG工具的碎片化和复杂性常常让开发者头疼不已。昨天我的Agent群里朋友们就Rerank问题展开激烈讨论，我想起之前看到的一篇论文，这项研究介绍了一个完美的开源python工具包Rankify，它将检索、重排序和RAG三大功能整合在一个统一框架中，大幅简化了开发流程。无论您是AI研究人员还是工程师，这篇文章都将为您揭示如何通过Rankify构建更高效、更准确的信息检…
RAG技术
- 7
- 0
charles25年5月12日
深度长文｜DeepSeek R1 的 RAG 检索之谜：为何“推理大师”不擅长 Embedding？

在人工智能的浩瀚星空中，检索增强生成（RAG）系统正以其独特的魅力，成为连接语言模型与外部知识的桥梁。它不仅能让 AI 拥有更广阔的知识储备，还能有效减少“幻觉”，提升回答的准确性和可靠性。然而，构建一个高效的 RAG 系统并非易事，每一个环节都如同解谜游戏中的关键线索，环环相扣，缺一不可。DeepSeek R1，作为一款拥有 6710 亿参数的混合专家模型（MoE），凭借其强大的推理能力，在数学…
RAG技术
- 4
- 0
charles25年5月12日
RAG检索增强之ReRank(重新排序)模型

了解ReRank模型前先回顾一下RAG的流程什么是Rerank模型？ Rerank模型是一种用于优化信息检索结果排序的机器学习模型，通过精细化评估文档与查询的相关性，提升最终结果的准确性和语义匹配度。以下是其核心要点：定义与定位属于重排序算法，作用于初步检索（如关键词匹配或向量相似度检索）之后，对候选文档…
RAG技术
- 6
- 0
charles25年5月12日
为什么说Agentic RAG是RAG领域的王者？

前言我们了解RAG的核心思想是将检索机制与大模型相结合，通过动态检索外部知识库来增强模型的生成能力，并生成上下文相关且准确的响应。RAG突破了目前大模型的静态知识限制，拓展了大模型开启了“生成+检索”协同工作的新范式。传统RAG-文本检索的利器首先回顾一下传统RAG的核心链路。传统RAG的三个核心链路：• 索引（向量嵌入）：通过Embedding模型服务实现文档的向量编码，…
RAG技术
- 6
- 0
charles25年5月12日
为什么RAG系统”一看就会，一做就废”？

随着大语言模型（LLM）的广泛应用，检索增强生成（RAG）技术作为一种结合检索技术和LLM提示的创新架构，因其在结合外部知识库和生成模型方面的卓越表现而备受关注。RAG系统通过将LLM与结构化或非结构化的外部数据源相结合，显著提升了生成内容的准确性、相关性和可信度。RAG在聊天机器人、知识密集型任务和企业应用中表现出色。然而从理论到工程实践，开发和优化一个高效的RAG系统并非易事，RA…
RAG技术
- 5
- 0
charles25年5月12日
做完RAG图片搜索后，才明白过去对RAG的理解完全不够

在AI技术飞速发展的今天，图片RAG（Retrieval-Augmented Generation，检索增强生成）正逐渐成为多模态应用的“杀手锏”。无论是电商平台的“以图搜商品”，还是教育领域的“文本生成插图”，图片RAG通过检索与生成的高效结合，能带来令人惊叹的效果。你是否遇到这样一个场景：你在电商平台上传一张衣服的图片，系统不仅能找到相似款，还能自动生成搭配建议；你在学习一篇复杂的医学文章，A…
RAG技术
- 6
- 0
charles25年5月12日
如何快速搭建个性化RAG聊天机器人

在 AI 领域，Retrieval-Augmented Generation（简称 RAG）已经成为生成式 AI 应用的重要技术，尤其是在对话式 AI 中。它结合了预训练大语言模型（LLM）如 OpenAI 的 GPT 和外部知识库（存储在向量数据库中，比如 Milvus 和 Zilliz Cloud），能够生成更加精准、上下文相关的回复，并且保持信息的实时性。一个完…
RAG技术
- 6
- 0
charles25年5月12日
从裁员到年薪百万：程序员靠RAG技术逆袭的“核心密码”

1. 前言作为一名从业七年的程序员，最近听到很多程序员朋友都喜提了n+1裁员大礼包。上周与老友聚会时，大家纷纷诉说着各自最近的遭遇，聚会气氛一度十分沉重。老Z感叹：“公司决定将部分业务外包，结果我被列入了裁员名单。”老L则无奈道：“市场竞争激烈，项目减少，团队预算被削减，前几天我也被裁掉了。”聚会回家后我十分焦虑地打开了招聘软件，发现传统程序员的岗位出现了僧多肉少的情况，hr每天回复几…
RAG技术
- 8
- 0
charles25年5月12日
RAG回答准确率暴涨300%！用Coze工作流进行数据结构化（附完整提示词）

1. 前言在生成式人工智能（Generative AI）快速发展的当下，大语言模型（LLMs）的幻觉问题始终是制约其落地应用的关键瓶颈。检索增强生成（RAG）技术通过引入外部知识库，将动态检索与生成能力结合，为解决这一难题提供了重要思路。然而，RAG系统的核心性能——数据召回率，高度依赖于底层数据的质量与组织形式。尤其是一些领域文献，原始数据常以非结构化形式（如PDF论文、扫描文档、图…
RAG技术
- 14
- 0
charles25年5月12日
技术人的大模型应用初学指南

随着人工智能技术的快速发展，检索增强生成（RAG）作为一种结合检索与生成的创新技术，正在重新定义信息检索的方式。本文深入探讨了RAG的核心原理及其在实际应用中的挑战与解决方案。文章首先分析了通用大模型在知识局限性、幻觉问题和数据安全性等方面的不足，随后详细介绍了RAG通过“检索+生成”模式如何有效解决这些问题。具体而言，RAG利用向量数据库高效存储与检索目标知识，并结合大模型生成合理答案。此外，文…
RAG技术
- 6
- 0
charles25年5月12日
RAG从入门到精通-RAG简介

开新坑了，本专题将带领大家使用RAG架构一步步利用搭建自己的知识库问答系统。从ChatGPT的官方API开始，到自己部署开源大模型。都将在这个专题中出现。欢迎大家关注。前言RAG（Retrieval Augmented Generation,检索增强生成）是一个将大规模语言模型(LLM)与来自外部知识源的检索相结合的框架,以改进问答能力的工程框架。本文讲对RAG进行简单介绍。LLM的知识更新难题在…
RAG技术
- 12
- 0
charles25年5月11日
深入剖析：如何利用 AI 智能体增强传统 RAG 系统

一、引言在当今的人工智能领域，生成式人工智能（Generative AI）正迅速发展，越来越多的企业希望利用定制数据构建自己的生成式 AI 助手。检索增强生成系统（Retrieval Augmented Generation systems，简称 RAG 系统）因其能够避免对大语言模型（Large Language Models，LLMs）进行昂贵的微调而迅速流行起来。RAG 系统的一个关键优势在…
RAG技术
- 4
- 0
charles25年5月11日
构建生产级RAG系统注意事项

构建生产级 RAG（检索增强生成）AI 系统是一个艰难的任务。?是 RAG 系统中的一些关键组件，你需要对它们进行管理和持续优化，以实现预期的效果（不要错过最后的 H 部分）：检索（Retrieval）F) 数据切分（Chunking） - 如何对用于外部上下文的数据进行切分？小块 vs. 大块。滑动窗口（sliding window）或滚动窗口（tumbling window）进行切分…
RAG技术
- 5
- 0
charles25年5月11日
基于大模型的业务流程原子化编排技术在RPA中的应用

编者荐语RPA 即机器人流程自动化（Robotic Process Automation），在其实际业务开发流程中，存在着相同业务步骤重复开发的问题，这使得 RPA 实施的成本显著增加，同时还降低了开发效率。随着大语言模型（LLM）技术发展，通过智能体编排 RPA 原子业务流程来提升 RPA 原子流程的复用度已成为可能。本文详细…
RAG技术
- 6
- 0
charles25年5月11日
AI助手要觉醒？揭秘RAG、Agent、MCP三大超能力如何让它无所不能！

你有没有想过，为什么现在的AI助手突然变得这么“聪明”？它能三秒内查清股市数据、自动安排你的差旅行程，甚至帮你写专业报告。这背后，其实是AI界悄悄解锁了三大超能力——超级记忆、自主思考、万物互联。今天我们就用人话拆解这些黑科技！超能力一：超级记忆（RAG）一句话解释：AI终于学会“查资料再答题”了！想象你让AI写一份《2024年新能源汽车报告》，以前的AI可能会瞎编数据，但现在——1️⃣ 翻资料：…
RAG技术
- 7
- 0
charles25年5月11日
为什么在大模型中需要使用向量数据库？

1. 引言在 AI 大模型（如 ChatGPT、LLaMA）的应用中，我们经常听到“向量数据库”这个概念。为什么大模型需要向量数据库？它到底解决了什么问题？本文将从向量、语义理解、向量之间的距离等方面入手，带你理解向量数据库的核心作用，并解释它在 AI 时代的重要性。2. 什么是向量？向量（Vector）是数学中的一个概念，可以简单理解为一个有方向和大小的数值列表。在 AI 领域，向量通常用于表示…
RAG技术
- 8
- 0
charles25年5月11日