全部标签

RAG技术

RAG之对于非结构性数据提取

前段时间在B站上看到一个up主分享了一个如何《将图片或PDF中复杂的表格数据转成纯文本输入大模型，如何保持表格文字的排版布局不变？》，后面在评论中和up主讨论了一下，当一个文档中出现了多种数据结构形式，比如文本、图片、表格、公式，而不是视频分享中的单一模式，对于这些形式内容的提取可以采用哪些方法呢？https://www.bilibili.com/vide…
RAG技术
- 7
- 0
charles25年5月9日
什么是Embedding向量模型？我们应该如何选择？

我们之前讲的搭建本地知识库，基本都是使用检索增强生成（RAG）技术来搭建，Embedding模型则是RAG的核心，同时也是大模型落地必不可少的技术。那么今天我们就来聊聊Embedding向量模型：一、Embedding模型是什么？Embedding模型是一种将离散数据（如文本、图像、用户行为等）映射到连续向量空间的技术。其核心思想是通过低维稠密向量（Embedding）捕捉数据的内在特征和语义关系…
RAG技术
- 8
- 0
charles25年5月9日
RAGFlow创建知识库

一、设定/修改系统默认模型点击头像，选择模型供应商，然后点击【系统模型设置】按钮，会弹出设置窗口，然后选择聊天模型，因为之前我的模型是火山引擎的，所以这里我选择了火山的DeepSeek-V3其中嵌入模型和Rerank模型是有系统自带的，如果不需要系统自带的，可以自己提供对应的模型。二、创建知识库知识库、聊天和文件管理是RAGFlow的三大支柱功能。RAGFlow 的 AI 聊天基于知识库。RAGF…
RAG技术
- 7
- 0
charles25年5月9日
精通代理性RAG：实施自我评估机制以增强信息检索的5个步骤

开发 Agentic RAG 的端到端教程随着 LLM 的发展，模型已经能够理解大量数据并进行逻辑推理。伴随这些发展而来的最重要的进步之一是检索增强生成（RAG）系统。LLM 接受过非常大的数据集的训练，但它们受到训练数据的限制。假设你有一家公司。你有一些政策文件。为了让你的员工找到正确的答案，他们要么需要非常了解这些文件，要么需要在文件中搜索答案。你想用聊天机器人让这个系统更简单。随着 LLM …
RAG技术
- 12
- 0
charles25年5月9日
RAG 的五大范式

Naive RAG (朴素 RAG)定义核心思想将文档分块、向量化并存入向量数据库用户查询也向量化，并在数据库中检索最相似的文档块最后，将查询和检索到的文档块一起输入 LLM 生成答案优缺点分析Advanced RAG (高级 RAG)定义核心思想化索引（如滑动窗口、细粒度分割、元数据利用）优化查询（如查询重写、扩展、转换）优化检索结果（如重排序、过滤、压缩）优缺点分析Modular RAG (模…
RAG技术
- 10
- 0
charles25年5月9日
陶哲轩使用o3 mini一手测评来了：好坏参半

数学大神陶哲轩（Terence Tao）刚发了一篇他使用o 3 mini感受帖子，给大家划个重点大神也好奇AI搞科研怎么样？陶哲轩发帖说，最近他在研究图论中的一个“专家级”定理——“三角形移除引理”。这定理有点复杂，咱们普通人听着可能头大。为了搞清楚这个定理的证明，现有三种方法：1. 传统手撸: 笔和纸，自己硬啃2. 传统搜索: 用搜索引擎，网…
RAG技术
- 11
- 0
charles25年5月9日
Anything LLM高级用法-deepseek本地调用神器

Anything LLM 是一款基于 RAG架构的本地知识库工具，能够将文档、网页等数据源与本地运行的大语言模型（LLM）相结合，构建个性化的知识库问答系统。它支持多种主流模型的 API 接入方式，如 OpenAI、DeepSeek 等。Anything LLM环境配置下载和安装过程都比较简单，这里就不详细介绍了。安装完成后，打开&nbs…
RAG技术
- 12
- 0
charles25年5月9日
Rig Agents：高阶LLM编排框架

在LLM应用开发中，如何高效管理模型、上下文和工具，构建强大的智能体（Agent）Rig提供了一种高阶的LLM编排框架，帮助开发者轻松集成RAG（检索增强生成）、工具调用和自定义配置。本文将深入解析Rig Agents的核心概念、使用方式及最佳实践，助你构建从基础聊天机器人到复杂RAG知识问答系统的AI应用。什么是 Rig Agents？Rig Agents是Rig框架中针对LLM高阶封装的核心组…
RAG技术
- 12
- 0
charles25年5月9日
终于出手了，微信公众号原生 RAG 上线，官方 AI 知识库来了！

还是来了，虽然早猜到有这么一天。微信公众号官方推出基于公众号的 RAG 系统。如何开通首先打开公众号后台，在左侧菜单点击自动回复在右侧打开的页面中点击智能回复接着打开智能回复的开关设置提示词，系统提供了默认的提示词，写的挺不错的，不过你也可以修改它接着，稍微几分钟（我的是等了 3 分钟左右吧）就会在后台看到发的开通成功的通知如何使用在手机上打开公众号头像，点击 “发消息” 进入对话界面在聊天界面，…
RAG技术
- 9
- 0
charles25年5月9日
博查正式发布语义排序模型（bocha-semantic-reranker）

一、概述博查正式发布语义排序模型（bocha-semantic-reranker）和排序API（Rerank API），可以使用Bocha Semantic Reranker 提升搜索应用和RAG应用中的搜索结果准确性。二、什么是博查语义排序模型（Bocha Semantic Reranker）？Bocha Semantic Reranker是一种基于文本语义的排序模型（Rerank Model）…
RAG技术
- 12
- 0
charles25年5月9日
AI比人类更需要搜索引擎，我们专门为AI设计了一个搜索引擎

我们专门为AI设计了一个搜索引擎，为AI产业提供世界知识搜索服务。上线 60 天，已经被AI调用超过 30 万次。在信息时代，搜索引擎已经成为我们日常生活中不可或缺的工具。然而，随着AI的迅猛发展，AI对搜索引擎的需求甚至超过了人类。这是因为AI不仅需要处理庞大的数据，还需要实时获取最新的信息来执行各种任务。AI为何需要搜索引擎？知识获取与学习：AI在执行任务时需要大量的背景知识。例如，聊天机器人…
RAG技术
- 10
- 0
charles25年5月9日
超越 RAG：Memobase 为 AI 应用注入长期记忆

目录什么是 AI 记忆？AI 记忆的类型短记忆 vs. 长记忆User Memory vs. Agent Memory：两种记忆，两种侧重记忆 vs. RAG：到底有什么区别？为什么 AI 应用需要记忆？现在的长记忆方案有哪些？记忆设计机制对比现有记忆方案的常见问题Memobase：为 AI 原生应用打造的长记忆解决方案为什么选择 Memobase？Memobase 的核心功能Memobase 的…
RAG技术
- 9
- 0
charles25年5月9日
【AI落地应用实战】RAGFlow + 知识图谱 + Deepseek 初步探索

人们对 LLM + RAG 的期望其实是很高的，认为它可能会颠覆知识产业。从逻辑上讲，这么想是有些道理的，LLM已经吃进去了互联网上所有的公开数据，而RAG机制则构建了动态的知识增强回路，相当于学到了数据里面所表示的知识，自然可以解答信息或知识层面的「任何」问题，理论上似乎是确实能端到端地做掉的。但是从另一方面来说，知识的运用远非简单的数据检索游戏。如果只是把一堆文件扔给学生，而不教给他…
RAG技术
- 11
- 0
charles25年5月9日
milvus lite快速实践-了解RAG落地背后的机制

Milvus Lite 是Milvus 的轻量级版本，Milvus 是一个开源向量数据库，通过向量嵌入和相似性搜索为人工智能应用提供支持，最典型的应用场景就是 RAG（Retrieval-Augmented Generation，检索增强生成），为 RAG 系统提供了强大的向量存储和检索能力。通过下面的实践，可以了解文本向量化与相似度匹配（语义匹配）的大概过程，了解RAG落地背后的机制。安装 mi…
RAG技术
- 11
- 0
charles25年5月9日
为什么RAG系统要拥抱向量检索？揭示关键字检索的致命弱点！

搭建RAG系统时，使用向量检索的原因主要在于其能够有效解决传统关键字检索的局限性，并提升检索的准确性和效率。那么关键字检索到底存在什么局限性？向量检索是如何解决的？这篇文章文章带你搞明白这背后的原因。关键字检索的局限性传统关键字检索依赖于词频统计，如基于BM25的倒排索引，这种方式无法理解语义信息，因此在处理复杂查询时存在以下问题：语义理…
RAG技术
- 9
- 0
charles25年5月9日
不要盲目再使用DeepSeek R1和QWQ这些推理模型做RAG了

DeepSeek R1 在首次发布时就展现出了强大的推理能力。在这篇文章中，我们将详细介绍使用 DeepSeek R1 构建针对法律文件的 RAG 系统的经验。我们之所以选择法律文件，是因为法律专业人士经常面临一项艰巨的任务：浏览案例、法规和非正式法律评论库。即使是最善意的研究也会因检索正确的文档而陷入困境，更不用说准确地总结它们了。这是 RAG 的绝佳领域！我们在大量法律文件数据集的基础上构建了…
RAG技术
- 10
- 0
charles25年5月9日
r1-reasoning-rag：一种新的 RAG 思路

最近发现了一个开源项目，它提供了一种很好的 RAG 思路，它将 DeepSeek-R1 的推理能力结合 Agentic Workflow 应用于 RAG 检索项目地址https://github.com/deansaco/r1-reasoning-rag.git项目通过结合 DeepSeek-R1、Tavily 和 LangGr…
RAG技术
- 5
- 0
charles25年5月8日
提高企业 RAG 准确性的分步指南

从PDF文件生成的知识图谱在我之前的博客中，我写到如何使用像Gemini Flash 2.0这样具有非常大上下文大小的新模型进行语义分块，可以显著提高从非结构化数据（如PDF）中的整体检索准确性。在探索这一点时，我开始研究其他策略，以进一步提高响应的准确性，因为在大多数大型企业中，对不准确的容忍度几乎为零，并且应该如此。在这个追求中，我最终尝试了许多不同的东西，在这篇博客中，让我们看看最终帮助提升…
RAG技术
- 9
- 0
charles25年5月8日
DeepSeek-R1 x Agentic RAG：构建带深度思考开关的知识研究助理｜深度长文

RAG是一种基于“检索结果”做推理的应用，这大大限制了类似DeepSeek-R1模型的发挥空间。但又的确存在将RAG的准确性与DeepSeek深度思考能力结合的场景，而不仅仅是回答事实性问题。比如：基于企业知识库与产品文档，写一份市场分析报告。根据已有的技术报告创作一篇公众号文章。你很难用传统的RAG方法去“回答”这样的主题；也无法快速的更换DeepSeek就输出需要的结果。本文将介绍如何结合De…
RAG技术
- 12
- 0
charles25年5月8日
通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统

随着大数据时代的到来，信息检索技术在各个领域中扮演着越来越重要的角色。阿里云向量检索服务 Milvus 版作为一款高性能的向量检索引擎，100%兼容开源 Milvus，凭借其开箱即用、灵活扩展和全链路告警能力，成为企业大规模 AI 向量数据相似性检索服务的理想选择。其最新版本 2.5 在全文检索、关键词匹配以及混合检索（Hybrid Search）方面实现了显著的增强，在多模态检索、RAG等多场景…
RAG技术
- 8
- 0
charles25年5月8日
本地部署DeepSeek R1 + Ollama + XRAG：三步搭建RAG系统，并解锁全流自动化评测

引言如何科学的评估RAG系统，对于RAG系统的性能优化至关重要。为此，本文提供了一个详细操作指南，帮助用户使用Ollama本地部署最新的DeepSeek R1模型，并使用最新的XRAG1.0框架来构建RAG系统并评估你的本地RAG知识库系统。这一过程分为三个主要步骤：Ollama安装下载启动DeepSeek R1模型配置XRAG使用本地模型和知识库，运行评估以解锁全流程自动化评测能力。RAG技术核…
RAG技术
- 5
- 0
charles25年5月8日
Graph RAG 迎来记忆革命：“海马体”机制如何提升准确率？

随着生成式 AI 技术的快速发展，RAG（Retrieval-Augmented Generation）和 Agent 成为企业应用大模型的最直接途径。然而，传统的 RAG 系统在准确性和动态学习能力上存在明显不足，尤其是在处理复杂上下文和关联性任务时表现不佳。近期，一篇论文提出了 HippoRAG 2，这一新型 RAG 框架在多个方面取得了显著进步，为企业级 AI 应用提供了更强大的解…
RAG技术
- 8
- 0
charles25年5月8日
Windows 部署 DeepSeek 本地 RAG 保姆教程：低配秒变AI工作站，断网也能稳如老狗！

一、二步为介绍，如果想要看怎样接入本地知识库，可直接从第三步：AnythingLLM 安装开始一、RAG介绍RAG 知识库概述1. 定义RAG（Retrieval-Augmented Generation）是一种结合检索技术与生成模型的自然语言处理方法，通过引入外部知识库提升系统回复的准确性与信息量。2. 核心原理• 检索优先：生成回答前，先从知识库中检索相关信息（类似“开…
RAG技术
- 13
- 0
charles25年5月8日
DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏

前言准备好迎接搜索3.0时代了吗？随着这几年AI技术的革新，“搜索应用”成为了AI应用层的第一个共识。从海外的OpenAI、微软Bing Copilot、Perplexity AI，再到国内的豆包、Kimi，都是这一共识下的代表产品。技术上，从传统的关键词检索，到RAG，大家已经不满足于只是生成对应的简单回答而是期待大语言模型能够更好地应用于企业级场景，产生更大的价值。不久前，OpenAI推出了最…
RAG技术
- 8
- 0
charles25年5月8日