-
别再为 RAG 文本分块发愁!Chonkie 让复杂操作轻松搞定
1. 为啥文本分块这么重要?2. 搭建 RAG 应用时的 “分块困境”3. Chonkie 库4. Chonkie 库使用示例在自然语言处理(NLP)中,RAG(检索增强生成)技术可谓大放异彩。它能让模型借助大量文本数据,生成更精准、更丰富的内容。不过,在 RAG 的实际运用中,有个关键环节却常常让开发者们头疼不已,那就是文本分块(Chunking)。今天,就给大家介绍一款堪称 “救星” 的神器 …- 9
- 0
-
为什么RAG一定需要Rerank?
今天和大家讲一下检索增强生成(RAG)里面的Rerank。RAG给人带来无限期待,尤其是在结合了LLM之后,大家都想着:这下终于能搞定那些复杂的问答任务了吧!但现实往往是骨感的。很多人开发完一个RAG流程后都会疑惑:为什么它的效果没有达到预期呢?其实,和大多数工具一样,RAG用起来简单,但想要精通却很难。事实上,RAG不只是把文档存入向量数据库,然后在上面添加一个LLM那么简单。那样做 …- 4
- 0
-
如何提升RAG知识库文档的召回准确率?
在RAG系统中,提升知识库文档的 召回准确率,对于提高整个系统的用户体验至关重要。今天,我就从文档 切割粒度、检索后排序、混合检索、RAG-Fusion 这几个方面,详细介绍如何提升知识库文档的召回准确率,希望对你有所帮助。文档切割粒度在RAG系统中,文档切割是将 大文档 分割成更小的 文本块,以便更高效地进行向量表示 和检索。…- 7
- 0
-
为什么RAG技术需要知识向量化?通俗解析
你是否好奇过,当你问ChatGPT一个问题时,它是如何从浩如烟海的信息中找到相关知识的?这背后的奥秘之一就是"知识向量化"。今天,我们将用通俗易懂的语言,揭开这项强大技术的面纱,特别是它在RAG(检索增强生成)系统中的关键作用。什么是知识向量化?想象一下,如果你需要整理一个装满成千上万本书的图书馆。传统方法是按照书名首字母或固定的分类方式排列。但这种方法有个问题:当你想找&qu…- 4
- 0
-
万字长文讲透 RAG在实际落地场景中的优化
本文主要围绕DB-GPT应用开发框架如何在实际落地场景做RAG优化。背景在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而为大模型在复杂场景中的应用提供更多可能性。但是在实际落地场景中,往往会存在检索准确率低,噪音干扰多,召回完整性,专业性不够,导致LLM…- 7
- 0
-
RAG之对于非结构性数据提取
前段时间在B站上看到一个up主分享了一个如何《将图片或PDF中复杂的表格数据转成纯文本输入大模型,如何保持表格文字的排版布局不变?》,后面在评论中和up主讨论了一下,当一个文档中出现了多种数据结构形式,比如文本、图片、表格、公式,而不是视频分享中的单一模式,对于这些形式内容的提取可以采用哪些方法呢?https://www.bilibili.com/vide…- 4
- 0
-
什么是Embedding向量模型?我们应该如何选择?
我们之前讲的搭建本地知识库,基本都是使用检索增强生成(RAG)技术来搭建,Embedding模型则是RAG的核心,同时也是大模型落地必不可少的技术。那么今天我们就来聊聊Embedding向量模型:一、Embedding模型是什么?Embedding模型是一种将离散数据(如文本、图像、用户行为等)映射到连续向量空间的技术。其核心思想是通过低维稠密向量(Embedding)捕捉数据的内在特征和语义关系…- 4
- 0
-
RAGFlow创建知识库
一、设定/修改系统默认模型点击头像,选择模型供应商,然后点击【系统模型设置】按钮,会弹出设置窗口,然后选择聊天模型,因为之前我的模型是火山引擎的,所以这里我选择了火山的DeepSeek-V3其中嵌入模型和Rerank模型是有系统自带的,如果不需要系统自带的,可以自己提供对应的模型。二、创建知识库知识库、聊天和文件管理是RAGFlow的三大支柱功能。RAGFlow 的 AI 聊天基于知识库。RAGF…- 5
- 0
-
精通代理性RAG:实施自我评估机制以增强信息检索的5个步骤
开发 Agentic RAG 的端到端教程随着 LLM 的发展,模型已经能够理解大量数据并进行逻辑推理。伴随这些发展而来的最重要的进步之一是检索增强生成(RAG)系统。LLM 接受过非常大的数据集的训练,但它们受到训练数据的限制。假设你有一家公司。你有一些政策文件。为了让你的员工找到正确的答案,他们要么需要非常了解这些文件,要么需要在文件中搜索答案。你想用聊天机器人让这个系统更简单。随着 LLM …- 10
- 0
-
陶哲轩使用o3 mini一手测评来了:好坏参半
数学大神陶哲轩(Terence Tao)刚发了一篇他使用o 3 mini感受帖子,给大家划个重点大神也好奇AI搞科研怎么样?陶哲轩发帖说,最近他在研究图论中的一个“专家级”定理——“三角形移除引理”。这定理有点复杂,咱们普通人听着可能头大。 为了搞清楚这个定理的证明,现有三种方法:1. 传统手撸: 笔和纸,自己硬啃2. 传统搜索: 用搜索引擎,网…- 4
- 0
-
Anything LLM高级用法-deepseek本地调用神器
Anything LLM 是一款基于 RAG架构的本地知识库工具,能够将文档、网页等数据源与本地运行的大语言模型(LLM)相结合,构建个性化的知识库问答系统。它支持多种主流模型的 API 接入方式,如 OpenAI、DeepSeek 等。Anything LLM环境配置下载和安装过程都比较简单,这里就不详细介绍了。安装完成后,打开&nbs…- 7
- 0
-
Rig Agents:高阶LLM编排框架
在LLM应用开发中,如何高效管理模型、上下文和工具,构建强大的智能体(Agent)Rig提供了一种高阶的LLM编排框架,帮助开发者轻松集成RAG(检索增强生成)、工具调用和自定义配置。本文将深入解析Rig Agents的核心概念、使用方式及最佳实践,助你构建从基础聊天机器人到复杂RAG知识问答系统的AI应用。什么是 Rig Agents?Rig Agents是Rig框架中针对LLM高阶封装的核心组…- 7
- 0
-
终于出手了,微信公众号原生 RAG 上线,官方 AI 知识库来了!
还是来了,虽然早猜到有这么一天。微信公众号官方推出基于公众号的 RAG 系统。如何开通首先打开公众号后台,在左侧菜单点击自动回复在右侧打开的页面中点击智能回复接着打开智能回复的开关设置提示词,系统提供了默认的提示词,写的挺不错的,不过你也可以修改它接着,稍微几分钟(我的是等了 3 分钟左右吧)就会在后台看到发的开通成功的通知如何使用在手机上打开公众号头像,点击 “发消息” 进入对话界面在聊天界面,…- 3
- 0
-
博查正式发布语义排序模型(bocha-semantic-reranker)
一、概述博查正式发布语义排序模型(bocha-semantic-reranker)和排序API(Rerank API),可以使用Bocha Semantic Reranker 提升搜索应用和RAG应用中的搜索结果准确性。二、什么是博查语义排序模型(Bocha Semantic Reranker)?Bocha Semantic Reranker是一种基于文本语义的排序模型(Rerank Model)…- 6
- 0
-
AI比人类更需要搜索引擎,我们专门为AI设计了一个搜索引擎
我们专门为AI设计了一个搜索引擎,为AI产业提供世界知识搜索服务。上线 60 天,已经被AI调用超过 30 万次。在信息时代,搜索引擎已经成为我们日常生活中不可或缺的工具。然而,随着AI的迅猛发展,AI对搜索引擎的需求甚至超过了人类。这是因为AI不仅需要处理庞大的数据,还需要实时获取最新的信息来执行各种任务。AI为何需要搜索引擎?知识获取与学习:AI在执行任务时需要大量的背景知识。例如,聊天机器人…- 8
- 0
-
超越 RAG:Memobase 为 AI 应用注入长期记忆
目录什么是 AI 记忆?AI 记忆的类型短记忆 vs. 长记忆User Memory vs. Agent Memory:两种记忆,两种侧重记忆 vs. RAG:到底有什么区别?为什么 AI 应用需要记忆?现在的长记忆方案有哪些?记忆设计机制对比现有记忆方案的常见问题Memobase:为 AI 原生应用打造的长记忆解决方案为什么选择 Memobase?Memobase 的核心功能Memobase 的…- 8
- 0
-
【AI落地应用实战】RAGFlow + 知识图谱 + Deepseek 初步探索
人们对 LLM + RAG 的期望其实是很高的,认为它可能会颠覆知识产业。从逻辑上讲,这么想是有些道理的,LLM已经吃进去了互联网上所有的公开数据,而RAG机制则构建了动态的知识增强回路,相当于学到了数据里面所表示的知识,自然可以解答信息或知识层面的「任何」问题,理论上似乎是确实能端到端地做掉的。但是从另一方面来说,知识的运用远非简单的数据检索游戏。如果只是把一堆文件扔给学生,而不教给他…- 4
- 0
-
milvus lite快速实践-了解RAG落地背后的机制
Milvus Lite 是Milvus 的轻量级版本,Milvus 是一个开源向量数据库,通过向量嵌入和相似性搜索为人工智能应用提供支持,最典型的应用场景就是 RAG(Retrieval-Augmented Generation,检索增强生成),为 RAG 系统提供了强大的向量存储和检索能力。通过下面的实践,可以了解文本向量化与相似度匹配(语义匹配)的大概过程,了解RAG落地背后的机制。安装 mi…- 9
- 0
-
为什么RAG系统要拥抱向量检索?揭示关键字检索的致命弱点!
搭建RAG系统时,使用 向量检索 的原因主要在于其能够有效解决传统 关键字检索 的 局限性,并提升检索的准确性和效率。那么关键字检索到底存在什么局限性?向量检索是如何解决的?这篇文章文章带你搞明白这背后的原因。关键字检索的局限性传统关键字检索依赖于词频统计,如基于BM25的倒排索引,这种方式无法理解语义信息,因此在处理复杂查询时存在以下问题:语义理…- 6
- 0
-
不要盲目再使用DeepSeek R1和QWQ这些推理模型做RAG了
DeepSeek R1 在首次发布时就展现出了强大的推理能力。在这篇文章中,我们将详细介绍使用 DeepSeek R1 构建针对法律文件的 RAG 系统的经验。我们之所以选择法律文件,是因为法律专业人士经常面临一项艰巨的任务:浏览案例、法规和非正式法律评论库。即使是最善意的研究也会因检索正确的文档而陷入困境,更不用说准确地总结它们了。这是 RAG 的绝佳领域!我们在大量法律文件数据集的基础上构建了…- 9
- 0
-
r1-reasoning-rag:一种新的 RAG 思路
最近发现了一个开源项目,它提供了一种很好的 RAG 思路,它将 DeepSeek-R1 的推理能力结合 Agentic Workflow 应用于 RAG 检索项目地址https://github.com/deansaco/r1-reasoning-rag.git项目通过结合 DeepSeek-R1、Tavily 和 LangGr…- 2
- 0
-
提高企业 RAG 准确性的分步指南
从PDF文件生成的知识图谱在我之前的博客中,我写到如何使用像Gemini Flash 2.0这样具有非常大上下文大小的新模型进行语义分块,可以显著提高从非结构化数据(如PDF)中的整体检索准确性。在探索这一点时,我开始研究其他策略,以进一步提高响应的准确性,因为在大多数大型企业中,对不准确的容忍度几乎为零,并且应该如此。在这个追求中,我最终尝试了许多不同的东西,在这篇博客中,让我们看看最终帮助提升…- 8
- 0
-
DeepSeek-R1 x Agentic RAG:构建带深度思考开关的知识研究助理|深度长文
RAG是一种基于“检索结果”做推理的应用,这大大限制了类似DeepSeek-R1模型的发挥空间。但又的确存在将RAG的准确性与DeepSeek深度思考能力结合的场景,而不仅仅是回答事实性问题。比如:基于企业知识库与产品文档,写一份市场分析报告。根据已有的技术报告创作一篇公众号文章。你很难用传统的RAG方法去“回答”这样的主题;也无法快速的更换DeepSeek就输出需要的结果。本文将介绍如何结合De…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



















