全部标签

RAG技术

最新｜用Qwen3 Embedding+Milvus，搭建最强企业知识库

前言这几天阿里低调放出两款 Qwen3 家族的新模型：Qwen3-Embedding 和 Qwen3-Reranker（都分别包括0.6B轻量版、4B平衡版、8B高性能版三种尺寸）。两款模型基于 Qwen3 基座训练，天然具备强大的多语言理解能力，支持119种语言，覆盖主流自然语言和编程语言。我简单看了下 Hugging Face 上的数据和评价，有几个点蛮值得分享Qwen3-…
RAG技术
- 8
- 0
charles25年6月16日
RAG、Agent、MCP：大模型的破局之道

摘要：在当今数字化时代，大模型凭借其强大的语言理解与生成能力，成为了人工智能领域的焦点。无论是智能客服、内容创作，还是数据分析，大模型都展现出了巨大的潜力，为我们的生活和工作带来了诸多便利。但，看似无所不能的大模型，实则也面临着诸多棘手的困境。主要的问题体现在幻觉、缺乏自主性、工具调用难。面对这些困境，难道大模型就束手无策了吗？当然不是！RAG（检索增强生成）、Agent（智能体）、MCP（模型上…
RAG技术
- 6
- 0
charles25年6月16日
n8n+fastgpt RAG = 王炸！！！用最强AI知识库MCP Server补全 n8n短板

暑假要来了，我的教培业务也要开始进入旺季。小红书、公众号上都要开始做暑假相关的内容但内容生产又成了老大难问题。怎么才能写出不空洞、有垂直业务经验的文章吸引目标客户呢？答案是借助RAG：用行业经验文章形成知识库，每次写文章前都先到知识库搜一下相关内容，再基于这些内容来生产，能最大程度上解决AI幻觉、内容空间等问题。昨天文章也提到，我所有业务工作流都放到了n8n里，但n8n并没有很好的知识库能力。之前…
RAG技术
- 9
- 0
charles25年6月16日
中文 RAG 系统 Embedding 模型选型技术文档（模版）

文档信息项目内容文档版本v2.0创建日期2025-06-10更新日期2025-06-10适用场景中文检索增强生成(RAG)系统技术领域自然语言处理、信息检索1. 选型背景1.1 业务需求中文RAG系统需要高质量的文本向量化能力，以实现准确的语义检索和知识召回。Embedding模型的选择直接影响：• 检索召回的准确性和相关性• 系统整体的问答质量• 部署成本和推理效率• 后续维护和迭代…
RAG技术
- 7
- 0
charles25年6月16日
RAG越来越不准？一文详解元数据与标签的系统优化方法（附完整流程图+实用提示词）

你是不是也遇到过这样的场景？公司刚花大钱上线AI知识库，结果AI助手总是“答非所问”，文档明明都上传了，关键时刻还是找不到想要的答案；苦心搭了一两个月RAG系统，老板随便一问，AI不是遗漏关键信息，就是东拉西扯，感觉还不如直接用大模型；越用越发现：明明投入了不少时间和成本，RAG效果却越来越让人失望？其实，你不是一个人。90%的RAG系统体验不理想，核心问题并不…
RAG技术
- 8
- 0
charles25年6月16日
从 LangChain 到企业级应用：RAG 中 Fixed-Size Chunking 的最佳实践揭秘

众所周知，在构建 RAG（Retrieval-Augmented Generation，检索增强生成）系统的过程中，文档切块策略往往决定了模型检索质量的上限。切得好，信息命中更精准，生成回答更有上下文逻辑；切得差，模型则容易“答非所问”。在众多策略中，Fixed-Size Chunking（固定切块）可谓最简单直接，却也是最常被忽…
RAG技术
- 2
- 0
charles25年6月16日
通过源码对 RAGFlow 检索召回机制的分析

1. 引言RAGFlow 是一个基于深度文档理解的开源 RAG（检索增强生成）引擎。接上文：关于 RAGFlow 项目中 RAG 技术的实现分析。本文将基于对 RAGFlow 源代码的分析，详细解析 RAGFlow 在检索召回（Retrieval）环节的实现机制。2. RAGFlow 整体架构根据 GitHub 仓库首页的介绍，RAGFlow 是一个"基于深度文档理解的开源 …
RAG技术
- 6
- 0
charles25年6月16日
告别 RAG 还太早？听听 Anthropic 怎么说

你有没有向你的RAG系统问过一个具体问题，却得到一个令人沮丧的模糊答案？你并不孤单。以下是一个巧妙的改进方法如何改变游戏规则。想象一下：你为公司的文档建立了一个流畅的RAG（Retrieval Augmented Generation）系统。你问它：“2023年第二季度的收入增长是多少？”它自信地回答：“收入比上一季度增长了3%。”很好，但是……哪家公司？哪个季度？你的系统只是给了你一块拼图，却没…
RAG技术
- 5
- 0
charles25年6月16日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 2
- 0
charles25年6月16日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 5
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 2
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 3
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 3
- 0
charles25年6月8日
动态数据太折磨人！静态RAG搞不定，就试下ZEP，让Agent调用实时知识图谱。

您是否遇到过这样的困扰：明明搭建了完善的RAG系统，但Agent总是回答过时的信息，或者面对历史偏好变化时一脸茫然？三个月前说喜欢激进投资策略，两周前改口要稳健配置，今天又想尝试新兴市场，传统RAG系统只能茫然地检索文档片段，根本无法理解这种动态演进。这不是您的系统有问题，而是静态RAG天生的局限性在作祟。传统RAG在动态场景下水土不服静态文档检索的三大死穴传统RAG系统本质上是一个…
RAG技术
- 2
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 1
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 4
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 1
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 1
- 0
charles25年6月8日
RAG 还是微调？大模型落地选型指南

点击上方蓝字关注我们越来越多的软件测试人员开始关注如何将 LLM（大语言模型）融入测试工作流。但当我们真正想“动手”时，常常会站在一个岔路口：到底该选择 RAG（检索增强生成）框架，还是直接做微调（fine-tuning）？这就像是在改造一辆老旧汽车时的两种方式：一种是加装一个超智能导航系统（RAG），依靠外部的地图来快速响应各种路线变化；另一种是更换整个引擎（微调），让它从底层具备更强的自适应…
RAG技术
- 6
- 0
charles25年6月8日
提升AI问答准确率：请在RAG前先做RAR，超越意图识别

在RAG（检索增强生成）落地的过程中，存在一个效果显著，却常被忽视的技术方法 —— RAR RAR：推理增强检索（Reasoning-Augmented Retrieval） R（检索）与G（生成）：谁才是胜负手从搜索引擎到智能助手，从笔记工具到AI知识库，输入框背后几乎都依赖RAG技术。当大模型让“生成”能力在聚光灯下闪耀发光时，我们往往低估了“检索”的决定性作用。尤其在当前大模型能力唾手可得的…
RAG技术
- 5
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 5
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 1
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 1
- 0
charles25年6月8日
Chonkie：开源、轻量、极速的 RAG 分块神器 🦛

在不断扩展的大模型上下文里，分块不仅是技术需求，更是确保模型效率的关键手段。然而，面对大部分冗杂的分块工具，不少开发者需要更直接、更有效的解决方案。这时，Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生，成为了 RAG 应用开发中的绝佳帮手。为什么需要分块？随着语言模型能够处理的上下文不断增加，在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块，…
RAG技术
- 2
- 0
charles25年6月7日