全部标签

新闻资讯

自适应RAG：用本地 LLM 构建更聪明的检索增强生成系统

大模型越来越强大，但它们依旧有一个致命短板：知识更新慢。如果直接问 ChatGPT 之类的模型一个近期事件的问题，它很可能答不上来。这就是为什么 RAG（检索增强生成）变得重要 —— 在回答问题之前，先去找相关资料，再让模型结合这些资料生成答案。不过，RAG 并不是“一刀切”的方案：有些问题根本不需要检索（比如定义类问题），有些问题需要一次检索就能解决，而另一些则需要多次尝试…
RAG技术
- 0
- 0
charles4月5日
使用RAG构建高质量知识库（四）- 数据检索

咱们的知识库，经过清洗、分块、向量化后，已经存入向量数据库中了。那么如何检索和召回这些知识？今天就来聊聊RAG的检索策略。检索前优化如果想要达到比较好的检索效果，首先需要对检索的query进行优化。常见的优化策略如下：原始问题改写通常在检索知识库之前，会需要调用大模型，结合上下文对用户的问题进行改写和优化。# 原始对话Q: 请给我推荐一门编程语言A: pythonQ: 我该如何开始？----# 说…
RAG技术
- 0
- 0
charles4月5日
RAG检索后如何应用更有效？

1 引言一、核心背景：RAG的价值与关键痛点1. RAG的核心作用检索增强生成（RAG）是提升大型语言模型（LLMs）在知识密集型任务（如需要大量事实支撑的问答、文档生成）中性能的重要技术，它通过为LLMs补充外部检索到的知识，解决了模型参数内知识有限或过时的问题，已成为该领域的主流方法之一。2. RAG的致命痛点：噪声段落的干扰尽管RAG有效，但检索到的文档质量无法保证——存在“低质量噪声段落”…
RAG技术
- 0
- 0
charles4月5日
RAG 不止能检索！它还能在 LangGraph 中当“工具调用大脑”

Retrieval-Augmented Generation（RAG）是一种结合信息检索和大型语言模型（LLMs）来回答用户查询的方法。传统上，这涉及将检索器直接连接到生成流水线。然而，通过 LangGraph 和 LangChain，我们可以进一步模块化这个过程，将检索器暴露为一个可调用的工具。在这篇博客中，我将展示如何在 LangGraph 中使用工具调用实现一个 RAG 系统。我…
RAG技术
- 0
- 0
charles4月4日
RAG进阶神技：让AI自动将“人话”翻译成SQL和Cypher查询！

在我们之前的文章中我们已经了解了两种预检索的优化策略。比如怎么“翻译”用户那七零八落的问题，还有怎么做一个聪明的“导航员”，把问题带到正确的数据源。那么，现在问题来了，我们知道去哪里找数据了，那我们如何查不同类型的数据呢？这就是我们今天想聊的另一种预检索优化策略：查询构建（Query Construction）。在本文中，我们将聚焦于如何将用户的自然语言问题，翻译成数据源能理解的那套"行…
RAG技术
- 0
- 0
charles4月4日
如何将 RAG 检索召回率从 50% 提高到 95% 以上

在本文中，我会分享一些改进 RAG（检索增强生成）应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术，将系统的召回率从大约 50-60% 一直提高到 95% 及以上。召回率对于任何 RAG 应用程序来说都是一个非常重要的指标。它虽然只是衡量检索系统为给定用户问题进行搜索或找到正确文档的能力。但是，这会强烈影响生成的结果的好坏——无论我们是在构建聊天机器人还是其他类似的应用。大多数人现在都…
RAG技术
- 0
- 0
charles4月4日
告别“搜不到、搜不准”：用这套查询优化，让你的RAG检索召回率飙升

引言在AI的世界里，有句老话叫“Garbage In, Garbage Out”。对于RAG系统而言，检索环节就是那个“In”，如果检索不到精准、全面的信息，那么即便是最强的LLM也只能望“材”兴叹，甚至开始一本正经地“胡说八道”，俗称产生幻觉。本篇将聚焦于检索前和检索中的优化，从数据的源头和查询的入口解决“找不到”和“找不准”的核心痛点。一：优化数据源：索引构建的最佳实践核心痛点：粗暴地按固定…
RAG技术
- 0
- 0
charles4月4日
比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答

社区问答（CQA）平台（如 Stack Overflow、AskUbuntu）沉淀了大量高质量知识，但在工业界落地时仍面临三大挑战：静态知识不足：仅靠官方文档难以覆盖真实业务场景的“坑”。历史 QA 质量参差不齐：早期答案可能已被更好答案取代。实时性 + 存储爆炸：新问题持续涌入，如何快速检索并控制存储增长？现有方法要么只检索社区历史，要么只用静态文档，缺少“动态反思 + 高效存储”的机制。Com…
RAG技术
- 0
- 0
charles4月4日
如何评估RAG系统：给你的AI助手做个"体检"

你有没有好奇过，为什么ChatGPT总能回答那些它"不应该"知道的问题？比如最新的新闻、你公司的内部资料？其实啊，它有个小秘密——背后有个超级勤快的"图书管理员"在帮忙。你一问问题，这个管理员就飞快地翻遍所有资料，找到相关内容，然后AI再基于这些资料给你答案。这个"图书管理员"就是RAG系统。但是，怎么知道这个助手靠不靠谱呢？…
RAG技术
- 0
- 0
charles4月4日
RAG知识库不等于数据库！90%企业都在做无用功

"我们花了300万上AI系统，结果还不如Excel好用。" 上周在一个技术交流会上，某制造业CTO的这句话引起了全场共鸣。台下不少人都在点头，看来大家都有类似的"血泪史"。这种场景你熟悉吗？公司高层拍板要做AI转型，技术团队加班加点搭建系统，最后却发现AI助手经常"胡说八道"，业务部门宁愿回到传统工作方式。钱花了，人…
RAG技术
- 0
- 0
charles4月4日
提升 Dify 应用 RAG 召回质量的实践

💡 目录 💡 01 dify 内置 RAG 引擎的局限 02 通过 AI 网关帮助 Dify 应用 “开挂” 03 实操指南与效果展示 04 总结与展望Dify 是一款开源的 AI 应用…
RAG技术
- 0
- 0
charles4月4日
RAG 实现多语言客户端技术方案要点分析

场景RAG项目对应的目标客户群体是多个不同国家、不同语言，比如英语、中文、德语等。开发RAG项目，该如何应对这种场景呢？一、知识库搭建1、知识库存储相关数据，是否要多语言存储？若能够提供多语言版本的知识源数据文档，建议各种语言都Embeddings向量化存储一份；可分在不同的表里，也可以在同一个表里。若无法提供多语言版本的知识源数据文档，或有些能有些不能，则只存储其中一份较为完善的文…
RAG技术
- 0
- 0
charles4月4日
一文搞懂大模型：何为深入理解RAG？

当你看到大模型应用开发招聘JD中"深入理解RAG"这个要求时，HR和技术面试官到底在考察什么？本文为你拆解RAG技能的各个层级，明确什么才算"深入理解"。一、理解层级：你在哪一层"深入理解RAG"并不是一个模糊的概念，而是有着清晰的能力层级划分。不同级别的岗位对"深入理解"的要求完全不同。Level 1：概念理解（入门…
RAG技术
- 0
- 0
charles4月4日
高质量AI知识库应用的前提：选对向量数据库

在构建RAG检索增强生成系统时，向量数据库几乎是必选组件。它负责存储和检索向量化的内容，直接影响检索结果的相关性和系统性能。选型不当，可能导致查询不准、响应缓慢、扩展困难等问题。本文将几款主流工具的向量数据库路线、适配场景和使用建议进行了系统整理。读完后，你可以直接判断应该选择哪一种。向量数据库的核心作用向量数据库的核心能力是存储embedding并在查询时快速找到语义相似的内容。在RAG系统中…
RAG技术
- 0
- 0
charles4月4日
深入聊聊RAG

本文深入探讨了RAG（Retrieval Augmented Generation）技术的实现细节与优化策略，指出在AI应用开发中，RAG常被视为黑盒导致问题定位困难。文章从文档分块（Chunking）、索引增强（语义增强与反向HyDE）、编码（Embedding）、混合检索（Hybrid Search）到重排序（Re-Ranking）等关键环节进行了详细解析，强调需结合具体场景对各模块进行调优，…
RAG技术
- 0
- 0
charles4月4日
RAG是个糟糕的概念，AI 应用的真正王牌是上下文工程

AI大模型浪潮汹涌，RAG（检索增强生成）无疑是过去一年最火热的概念之一。几乎所有人都认为，RAG是构建可靠AI应用，解决大模型“幻觉”问题的“银弹”。然而，AI原生向量数据库Chroma的创始人Jeff Huber，却在一次顶级播客访谈中语出惊人：RAG是一个糟糕的概念，它让开发者忽略了真正重要的事情。Jeff认为，当下所有顶尖的AI初创公司，真正擅长且赖以成功的核心能力，其实是另一…
RAG技术
- 0
- 0
charles4月4日
从3%到80%：揭秘Vanna如何用RAG技术革命性地解决AI生成SQL的准确率难题

❝"在数据驱动的时代，让AI理解你的数据库就像教会外星人说人话一样困难。但Vanna做到了，而且做得相当优雅。"引言：当ChatGPT遇上企业数据库的"水土不服"想象一下这样的场景：你兴冲冲地打开ChatGPT，输入"帮我查询一下德国有多少客户"，期待着AI能够生成一条完美的SQL语句。结果呢？AI给你返回了一个看起来很专业的查询：SEL…
RAG技术
- 0
- 0
charles4月4日
对话式 RAG：让你的问答应用更“聪明”

在很多问答（Q&A）应用中，用户希望和机器人进行自然的多轮对话。这意味着应用不仅要能回答单个问题，还需要具备“记忆”功能，把过去的问题和答案利用起来，才能让对话连贯。本文将介绍如何在 RAG（Retrieval-Augmented Generation，检索增强生成）的基础上，扩展支持对话交互。🔑 核心思路传统的 RAG 通常是这样的流程：👉 用户输入问题 → 检索文…
RAG技术
- 0
- 0
charles4月4日
Agentic RAG 开发实践（查询重写、多路召回、路由决策、质量评估、多步重查）

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将检索技术与生成式 AI结合的技术框架。其核心流程包括：存储阶段：对输入文档进行清洗、分块等预处理，并存入知识库；查询阶段：接收查询请求后，通过检索系统获取候选结果，再交由生成式 AI 处理，输出逻辑性更强、可读性更好的答复。在实际应用中，单纯的 RAG 系统往往存在查询质…
RAG技术
- 0
- 0
charles4月4日
大模型应用开发之RAG基本原理

写在前面在大模型应用开发领域，RAG技术栈在其中具有很重要的地位，本文主要通过介绍带大家了解一下什么是RAG技术，RAG技术栈的整体流程，希望对于想要学习RAG技术的你提供帮助。什么是RAGRAG，全称为Retrieval-Augmented Generation（检索增强生成），是一种结合了 “信息检索” 与 “生成式 AI” 的混合 AI 技术。它的核心目标是解决传统大语言模型（L…
RAG技术
- 0
- 0
charles4月4日
从 EchoLeak 到 AgentFlayer：RAG 系统面临的间接 Prompt 注入威胁与防御

随着大模型进入生产环境，RAG（Retrieval-Augmented Generation）已成为降低幻觉、提升准确性的主流手段。同时，由于 AI 可访问更广的企业数据，新的攻击面同步扩大。2025 年 6 月 11 日，Aim Security 披露了 Microsoft 365 Copilot 的“零点击（Zero-Click）”间接 Prompt 注入漏洞 EchoLeak（CV…
RAG技术
- 0
- 0
charles4月4日
数据"烹饪"艺术：如何为RAG系统准备完美食材

你有没有想过，为什么有些AI助手回答问题特别准确，而有些却经常答非所问？昨天我朋友跟公司 AI 客服说“我要请年假”，AI 立刻回了一大段“年假规则第 3.2.1 条、申请入口在 HR 系统→假勤管理→新建流程、需提前 5 个工作日……”他当场头大——全是正确却用不上的说明书式答案，还不如直接甩给他请假按钮。这让我想起一个很形象的比喻：如果把RAG系统比作一个图书馆，那么数据预处理就是…
RAG技术
- 0
- 0
charles4月4日
Passage Injection：让RAG系统在噪声数据中仍保持清醒的推理能力

碎碎念｜持续学习、持续分享一句话概括：论文提出的 Passage Injection 方法通过将检索到的段落明确融入大型语言模型的推理过程，在四种事实问答数据集上显著提升了检索增强生成（RAG）系统的整体性能，尤其增强了模型对含噪声段落（包括随机噪声和反事实噪声）的鲁棒性，同时还能有效利用有用段落。摘要：检索增强生成（RAG）已广泛应用于为大型语言模型（LLM…
RAG技术
- 0
- 0
charles4月4日
RAG关键技术：向量+标量混合检索

前言：RAG（Retrieval Augmented Generation，检索增强生成）是一种结合了信息检索和生成式模型的技术，能够在大模型生成答案时利用外部知识库中的相关信息。它的工作流程可以分为几个关键步骤：解析与切片、向量存储、检索召回、生成答案等。1. 什么是向量+标量混合检索？混合检索（Hybrid Search），特别是向量+标量混合检索，是一种结合了语义相似度检索（向量检索）和精确…
RAG技术
- 0
- 0
charles4月4日