全部标签

新闻资讯

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

一、揭开大模型的神秘面纱：并非万能的"超级大脑"旁白：初次踏入AI领域，你便听闻"大模型"的赫赫威名——能写文案、解难题、聊人生，仿佛拥有无所不能的魔力。于是你满怀期待地与它深度互动，却渐渐发现：它也会"答非所问"，也会"一本正经地胡说八道"，原来所谓的"超级大脑"，也有不少能力边界。今天我们就来深…
RAG技术
- 0
- 0
charles4月10日
货拉拉RAG优化实践：从原始数据到高质量知识库

一、背景知识库一般通过本场景的人工外呼获得专有知识，以及从其他场景的知识库迁移通用知识来人工构建的。图1 知识库初始构建初始构建的知识库一般包含三部分：相似问法、意图、标准话术（如图2所示）；知识库在线上使用时，是将RAG召回的意图、相似问法、标准话术拼接到prompt中，由LLM生成相应的话术，所以知识库意图、相似问法、标准话术的映射关系是否准确尤为重要。图2 相似问法、意图、标准话术的映射关系…
RAG技术
- 0
- 0
charles4月10日
RAG评估:Opik监控追踪RAG应用

随着LLM系统规模的扩大，确保其性能保持稳当可靠成为真正的挑战。因此，构建可靠且高效的基于LLM的应用系统，需要的不仅仅是部署一个模型，还需要持续评估以确保质量和可观察性，以便能够在部署后发现问题。很多团队在兴奋地搭完 RAG 管道后，却发现效果“玄学”：同样一套数据和模型，时而答得精准，时而胡说八道，线上用户反馈也忽好忽坏。到底是检索质量不行？还是生成阶段崩了？抑或上下文过长导致注意力稀释？配置…
RAG技术
- 0
- 0
charles4月10日
Struct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week

本文为Milvus Week系列第二篇，该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践，以下是DAY2内容划重点：Struct Array + MAX_SIM ，能够让数据库看懂 “多向量组成一个实体” 的逻辑，进而原生返回业务要的完整结果用向量数据库的人大概率都碰过这类问题：数据库里存的是被拆成片段的向量（比如一篇文档的段落向量、商品的单张图片向量），但业…
RAG技术
- 0
- 0
charles4月10日
企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

SaaS 用不好常卡在“最后一公里”。但 Al Agent 用不好，问题会出在“每一公里”。2025 被普遍视为企业级 Al Agent 的落地拐点：企业从“试试看”走向“用起来”，技术叙事让位于业务结果。美国著名通信 API 服务机构 Plivo 的调研显示，超过六成企业将 Al Agent 列为未来 12 个月的关键布局，“价值导向型…
RAG技术
- 0
- 0
charles4月9日
MCP与数据库的完美结合

知识库检索总是答非所问？复杂查询根本搞不定？模型微调成本又太高？如果你也被这些问题困扰，今天这篇文章可能会给你一个全新的思路——MCP + 数据库，一种让AI精准检索结构化数据的"黑科技"。实测效果吊打传统RAG，而且几乎零代码！RAG的"中年危机"我们以为的RAG vs 现实中的RAG说起RAG（检索增强生成），很多人觉得这是给大模型"接外挂&q…
RAG技术
- 0
- 0
charles4月9日
KnowEval：RAG 工程化的最后一公里，让问答质量有据可依

KnowEval：RAG 工程化的最后一公里，让问答质量有据可依前言为什么需要 KnowEval？在过去一年与众多企业客户的交流中，我们发现一个普遍的痛点：RAG 系统上线后，如何量化评估问答质量？如何系统化提升检索效果？如何在多个优化方案中选择最优解？很多团队花费大量时间调试 RAG 系统，但往往凭感觉调参，缺乏数据支撑。A/B 测试需要人工逐条对比，效率低下。更关键的是，没有一套标…
RAG技术
- 0
- 0
charles4月9日
大模型文本分类：从原理到工程落地（含代码）

1. 大模型时代，文本分类为何需要新方案？1.1 传统文本分类的三大痛点1.2 大模型带来的颠覆性突破2. 核心原理：向量检索 + 大模型的双阶段架构2.1 离线阶段：构建 “标签 - 样本” 知识索引库2.2 在线阶段：两步完成文本分类3. 技术选型：从模型到工具的最佳组合4. 工程落地：核心模块实现4.1 项目结构设计4.2 核心模块实现4.2.1 句子嵌入模型：BGE-base-zh-v1.…
RAG技术
- 0
- 0
charles4月9日
RAG 只是 AI 的上半场，OmniThink 才是类人的真思考（深度）

过去两年，从 ChatGPT 的爆发到各类 AI 应用的遍地开花，RAG（检索增强生成）成了技术圈最热门的词汇之一。几乎每一个企业级 AI 项目，都在谈论如何用 RAG 来增强大模型的能力，让 AI"知道"更多、"懂"更多。但这里有一个被忽视的核心问题：RAG 真的让 AI 变得更聪明了吗？还是我们只是制造了一个更快速的"答案复印机"？在…
RAG技术
- 0
- 0
charles4月9日
从检索增强到自主检索：构建可行动的 Agentic RAG 系统

前言我们主要学习了如何构建多智能体系统，让大模型不仅能够“回答问题”，还能够在复杂任务中进行规划、决策，并通过工具调用完成更高层次的操作。然而，再强的智能体依然离不开一个核心前提——获取准确、可靠、上下文相关的信息。大模型本身并不具备实时知识库，它的知识来源于训练数据，天然具有时效性、覆盖不完整、无法访问企业内部资料等限制。而解决这一问题的关键技术，就是本节课的核心：Agentic RAG。与传统…
RAG技术
- 0
- 0
charles4月9日
RAG被判死刑：Google用一行API架空工程师！

Google宣判RAG死刑！那条曾让无数工程师自豪的技术链，如今只剩下一行API调用。Gemini的File Search，把检索、分块、索引、引用，全都封进了模型内部。开发者不再需要理解流程，只需要上传文件。当智能被自动化吞并，工程师第一次发现，自己也成了被自动化的一部分。在过去几年里，RAG是工程师的底气。他们手动切块、生成向量、建立索引，再把检索到的内容精准拼进prompt。那是一整套细腻又…
RAG技术
- 0
- 0
charles4月9日
目前较优的知识库解决方案

知识库的问题大概跟外星人能否听到甚至听懂旅行者号上面的金唱片是一个问题。AI是否能听懂我们想找什么？又如何感知我们的情绪，旅行者号的解决方案是给了操作说明，然后多种声音模式等。其实我们用RAG搞知识库也可以这么搞，精准的控制切片信息和给AI一个操作手册。总比叫外星人听懂地球语言（自己训练模型）要省事儿很多。逻辑上来说，我们希望AI在工作中如实的向我们反馈信息，而知识库作为必要的验证过程，也有不可或…
RAG技术
- 0
- 0
charles4月9日
RAG不会过时，但你需要这10个上下文处理技巧|Context Engineering系列一

RAG效果不及预期，试试这10个上下文处理优化技巧对大部分开发者来说，搭一个RAG或者Agent不难，怎么把它优化成生产可用的状态最难。在这个过程中，检索效率、准确性、成本、响应速度，都是重点关注问题。那么，如何对其进行优化？业内一致看好Context Engineering也就是上下文工程。本系列文章，将从上下文工程的不同环节（上下文处理与生成、上下文处理、上下文管理）最新的行业探索与进…
RAG技术
- 0
- 0
charles4月9日
深度解析 RAG 索引：决定检索质量的核心机制与六大策略

检索增强生成（RAG）技术正在重塑大语言模型（LLM）获取外部知识的方式。然而，在实际开发中，许多工程师往往过度关注“检索（Retrieval）”环节，而忽视了更为基础的“索引（Indexing）”设计。本文将深入探讨 RAG 索引的本质，指出索引与检索的区别，并结合代码示例，详细解析六种在生产环境中被验证有效的索引策略，旨在帮助开发者构建更精准、低幻觉的语义推理系统。一、什么是 RAG 索引？…
RAG技术
- 0
- 0
charles4月9日
RAG 知识库的四个段位

有个哥们跟我吐槽说公司花了200万搞的AI客服系统，客户问"你们产品有什么优势"，回答居然说"我觉得一般般"。这让我想起了最近在技术圈热议的话题：RAG技术到底该怎么选？说白了，RAG就是让AI从"闭卷考试"变成"开卷考试"。但这个"开卷考试"可不简单，里面的门道多着呢。RAG不是万能药，但没它万万…
RAG技术
- 0
- 0
charles4月9日
基于 RAG 的 AI 搜索技术实践

导读本文介绍了基于 RAG 的 AI 搜索技术实践。今天分享主要包含三部分：1. 搜索演进思路2. 关键技术落地实践：重点阐述技术点的实际落地方式3. 总结展望补充说明：安全合规部分会简要提及，因敏感性不纳入 PPT 总结。分享嘉宾｜钟啸林 NIO（蔚来汽车）搜推算法负责人编辑整理｜陈锡杜内容校对｜郭慧敏出品社区｜DataFun01搜索演进思路1.&nb…
RAG技术
- 0
- 0
charles4月9日
深入探索RAPTOR：构建知识森林，突破RAG语义检索瓶颈的技术解析

一、传统检索的痛点现有检索系统（如BM25或向量库）往往存在两大短板：信息碎片化：仅返回孤立文本片段，割裂整体逻辑上下文缺失：难以理解文档的层次结构与宏观主题当传统检索还在“关键词匹配”的平原上徘徊时，RAPTOR已带我们登上语义理解的树冠层。这片由斯坦福培育的“知识森林”，正为LLM注入真正的理解力——未来已来，只是尚未均匀分布。二、RAPTOR的森林建造术RAPTOR通过构建语义摘要树解决上述…
RAG技术
- 0
- 0
charles4月9日
AAAI-26 | Cog-RAG：用双超图，重构RAG的认知流程

Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation 西交、清华、西电联合团队 https://arxiv.org/pdf/2511.13201一、当 RAG 陷入“实体孤岛”Retrieval-Augmented Generation（R…
RAG技术
- 0
- 0
charles4月9日
涌现观点｜从 RAG 到文件系统：Agent 记忆的“逆向进化”

unsetunset困在“上下文迷雾”中的巨兽unsetunset上周五下午，我盯着屏幕上的一个数据，愣了足足十秒。一份 EMNLP 的报告给了我当头一棒：即使你的检索准确率是 100%，一旦上下文超过 30,000 个 Token，推理准确率就会出现断崖式下跌，跌幅最高可达 85%。我感觉像被谁打了一拳。我们一直以为，给 Agent 喂越多的数据，它就越聪明。但这就像给一个正在做微积分的学生，塞…
RAG技术
- 0
- 0
charles4月9日
RAG的进化之路：从DrQA流水线到LLM的即时上下文服务

一、RAG的本质：参数记忆与外部知识的协同艺术检索增强生成（RAG）看似简单——“给定问题，获取相关文档，让模型基于文档作答”，但这背后藏着近十年自然语言处理（NLP）领域在检索、知识表示与模型注入上的持续迭代。其核心是打通两种记忆：参数记忆：存储在模型权重中的通用知识（如语言规律、常识）；非参数记忆：外部知识库（数据库、维基百科、PDF、工单、代码等）中的专属信息。从技术逻辑来看，RAG系统的核…
RAG技术
- 1
- 0
charles4月9日
RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

昨晚和技术团队复盘项目时，大家的一致感受是：传统RAG系统已经走到了尽头。我们花了大半年时间搭建的企业知识问答系统，本以为能解决复杂查询问题，结果用户体验却越来越糟糕。用户问一个稍微复杂的问题，系统就开始胡言乱语，答案支离破碎，根本无法形成完整的逻辑链条。这让我突然意识到一个问题：传统RAG本质上就是个高级搜索工具，就像在图书馆里疯狂翻书找关键词，却永远无法理解书籍背后的深层逻辑。直到GraphR…
RAG技术
- 0
- 0
charles4月9日
RAG数据召回优化方案——先进行标量召回再进行相似度召回

“ RAG召回时最好进行多次过滤，这样才能大大提升召回文档的质量。”关于RAG数据召回技术，大家都都知道现在普遍使用的是相似度(语义)召回方式；但对没有真正实际操作过的人来说，可能会认为RAG只能进行相似度召回；但在真正的业务场景中，标量召回的效果可能会比相似度召回更好。原因在于，RAG的目的是为了更准确的召回与问题相关的内容，但并没有限制具体的召回方式，不论是传统的字符匹配，分词技术(…
RAG技术
- 0
- 0
charles4月9日
多源 RAG 自动化处理：从 0 到 1 构建事件驱动的实时 RAG 应用

前言Cloud Native当企业想用大模型和内部非公开信息打造智能问答系统时，RAG（Retrieval-Augmented Generation，检索增强生成）已成为必备技术。然而，在实际落地中，构建 RAG 应用的数据准备过程繁琐复杂且充满挑战，让很多企业和开发者望而却步。本文将介绍构建 RAG 的最佳实践：通过阿里云事件总线 EventBridge 提供的多源 RAG 处理方案，基于事件驱…
RAG技术
- 0
- 0
charles4月9日
再谈RAG的文档解析——文档解析的难点在哪里？

“ 知识库是RAG的灵魂，一个好的知识库能解决绝大部分RAG问题。”在之前关于RAG的优化文章中，大部分都是在强调检索端的优化，而关于文档解析方面的内容却非常的少，而这也是有原因的。在之前介绍RAG的文章中，曾说过RAG是一种方法论，而不是一项具体的技术；其中有两个比较重要的模块：其一是与大模型相关的上下文管理其二是文档召回模块其中文档召回模块又分为两大块，一块是知识库的构建，另一块是检…
RAG技术
- 0
- 0
charles4月9日