-
多层次理解向量匹配的底层原理
向量匹配原理本质上是:把“对象 / 文本 / 图片 / 行为”等转成向量(一串数字),再用数学方法衡量向量之间的相似度,从而判断它们“有多像”。下面我从 直觉 → 数学 → 工程实现 → 应用场景等多层次给大家系统性的讲清楚。一、直觉层理解1️⃣ 向量是什么?向量 = 对一个对象的“特征编码”比如一句话:“LangChain可以构建智能体”会被编码成类似:[0.12, -0.33, 0.…- 0
- 0
-
2026 年你需要了解的 RAG 全解析
核心概念、架构与更多实践…随着2025年的过去,各类基于 LLM 的系统架构已被广泛采用,并在诸多任务上展现出高效性。其中,Retrieval-Augmented Generation (RAG) 无疑是每位 AI 从业者都必须掌握的关键架构。鉴于其重要性以及原始 RAG 框架在研究与生产系统中的快速演进,本文力求兼顾实用与系统性。每当我写这类重要 AI 主题时,都会尽量深入,覆盖核心概…- 0
- 0
-
官宣,Milvus开源语义高亮模型:告别饱和检索,帮RAG、agent剪枝80%上下文
RAG与Agent用到深水区,一定会遇到这个问题:明明架构很完美,私有数据也做了接入,但项目上线三天,不但token账单爆了,模型输出结果也似乎总差点意思。原因在于,针对大模型的RAG、agent架构,其检索模块,本质上可视为传统搜索做的衍生变体。这就导致了一个问题,传统搜索系统,比如搜索引擎、推荐系统等,需要饱和式输出,保证用户能够收到关于检索结果所有召回信息,然后人类会自动在其中选择适合的信息…- 0
- 0
-
从RAG到记忆工程:AI长期记忆系统的架构范式与落地瓶颈
一场关于技术本质、落地挑战与未来展望的深度对话导读 2025年12月25日晚,记忆张量CTO李志宇与两位行业专家——阶跃星辰Agent研发负责人胡晨、OPPO AI高级算法工程师于明,围绕"记忆工程"展开了一场深入对话。这场讨论不仅是为2026年1月16-17日在北京举办的Agent AI Summit超级智能体系统架构大会预热,更是对这一新兴技术领域的系统性思考。记…- 0
- 0
-
索引选不对,成本贵十倍!ScaNN就是电商推荐的最优解
在日常解答Milvus社区中各种用户提问的时候,一个最常见的问题是:Milvus索引这么多,我到底要怎么选?对于常见场景,我们可以参考这两张图但肯定也有用户发现了,Milvus中,还有ScaNN这么一个索引类型怎么没有放进来,这个索引究竟要怎么用?适合什么场景用?先一句话解答,它框架上和IVFPQ非常相似,优点在于改善了PQ编码的一些细节,以及使用了高效的SIMD实现。主要适用于一些中等精度(召回…- 0
- 0
-
Cursor 用文件系统重构上下文工程:5个实践讲透
随着 Agent 能力不断提升,如何高效管理上下文成为关键挑战。Cursor 团队近期发布的"动态上下文发现"工程博客,给出了一套系统性的解法——用文件系统作为外部存储,让 Agent 按需发现、渐进加载。01 从"提前灌输"到"按需发现"Cursor 的核心判断是:预先提供更少的细节,反而能让 Agent 更容易自主地按需提取相关上下文…- 0
- 0
-
CES 2026 | 如何使用 RAG 和安全护栏构建语音智能体
构建智能体不仅仅是“调用 API”,而是需要将检索、语音、安全和推理组件整合在一起,使其像一个统一并互相协同的系统一样运行。每一层都有自己的接口、延迟限制和集成挑战,一旦跨过简单的原型就会开始感受到这些挑战。在本教程中,您将学习如何使用 2026 年 CES 发布的最新 NVIDIA Nemotron 语音、检索增强生成 (RAG)、安全和推理模型,去构建一个带有护栏的语音驱动…- 0
- 0
-
不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解
企业级场景中,无论是做RAG还是Agent,我们都会面临一个问题:出于数据隐私以及合规要求,数据必须保留在本地。但传统的本地存储方案往往存在数据隔离性差、崩溃易丢数据、配置管理混乱、操作不可撤销等问题。Claude Code 通过一套精心设计的存储体系,系统性地解决了这些痛点。以下为核心思路的太长不看版:多项目隔离问题:路径编码的项目目录 + Session文件独立存储 → 不同项目数据…- 0
- 0
-
为RAG装上导航:ToPG通过图遍历,破局复杂查询
https://github.com/idiap/ToPGhttps://arxiv.org/pdf/2601.04859A Navigational Approach for Comprehensive RAG via Traversal over Proposition Graphs一、RAG 的三座“大山”传统 RAG 方案擅长不擅长Chunk-RAG(整块召回)简单事实…- 0
- 0
-
高精度知识库≠Milvus+llm!这份PaddleOCR+混合检索+Rerank技巧请收好
在大型语言模型(LLM)的应用落地中,RAG(检索增强生成)是解决模型幻觉和知识时效性的关键技术。而在RAG的诸多场景中,基于多文档高精度智能分析与问答系统,也就是知识库又必然是我们最常遇到,且企业场景最刚需的一类。那么如何做好知识库?本文将以开源项目Paddle-ERNIE-RAG为例,对其关键技术进行说明介绍。项目地址:https://github.com/LiaoYFBH/Paddle-ER…- 0
- 0
-
AIOps探索:做AIOps不要低估运维领域的RAG带来的影响
研究Aiops有一段时间了,目前手里有不少可落地的方案了,接下来会把这些方案全部整理到我的大模型课程里。同时,欢迎大家把你遇到的场景在评论区留言。我会在能力范围内给你提供思路和建议。我发现对AIOps感兴趣的同学大多都聚焦在这几方面:“异常检测”、“智能告警”、“根因分析(RCA)”或者“容量预测”。但很少有人讨论运维领域的RAG。如果你觉得RAG仅仅只是个“高端版全文检索”或者“聊天机器人”,那…- 0
- 0
-
Qwen3-VL 正式开源:多模态 RAG 的关键一环终于补齐
AI模型库 · 今日重点阿里刚刚开源的这套多模态模型,可能会改变“搜索”和“RAG”的底层逻辑如果你最近在关注 AI 模型圈,会发现一个非常明显的变化:大家讨论的不再只是“能不能生成”,而是——能不能真正“理解”。就在 1 月 9 日,阿里通义悄悄扔出了一套重量级开源模型组合:Qwen3-VL-Embedding + Qwen3-VL-Reranker没有铺天盖地的营销,但在开发者圈子里,这套模型…- 0
- 0
-
白嫖一个英伟达的垂直领域 Deep Research 智能体
如果大家玩过类似 cherry stutio, ima 等本地客户端,把自己的专业领域文档导入然后做问答,这很容易做到。但是想要产出一份长篇幅有深度的报告,就力不从心了。如果大家在国内外的网站上体验过 deep research 功能,针对通用话题出一份报告问题不大。但是想要出一份自己专业领域的报告,就无从下手了。好消息,NVIDIA DLI 的在线课程《Build a Deep Research…- 0
- 0
-
Milvus 向量数据库实战:从零构建高性能 RAG 系统
前言在 AI 应用快速发展的今天,向量数据库已成为构建智能检索系统的核心基础设施。Milvus 作为一款开源的高性能向量数据库,在 RAG(Retrieval-Augmented Generation)系统中发挥着关键作用。本文将带你从零开始,基于 Milvus 构建一个完整的 RAG 系统,涵盖数据准备、向量检索、结果重排、位置优化等核心环节,并分享生产环境中的最佳实践和性能优化技巧。1. Mi…- 0
- 0
-
都有混合检索与智能路由了,谁还在给RAG赛博哭坟?
最近一年,互联网上各种为RAG赛博哭坟的帖子不胜枚举。所有内容总结一句话,其实还是那些陈词滥调:大模型上下文已经够长了,可以取代RAG了。但果真如此吗?要知道,上下文再大,本质还是一次性的记忆空间,全量加载token不仅浪费算力,大模型本身的注意力也是有限的,过长的上下文,只会导致上下文输出时模糊重点,反而导致质量下滑。也是因此,RAG不但没死,还从单纯的语义检索进化成了先想清楚该不该检、检什么、…- 0
- 0
-
当 Claude Code 连接 NotebookLM,个人 AI 终于有了“长期记忆”
很多人第一次看到 NotebookLM Skill,都会觉得它是一个挺实用的小工具:让 Claude Code 多了一个可以查资料的能力。这个判断不算错,但严重低估了它的真正威力。因为这件事的本质,不是“多一个工具”,而是个人 AI 架构层级的一次跃迁。一、先别急着谈体验,先看结构我们先把情绪放一边,冷静看一下这套结构本身:一句话概括:这是一个“知识检索 + 本地执行”的闭环系统。注意,这里不是 …- 0
- 0
-
AI 总 “胡说八道”?分类法 + 本体论,让 AI 决策透明可追溯
你有没有遇到过这样的糟心场景:医生对着 AI 辅助诊断报告皱紧眉头,明明患者症状是病毒性感冒,系统却推荐了抗生素治疗方案,稍有不慎就可能误导诊疗;银行客服加班到深夜,几百位客户集中投诉 —— 工资转账被 AI 风控误判为欺诈,账户被临时冻结,影响正常消费;电商运营看着智能客服的回复欲哭无泪,消费者问 “羽绒服能不能机洗”,系统却答非所问扯起面料成分,导致客户流失。AI 越智能,“不可控” 的风险就…- 0
- 0
-
MegaRAG :用“多模态知识图谱”打破 RAG 的“次元壁”
教科书、财报、PPT 里那些图表,AI 终于能看懂了!你有没有这样的经历?上传一份带流程图的技术白皮书,问:“这个架构的核心模块是什么?”→ AI 只复述文字,完全无视旁边的架构图。丢给大模型一本数学教材扫描件,问:“图3.2 如何证明勾股定理?”→ 它答非所问,甚至编造不存在的“图3.2”。问题根源:传统 RAG(检索增强生成)是纯文本范——它把 PDF 切成一块块文字,视觉信息直接丢弃。而人类…- 0
- 0
-
打造你的企业级智能文档问答系统——Everything plus RAG 实战指南
从零开始,用开源技术搭建一个能"读懂"文档的智能问答系统大家好,我是铭毅天下。今天给大家分享一个非常实用的项目——Everything plus RAG 智能文档问答系统。相信大家的电脑上都安装了 Everything,一个磁盘文件快速查找桌面级应用软件。一直以来,我都有个想法,能否做一个 plus 版本,支持文档的全文检索和智能问答?!这个想法萌芽已久,且和同事、朋友做过多次…- 0
- 0
-
LEANN:200GB 压到 6GB,笔记本跑 RAG 不是梦
开篇:做 RAG 应用,向量数据库动辄几十上百 GB,云服务费用一个月小几千。有个开源项目挺有意思,反着来——不存向量,只存关系图,6000 万文档只要 6GB。先说痛点去年给公司搭 RAG 系统,踩了不少坑:云服务贵:Pinecone 免费额度用完,一个月账单 200 刀起本地吃资源:试过 Milvus,100 万文档就要 30 多 GB,服务器内存直接吃满数据出不去:金融客户要求数据不能上云,…- 0
- 0
-
如何用NotebookLM,把枯燥的财报解读成精美的PPT?
Notebook LM,看似是个笔记本,但它绝不是像Notion或Evernote那样,是个只等着我们往里面传文件的空本子。它是Google(全家桶工具Google到底出了多少AI工具?25年Google AI地图!)推出的一款基于RAG(检索增强生成)技术的AI笔记助手,基于我们给的内容,帮我们重新理解、重组和输出。其核心前提是:你先给资料,它再工作。我们可以把它想象成一个超级学霸助手…- 0
- 0
-
这次,RAG记忆被微信AI团队的超图盘活了
https://github.com/Encyclomen/HGMemImproving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling https://arxiv.org/pdf/2512.23959港中大 & WeC…- 0
- 0
-
企业级 RAG + 知识图谱的4 种主流实现路径
前面我们重点讲了 LlamaIndex + Nebula + Milvus 这条“开源组合拳”路线,但它并不是唯一解。在企业级 RAG + 知识图谱的实际落地中,根据业务目标、技术栈偏好、合规要求和团队能力的不同,至少还有 4 种主流实现路径,每种都有成功案例。🧭 企业级 RAG+知识图谱的 5 大实现路径路径核心思想典型用户优势劣势1. 开源组合派(LlamaInd…- 0
- 0
-
企业RAG知识库系统中关于向量数据库的对比选型指南
0 引言选择合适的向量数据库(Vector Store)对 RAG(Retrieval-Augmented Generation,检索增强生成)系统的性能、成本和可扩展性至关重要。本文全面对比了 2024–2025 年最主流的向量数据库选型。1 什么是向量数据库?为什么 RAG 需要它?向量数据库是一种专门用于存储和查询高维嵌入向量(embedding vectors)的数据库。在 RAG 系统中…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















