-
用RAG的思路做agent知识管理,为什么跑不通
有多少人在用RAG系统的思路,做Agent的知识管理系统?起手就是文档切分、向量化,然后接下来存向量库,最后检索召回,得到最相关的topK片段给到大模型。然后立刻发现,agent场景中,相似度高,并不一定等于正确。一旦出现跨页面答案,或者几个chunk拼合一起,才能组成正确答案的情况,传统RAG流程,就会力不从心。原因很简单,RAG的这套逻辑是做简单、被动查询用的,不是给Agent用的。Agent…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 2
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 1
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 0
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 0
- 0
-
Chonkie:开源、轻量、极速的 RAG 分块神器 🦛
在不断扩展的大模型上下文里,分块不仅是技术需求,更是确保模型效率的关键手段。然而,面对大部分冗杂的分块工具,不少开发者需要更直接、更有效的解决方案。这时,Chonkie — 一款专为分块任务设计的轻量工具 — 应运而生,成为了 RAG 应用开发中的绝佳帮手。为什么需要分块?随着语言模型能够处理的上下文不断增加,在提供丰富上下文的同时也带来了计算速度与内存开销的挑战。通过分块,…- 0
- 0
-
YC CEO 的 AI 记住了 3000 个人
最近,Garry Tan 在 X 上发了一条推文,附了一个 GitHub 链接。没有长文预告,没有产品发布会,就一句话:「这是我每天用的 AI 系统,源码全在这了。」5300 个 star,几天而已。Garry Tan,Y Combinator 现任 CEO。就是那个孵化了 Airbnb、Stripe、Dropbox、Reddit 的 YC。一个管着几千家创业公司的人,把自己的 AI 记忆系统开源…- 0
- 0
-
AI 答疑助手优化实践:从 RAG 到 LightRAG 的全链路升级
本文针对传统RAG存在的意图识别模糊、知识碎片化及缺乏评测闭环等痛点,提出了一套系统性解决方案:首先,利用思维链(CoT)驱动的意图识别,将用户问题分解为多步逻辑查询并行检索,解决了上下文工程中查询不精准的问题;其次,在检索架构上,对比了GraphRAG高昂的构建成本与维护难度,文章重点阐述了LightRAG的落地实践,通过实体关系抽取与双层检索范式,在保留图结构优势的同时实现了秒级响应与增量更新…- 0
- 0
-
阿里云百炼「记忆库」正式上线,让龙虾真正记住你!
今天,阿里云百炼正式上线「记忆库」功能,让Agent具备跨会话的长期记忆能力,真正实现「越聊越懂用户」的个性化体验。现在,「记忆库」功能限时免费向所有用户开放,用户可通过API直接调用,或通过OpenClaw等Agent产品一键安装。阿里云百炼推出的「记忆库系统」内置了「提取-存储-检索-注入」四大模块,用户每次与AI Agent对话结束后,系统可根据配置的记忆规则自动提取关键信息并存储,并根据用…- 0
- 0
-
用Karpathy的设计哲学重构龙虾助手的知识库架构
在龙虾狂热传播的今天,我们面临一个现实问题:云端API的token成本让持续使用变得极其昂贵。我构建的这套系统,基于Andrej Karpathy的本地化知识库设计哲学,实现了完全本地化的AI能力。这不是概念验证,而是可以日常使用的完整工作流程。PART 01设计逻辑的工程本质这个本地最小化知识库能够处理文本和PDF,完全由本地语言模型和嵌入模型驱动。最令人惊讶的是,这个最小化系统设计思维的实战演…- 0
- 0
-
AI数据工程师在应用中如何"返璞归真"
阿里妹导读本文反思了“知识库+Prompt工程+工具调用”这一轻量级Agent构建模式的局限性,指出其难以应对真实业务场景中的知识质量、语义理解与规模化维护挑战。(本文内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)一、引言:Agent热潮下的实践反思回顾过去2–3年,AI演进速度堪比代码提交频率——快的甚至让人来不及写“注释”。在这波浪潮中,“AI Agent”迅速从学术圈的…- 0
- 0
-
AIOps探索:分享一套保障100%准确率的告警知识检索方案
研究AIOps已有数月,目前手里有不少可落地的方案了,接下来会把这些方案全部整理到我的大模型课程里。欢迎大家把你遇到的场景在评论区留言。我会在能力范围内给你提供思路和建议。经常看我公众号的朋友应该知道,这段时间我整理了很多关于AIOps的一些感想,同时也了解到了不少企业或者团队遇到的问题。其中最为典型的问题就是关于告警以及根因分析。可能对于小规模应用或者平台来说,问题很好解决,因为体量不大,系统复…- 0
- 0
-
全网爆火的大模型AI知识库,保姆级教程来了
构建Karpathy大神同款AI知识库Karpathy 发了一条推文,分享了他近期重点在用 AI 构建个人知识库,短短两天,全网千万人观看。“我最近发现一件非常有用的事:用 LLMs 为各种研究主题建立个人知识库。这样一来,我最近的大部分 token 使用量更多地用于处理内容,而不是编写或修改代码。”然后就在昨天,他公开了整个构建的思路:思路很简单:不要把笔记分散在各种应用里,而是全扔进一个文件夹…- 0
- 0
-
RAG进化了,深扒Claude Code源码中RAG高级技巧
本文基于对Claude Code源码的深入分析,揭示其如何将RAG从"外挂知识库"升级为"操作系统级内存管理"。最近,Claude Code的源码被动开源,引发了广泛关注。在深入分析其源码后,我们发现它完全颠覆了传统RAG(检索增强生成)的玩法。传统RAG大多停留在"文档切分、向量库存储、相似度检索"的初级阶段,而Claude Code则…- 0
- 0
-
Claude Code 源码一夜流出:会看热闹的人很多,会读源码的人很少
2026 年 3 月 31 日下午,Claude Code 的完整源码意外流出来了。不是那种大家想象中的“被黑了”,也不是内部有人泄密,更像是发布 npm 包的时候手一滑,把 source map 也一起带进去了。有朋友闹了个乌龙,看到 Anthropic 官方 GitHub 上有个 claude-code 仓库,就以为它本来已经开源了。但那个仓库更像是个文…- 0
- 0
-
OpenDataLoader:PDF文档提取的一站式方案
很长时间没有关注文档解析这一块的进展,最近发现了一个新的专门针对LLM和RAG场景优化的PDF解析工具OpenDataLoader,在基准测试中取得了0.90 的综合得分,位居同类工具之首。因此本文将深入查看 OpenDataLoader的技术架构、核心特性,并与MinerU、PaddleOCR-VL等主流方案进行对比,分析这个新项目有什么设计亮点。项目概述OpenDataLo…- 0
- 0
-
只用文件系统和 Bash,Vercel 做出了一套高效 RAG
不建向量库,也能做 RAG?Vercel 给了一个新答案Vercel 发了一篇博客:Build knowledge Agents without embeddings。开源了一个知识库agent问答项目 Knowledge Agent Template。该项目不靠“embeddings”实现了一个知识库搜索问答系统。它把知识库当成一个可搜索的文件系统:模型在 sandbox 里调用 gr…- 0
- 0
-
GraphRAG新范式 = LPG + 本体RDF
https://arxiv.org/pdf/2603.22340Graphs RAG at Scale: Beyond Retrieval-Augmented Generation With Labeled Property Graphs and Resource Description Framework for Complex and Unknown Search Spac…- 0
- 0
-
深度解析 PageIndex:无向量 RAG 框架的技术实现与原理剖析
摘要:本文深入剖析 PageIndex 的核心技术细节,详解 PDF/Markdown 文档的结构化索引构建流程、目录智能检测算法、LLM 驱动的树搜索检索机制,以及无向量 RAG 的完整实现原理。无论你是 RAG 技术研究者还是工程实践者,这篇技术解析都将为你揭示一种全新的文档检索范式。⭐ GitHub 14K Stars | 🔗 https://github.co…- 0
- 0
-
使用 Agent Skills 做知识库检索,能比传统 RAG 效果更好吗?
使用 Agent Skills 做知识库检索,是一种什么体验?它能比传统的分块+向量匹配的 RAG 效果更好吗?大家好,欢迎来到 code秘密花园,我是花园老师,这一期我们进入 Agent Skills 的实战章节。基础回顾我们上期视频介绍了 Skills 的工作原理和使用方法,我们简单回顾一下:Skills 是最近 Anthropic 推出的一个 Agent 领域的行业标准,它本身就是一个文件夹…- 1
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!






















