-
RAG落地实践:知识库三层架构和关键组件
在当前LLM(大型语言模型)的应用浪潮中,检索增强生成(RAG)已成为相对成熟且应用最广的落地模式之一。但无论是从最初的Naive RAG演进到Advanced RAG,还是最新的Agentic RAG,其核心都离不开一个关键底座:知识库管理系统。对于面向落地应用RAG的产品经理和工程化技术人员而言,如果只是停留在对LLM能力或RAG流程的表面理解,很难在真实复杂的业务场景中建立起高效、稳定的智能…- 0
- 0
-
拆解 Dify 节点:搭建 AI 应用,这些 “积木” 怎么用?
在AI应用搭建的世界里,dify就像一个神奇的“积木工坊”,一堆节点各有神通,能组合出千变万化的智能场景。今天咱们就来拆解这些节点,搞懂它们在啥场景派上用场,帮你轻松搭出专属AI应用!一、核心“大脑”与“知识库”节点(一)LLM:大模型“心脏”作用:对接GPT、豆包等大语言模型,让AI拥有文本生成、问答、逻辑推理的核心能力。场景举例:写营销文案时,让它生成抓人眼球的产品推广语;解答知识类提问,像“…- 0
- 0
-
从IDE到Terminal:适合后端宝宝体质的Claude Code工作流|得物技术
目录一、背景二、工具选型 1.Claude Code CLI 2.快速切换模型三、开发环境 1.多屏协作 2.GUI/TUI衔接四、多Agent协作 1.主从架构 2.规范驱动开发(SDD)五、CC拓展 1.命令(co…- 0
- 0
-
Dify x 阿里云 Tablestore:向量检索与结构化数据统一存储方案
今天,dify 正式适配阿里云 Tablestore 向量索引能力,并依托阿里云计算巢提供一键部署体验。企业无需重构现有架构,就能获得更轻的运维负担、更灵活的按需计费,以及面向百亿级数据增长的扩展能力,让生产级 RAG 更容易落地。挑战:Dify 用户在构建生产级 RAG 时,常需额外部署和维护独立向量数据库,面临高昂内存成本、百亿级扩展困难、多系统数据同步复杂等难题,严重制约应用规模化落地。开源…- 0
- 0
-
Dify 又更新了,v1.7.1版本:从默认值设置、OpenAPI 模式增强到K8s纯迁移选项!
dify v1.7.1 版本发布了,新增功能包括为选择输入字段设默认值等;修复了 Langfuse 集成路径等错误;优化了工具提示组件等;还改进了工具列表页面等。此次更新优化了体验,为未来发展奠基。🚀 v1.7.1 新增功能选择输入的默认值:现在,您可以为选择输入字段设置默认值,在使用表单时能提供更流畅的用户体验。感谢 @antonko。(#21192)在条件筛选器中选择变量…- 0
- 0
-
同一个 Claude,为什么别人跑出 78%,你只有 42%?也许你需要Harness工程
事情是从一个让我困惑了很久的现象开始的。去年我做了几个 AI Agent 的项目,遇到一件很奇怪的事。我跑的是 Claude Opus,按理说是当时最强的模型之一。但任务完成率就是上不去,卡在 40% 多。然后我看到有人用同款模型,同类任务,跑出了将近 80%。我当时的第一反应是——他用了什么 prompt trick?还是偷偷微调过?后来才慢慢意识到,不是模型问题,也不是 promp…- 0
- 0
-
RAG检索增强是在给大模型“喂”数据?不,你是在为它构建一整套物流体系
“ RAG就像一套完善的物流管理体系,其核心困难点永远在我们看不到的地方。”在很多人看来,做检索增强生成的难点在于提升检索召回的效率和准确率,因,因此很多人把大量的时间花在优化检索方案上。但作者作为一个对RAG有深入了解的开发人员,恰恰认为RAG真正的难点并不在检索端,而在于知识库的管理。为什么会说RAG的难点在知识库的管理,而不是数据召回?知识库管理很多人都知道RAG是检索增强生成,从…- 0
- 0
-
破除偏见:阻碍生成式AI加速落地的认知桎梏
现状偏见与思维惰性,正悄然拖慢企业推进生成式AI的脚步。以下举措可帮助企业突破这些隐形阻力。哪怕出发点再正确,管理者也会常常在无意中陷入认知与组织层面的偏见,进而影响决策质量。本系列文章将系统梳理这些隐秘却顽固的心理机制,并提供切实可行的应对之策。本期聚焦:阻碍生成式AI加速落地的认知桎梏现实困境一家医疗企业曾制定明确计划,希望加快员工对生成式AI工具的使用。为此,公司投入大量时间与资源,推出覆盖…- 0
- 0
-
ChatGPT VS Claude ,Agent记忆用对话压缩还是RAG按需检索
在高质量 AI Agent 系统里,记忆模块的设计远比看起来复杂,它要解决三个关键问题:怎么存历史对话?什么时候检索?该检索哪些内容?这些问题直接决定了 Agent 的响应速度、资源占用和能力天花板。而我们常用的 ChatGPT、Claude 这类大模型,之所以能记住用户的长期偏好,越用越顺手,本质上是因为它们也算一种极简版 AI Agent。但在记忆模块的设计上,两者走了完全不同的路。最近,一位…- 0
- 0
-
OpenAI发布GPT-5.4金融套件:顶级数据库首次向普通用户开放
有一类数据库,普通人几乎从来不会知道它叫什么名字。穆迪(Moody's)——全球三大信用评级机构之一,它的数据决定一家公司能不能以合理利率借到钱。FactSet——全球顶尖的机构投资分析平台,全球几乎所有主流投行和基金都在用。道琼斯Factiva——覆盖200多个国家、超过3.3万个信息源的商业资讯数据库。这些平台有一个共同点:它们不对个人开放,只卖给机构,年授权费用从数十万到数百万元人…- 0
- 0
-
上下文不等于记忆:从单Agent到多Agent协作,记忆系统是关键
开篇在Agent的浪潮中,我们经历了一次又一次的认知迭代。最初是提示工程,我们学习如何更好地提问;随后是上下文工程,随着窗口从8k卷到1M,我们误以为塞进去就是记住了。但当Manus、Anthropic 等团队开始引入file system和agent skill等概念后,上下文工程的边界又变得日益模糊。😳最近看了AWS re:Invent 2025 中关于memory的一场技术演讲以及Mongo…- 0
- 0
-
在树莓派 Zero 上跑一只轻量级的 ZeroClaw 小龙虾
ZeroClaw 在树莓派 Zero 2 W 上表现出色——它是一个单一的 Rust 二进制文件,无需运行时,也没有动态依赖。启动速度更快,二进制文件大约只有 3.4 MB,内存占用极低。相比之下,OpenClaw 是一个 Node.js 应用,拥有大量 npm 模块和动态依赖,这让它在小…- 0
- 0
-
为什么Claude Code不用RAG?
引言最近看到有一些文章提出了“RAG已死”的观点。核心论据是 Claude Code 开发负责人 Boris Cherny 在一档播客节目[1]中,披露现在的 Claude Code已不再使用RAG,而改用 Agentic Search。他的主要观点如下:起初采用RAG路线,将整个代码库索引一遍,然后用 Voyage 这类检索器上,让模型用提示去查找信息,用的是标准模板。但到最后,团队放弃了结构化…- 0
- 0
-
从“暴力烧Token”到“系统工程”:OpenAI与华为的两条 AI 编程路径
1 AI 编程工具的两种演进路径:算力暴力与工程确定性 2026 年,AI 编程工具的市场演进分化为两条截然不同的路径:模型中心派:其核心逻辑是“模型即一切”。通过推高上下文窗口(Context Window),试图将超大规模的完整工程载入 Prompt,Gemini 1.5/2.0 Pro 支持高达 2M Token,这种超长上下文允许开发者将整个代码仓库作为 Prompt 的一部分进…- 0
- 0
-
图索引性能提升 400%:详解 VSAG 向量检索框架
VSAG 是蚂蚁集团开源的图索引向量检索框架。本文源自 VSAG 团队在 VLDB'25 发表的《VSAG: An Optimized Search Framework for Graph-based Approximate Nearest Neighbor Search》,介绍 VSAG 框架如何通过缓存优化、自动调参和距离计算加速,在保证高召回率前提下将检索性能提升最高 …- 0
- 0
-
我们做了比你更懂 Java 的 AI-Agent — Arthas Agent
Arthas 是 alibaba/arthas 开源的 Java 诊断工具。它能在不重启应用的前提下,动态查看线程/CPU、反编译类、追踪方法耗时、观察入参返回值、执行 OGNL、查看类加载器、线上取证定位问题——几乎是 Java 线上排障的“瑞士军刀”。地址:https://github.com/alibaba/arthas但现实也很直白:Arthas 很强,门槛也很高。你得知道该用哪个命令(t…- 0
- 0
-
告别关键词高亮,语义高亮才是解决搜索 / Agent噪音的标准答案
今天聊一聊怎么在RAG、Agent场景中实现语义高亮(Semantic Highlight)。在AI落地的过程中,我们不管是用电商搜东西、用RAG查文档,还是靠AI Agent做信息挖掘,大家做检索最核心的需求其实就一个:快速找到有用的信息。而高亮功能,就是帮我们快速定位信息的关键。但传统基于关键词匹配的传统高亮,无法根据语义信息做内容定位,市面上已有的Semantic Highlight方案,又…- 0
- 0
-
RLC Pro:AI 时代的企业级 Linux
CIQ推出RLC Pro企业级Linux,为AI时代提供合规、长期支持和工程修复的打包订阅服务,旨在简化企业部署,提升效率和安全。译自:RLC Pro is an enterprise Linux for the AI era[1]作者:Steven J. Vaughan-Nichols构建了流行 Rocky Linux[2] 发行版的公司 CIQ[3],…- 0
- 0
-
让RAG像人类一样“扫视全文”:上下文检索技术详解
尽管大语言模型本身的能力在快速演进,但它依然无法凭空获取训练数据之外最新或专有知识。检索增强生成(RAG, Retrieval-Augmented Generation)正是为解决这一问题而生:在回答问题前,先从知识库中检索相关资料,再让模型参考这些资料生成答案。换言之,RAG让大模型从“闭卷考试”变成了“开卷考试”。但“开卷”也不一定更容易。如果检索到的资料不完整、不准确,能力再强的大模型也无法…- 0
- 0
-
我搭了一套国产的小龙虾方案,成本可控,还能 24小时自动干活
前几天我们发了一篇10w+,是国外大神的 OpenClaw 使用方案,后台收到好多小伙伴的留言:太烧Token了,国内用不了Claude。我们就想着能不能搭一套国产的入门方案,成本可控,还能 24 小时自动干活?试了一圈,真让我们搞出来了。用的是 nanobot(轻量级框架)+ Seed 2.0(国产大模型)+ Claude Code(终端 AI 工具)这个组合,搭了一套自动化编程系统。VLM 视…- 0
- 0
-
Uber 如何利用 OpenSearch 实现十亿级向量搜索
介绍在 Uber,我们的系统每天处理海量数据,涵盖从拼车到外卖的各个环节。我们传统上使用基于关键词的 Apache Lucene ^™^搜索。然而,我们需要超越简单的关键词匹配,转向语义搜索,才能理解搜索背后的含义。 为了实现这一目标,我们采用了 Amazon® ^OpenSearch^作为向量搜索引擎。其可扩展性、性能和灵活性是我们做出这一决定的关键因素。这篇博文将探讨我们…- 0
- 0
-
粮厂研究员Will | 小米miclaw发布:谈谈为什么豆包手机没有撑过72小时?
小米今天发布了一个叫 Xiaomi miclaw 的产品,同时开启邀请制封测。没有发布会,没有大规模宣传,但消息传出后,小米股价盘中一度上涨逾6%。Xiaomi miclaw 的定位是移动端 Agent,它是一个深度嵌入小米手机操作系统底层的 AI 助手。不同于以往那种只能回答问题的对话框:它能真正帮你把事情做完。理解你的意图之后,它会调用手机里的各种系统能力,自主完成从发短信、管日历、控制家里的…- 0
- 0
-
别让大模型在“垃圾堆”里找金子:深度解析 RAG 的上下文压缩技术
在 RAG(检索增强生成)的工程实践中,我们常常陷入一种“囤积癖”式的误区:为了防止漏掉关键信息,我们恨不得把检索到的 Top 20 文档,连同文件名、页码甚至页眉页脚,一股脑塞进大模型(LLM)的 Prompt 里。毕竟,现在的 GPT-4 Turbo 和 Claude 3 都支持 128k 甚至 200k 的上下文,不用白不用,对吧?但这恰恰是导致 RAG 系统“慢”、“贵”、“笨”的元凶。如…- 0
- 0
-
ChatGPT 5.4 与 OpenClaw 驱动下的 SaaS 市场重构与未来演进
2026年被视为软件工业的分水岭。随着 OpenAI 发布 ChatGPT 5.4以及开源框架 OpenClaw的爆发式普及,全球SaaS市场正在经历一场从“工具属性”向“智能体属性”的结构性转变 。当前的 SaaS 市场正处于动荡期,传统的以席位计费(Seat-based pricing)为核心的商业模式面临崩塌,而以结果导向(Outcome-based)和消费(使用)驱动(Consumptio…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























