-
RAG如七夕,鹊桥大工程:再看文档解析实际落地badcase
今天是2025年8月29日,星期五,北京,雨,8月份的最后一个工作日我们来看两个话题,一个是RAG,一个是文档解析。RAG如七夕,鹊桥大工程,做个比喻,加深印象。文档解析上,还是从使用角度出发, 总结一些问题以及对应的产生逻辑、应对思路。多总结,多归纳,多从底层实现分析,会有收获。一、RAG如七夕,鹊桥大工程今天是七夕节,在社区做了个一个很形象的比喻。七夕搭桥,可以类比RAG,为了让q跟chunk…- 0
- 0
-
简单就是美!Claude Code Ralph循环机制详解
过去一年,很多开发者尝试通过构建复杂系统来实现AI自主编程——多智能体协调器、专职任务子智能体、繁琐的上下文传递……然而最终发现,解决方案可能只需要一个bash 循环(for-loop)。这套技术被称为Ralph Wiggum,由Geoffrey Huntley于2025年7月提出。名称取自《辛普森一家》中那位单纯而执着的角色。随后,该机制获得Anthropic官方认可,并…- 0
- 0
-
OpenAI 发布 GPT-5.3-Codex,一文详解
Claude Opus 4.6 发布大约半小时后,GPT-5.3-Codex 来了Opus 4.6 的博客里说自己拿了 Terminal-Bench 2.0 的最高分,GPT-5.3-Codex 直接交出 77.3%,把这个最高分抢了回去这里对比下两边的跑分GPT-5.3-Codex 把 GPT-5.2-Codex 的编码能力和 GPT-5.2 的推理 + 专业知识能力合进了…- 0
- 0
-
基于智能体增强生成式检索(Agentic RAG)的流程知识提取技术研究
在工业设备维护、工程操作指导等领域,传统技术手册多以非结构化文本、图表混合形式存在,难以直接被人工智能系统或机器人解读。将这些“ legacy 维护手册”转化为机器可读取的结构化流程,成为提升工业效率的关键需求——而精准的流程知识提取(Procedure Knowledge Extraction)技术,正是实现这一目标的核心路径。本文基于新加坡管理大学(SMU)商业信息技术硕士项目中“生成式AI与…- 0
- 0
-
火拼升级!OpenAI、Anthropic同日发布新模型,一个能替你写代码,一个能替公司管流程
凌晨,Anthropic和OpenAI同时上线了新模型Claude Opus 4.6和GPT-5.3-Codex,给两家企业本就在为超级碗广告互呛的激烈气氛又添了一把柴火。当全美观众还在为它俩斥资数百万美元投放的互怼广告津津乐道时,它们已经杀到了同日发新模型这样的正面交锋战场上。 Anthropic发布Claude Opus 4.6:搭载处于Beta阶段的1M上下文窗口 Ant…- 0
- 0
-
RAG 为何能瞬间找到答案?向量数据库告诉你
了解 Hierarchical Navigable Small World (HNSW) 算法如何为当今的 RAG 系统提供动力Retrieval-Augmented Generation (RAG) 是为 Large Language Models (LLMs) 添加外部知识的重要工具。几乎每个 RAG 系统都包含一个向量数据库,用于执行 semantic search。在这种搜索中…- 0
- 0
-
Claude Code最佳实践
文章的名字有点危言耸听,这当然不是我有资格说的话,而是官方今天给出的文档。一直以来,我学习的习惯就是向源头去求解。譬如,如果要弄懂某个机制,我会阅读源码、写邮件和作者沟通;如果要了解某个领域,我会阅读领域内最权威、最经典的书籍;如果要学习某项技术,我会阅读官方文档、实际上手去操作。这里面有一个朴素的观念,即深入才能浅出,越是源头的东西往往越好理解。这里的“好理解”并非指“不动脑”,而是…- 0
- 0
-
寻找RAG通往上下文工程之桥:生成式AI的双重基石重构
序:当知识不再“固态”——AI进入上下文时代你是否曾遇到这些问题:• AI的回答听起来像真的一样,但仔细一查却是假的?• 提问再多遍,它都只会重复同一套说辞?• 想让它解释一个专业概念,结果讲得和外行一样模糊?这正是生成式AI在企业应用中最现实、最痛彻的问题。它们的核心局限,不是不会表达,而是没有足够新鲜的事实支撑,也没有足够明确的意图引导。于是我们看到了两个方向的崛起:检索增强生成(RAG)&n…- 0
- 0
-
自适应RAG:用本地 LLM 构建更聪明的检索增强生成系统
大模型越来越强大,但它们依旧有一个致命短板:知识更新慢。如果直接问 ChatGPT 之类的模型一个近期事件的问题,它很可能答不上来。这就是为什么 RAG(检索增强生成) 变得重要 —— 在回答问题之前,先去找相关资料,再让模型结合这些资料生成答案。不过,RAG 并不是“一刀切”的方案:有些问题根本不需要检索(比如定义类问题),有些问题需要一次检索就能解决,而另一些则需要多次尝试…- 0
- 0
-
Claude Agent SDK 构建 AI Agent 实践:服务端向 Claude Agent SDK 注入环境变量的实践
在使用 Claude Agent SDK 构建 AI Agent 托管平台时,我们遇到了一个棘手的问题:CLI 在受管会话中频繁出现 403 Forbidden 错误,提示 /login。因为 Claude Agent SDK 的 API 需要 ANTHROPIC_AUTH_TOKEN 等环境变量绕过认证,而这个 token 通常存储在…- 0
- 0
-
使用RAG构建高质量知识库(四)- 数据检索
咱们的知识库,经过清洗、分块、向量化后,已经存入向量数据库中了。那么如何检索和召回这些知识?今天就来聊聊RAG的检索策略。检索前优化如果想要达到比较好的检索效果,首先需要对检索的query进行优化。常见的优化策略如下:原始问题改写通常在检索知识库之前,会需要调用大模型,结合上下文对用户的问题进行改写和优化。# 原始对话Q: 请给我推荐一门编程语言A: pythonQ: 我该如何开始?----# 说…- 0
- 0
-
Claude Opus 4.6 发布,跑分霸榜,价格不变
万众期待的 Sonnet 5 没来,Opus 4.6 先来了。Anthropic 今天发布了 Claude Opus 4.6,对自家最强模型做了一次全面升级:更会写代码,更能扛长任务,还学会了自己检查自己的错误。而且,这是 Opus 系列第一次支持 1M token 的上下文窗口(beta)。就是我们的 Claude Code 在自动进行上下文压缩之前,能干更多的活、记性也更好了。跑分,…- 0
- 0
-
RAG检索后如何应用更有效?
1 引言一、核心背景:RAG的价值与关键痛点1. RAG的核心作用检索增强生成(RAG)是提升大型语言模型(LLMs)在知识密集型任务(如需要大量事实支撑的问答、文档生成)中性能的重要技术,它通过为LLMs补充外部检索到的知识,解决了模型参数内知识有限或过时的问题,已成为该领域的主流方法之一。2. RAG的致命痛点:噪声段落的干扰尽管RAG有效,但检索到的文档质量无法保证——存在“低质量噪声段落”…- 0
- 0
-
中门对狙!Claude Opus 4.6和GPT-5.3 Codex同时发布,这下真的AI春晚了。
在全网翘首以盼的等了两天之后,在凌晨2点。Anthropic的新模型Cluade Opus 4.6正式更新了。我说实话,我是真的最近因为AI圈这些模型和产品,熬夜熬的有点扛不住了。但其实最颠最绝望的是,20分钟之后,OpenAI也发了新模型。。。GPT 5.3 Codex也来了。这尼玛,真的是中门对狙了。要了亲命了。。。这两模型都还是得看,因为之前GPT和Claude几乎就是我最常用的维二最主力的…- 0
- 0
-
RAG 不止能检索!它还能在 LangGraph 中当“工具调用大脑”
Retrieval-Augmented Generation(RAG)是一种结合信息检索和大型语言模型(LLMs)来回答用户查询的方法。传统上,这涉及将检索器直接连接到生成流水线。然而,通过 LangGraph 和 LangChain,我们可以进一步模块化这个过程,将检索器暴露为一个可调用的工具。在这篇博客中,我将展示如何在 LangGraph 中使用工具调用实现一个 RAG 系统。我…- 0
- 0
-
Skills 怎么帮企业 AI 转型?Claude 能力拆解(二)
Skills上架没多久,却极快的占据了Claude产品架构中的核心位置。Skills的出现源于Claude内部员工偶然发现公司里的财务、数据分析等业务部门都在使用自己搭建的skills小工具完成非代码类工作。他们迅速意识到了这个小工具的普世性和易用性,将其作为产品发布了出来,且理所当然的火了。我认为 Skills 对企业 AI 转型有着巨大的作用。然而其价值不在技术本身,而是在组织结构能…- 0
- 0
-
RAG进阶神技:让AI自动将“人话”翻译成SQL和Cypher查询!
在我们之前的文章中我们已经了解了两种预检索的优化策略。比如怎么“翻译”用户那七零八落的问题,还有怎么做一个聪明的“导航员”,把问题带到正确的数据源。那么,现在问题来了,我们知道去哪里找数据了,那我们如何查不同类型的数据呢?这就是我们今天想聊的另一种预检索优化策略:查询构建(Query Construction)。在本文中,我们将聚焦于如何将用户的自然语言问题,翻译成数据源能理解的那套"行…- 0
- 0
-
未来对本地运行的私有模型的需求会日益增长 | Sam Altman最新对话实录
2 月 5 日,OpenAI 首席执行官 Sam Altman 与 Cisco 执行副总裁兼首席产品官 Jeetu Patel 在 Cisco AI Summit 现场围绕 AI Agent 的爆发与范式转移展开了深度对谈。本次对话全面探讨了 Codex 带来的第二次“ChatGPT 时刻”、AI 从生产力工具向“全自动化队友”的身份转变、软件架构为适应 AI 而面临的底层重构、万亿级算力基础设施…- 0
- 0
-
Codex 振臂一呼,众厂商热血响应: Skills 目录即将实现大一统,可惜 Claude Code 没有回应
前些天看到推上有人发帖问:你们都是怎么管理 Skills 的,怎么在各个工具间同步的?我太能理解了,就拿 Claude Code、Codex、Gemini Cli 这仨来说吧,Claude Code 在 .claude/skills,Codex 在 .codex/skills,Gemini Cli 在 .gemini/skills。更别说再加上其他工具里,就比如 Op…- 0
- 0
-
如何将 RAG 检索召回率从 50% 提高到 95% 以上
在本文中,我会分享一些改进 RAG(检索增强生成)应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术,将系统的召回率从大约 50-60% 一直提高到 95% 及以上。召回率对于任何 RAG 应用程序来说都是一个非常重要的指标。它虽然只是衡量检索系统为给定用户问题进行搜索或找到正确文档的能力。但是,这会强烈影响生成的结果的好坏——无论我们是在构建聊天机器人还是其他类似的应用。大多数人现在都…- 0
- 0
-
Claude Code vs. OpenAI Codex为什么更慢的模型,反而更快把事情做完
同时使用 Claude Code 和 OpenAI Codex 的人,常会遇到一个反直觉现象:响应更慢的模型,反而更快把项目做完。问题不在模型强弱,而在工作方式的差异。一、一个反直觉的问题:为什么写得慢,反而交付更快?很多第一次同时用 Claude Code 和 OpenAI Codex 的人,都会产生同一个困惑:Opus 立刻响应,看起来效率极高Codex 半天不动,像是“卡住了”但在真实项目里…- 0
- 0
-
告别“搜不到、搜不准”:用这套查询优化,让你的RAG检索召回率飙升
引言在AI的世界里,有句老话叫“Garbage In, Garbage Out”。对于RAG系统而言,检索环节就是那个“In”,如果检索不到精准、全面的信息,那么即便是最强的LLM也只能望“材”兴叹,甚至开始一本正经地“胡说八道”,俗称产生幻觉。 本篇将聚焦于检索前和检索中的优化,从数据的源头和查询的入口解决“找不到”和“找不准”的核心痛点。一:优化数据源:索引构建的最佳实践核心痛点:粗暴地按固定…- 0
- 0
-
Skills使用体验
Skills概念关于Skills的概念,推荐查阅Anthropic官方文档的描述:“Agent Skills 是扩展 Claude 功能的模块化能力。每个 Skill包含指令、元数据和可选资源(脚本、模板),Claude 在相关时会自动使用这些资源。”https://platform.claude.com/docs/zh-CN/agents-and…- 0
- 0
-
比RAG提升27.4%,阿里等ComRAG利用“质心式”记忆机制实现实时社区问答
社区问答(CQA)平台(如 Stack Overflow、AskUbuntu)沉淀了大量高质量知识,但在工业界落地时仍面临三大挑战:静态知识不足:仅靠官方文档难以覆盖真实业务场景的“坑”。历史 QA 质量参差不齐:早期答案可能已被更好答案取代。实时性 + 存储爆炸:新问题持续涌入,如何快速检索并控制存储增长?现有方法要么只检索社区历史,要么只用静态文档,缺少“动态反思 + 高效存储”的机制。Com…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















