全部标签

新闻资讯

关于RAG系统在多轮对话中的问题改写(优化)方法—使用历史记录改写问题

“ 基于大模型的RAG多轮对话功能，其检索增强的流程和实际业务的场景可能会存在一定的冲突，而这个平衡点却很难把握。”在之前的文章中有讲过一个RAG检索优化的方法论，简单来说就是通过对问题进行改写和优化；比如说用户输入一个问题query，但由于我们无法控制用户的行为，因此用户输入的内容query可以是任何东西，包括可能存在错别字，语义错误，甚至是一些无意义内容。面对这种情况，特别是在多轮对…
RAG技术
- 1
- 0
charles4月7日
Claude Sonnet 4.6 编程实测：免费用户也能用Opus级编程能力

昨天 Anthropic 发了 Claude Sonnet 4.6，免费用户默认模型直接升级到 Opus 级别。我用了一晚上实测，说句实话：这可能是今年性价比最高的一次模型升级。01 Sonnet 4.6 到底升了什么先摆数据。Sonnet 4.6 在 Claude Code 内测中，70% 的开发者更偏好它而不是上一代 Sonnet 4.5。更夸张的是，59% 的人甚至觉得它比 Opus 4.5…
前沿技术
- 0
- 0
charles4月7日
你的RAG知识库，真的“喂”对数据了吗？拆解dify分段策略，告别无效召回

dify源码的解析上一篇推文中，我们亲手实现了 RAG 系统中 5 种实用的文本分段策略，感受到了“手搓”代码的扎实感。今天，我们将更进一步，直接“潜入”广受好评的低代码平台 dify 的源码内部，一探究竟 —— 它究竟是如何优雅且高效地完成知识库文件的分段、向量化与存储的？通过这次对 dify 源码的拆解，我们希望能为大家揭开一个成熟 RAG 系统在数据预处理层面的设计思路与工程实现，…
RAG技术
- 1
- 0
charles4月7日
Google 悄悄升级了 Deep Think，ARC-AGI-2 直接干到 84.6%

刚刚，Google DeepMind 升级了 Gemini 3 的专用推理模式 Deep Think，跑分直接屠榜了。要知道，ARC-AGI-2 是目前公认测试 AI 推理能力的前沿基准，之前没有模型能在这上面拿到特别好看的分数。而升级后的 Deep Think 拿下了 84.6%，对比一下：Claude Opus 4.6 是 68.8%，GPT-5.2 是 52.9%，就连自家的 Ge…
前沿技术
- 0
- 0
charles4月7日
基于大模型的智能问答场景解决方案——RAG提升召回率的关键

“ 知识库的质量才是RAG系统的核心，任何优化手段都是建立在高质量知识库的基础之上。”在目前大模型应用场景中智能问答应该是一个主流的应用方法，在很多领域智能问答已经部分取代人工，不但大大降低了企业的人工成本，而且能够做到7*24小时在线，能够及时解决用户问题。而具体的应用场景有智能客服，业务咨询，医疗教育，金融投资等等多种行业；但目前为止很多人可能还认为AI只适用于那些大型互联网公司，和…
RAG技术
- 0
- 0
charles4月7日
谷歌上线Gemini in Chrome，想免费使用还需打怪升级

前言2026年1月29日谷歌Gemini in Chrome正式上线，拥有谷歌账号的小伙伴可以免费使用。但是根据本人尝试配置过程中的限制还是非常多的，如果你也遇到相同的问题，希望可以帮助到你。当前使用版本Google Chrome Version 144.0.7559.110前提条件官方说明文档：https://support.google.com/gemini/answer/16283624?h…
前沿技术
- 0
- 0
charles4月7日
用合成数据评测 RAG 系统：一份可直接上手的 DeepEval 实操指南

在构建 RAG（Retrieval-Augmented Generation，检索增强生成）系统的过程中，很多人都有这样的困惑：“模型看起来能回答问题，但到底是不是在胡说八道？” “Retriever 到底找得准不准？” “我该怎么知道系统整体是不是可靠的？”这些问题的根源在于——我们缺乏系统化的评测方法。尤其在项目早期，还没有真实用户数据时，想要验证 RAG 流程的效果就更加困难。今天，我们就…
RAG技术
- 0
- 0
charles4月7日
Jeff Dean 访谈：一页备忘录催生 Gemini 与万 Token 时代

从 MapReduce、BigTable 到 TPU、Google Brain，再到 Gemini，Jeff Dean 参与或主导了 Google 几乎所有核心 AI 基础设施的构建。他是 Google 的第 30 号员工，现任首席科学家、Gemini 项目负责人。在 Latent Space 播客最近一期节目中，主持人 Alessio 和 Swyx 与 Jeff Dean 进行了一个多…
前沿技术
- 0
- 0
charles4月7日
2025 年 RAG 最佳 Reranker 模型

检索增强生成(RAG) 标志着自然语言处理向前迈出了重要一步。它允许大型语言模型(LLM) 在创建响应之前检查训练数据之外的信息，从而提高其性能。这意味着 LLM 可以很好地处理特定的公司知识或新信息，而无需进行昂贵的重新训练。RAG 的重排序器在优化检索到的信息方面发挥着至关重要的作用，确保提供最相关的上下文。RAG 将信息检索与文本生成相结合，从而生成准确、相关且听起来自然的答案。为什么初始检…
RAG技术
- 0
- 0
charles4月7日
大年初二炸场！Claude Sonnet 4.6 突发上线：拥有 Opus 水平，编程能力史诗级进化

昨天（大年初一），阿里 Qwen 团队除夕夜刚给大家送上了一份“硬核年货” —— Qwen 3.5 开源版，让不少技术人除夕夜都没睡好。万万没想到，大洋彼岸的 Anthropic 也是“上赶着祝贺”，在今天大年初二（2月18日），突然扔出了一枚重磅炸弹——Claude Sonnet 4.6 正式发布。看来硅谷的 AI 巨头们也深谙中国春节的“内卷”之道，生怕大家假期过得太清闲。官方本次发布描述为&…
前沿技术
- 0
- 0
charles4月7日
HiRAG问答流程深入分析

前言近期一直在做知识图谱问答，参考了不少前沿的GraphRAG论文思想，这篇文章，主要深入分析下HiRAG是如何工作的。项目结构对GraphRAG不熟悉的同学，可以先看看 LightRAG 或者微软的 GraphRAG知识图谱构建graph TD subgraph "知识图谱构建" …
RAG技术
- 0
- 0
charles4月7日
Claude Code Skills 完全指南：从“菜鸟”到“专家”的进阶之路

还在为每次写代码都要重复解释项目规范而烦恼吗？Claude Code Skills 帮你把“知识”打包，让 AI 成为你的专属专家。一、什么是 Claude Code Skills？Claude Code Skills我的理解就是给大模型的技能工具包，他是可复用的指令包，通过封装团队的工作流程，业务逻辑和领域知识，解决了 AI 缺乏专业知识的鸿沟。它将特定的程序化知识、业务逻辑和执行脚本打包，让 …
前沿技术
- 0
- 0
charles4月7日
LightRAG × Yuxi-Know——「知识检索 + 知识图谱」实践案例

一、LightRAG：把“图结构”装进 RAG 的双层检索大脑LightRAG 的核心设计思路是：在传统向量召回基础上，显式引入知识图谱（KG），形成“低层语义块 + 高层图结构”的双层检索，让答案既能对齐语义又能走通逻辑路径。近期它还把多模态接进来了，并提供了开箱即用的 Server/UI/Docker 形态，易于部署集成。你能得到什么：•多模态 RAG（文本 / 图片 / Offic…
RAG技术
- 0
- 0
charles4月7日
Peter Thiel花3500万美金投了一个销售领域的Claude Code，号称要终结Salesforce时代

你知道有多少前景光明的创业公司最终倒在了销售这关吗？产品做得再好，技术再先进，如果卖不出去，一切都是空谈。我在过去几年里见过太多这样的案例：团队技术过硬，融资顺利，产品也确实解决了真实痛点，但就是无法产生可重复的收入，最终只能黯然退场。这个问题困扰了整个创业生态系统，特别是那些由技术创始人主导的早期创业公司。他们懂产品，懂技术，但对销售一窍不通。当我看到前 Founders Fund 合伙人 Sa…
前沿技术
- 0
- 0
charles4月7日
PG用户福音｜一次性搞定RAG完整数据库套装

一次性搞定构建RAG的完整数据库套件要在数据库中构建高效的RAG, 除了向量搜索能力还需要什么?FTS: 关键词(特征)检索multi-vectors search: 支持细粒度相似性查询, 传统向量检索基于聚合向量(也就是句子中所有token的向量聚合成1个向量后进行检索, 将丢失token的特征; 这也是为什么混合搜索会兴起的原因之一!)《不是混合搜索? 另一种解决方案提高向量搜索结果相关性!…
RAG技术
- 0
- 0
charles4月7日
Cloudflare推出Markdown for Agents：AI抓取网页的方式彻底变了

Cloudflare最近推出的Markdown for Agents功能，让AI抓取网页的方式发生了根本变化。这项技术允许网站在服务器端直接将HTML内容实时转换为Markdown格式，而不是让每个AI系统各自进行转换。这个功能的关键在于内容协商机制。当AI系统在HTTP请求头中添加Accept: text/markdown时，启用该功能的Cloudflare网站就会直接返回Markdown格式的…
前沿技术
- 0
- 0
charles4月7日
任何格式RAG数据实现秒级转换！彻底解决RAG系统中最令人头疼的数据准备环节

传统RAG系统开发者都知道，从PDF、Word、音频等复杂文件中提取结构化文本，往往需要整合多个工具、编写大量胶水代码，整个流程耗时费力且容易出错。而Docling将这个过程简化为5分钟的自动化流程，支持PDF、DOCX、PPTX、XLSX、HTML、音频、视频字幕等多达15种文件格式，并提供开箱即用的智能分块策略。其核心价值在于彻底解决RAG（检索增强生成）系统中最令人头疼的数据准备环节。Doc…
RAG技术
- 0
- 0
charles4月7日
国产模型再发力！刚刚，字节发布 Doubao 2.0 Pro，硬刚 GPT-5.2！

快过年了，国产模型这几天都要开始搞事情了！前两天，GLM-5 刚刚开源，把 Agentic Engineering 的概念推向高潮，而 DeepSeek 放出了一点风声" data-itemshowtype="8" linktype="text" data-linktype="2">DeepSeek 放出了一点风…
前沿技术
- 0
- 0
charles4月7日
总结了 13 个顶级 RAG 技术

AI 能否大规模生成真正相关的答案？我们如何确保它理解复杂的多轮对话？我们如何防止它轻率地吐出错误的事实？这些都是现代 AI 系统面临的挑战，尤其是使用 RAG 构建的系统。RAG 将文档检索的强大功能与语言生成的流畅性相结合，使系统能够基于上下文感知、基于事实的响应来回答问题。虽然基本的 RAG 系统在处理简单任务时表现良好，但在处理复杂查询、幻听以及长时间交互中的上下文记忆时，它们往往会遇到问…
RAG技术
- 0
- 0
charles4月7日
试用 “全球最强模型” Gemini 3 Deep Think

Google DeepMind 宣布 Gemini 3 Deep Think 现在是全球表现最强的模型，可处理研究级数学与编程问题的推理系统。从 IMO 金牌到研究代理（Research Agent）Google 强调一个核心升级 Deep Think 内部使用 research agent 机制。其流程包括：分步推理（step-by-step reasoning）自检答案修正错误找不到有效解时主…
前沿技术
- 0
- 0
charles4月7日
企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

So，从这篇开始，我会把日常闲暇时观摩的一些海外优质内容整理和加工后，附上自己的不同观察和思考也通过文章或者视频的形式发布出来，给各位做个参考。主要聚焦在 Reddit、Medium、X、Youtube 等平台。这篇就以 Reddit 上 r/AI_Agents 中一个月前发布的一篇有 905 upvotes 的帖子做个翻译整理。这篇试图说清楚：原帖的中文翻译（人话版）、原帖中四个工程要点的代码示…
RAG技术
- 0
- 0
charles4月7日
一切皆可Agent Skills，无处不在的AI Agent会替代业务流程吗？

一篇文章，看懂业务流程、工作流、Agentic Workflow、AI Agent、Agent Skills之间的区别与联系。没有谁替代谁，只有融合发展。全文约4900字阅读时间8分钟你公司的ERP审批流程，点十几个按钮，转三个部门，等五天才能报销一张发票。隔壁创业公司，一句话跟AI说帮我处理这笔报销，三分钟搞定。老板叫你进办公室：咱们那套三百万的工作流系统，是不是可以扔了？先别慌。我…
前沿技术
- 0
- 0
charles4月7日
RAG-Anything × Milvus：读PDF要集成20个工具的RAG时代结束了！

AI落地主流场景之一是知识库，而做知识库，必定少不了PDF文件。传统RAG要想精准读取这些图文并茂的PDF，就需要集成PyPDF2、OpenCV、Camelot、Tesseract等多个工具，系统庞杂且低效。此外，不同 PDF 各有侧重：报告重图表、财报重表格、论文重公式，如何精准调用这些工具同样难度不低。香港大学数据科学学院刚刚开源的RAG-Anything项目，结合开源的Milvus向量数据库…
RAG技术
- 0
- 0
charles4月7日
豆包大模型2.0发布

今天，豆包大模型正式进入2.0阶段。随着Agent时代到来，大模型将在现实世界发挥更大作用。豆包2.0（Doubao-Seed-2.0）围绕大规模生产环境下的使用需求做了系统性优化，依托高效推理、多模态理解与复杂指令执行能力，更好地完成真实世界复杂任务。豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型，灵活适配各类业务场景：豆包2.0 Pro面向深度推理与长链路任务…
前沿技术
- 0
- 0
charles4月7日