-
关于RAG系统在多轮对话中的问题改写(优化)方法—使用历史记录改写问题
“ 基于大模型的RAG多轮对话功能,其检索增强的流程和实际业务的场景可能会存在一定的冲突,而这个平衡点却很难把握。”在之前的文章中有讲过一个RAG检索优化的方法论,简单来说就是通过对问题进行改写和优化;比如说用户输入一个问题query,但由于我们无法控制用户的行为,因此用户输入的内容query可以是任何东西,包括可能存在错别字,语义错误,甚至是一些无意义内容。面对这种情况,特别是在多轮对…- 1
- 0
-
Claude Sonnet 4.6 编程实测:免费用户也能用Opus级编程能力
昨天 Anthropic 发了 Claude Sonnet 4.6,免费用户默认模型直接升级到 Opus 级别。我用了一晚上实测,说句实话:这可能是今年性价比最高的一次模型升级。01 Sonnet 4.6 到底升了什么先摆数据。Sonnet 4.6 在 Claude Code 内测中,70% 的开发者更偏好它而不是上一代 Sonnet 4.5。更夸张的是,59% 的人甚至觉得它比 Opus 4.5…- 0
- 0
-
你的RAG知识库,真的“喂”对数据了吗?拆解dify分段策略,告别无效召回
dify源码的解析上一篇推文中,我们亲手实现了 RAG 系统中 5 种实用的文本分段策略,感受到了“手搓”代码的扎实感。今天,我们将更进一步,直接“潜入”广受好评的低代码平台 dify 的源码内部,一探究竟 —— 它究竟是如何优雅且高效地完成知识库文件的分段、向量化与存储的?通过这次对 dify 源码的拆解,我们希望能为大家揭开一个成熟 RAG 系统在数据预处理层面的设计思路与工程实现,…- 1
- 0
-
Google 悄悄升级了 Deep Think,ARC-AGI-2 直接干到 84.6%
刚刚,Google DeepMind 升级了 Gemini 3 的专用推理模式 Deep Think,跑分直接屠榜了。要知道,ARC-AGI-2 是目前公认测试 AI 推理能力的前沿基准,之前没有模型能在这上面拿到特别好看的分数。而升级后的 Deep Think 拿下了 84.6%,对比一下:Claude Opus 4.6 是 68.8%,GPT-5.2 是 52.9%,就连自家的 Ge…- 0
- 0
-
基于大模型的智能问答场景解决方案——RAG提升召回率的关键
“ 知识库的质量才是RAG系统的核心,任何优化手段都是建立在高质量知识库的基础之上。”在目前大模型应用场景中智能问答应该是一个主流的应用方法,在很多领域智能问答已经部分取代人工,不但大大降低了企业的人工成本,而且能够做到7*24小时在线,能够及时解决用户问题。而具体的应用场景有智能客服,业务咨询,医疗教育,金融投资等等多种行业;但目前为止很多人可能还认为AI只适用于那些大型互联网公司,和…- 0
- 0
-
谷歌上线Gemini in Chrome,想免费使用还需打怪升级
前言2026年1月29日谷歌Gemini in Chrome正式上线,拥有谷歌账号的小伙伴可以免费使用。但是根据本人尝试配置过程中的限制还是非常多的,如果你也遇到相同的问题,希望可以帮助到你。当前使用版本Google Chrome Version 144.0.7559.110前提条件官方说明文档:https://support.google.com/gemini/answer/16283624?h…- 0
- 0
-
用合成数据评测 RAG 系统:一份可直接上手的 DeepEval 实操指南
在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,很多人都有这样的困惑:“模型看起来能回答问题,但到底是不是在胡说八道?” “Retriever 到底找得准不准?” “我该怎么知道系统整体是不是可靠的?”这些问题的根源在于——我们缺乏系统化的评测方法。 尤其在项目早期,还没有真实用户数据时,想要验证 RAG 流程的效果就更加困难。今天,我们就…- 0
- 0
-
Jeff Dean 访谈:一页备忘录催生 Gemini 与万 Token 时代
从 MapReduce、BigTable 到 TPU、Google Brain,再到 Gemini,Jeff Dean 参与或主导了 Google 几乎所有核心 AI 基础设施的构建。他是 Google 的第 30 号员工,现任首席科学家、Gemini 项目负责人。在 Latent Space 播客最近一期节目中,主持人 Alessio 和 Swyx 与 Jeff Dean 进行了一个多…- 0
- 0
-
2025 年 RAG 最佳 Reranker 模型
检索增强生成(RAG) 标志着自然语言处理向前迈出了重要一步。它允许大型语言模型(LLM) 在创建响应之前检查训练数据之外的信息,从而提高其性能。这意味着 LLM 可以很好地处理特定的公司知识或新信息,而无需进行昂贵的重新训练。RAG 的重排序器在优化检索到的信息方面发挥着至关重要的作用,确保提供最相关的上下文。RAG 将信息检索与文本生成相结合,从而生成准确、相关且听起来自然的答案。为什么初始检…- 0
- 0
-
大年初二炸场!Claude Sonnet 4.6 突发上线:拥有 Opus 水平,编程能力史诗级进化
昨天(大年初一),阿里 Qwen 团队除夕夜刚给大家送上了一份“硬核年货” —— Qwen 3.5 开源版,让不少技术人除夕夜都没睡好。万万没想到,大洋彼岸的 Anthropic 也是“上赶着祝贺”,在今天大年初二(2月18日),突然扔出了一枚重磅炸弹——Claude Sonnet 4.6 正式发布。看来硅谷的 AI 巨头们也深谙中国春节的“内卷”之道,生怕大家假期过得太清闲。官方本次发布描述为&…- 0
- 0
-
HiRAG问答流程深入分析
前言近期一直在做知识图谱问答,参考了不少前沿的GraphRAG论文思想,这篇文章,主要深入分析下HiRAG是如何工作的。项目结构对GraphRAG不熟悉的同学,可以先看看 LightRAG 或者 微软的 GraphRAG知识图谱构建graph TD subgraph "知识图谱构建" …- 0
- 0
-
Claude Code Skills 完全指南:从“菜鸟”到“专家”的进阶之路
还在为每次写代码都要重复解释项目规范而烦恼吗?Claude Code Skills 帮你把“知识”打包,让 AI 成为你的专属专家。一、什么是 Claude Code Skills?Claude Code Skills我的理解就是给大模型的技能工具包,他是可复用的指令包,通过封装团队的工作流程,业务逻辑和领域知识,解决了 AI 缺乏专业知识的鸿沟。它将特定的程序化知识、业务逻辑和执行脚本打包,让 …- 0
- 0
-
LightRAG × Yuxi-Know——「知识检索 + 知识图谱」实践案例
一、LightRAG:把“图结构”装进 RAG 的双层检索大脑LightRAG 的核心设计思路是:在传统向量召回基础上,显式引入知识图谱(KG),形成“低层语义块 + 高层图结构”的双层检索,让答案既能对齐语义又能走通逻辑路径。近期它还把多模态接进来了,并提供了开箱即用的 Server/UI/Docker 形态,易于部署集成。你能得到什么:•多模态 RAG(文本 / 图片 / Offic…- 0
- 0
-
Peter Thiel花3500万美金投了一个销售领域的Claude Code,号称要终结Salesforce时代
你知道有多少前景光明的创业公司最终倒在了销售这关吗?产品做得再好,技术再先进,如果卖不出去,一切都是空谈。我在过去几年里见过太多这样的案例:团队技术过硬,融资顺利,产品也确实解决了真实痛点,但就是无法产生可重复的收入,最终只能黯然退场。这个问题困扰了整个创业生态系统,特别是那些由技术创始人主导的早期创业公司。他们懂产品,懂技术,但对销售一窍不通。当我看到前 Founders Fund 合伙人 Sa…- 0
- 0
-
PG用户福音|一次性搞定RAG完整数据库套装
一次性搞定构建RAG的完整数据库套件要在数据库中构建高效的RAG, 除了向量搜索能力还需要什么?FTS: 关键词(特征)检索multi-vectors search: 支持细粒度相似性查询, 传统向量检索基于聚合向量(也就是句子中所有token的向量聚合成1个向量后进行检索, 将丢失token的特征; 这也是为什么混合搜索会兴起的原因之一!)《不是混合搜索? 另一种解决方案提高向量搜索结果相关性!…- 0
- 0
-
Cloudflare推出Markdown for Agents:AI抓取网页的方式彻底变了
Cloudflare最近推出的Markdown for Agents功能,让AI抓取网页的方式发生了根本变化。这项技术允许网站在服务器端直接将HTML内容实时转换为Markdown格式,而不是让每个AI系统各自进行转换。这个功能的关键在于内容协商机制。当AI系统在HTTP请求头中添加Accept: text/markdown时,启用该功能的Cloudflare网站就会直接返回Markdown格式的…- 0
- 0
-
任何格式RAG数据实现秒级转换!彻底解决RAG系统中最令人头疼的数据准备环节
传统RAG系统开发者都知道,从PDF、Word、音频等复杂文件中提取结构化文本,往往需要整合多个工具、编写大量胶水代码,整个流程耗时费力且容易出错。而Docling将这个过程简化为5分钟的自动化流程,支持PDF、DOCX、PPTX、XLSX、HTML、音频、视频字幕等多达15种文件格式,并提供开箱即用的智能分块策略。其核心价值在于彻底解决RAG(检索增强生成)系统中最令人头疼的数据准备环节。Doc…- 0
- 0
-
国产模型再发力!刚刚,字节发布 Doubao 2.0 Pro,硬刚 GPT-5.2!
快过年了,国产模型这几天都要开始搞事情了!前两天,GLM-5 刚刚开源,把 Agentic Engineering 的概念推向高潮,而 DeepSeek 放出了一点风声" data-itemshowtype="8" linktype="text" data-linktype="2">DeepSeek 放出了一点风…- 0
- 0
-
总结了 13 个 顶级 RAG 技术
AI 能否大规模生成真正相关的答案?我们如何确保它理解复杂的多轮对话?我们如何防止它轻率地吐出错误的事实?这些都是现代 AI 系统面临的挑战,尤其是使用 RAG 构建的系统。RAG 将文档检索的强大功能与语言生成的流畅性相结合,使系统能够基于上下文感知、基于事实的响应来回答问题。虽然基本的 RAG 系统在处理简单任务时表现良好,但在处理复杂查询、幻听以及长时间交互中的上下文记忆时,它们往往会遇到问…- 0
- 0
-
试用 “全球最强模型” Gemini 3 Deep Think
Google DeepMind 宣布 Gemini 3 Deep Think 现在是全球表现最强的模型,可处理研究级数学与编程问题的推理系统。从 IMO 金牌到研究代理(Research Agent)Google 强调一个核心升级 Deep Think 内部使用 research agent 机制。其流程包括:分步推理(step-by-step reasoning)自检答案修正错误找不到有效解时主…- 0
- 0
-
企业级 RAG 系统实战(2万+文档):10 个项目踩过的坑(附代码工程示例)
So,从这篇开始,我会把日常闲暇时观摩的一些海外优质内容整理和加工后,附上自己的不同观察和思考也通过文章或者视频的形式发布出来,给各位做个参考。主要聚焦在 Reddit、Medium、X、Youtube 等平台。这篇就以 Reddit 上 r/AI_Agents 中一个月前发布的一篇有 905 upvotes 的帖子做个翻译整理。这篇试图说清楚:原帖的中文翻译(人话版)、原帖中四个工程要点的代码示…- 0
- 0
-
一切皆可Agent Skills,无处不在的AI Agent会替代业务流程吗?
一篇文章,看懂业务流程、工作流、Agentic Workflow、AI Agent、Agent Skills之间的区别与联系。没有谁替代谁,只有融合发展。全文约4900字阅读时间8分钟你公司的ERP审批流程,点十几个按钮,转三个部门,等五天才能报销一张发票。隔壁创业公司,一句话跟AI说帮我处理这笔报销,三分钟搞定。老板叫你进办公室:咱们那套三百万的工作流系统,是不是可以扔了?先别慌。我…- 0
- 0
-
RAG-Anything × Milvus:读PDF要集成20个工具的RAG时代结束了!
AI落地主流场景之一是知识库,而做知识库,必定少不了PDF文件。传统RAG要想精准读取这些图文并茂的PDF,就需要集成PyPDF2、OpenCV、Camelot、Tesseract等多个工具,系统庞杂且低效。此外,不同 PDF 各有侧重:报告重图表、财报重表格、论文重公式,如何精准调用这些工具同样难度不低。香港大学数据科学学院刚刚开源的RAG-Anything项目,结合开源的Milvus向量数据库…- 0
- 0
-
豆包大模型2.0发布
今天,豆包大模型正式进入2.0阶段。随着Agent时代到来,大模型将在现实世界发挥更大作用。豆包2.0(Doubao-Seed-2.0)围绕大规模生产环境下的使用需求做了系统性优化,依托高效推理、多模态理解与复杂指令执行能力,更好地完成真实世界复杂任务。豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,灵活适配各类业务场景:豆包2.0 Pro面向深度推理与长链路任务…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!























