全部标签

新闻资讯

打破RAG局限！意图+语义双检索框架来了

1.背景 Science Technology在数字化转型的浪潮中，智能客服和智能外呼（邀约）已成为企业降本增效、提升客户体验的核心工具。它们通过多轮对话技术，模拟真人交互，实现了全天候的即时答疑、业务办理以及主动的客户触达与需求挖掘，应用前景十分广阔。目前，主流的智能对话系统通常基于以下典型的技术方案来实现，其核心流程如下图所示：语音输入与转写系统首先通过ASR技术，将客户的语音实时、…
RAG技术
- 0
- 0
charles4月6日
如何评估Deep Research ？四个Benchmark介绍

BrowseComp,BrowseComp-Plus,GAIA,xbench-DeepSearch这四个数据集和评测基准代表了当前评估 AI Agent（尤其是具备复杂信息检索和“深度研究/Deep Research”能力的智能体）的最前沿标准。它们的核心区别在于评测环境（离线固定语料 vs. 实时在线网络）以及任务考察的侧重点（纯信息检索 vs. 复杂多步推理与工具调用）。以下是这几个数据集的详…
前沿技术
- 0
- 0
charles4月6日
为什么我不再折腾RAG了

我已经很久很久没折腾RAG了。其实我的账号最初就是靠RAG、个人知识库的内容收获了第一批流量、第一批社群成员。但是后来我逐渐不再关注这个技术和相关产品。两个原因。第一，技术局限性。一年前，当我看倒GraphRAG的时候，眼前一亮，因为它解决了传统RAG的严重不足。传统RAG的基础是分块。这会切断知识之间的内在联系，造成上下文孤立。举个例子，有三个分块。A提到了张三，B提到了李四，C提到了张三和李四…
RAG技术
- 0
- 0
charles4月6日
Chaterm Agent Skills + 千问大模型，智能运维再进化

导读凌晨3点被监控告警叫醒，手动排查20分钟才找到问题？Chaterm Agent Skills来帮你！通过深度集成千问大模型，Chaterm的Agent Skills可以将运维经验"打包"成可执行技能，让AI助手自动执行标准流程。Chaterm提供了Chat、Command、Agent三种模式，依托Qwen模型强大的语义理解、可靠的命令生成和智能的Agent任务规划能力，Ch…
前沿技术
- 0
- 0
charles4月6日
ppt检索的RAG方案（多模态、OCR、混合检索）评估结论

ppt RAG主要分下面3种：基于layout+OCR的pipline的以文本主导的RAG方案。基于VLMs+图片向量模型（如：ColPali与Qwen2.5-VL的文档多模态RAG技术流程）的多模态RAG方案。综合上述两种的混合检索那么哪种方式更好？下面主要记录一下评估结论。数据集SlideVQA：是一个为推动演示文稿VQA研究而开发的数据集，包含来自SlideShare 的2619个ppt，包…
RAG技术
- 0
- 0
charles4月6日
关于 AI 应用的一点想法

AI 一天，地上一年。最近 AI 相关应用不断爆火，颇有一点让人学不过来的感觉，AI 应用正不断朝着提升人们生产效率和提升 AI 使用率方向去了。我现在回看 ChatGPT，突然有一种这应用有点过时的感觉... 2025 年一整年 AI 的发展都在朝着一个方向明确的演进，那就是不断提升 AI 外界能力。这里不得不提到一家公司 Anthropic，也就是做出不断火出圈的 Claude Code 工具…
前沿技术
- 0
- 0
charles4月6日
RAG系统优化大揭秘：让你的AI从学渣变学霸的进化之路

大家好啊，今天我要跟各位聊一个有趣的话题：为什么有的RAG系统像学霸，知道的越来越多，而有的却像学渣，天天"编、抄、混"？想象一下，你刚刚给一家书店部署了一个智能助手系统。刚上线那天，老板信心满满，结果第一个顾客问："你们有《百年孤独》的简体中文新版吗？"，AI助手自信地回答："有的，就在科幻小说区。"老板：......AI也需要&quo…
RAG技术
- 0
- 0
charles4月6日
Claude in Excel，在Excel中直接使用Opus 4.5是一种怎样的体验

Excel应该是职场办公基础技能了，每个人都会使用。用AI来分析Excel数据，本身也不新鲜，随便找个哪家的chatbot，把Excel文件传上去，大模型都能给你哐哐一顿处理。但是直接在Excel中使用AI辅助和AI操作，在这之前，其实相关的产品还不多。WPS很早就推出了AI表格助手，用其实也能用，只能说效果不尽如人意。最近Anthropic推出了Claude in Excel，直接把Claude…
前沿技术
- 0
- 0
charles4月6日
Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室的首篇论文，来了——提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。毕竟算是超级智能实验的“开山之作”，研究一出，就已经在网上掀起了不少的热议。例如Reddti网友表示：若效果真如研究所说的那样，那对RAG来说是相当不错的改进，看起来可以做到在不牺牲准确性的情况下，能显著提高速度和上下文大小。天下苦RAG…
RAG技术
- 0
- 0
charles4月6日
跳出英伟达生态：OpenAI 发布新编程模型 GPT-5.3-Codex-Spark，速度达 1000 token每秒

刚刚，OpenAI 发布了一个新的编程模型，跑在一块餐盘大小的芯片上，每秒能吐出超过 1000 个 token。这个模型叫 GPT-5.3-Codex-Spark，是 GPT-5.3-Codex 的轻量版，专为实时编程设计。来看对比视频：而 Sam Altman 本人在发布前就发出了预告："It sparks joy for me"。而让它跑这么快，秘密并非 Nvidia 的 …
前沿技术
- 0
- 0
charles4月6日
关于相似度计算和rerank重排序的区别和作用

“ 相似度召回的作用是快速从海量文档中召回相关文档，而rerank重排序的作用是在这些相关文档中找到相关性最高的文档。”这段时间在完成基于RAG的聊天对话系统之后，开始优化各个环节的功能；这时才真正发现，RAG做出来不难，想做好真的不容易。这次在优化上下文结构时发现了一个问题，那就是相似度计算和重排序；在刚开始对相似度计算和重排序的理解就是，通过相似度进行数据召回，然以后再通过重排序找到…
RAG技术
- 0
- 0
charles4月6日
Agent Skills实操心得：Claude Code篇

- ｜想，都是问题；做，才是答案。｜ -引言：你是否卡在Skills入门第一步？[ Skills，中文翻译为技能，为方便阅读，本文统一用技能来代表Skills。 ]你是不是也遇到过这种情况？对着Claude的技能官方文档看了半天，准备创建第一个技能时，却发现自己连技能的目录结构都还没搞明白？别担心，今天我们就来聊聊在Claude Code创建技能时，那些让人头痛的点，以及我的一些实操心得…
前沿技术
- 0
- 0
charles4月6日
给RAG打分：小白也能懂的AI系统评测全攻略

你是不是经常被这些问题困扰："我搭的RAG系统，到底靠不靠谱？""花了大价钱部署的RAG应用，效果怎么还不如直接问ChatGPT？""为啥有时候回答超准，有时候却离谱到天际线？"别担心，今天我们就要聊聊如何给RAG系统打分，就像我们平时给外卖评星一样简单！RAG评测：从"感觉良好"到"有理有据"先来…
RAG技术
- 0
- 0
charles4月6日
来自MiniMax M2.5的震撼：小尺寸几乎打平opus4.6，巨便宜，巨能干活，速度巨快

MiniMax M2.5 正式发布了，可以肯定的说这一个非常优秀的国产模型，国产模型每一家都有自己的聚焦，MiniMax在进行的是极致优化，没有过多花哨的技术实验，专注于推出的是一款极其方便部署，价格具实惠，能干活，性能对标世界顶尖的模型我先放两张图大家感受一下MiniMax的进化，看一下MiniMax M系列的来时路：尺寸对比，这就有意思了，感觉具有极高的可用性，非常适合家庭实验室部…
前沿技术
- 0
- 0
charles4月6日
向量化与嵌入模型：RAG系统背后的隐形英雄

为什么搜索总是不懂你的心？你是不是也有这种经历？在电商平台上搜索"轻薄笔记本"，系统却推荐你"笔记本纸"。这就像你对暗恋对象说："我喜欢听你说话"，结果对方回答："哦，我也喜欢听歌"。两个人说的都是中文，却完全不在一个频道上。或者更惨的是，你问智能客服："我的订单什么时候能到？"，它回答："…
RAG技术
- 0
- 0
charles4月6日
我给 Claude Code 加装了 MiniMax M2.5：它像“法拉利”，但更像一台工作机

自从我的 Claude 账号被封之后，Claude Code 这个工具就在我这儿沉寂了一段时间。后来在大师和二爷的提示下，我给 CC 加装了 MiniMax 模型。我本来就是 MiniMax 的 Coding Plan 用户，只要在 .claude 目录下配置 setting.json，把 MiniMax 的 API Key 写进去，CC 就可以直接用 MiniMax 的模型了。之前我一直用 Mi…
前沿技术
- 0
- 0
charles4月6日
当“相似度 ≠ 相关性”：PageIndex 带来的 RAG 新范式

过去两年，RAG（Retrieval-Augmented Generation，检索增强生成）几乎成为了所有 AI 应用的标配。无论是智能客服、企业知识库，还是财务分析、法律文档问答，大家都在用同一套逻辑：把文档切块、向量化，然后通过余弦相似度去匹配，再把检索到的内容丢给大模型进行回答。这套方案简单有效，但问题也显而易见——当问题变得复杂、跨页甚至涉及多层逻辑时，向量相似度检索往往“南辕北辙”。举…
RAG技术
- 0
- 0
charles4月6日
AgentRun 实践指南：Agent 的宝藏工具——All-In-One Sandbox

概述Cloud Native函数计算 AgentRun 是一个以高代码为核心的一站式 Agentic AI 基础设施平台。秉持生态开放和灵活组装的理念，为企业级 Agent 应用提供从开发、部署到运维的全生命周期管理。在开发 AgentRun 的过程中，我们发现了一个让人头疼的问题：现有的沙箱方案太零散了。浏览器、代码执行、Shell 环境各自为政，导致开发效率大打折扣。于是我们决定自己动手，打造…
前沿技术
- 0
- 0
charles4月6日
解锁RAG高阶密码：自适应、多模态、个性化技术深度剖析

当你走进一家智能咖啡厅，第一次来，但AI店员已经知道你是口味偏重的咖啡爱好者，面对你含糊的"来杯日常喝的"，它准确推荐了一款中度烘焙的单品。更神奇的是，当你拍下杯中拉花发给朋友时，AI还能告诉你这是什么花式，出自哪位咖啡大师的创意，甚至建议你下次尝试口感更接近的另一款。这，就是我们今天要聊的高级RAG技术在生活中的应用场景。从RAG小白到RAG大神，就差这三项"高级技…
RAG技术
- 0
- 0
charles4月6日
Higress 已支持全新 Gateway API 及其 AI 推理扩展

💡 目录 💡 01 概述 02 Ingress Nginx 退役与应对方案 03 Higress 长期支持 Ingress 04 支持全新 Gateway API 及其 AI 推理扩展 05…
前沿技术
- 0
- 0
charles4月6日
你的 RAG 还在“垃圾进，垃圾出”？我用这套流程，把“废料”文档变成了黄金知识库

最近大家关注dify的进展的话，应该知道它的版本更新直接从1.8.0--->2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的门槛，未来也许能高效处理 80% 的相对标准的文档。但是，仍然会有20%，还是要依赖于我们人来手动处理。我们都知道，现阶段来说，对于知识库，仍然是一个垃圾进垃圾出的…
RAG技术
- 0
- 0
charles4月6日
GLM-5 发布：从“写代码”到“写工程”的范式跃迁

2026 年 2 月 11 日深夜，智谱 AI 正式发布新一代旗舰模型 GLM-5。这不是一次常规的版本迭代，而是一场针对 Agentic Engineering 范式的系统性重构。当行业还在讨论“如何让 AI 写出更好的代码”时，GLM-5 已经将目标锁定在“如何让 AI 完成真实的系统工程”。神秘面纱下的实力验证在 GLM-5 正式发布前，一个代号为 “Pony …
前沿技术
- 0
- 0
charles4月6日
应对知识管理挑战：RAG技术如何驱动企业智能化升级

在人工智能技术迅速发展的背景下，检索增强生成（Retrieval-Augmented Generation, RAG）作为一种融合信息检索与自然语言生成的关键技术，正逐步成为企业推进数字化转型的重要工具。近年来，基于 RAG 的解决方案市场需求显著增长，多个行业积极引入该技术以提升知识管理及应用效率。据多家权威机构报告，企业对于 RAG 相关技…
RAG技术
- 0
- 0
charles4月6日
模型能力、提示词、Skill、工作流、Vibe Coding——到底都是什么？

这半年，不管是自己学习 AI ，还是做项目，有五个词反复出现又经常让小白困惑：模型能力、提示词、Skill、工作流、Vibe Coding。它们各自是什么、什么关系、你现在该关心哪个——面向小白和非专业人士，分享一点个人的观点，仅供参考。🧠 模型能力大模型本身具备的底层能力——理解语言、生成文字、识别图片、逻辑推理。ChatGPT、Claude、DeepSeek、豆包，都属于这一层。它是一切的基础…
前沿技术
- 0
- 0
charles4月6日