-
打破RAG局限!意图+语义双检索框架来了
1.背景 Science Technology在数字化转型的浪潮中,智能客服和智能外呼(邀约)已成为企业降本增效、提升客户体验的核心工具。它们通过多轮对话技术,模拟真人交互,实现了全天候的即时答疑、业务办理以及主动的客户触达与需求挖掘,应用前景十分广阔。目前,主流的智能对话系统通常基于以下典型的技术方案来实现,其核心流程如下图所示:语音输入与转写系统首先通过ASR技术,将客户的语音实时、…- 0
- 0
-
如何评估Deep Research ?四个Benchmark介绍
BrowseComp,BrowseComp-Plus,GAIA,xbench-DeepSearch这四个数据集和评测基准代表了当前评估 AI Agent(尤其是具备复杂信息检索和“深度研究/Deep Research”能力的智能体)的最前沿标准。它们的核心区别在于评测环境(离线固定语料 vs. 实时在线网络)以及任务考察的侧重点(纯信息检索 vs. 复杂多步推理与工具调用)。以下是这几个数据集的详…- 0
- 0
-
为什么我不再折腾RAG了
我已经很久很久没折腾RAG了。其实我的账号最初就是靠RAG、个人知识库的内容收获了第一批流量、第一批社群成员。但是后来我逐渐不再关注这个技术和相关产品。两个原因。第一,技术局限性。一年前,当我看倒GraphRAG的时候,眼前一亮,因为它解决了传统RAG的严重不足。传统RAG的基础是分块。这会切断知识之间的内在联系,造成上下文孤立。举个例子,有三个分块。A提到了张三,B提到了李四,C提到了张三和李四…- 0
- 0
-
Chaterm Agent Skills + 千问大模型,智能运维再进化
导读凌晨3点被监控告警叫醒,手动排查20分钟才找到问题?Chaterm Agent Skills来帮你!通过深度集成千问大模型,Chaterm的Agent Skills可以将运维经验"打包"成可执行技能,让AI助手自动执行标准流程。Chaterm提供了Chat、Command、Agent三种模式,依托Qwen模型强大的语义理解、可靠的命令生成和智能的Agent任务规划能力,Ch…- 0
- 0
-
ppt检索的RAG方案(多模态、OCR、混合检索)评估结论
ppt RAG主要分下面3种:基于layout+OCR的pipline的以文本主导的RAG方案。基于VLMs+图片向量模型(如:ColPali与Qwen2.5-VL的文档多模态RAG技术流程)的多模态RAG方案。综合上述两种的混合检索那么哪种方式更好?下面主要记录一下评估结论。数据集SlideVQA:是一个为推动演示文稿VQA研究而开发的数据集,包含来自SlideShare 的2619个ppt,包…- 0
- 0
-
关于 AI 应用的一点想法
AI 一天,地上一年。最近 AI 相关应用不断爆火,颇有一点让人学不过来的感觉,AI 应用正不断朝着提升人们生产效率和提升 AI 使用率方向去了。我现在回看 ChatGPT,突然有一种这应用有点过时的感觉... 2025 年一整年 AI 的发展都在朝着一个方向明确的演进,那就是不断提升 AI 外界能力。这里不得不提到一家公司 Anthropic,也就是做出不断火出圈的 Claude Code 工具…- 0
- 0
-
RAG系统优化大揭秘:让你的AI从学渣变学霸的进化之路
大家好啊,今天我要跟各位聊一个有趣的话题:为什么有的RAG系统像学霸,知道的越来越多,而有的却像学渣,天天"编、抄、混"?想象一下,你刚刚给一家书店部署了一个智能助手系统。刚上线那天,老板信心满满,结果第一个顾客问:"你们有《百年孤独》的简体中文新版吗?",AI助手自信地回答:"有的,就在科幻小说区。"老板:......AI也需要&quo…- 0
- 0
-
Claude in Excel,在Excel中直接使用Opus 4.5是一种怎样的体验
Excel应该是职场办公基础技能了,每个人都会使用。用AI来分析Excel数据,本身也不新鲜,随便找个哪家的chatbot,把Excel文件传上去,大模型都能给你哐哐一顿处理。但是直接在Excel中使用AI辅助和AI操作,在这之前,其实相关的产品还不多。WPS很早就推出了AI表格助手,用其实也能用,只能说效果不尽如人意。最近Anthropic推出了Claude in Excel,直接把Claude…- 0
- 0
-
Meta超级智能实验室首篇论文:重新定义RAG
Meta超级智能实验室的首篇论文,来了——提出了一个名为REFRAG的高效解码框架,重新定义了RAG(检索增强生成),最高可将首字生成延迟(TTFT)加速30倍。毕竟算是超级智能实验的“开山之作”,研究一出,就已经在网上掀起了不少的热议。例如Reddti网友表示:若效果真如研究所说的那样,那对RAG来说是相当不错的改进,看起来可以做到在不牺牲准确性的情况下,能显著提高速度和上下文大小。天下苦RAG…- 0
- 0
-
跳出英伟达生态:OpenAI 发布新编程模型 GPT-5.3-Codex-Spark,速度达 1000 token每秒
刚刚,OpenAI 发布了一个新的编程模型,跑在一块餐盘大小的芯片上,每秒能吐出超过 1000 个 token。这个模型叫 GPT-5.3-Codex-Spark,是 GPT-5.3-Codex 的轻量版,专为实时编程设计。来看对比视频:而 Sam Altman 本人在发布前就发出了预告:"It sparks joy for me"。而让它跑这么快,秘密并非 Nvidia 的 …- 0
- 0
-
关于相似度计算和rerank重排序的区别和作用
“ 相似度召回的作用是快速从海量文档中召回相关文档,而rerank重排序的作用是在这些相关文档中找到相关性最高的文档。”这段时间在完成基于RAG的聊天对话系统之后,开始优化各个环节的功能;这时才真正发现,RAG做出来不难,想做好真的不容易。这次在优化上下文结构时发现了一个问题,那就是相似度计算和重排序;在刚开始对相似度计算和重排序的理解就是,通过相似度进行数据召回,然以后再通过重排序找到…- 0
- 0
-
Agent Skills实操心得:Claude Code篇
- |想,都是问题;做,才是答案。| -引言:你是否卡在Skills入门第一步?[ Skills,中文翻译为技能,为方便阅读,本文统一用技能来代表Skills。 ]你是不是也遇到过这种情况?对着Claude的技能官方文档看了半天,准备创建第一个技能时,却发现自己连技能的目录结构都还没搞明白?别担心,今天我们就来聊聊在Claude Code创建技能时,那些让人头痛的点,以及我的一些实操心得…- 0
- 0
-
给RAG打分:小白也能懂的AI系统评测全攻略
你是不是经常被这些问题困扰:"我搭的RAG系统,到底靠不靠谱?""花了大价钱部署的RAG应用,效果怎么还不如直接问ChatGPT?""为啥有时候回答超准,有时候却离谱到天际线?"别担心,今天我们就要聊聊如何给RAG系统打分,就像我们平时给外卖评星一样简单!RAG评测:从"感觉良好"到"有理有据"先来…- 0
- 0
-
来自MiniMax M2.5的震撼 :小尺寸几乎打平opus4.6,巨便宜,巨能干活,速度巨快
MiniMax M2.5 正式发布了,可以肯定的说这一个非常优秀的国产模型,国产模型每一家都有自己的聚焦,MiniMax在进行的是极致优化,没有过多花哨的技术实验,专注于推出的是一款极其方便部署,价格具实惠,能干活,性能对标世界顶尖的模型我先放两张图大家感受一下MiniMax的进化,看一下MiniMax M系列的来时路:尺寸对比,这就有意思了,感觉具有极高的可用性,非常适合家庭实验室部…- 0
- 0
-
向量化与嵌入模型:RAG系统背后的隐形英雄
为什么搜索总是不懂你的心?你是不是也有这种经历?在电商平台上搜索"轻薄笔记本",系统却推荐你"笔记本纸"。这就像你对暗恋对象说:"我喜欢听你说话",结果对方回答:"哦,我也喜欢听歌"。两个人说的都是中文,却完全不在一个频道上。或者更惨的是,你问智能客服:"我的订单什么时候能到?",它回答:"…- 0
- 0
-
我给 Claude Code 加装了 MiniMax M2.5:它像“法拉利”,但更像一台工作机
自从我的 Claude 账号被封之后,Claude Code 这个工具就在我这儿沉寂了一段时间。后来在大师和二爷的提示下,我给 CC 加装了 MiniMax 模型。我本来就是 MiniMax 的 Coding Plan 用户,只要在 .claude 目录下配置 setting.json,把 MiniMax 的 API Key 写进去,CC 就可以直接用 MiniMax 的模型了。之前我一直用 Mi…- 0
- 0
-
当“相似度 ≠ 相关性”:PageIndex 带来的 RAG 新范式
过去两年,RAG(Retrieval-Augmented Generation,检索增强生成)几乎成为了所有 AI 应用的标配。无论是智能客服、企业知识库,还是财务分析、法律文档问答,大家都在用同一套逻辑:把文档切块、向量化,然后通过余弦相似度去匹配,再把检索到的内容丢给大模型进行回答。这套方案简单有效,但问题也显而易见——当问题变得复杂、跨页甚至涉及多层逻辑时,向量相似度检索往往“南辕北辙”。举…- 0
- 0
-
AgentRun 实践指南:Agent 的宝藏工具——All-In-One Sandbox
概述Cloud Native函数计算 AgentRun 是一个以高代码为核心的一站式 Agentic AI 基础设施平台。秉持生态开放和灵活组装的理念,为企业级 Agent 应用提供从开发、部署到运维的全生命周期管理。在开发 AgentRun 的过程中,我们发现了一个让人头疼的问题:现有的沙箱方案太零散了。浏览器、代码执行、Shell 环境各自为政,导致开发效率大打折扣。于是我们决定自己动手,打造…- 0
- 0
-
解锁RAG高阶密码:自适应、多模态、个性化技术深度剖析
当你走进一家智能咖啡厅,第一次来,但AI店员已经知道你是口味偏重的咖啡爱好者,面对你含糊的"来杯日常喝的",它准确推荐了一款中度烘焙的单品。更神奇的是,当你拍下杯中拉花发给朋友时,AI还能告诉你这是什么花式,出自哪位咖啡大师的创意,甚至建议你下次尝试口感更接近的另一款。这,就是我们今天要聊的高级RAG技术在生活中的应用场景。从RAG小白到RAG大神,就差这三项"高级技…- 0
- 0
-
Higress 已支持全新 Gateway API 及其 AI 推理扩展
💡 目录 💡 01 概述 02 Ingress Nginx 退役与应对方案 03 Higress 长期支持 Ingress 04 支持全新 Gateway API 及其 AI 推理扩展 05…- 0
- 0
-
你的 RAG 还在“垃圾进,垃圾出”?我用这套流程,把“废料”文档变成了黄金知识库
最近大家关注dify的进展的话,应该知道它的版本更新直接从1.8.0--->2.0.1了。跨越了一个大的版本。它本次的主要更新就在于知识库构建的知识流水线。我认为Dify2.0以后的知识流水线会极大地降低了构建知识库的门槛,未来也许能高效处理 80% 的相对标准的文档。但是,仍然会有20%,还是要依赖于我们人来手动处理。我们都知道,现阶段来说,对于知识库,仍然是一个垃圾进垃圾出的…- 0
- 0
-
GLM-5 发布:从“写代码”到“写工程”的范式跃迁
2026 年 2 月 11 日深夜,智谱 AI 正式发布新一代旗舰模型 GLM-5。这不是一次常规的版本迭代,而是一场针对 Agentic Engineering 范式的系统性重构。当行业还在讨论“如何让 AI 写出更好的代码”时,GLM-5 已经将目标锁定在“如何让 AI 完成真实的系统工程”。神秘面纱下的实力验证在 GLM-5 正式发布前,一个代号为 “Pony …- 0
- 0
-
应对知识管理挑战:RAG技术如何驱动企业智能化升级
在人工智能技术迅速发展的背景下,检索增强生成(Retrieval-Augmented Generation, RAG)作为一种融合信息检索与自然语言生成的关键技术,正逐步成为企业推进数字化转型的重要工具。近年来,基于 RAG 的解决方案市场需求显著增长,多个行业积极引入该技术以提升知识管理及应用效率。据多家权威机构报告,企业对于 RAG 相关技…- 0
- 0
-
模型能力、提示词、Skill、工作流、Vibe Coding——到底都是什么?
这半年,不管是自己学习 AI ,还是做项目,有五个词反复出现又经常让小白困惑:模型能力、提示词、Skill、工作流、Vibe Coding。它们各自是什么、什么关系、你现在该关心哪个——面向小白和非专业人士,分享一点个人的观点,仅供参考。🧠 模型能力大模型本身具备的底层能力——理解语言、生成文字、识别图片、逻辑推理。ChatGPT、Claude、DeepSeek、豆包,都属于这一层。它是一切的基础…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















