-
赢得企业RAG挑战赛的秘诀 —— 冠军方案剖析与感悟
RAG 的魔力在于细节The magic of RAG lies in the detailsIlya Rice前不久看到一篇技术博客,是名为 Ilya Rice 的工程师所著(OS:想念另一位Ilya大佬的第N天),文中记录了作者在一次RAG挑战赛中,尝试过的有效方法,及踩过的坑。最终获得比赛第一名后,吐露真言,有感而发地说出了做好RAG的秘诀:「细节」作者虽不是中土人士,但…- 7
- 0
-
AI Agent 的工程化被低估了
近期热度较高的两篇文章[1][2],不约而同的提到了 AI 发展至今,工程化对 AI 应用的作用被低估了。 “比如更好的虚拟机、更长上下文、大量的 MCP、甚至智能合约……等等一系列工程问题都是巨大的需求。” “AI 的工程化工具很多,例如 LangGraph、LangChain,这些都是用于搭建的乐高积木,积木越丰富,组装成复杂结构的能力就越强。” 但工程化一词是很泛化的技术用语,包含的内容极广…- 5
- 0
-
「AI实践笔记」看AI工具拆解业务系统
一.写在前面 最近也在学习吴恩达的新书,在他的书中提到一个观点,大意是虽然不会人人都去设计AI产品,但肯定未来人人都要会使用AI。因此我们要在自己的学习和生活中不断地去探索AI的应用场景。今天我们就从AI工具拆解系统聊起。 本文有如下几个章节: 1.展示拆解成果(展示AI拆解的对应系统文档,以采购业务为例) 2.怎么拆解(使用的AI工具,提…- 7
- 0
-
提升AI问答准确率:请在RAG前先做RAR,超越意图识别
在RAG(检索增强生成)落地的过程中,存在一个效果显著,却常被忽视的技术方法 —— RARRAR:推理增强检索(Reasoning-Augmented Retrieval) R(检索)与G(生成):谁才是胜负手从搜索引擎到智能助手,从笔记工具到AI知识库,输入框背后几乎都依赖RAG技术。当大模型让“生成”能力在聚光灯下闪耀发光时,我们往往低估了“检索”的决定性作用。尤其在当前大…- 8
- 0
-
火山引擎AI大爆发,一个人=一家公司的时代来了!
如果我告诉你,2025年可能出现第一家"一人独角兽公司",你会觉得这是天方夜谭吗?当我在火山引擎FORCE大会上看到完整的AI智能体生态时,突然意识到——这个未来可能比我们想象的更近。作为一个用遍了市面上所有主流大模型的开发者,我必须说:我们正站在一个前所未有的历史转折点上。AI不再是那个只会聊天的工具,而是正在变成真正能干活的数字员工。随着AI全链路进化,智能体落地正在疯狂加…- 7
- 0
-
RAG不好用?试试MCP这个“知识库优化大师”
在企业数字化转型浪潮中,如何有效管理和利用内部知识资产已成为关键挑战。随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。然而,传统RAG实现常面临检索质量不佳、实时更新困难等痛点问题。本文将通过实战案例,详细介绍如何基于模型上下文协议(MCP)构建一套高性能企业RAG系统,帮助企业快速打造智能知识库应用。MCP与传统RAG对比优…- 6
- 0
-
160行需求文档,32分钟变成可玩游戏,我见证了AI开发的恐怖实力
你相信一款完整的网页游戏能在32分钟内开发完成吗?不是简单的小游戏,而是包含战斗系统、装备系统、多层关卡的完整魔塔游戏!如果放在以前,我肯定会说你在做梦。但今天,我亲身体验了这个"梦"变成现实的过程,而且比想象中还要惊艳!一份160行的游戏需求,能在半小时内变成可玩游戏?事情是这样的,黄叔通过和DeepSeek Chat,拿到了一份网页版魔塔游戏的需求文档,足足160多行的详细…- 7
- 0
-
RAG系统文本切分算法选型指南
RAG系统文本切分算法选型指南简介在构建企业级检索增强生成(RAG)系统时,文本切分算法的选择至关重要。切分策略直接影响检索的质量和生成结果的准确性。本文档将介绍常用的文本切分方法,分析其优缺点,并结合不同检索器给出最佳实践方案。RAG系统通常包含两个主要组件:1. 索引阶段:加载数据、切分文档、存储向量2. 检索和生成阶段:基于用户输入检索相关内容,利用LLM生成…- 6
- 0
-
字节对 AI Coding 的理解,够深刻。
上周三,我在火山引擎的 Force 大会上,听了字节跳动技术副总裁洪定坤关于 AI 编程的分享。你也看得到,今年以来,AI Coding 赛道无比火热,国内连一向不怎么涉足技术类业务的美团,最近都忍不住推出了类似的产品。国外 OpenAI、Anthropic 这两家头部大模型创业公司,都发布了自家的编程应用,甚至还传出来 OpenAI 准备全资收购 Windsurf 的消息。字节此前推出了国内第一…- 7
- 0
-
如何创建具有自我评估机制的Agent RAG
随着大语言模型(LLMs)的发展,模型已经能够理解大量数据并进行逻辑推理。这些发展带来的最重要成果之一是检索增强生成(Retrieval-Augmented Generation,简称RAG)系统。LLMs 在非常大的数据集上进行训练,但它们受限于训练数据的范围。假设您拥有一家公司,并有一些政策文档。为了让员工找到正确的答案,他们要么需要非常熟悉这些文档,要么需要在文档中搜索答案。您希望通过一个聊…- 5
- 0
-
RAG效果炸裂,亲测EasyDoc文档解析,结构化输出太香了
在构建 RAG(检索增强生成)系统时,光有文档远远不够,一份结构清晰、可被理解的知识库才是模型“打怪升级”的关键。很多解析方案只是简单提取文字,忽略了段落、标题、表格、图表等结构信息,导致内容碎片化、上下文丢失,检索结果不准、回答效果不佳。最终喂给大模型的是一堆“看不懂”的无结构输入,Attention 无法聚焦重点,RAG 效果自然大打折扣。如果你也遇到这些坑,不妨给自己点个赞:你已经意识到——…- 4
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
一分钟读懂RAG的切分策略
RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段。在RAG系统的构建中,文档切分策略…- 5
- 0
-
AI产品,真正的壁垒在哪?
01 壁垒?在技术和商业环境日新月异的当下,“壁垒”一词常隐含着短视、封闭与自视甚高的傲慢——妄图通过建立高墙的方式把竞争者隔绝在外。然而从GPT3.5到Claude4,似乎随着模型能力的攀升,所谓的壁垒似乎已经不存在了。这时候沉迷壁垒带来的安全感幻觉,似乎沙漠里盖草房的感觉——盖的越高、崩的越惨。另一方面,因为经济周期带来的市场情绪,舆论常常在期待一些一夜爆红、以一敌百、暴虐大厂的产品…- 5
- 0
-
RAG-embedding篇
1.前言RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段一分钟读懂RAG的切分策略。…- 4
- 0
-
云端超级AI vs 用户侧AI:谁将赢得未来?
“ 在刚刚结束的苹果全球开发者大会(WWDC)上,虽然没有“惊天一问”的“One More Thing”,但一项被低调宣布的技术,可能会在未来几年对企业应用与用户智能产生深远影响——苹果正式开放端侧大模型的调用能力。这意味着,开发者可以直接调用苹果设备中的本地大模型,让AI在手机本地完成处理、分析与响应,而用户则可以用这些模型来自定义快捷指令,实现真正意义上的手机自动化操作。“这一转变的…- 6
- 0
-
RAG 信息检索:如何让模型找到‘对的知识’
1.前言RAG飞速发展,成为连接“生成能力”与“外部知识”的桥梁,关于RAG的介绍可以参考什么是RAG?一文搞懂检索增强生成技术。前面我们介绍了RAG系统中的文档解析,RAG 的文档解析:PDF 篇,在解析文档得到数据后,由于数据规模很可能非常庞大,整体存储具有难度,并且在查询的时候可能仅仅和其中的一个或几个段落有关系,所以需要分块技术将解析后的文档内容切分为适当的片段一分钟读懂RAG的切分策略。…- 4
- 0
-
字节DeerFlow深度解析:下一代AI研究助理,还是又一个Agent框架?
在信息爆炸的今天,每一位开发者、金融分析师还是学术研究员都面临着一个共同的痛点:如何从浩如烟海的数据中高效地提炼有效信息并进行深度研究。这不仅是效率问题,更成为了制约创新的核心瓶颈。在此背景下,字节跳动于2025年5月开源了DeerFlow 。这个名字本身就蕴含深意,即“深度探索与高效研究流”(Deep Exploration and Efficient Research Flow)。DeerFl…- 8
- 0
-
从零开始学 Dify – Dify 的 RAG 系统如何有效地处理和检索大量文档?
一、整体架构1.1 架构概述dify 的 RAG(检索增强生成)架构是一个完整的文档处理、索引和检索系统,旨在提高大语言模型生成内容的准确性和相关性。该架构由三个主要模块组成:文档处理模块、向量化与索引模块、检索与重排模块。整个系统的数据流如下:用户上传文档或提供URL文档处理模块提取文本内容并进行清洗文本被分割成适当大小的段落(chunks)向量化模块将这些段落转换为向量表示并存储在向量数据库中…- 6
- 0
-
大模型安全:业务要上MCP,认证鉴权怎么搞?
0x00 前言上半年公司业务开始逐步支持MCP,方案评审的时候要求业务上线的前提是必须支持认证,但是早期MCP更多的使用场景是用在本地工具上,官方也没有给出远程MCP服务的标准认证方案,所以花了些时间研究MCP认证鉴权的方案,期间官方也在积极推动相关的安全认证标准。目前官方给出的安全认证方案采用了OAuth2方案,但是个人觉得这个标准方案对于普通开发者有点重了,如果没有成熟的SDK,最终搞下来在认…- 7
- 0
-
通过 RAG如何扩展提示词Prompting?
在这个AI深度介入软件开发的时代,作为一名测试工程师,如果你还停留在“自动化测试脚本怎么写”的阶段,那就已经有点落后了。如今,我们已经进入了一个“如何与大模型合作”的新纪元。今天,我想带大家深入了解一个可能听过但不太熟悉的技术名词——RAG(Retrieval-Augmented Generation,检索增强生成),以及一个你今后绕不开的重要概念:上下文窗口(context window)。别急…- 5
- 0
-
穿透式监管,AI如何助力集团治理?
不是监管不到位,而是看不见。过去的监管像打电话,靠回音判断对面有没有人;而今天的监管,必须像视频会议,看得清、听得全、记录留痕。在超大型集团公司,组织像一棵枝繁叶茂的大树,根干交错、层级复杂。总部战略能否真正穿透基层?制度执行是否在落地过程中被“稀释”?资金、合同、项目是否真的在阳光下运转?这些问题,几乎困扰着所有集团的合规、风控和审计部门。真正的风险,常常藏在看不见的地方。越大规模、越多层级、越…- 4
- 0
-
什么是RAG?一文搞懂检索增强生成技术
在大语言模型(LLM)如ChatGPT、Claude、Gemini日益强大的今天,人们希望它们不仅能“生成”,还要“准确生成”。然而,LLM训练的数据往往是静态的、封闭的,这使得它们在面对时效性强、专业性高、上下文复杂的问题时,力不从心。在有些时候,企业内部或者事业部门内部的数据是不允许公开上传的,那么也就没有办法享受到大模型的服务,生产力也得不到解放。这时,RAG(Retrieval-Augme…- 2
- 0
-
MCP vs A2A:2025 年,AI 自主智能体的“左右手”如何抉择?
在 2025 年,自主 AI 智能体已经不再是科幻小说中的概念,而是真真切切地走进了我们的生活和工作场景。它们能够通过 A2A 协议相互交流,并借助 MCP 协议连接到各种数据源和工具。对于开发者来说,构建自管理智能体网络已经成为一个热门话题。这些智能体正在逐步取代传统的独立流程,形成复杂的多智能体生态系统,它们能够实时管理操作,交换上下文和状态信息,解决比单一智能体更复杂的问题。无论是运营还是营…- 13
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















