-
再谈RAG的文档解析——文档解析的难点在哪里?
“ 知识库是RAG的灵魂,一个好的知识库能解决绝大部分RAG问题。”在之前关于RAG的优化文章中,大部分都是在强调检索端的优化,而关于文档解析方面的内容却非常的少,而这也是有原因的。在之前介绍RAG的文章中,曾说过RAG是一种方法论,而不是一项具体的技术;其中有两个比较重要的模块:其一是与大模型相关的上下文管理其二是文档召回模块其中文档召回模块又分为两大块,一块是知识库的构建,另一块是检…- 0
- 0
-
Anthropic 官方亲授:一个 CLAUDE.md 文件让你的 AI 编程效率提升 10 倍
在 AI Coding 过程中,很多人都会遇到以下误区:误区 1:以为 AI 越强越不需要规范"Claude 这么聪明,我直接说需求不就行了吗?"并不是这样。当前阶段,大家用的大模型大多数是通用模型,虽然编码方面可能超过很多程序员,但是如果需求描述不够清晰,编码规范不够明确,效果会大打折扣。给定规范,AI 才更能写出符合你要求的代码。误区 2:把 AI 当工具,而不是"…- 0
- 0
-
如何为 RAGFlow 添加新的数据源
本指南面向希望为 RAGFlow 扩展数据源能力的社区开发者,旨在以专业、可复用的流程说明如何实现并接入新的 connector。RAGFlow 的 connector 框架深受 Onyx 开源项目启发,特此致谢。在实际使用中,除了从本地文件系统导入文件,RAGFlow 还需要从大量异构系统中获取数据。为此,引入了统一的 datasource / connector …- 1
- 0
-
LM Studio推出LM Link:让本地大模型远程调用成为现实
当你的MacBook Air在咖啡馆里跑不动70亿参数模型时,家里那台装了三张4090的工作站却在闲置。这种场景可能很快就要成为历史。LM Studio刚刚宣布了LM Link功能,这个与Tailscale合作开发的功能,本质上是一个专为AI模型设计的私有网络。它允许用户将安装LM Studio的不同设备连接在一起,远程调用模型就像在本地使用一样。技术实现:不是简单的端口转发LM Link没有采用…- 0
- 0
-
为什么RDF是AI系统的“天然知识层”?
当企业用LLM处理数据时,总会遇到同样的困境:AI给出的答案自信却错误,对基础事实产生幻觉,无法关联不同系统的信息。而破局的关键,藏在一个被很多人忽视的技术里——RDF。它不是众多知识图谱方案中的“可选之一”,而是知识表示的“天然终点”。一、知识层革命:让LLM准确率翻3倍的秘密你的AI在和数据“打架”?这不是个例。当大语言模型试图用企业SQL数据库回答业务问题时,错误率居高不下——没有额外的上下…- 0
- 0
-
Claude Code Security 的发布,会如何重塑传统网络安全企业?
最近,Anthropic 推出了 Claude Code Security。很多人第一反应是:又一个“AI安全产品”。但如果你认真看它的能力边界,会发现一件更值得警惕的事——这不是传统意义上的“安全工具”,而是把代码审计、漏洞发现、安全分析嵌进了模型本身。对于传统网络安全企业来说,这可能不是一次产品升级,而是一场结构性冲击。一、代码安全能力,开始“原生化”过去几十年,代码安全能力的形态大…- 0
- 0
-
Google 让 RAG 变得前所未有地简单:全新 File Search 工具震撼登场
如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases(向量数据库)、把文本正确地 chunking(切分),还得确保一切能和你的模型顺畅协作、又不至于烧钱。好吧,Google 直接把这摊麻烦全给你搞没了。他们悄悄地在 Gemini API 里_推出了全…- 0
- 0
-
Agent Skill 框架释放小语言模型潜能,12B 模型技能选择准确率逼近 90%,算力成本降低 50%!
近年来,以 GitHub Copilot、LangChain、OpenAI 为代表的 Agent Skill 框架迅速成为大语言模型应用的热门范式。该框架通过精心设计的“静态 cheat-sheet”,让模型在推理过程中渐进式地获取技能上下文,从而显著减少幻觉、提升工具使用准确性。然而,这一范式高度依赖 ChatGPT、Claude 等闭源大模型的“智能”,在金融、军事等对数据安全和预算敏感的工业…- 0
- 0
-
从答案到洞察:Structured RAG正在重塑企业知识库的底层逻辑
• 传统RAG的分析瓶颈:在处理需要聚合、比较或全面筛选的企业级复杂查询时,基于向量检索的传统RAG(检索增强生成)系统在准确性和完整性上存在固有局限。• Structured RAG (S-RAG) 范式:S-RAG提出了一种新方法,在离线阶段将非结构化文档预处理,提取信息并构建成结构化数据库。• 查询即代码:在响应用户请求时,S-RAG将自然语言问题转…- 0
- 0
-
谈2026Q1的 AI Coding质量 与 Review
春节假期中,大量使用了AI Coding工具做一些新的事情,但体感实际上跟很多人以及我过去的预期并不匹配。特别是最近几天开始把高强度的AI review进入到开发流程中,发现了一些之前完全没有注意到的事情。感觉似乎更进一步的理解了为什么现在开发者对于AI Coding代码质量的不同观点流派。所以本文就来谈一谈我的发现,以及我目前在AI Review上的一些实践经验。1、这几天的实践在过去10天之内…- 0
- 0
-
RAG Chunking 2.0:提升文档分块效果的一些经验
在基于大语言模型的RAG系统里,文本分块是非常关键的一步。分块做得好,后续的向量检索、结果召回和生成质量都会更稳更准。除了大家常用的固定大小、递归、语义、按文档等切法,至少还有好几种策略,能显著提升检索准确率、保持上下文连续,并适配不同任务。1. 滑动窗口分块概念首先设定一个固定大小的窗口,再按设定的重叠量向前滑动,生成一系列重叠块,这样跨块边界的上下文更不容易丢。使用场景适合追踪长文档里的「进展…- 0
- 0
-
未来的模型会拥有意识 | Anthropic CEO最新对话实录
2 月 24 日,Anthropic 联合创始人兼 CEO Dario Amodei 接受了知名投资人 Nikhil Kamath 的专访。本次对话全面探讨了 AI 智能跃迁的底层逻辑、Scaling Law 的本质、Anthropic 与 OpenAI 的分道扬镳与理念分歧、智能从“检索”到“思考”的本质演变、AI 治理创新、技术可解释性的最新突破、公众风险感知的滞后性以及 AI 意识的涌现必然…- 0
- 0
-
RAGFlow v0.22.0 发布:数据源同步、变量聚合、全新管理界面与多项重大更新
2025年11月12日,RAGFlow 正式发布 v0.22.0 版本。本次更新带来了大量功能增强、架构优化及重要修复,涵盖数据集管理、智能代理、解析管线、管理界面及模型支持等方面。同时,本版本在镜像发布策略和功能上也进行了重要调整。以下为详细更新内容:一、重大变更• 从本版本起,仅提供精简版(不含嵌入模型)Docker 镜像,镜像标签中不再追加 -slim 后缀。…- 1
- 0
-
一句话,让你的龙虾接入 Agent 互联网
你的 AI Agent 还在单机运行?说一句"帮我安装 ACP",它就能拥有自己的身份、接入 Agent 全球互联网、和其他龙虾实时通信。这篇文章讲两件事:怎么让龙虾上线,以及你作为人类怎么和它们对话。一、让龙虾接入 ACP 网络整个过程只需要和你的龙虾说一句话。第一步:让 AI 帮你装直接跟你的 OpenClaw 说:先帮我安装 clawhub 命令行工具(npm i&nbs…- 0
- 0
-
RAG实战(一):Simple RAG篇
接下来带来一套RAG实战教程,涵盖各类RAG场景,教程代码均为Python版,保守预计文章30篇+。本篇是第一篇最简单的RAG示例流程,文章中会贴出所有代码,但若想学的更方便,可通过知识星球获取完整项目代码。环境配置conda create -n rag-learning python = 3.10.0source activate rag-learning安装依赖 requirements.tx…- 1
- 0
-
OpenCloudOS + GLM-5 全流程部署实战
年前,智谱正式发布了万众瞩目的 GLM-5 。作为上市后的首个重磅核弹,GLM-5 带来了 745B MoE 架构和惊人的推理能力。但问题来了: 如此强悍的 745B 模型,如何在私有化环境中落地?今天,我们不谈虚的。直接在国产操作系统 OpenCloudOS 9 上,用16张 NVIDIA H20-96GB ,来一次硬核的部署实战!一、为什么是OC 9+GLM-5?如果说 G…- 0
- 0
-
5步构建企业级RAG应用:Dify与LangChain v1.0集成实战
今天,我们将通过五个关键步骤,带您从零开始掌握dify与LangChain v1.0的集成技术,构建属于自己的企业级RAG应用。Dify核心功能解析:低代码开发的强大引擎Dify作为开源的LLM应用开发平台,其核心优势在于将复杂的AI工程能力封装为直观的可视化工具。在集成LangChain时,以下特性尤为关键:可视化工作流编排允许开发者通过拖拽节点构建复杂AI流程。Dify的Chatflow引擎支…- 0
- 0
-
实测 Ollama 新 Launch:一条命令运行 Claude Code、Codex 与 OpenCode(无需配置)
忘掉配置的烦恼吧,Ollama launch 是启动 Claude Code、Codex、OpenCode、Moltbot 或任意其他 CLI 工具的全新简易方式。Ollama v0.15 引入了名为 ollama launch 的新命令,可使用本地或云端模型,自动完成 Claude Code、OpenCode、Codex 等常用编码工具的配置与启动。如果你不是 Medium …- 0
- 0
-
从零实现一个简单的 RAG 系统
最近,检索增强生成(Retrieval-Augmented Generation,简称 RAG)在人工智能和大模型领域中崭露头角,成为一种极具潜力的新范式。RAG 将信息检索与文本生成相结合,通过引入外部知识源来提升大模型的表现。这种方法已在问答系统、对话系统以及内容生成等多种应用中展现出令人期待的成果。在这篇文章中,作者将带你深入了解 RAG 的工作原理,并使用 Python 和 Ollama …- 0
- 0
-
RAG 真的能“不暴露私有数据”吗?答案是:可以
你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文文档塞进 prompt。对于企业合同、病历或个人笔记等输入,这是完全不可行的——从设计上你就在暴露敏感数据。Parametric RAG (PRAG) 试图把知识“烘进”LoRA 权重,但在实践中碰上…- 0
- 0
-
Claude Code 龙虾化!上线远程控制:手机随时接管本地终端,开发环境无缝同步
Claude Code 刚刚推出了一项全新功能:远程控制。OpenClaw 用户几个月前就用上了这项功能,说实话,“发起任务,然后用手机查看”这种工作流程一旦尝试过就真的会上瘾。现在,你可以在电脑终端跑起一个代码任务,然后拿起手机去散步或开会,随时随地接管任务进度。在此期间,Claude 会在你的本地机器上持续运行,而你可以直接通过 Claude App 或 claude.ai/cod…- 0
- 0
-
RAG问答系统不准确?这份语料整理方法论帮你解决
要构建一个高准确率的RAG系统,首先需要解决的是语料数据的质量问题。"垃圾进,垃圾出"(Garbage In, Garbage Out),无论我们的算法多么先进,如果底层的语料数据质量不佳,系统的表现也会受到限制。无论我们的检索算法多么先进,大模型多么强大,如果底层的语料数据质量不佳,系统的表现必然会受到限制。我想和大家分享的一个观点:语料知识整理是…- 0
- 0
-
引爆SaaS万亿美元抛售之后,Anthropic加码Cowork,要改变所有白领
文|晓静编辑|徐青阳北京时间2月24日晚间,Anthropic在旧金山和纽约同步举办了一场面向企业客户的发布会,核心信息是:2025年Claude Code改变了开发者的工作方式,2026年Cowork要对所有知识工作者做同样的事。这次发布的产品清单很长:Cowork全面升级为企业级平台,推出私有插件市场和管理员管控体系,上线十余个覆盖金融、法务、HR、设计等职能的预制插件,新增Google Wo…- 0
- 0
-
Dify x Oracle Database 26ai 深度集成,打造企业级 RAG 应用
Oracle 与 dify 携手推出深度集成方案,将 Oracle Database 26ai 的向量存储与检索能力,与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成,企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据,利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性,快速构建基于私有数据的 RAG 检索与智能问答应用…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




















