-
OpenCloudOS + GLM-5 全流程部署实战
年前,智谱正式发布了万众瞩目的 GLM-5 。作为上市后的首个重磅核弹,GLM-5 带来了 745B MoE 架构和惊人的推理能力。但问题来了: 如此强悍的 745B 模型,如何在私有化环境中落地?今天,我们不谈虚的。直接在国产操作系统 OpenCloudOS 9 上,用16张 NVIDIA H20-96GB ,来一次硬核的部署实战!一、为什么是OC 9+GLM-5?如果说 G…- 0
- 0
-
5步构建企业级RAG应用:Dify与LangChain v1.0集成实战
今天,我们将通过五个关键步骤,带您从零开始掌握dify与LangChain v1.0的集成技术,构建属于自己的企业级RAG应用。Dify核心功能解析:低代码开发的强大引擎Dify作为开源的LLM应用开发平台,其核心优势在于将复杂的AI工程能力封装为直观的可视化工具。在集成LangChain时,以下特性尤为关键:可视化工作流编排允许开发者通过拖拽节点构建复杂AI流程。Dify的Chatflow引擎支…- 0
- 0
-
实测 Ollama 新 Launch:一条命令运行 Claude Code、Codex 与 OpenCode(无需配置)
忘掉配置的烦恼吧,Ollama launch 是启动 Claude Code、Codex、OpenCode、Moltbot 或任意其他 CLI 工具的全新简易方式。Ollama v0.15 引入了名为 ollama launch 的新命令,可使用本地或云端模型,自动完成 Claude Code、OpenCode、Codex 等常用编码工具的配置与启动。如果你不是 Medium …- 0
- 0
-
从零实现一个简单的 RAG 系统
最近,检索增强生成(Retrieval-Augmented Generation,简称 RAG)在人工智能和大模型领域中崭露头角,成为一种极具潜力的新范式。RAG 将信息检索与文本生成相结合,通过引入外部知识源来提升大模型的表现。这种方法已在问答系统、对话系统以及内容生成等多种应用中展现出令人期待的成果。在这篇文章中,作者将带你深入了解 RAG 的工作原理,并使用 Python 和 Ollama …- 0
- 0
-
RAG 真的能“不暴露私有数据”吗?答案是:可以
你是否认真考虑过 RAG 流水线中的文档隐私?这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文文档塞进 prompt。对于企业合同、病历或个人笔记等输入,这是完全不可行的——从设计上你就在暴露敏感数据。Parametric RAG (PRAG) 试图把知识“烘进”LoRA 权重,但在实践中碰上…- 0
- 0
-
Claude Code 龙虾化!上线远程控制:手机随时接管本地终端,开发环境无缝同步
Claude Code 刚刚推出了一项全新功能:远程控制。OpenClaw 用户几个月前就用上了这项功能,说实话,“发起任务,然后用手机查看”这种工作流程一旦尝试过就真的会上瘾。现在,你可以在电脑终端跑起一个代码任务,然后拿起手机去散步或开会,随时随地接管任务进度。在此期间,Claude 会在你的本地机器上持续运行,而你可以直接通过 Claude App 或 claude.ai/cod…- 0
- 0
-
RAG问答系统不准确?这份语料整理方法论帮你解决
要构建一个高准确率的RAG系统,首先需要解决的是语料数据的质量问题。"垃圾进,垃圾出"(Garbage In, Garbage Out),无论我们的算法多么先进,如果底层的语料数据质量不佳,系统的表现也会受到限制。无论我们的检索算法多么先进,大模型多么强大,如果底层的语料数据质量不佳,系统的表现必然会受到限制。我想和大家分享的一个观点:语料知识整理是…- 0
- 0
-
引爆SaaS万亿美元抛售之后,Anthropic加码Cowork,要改变所有白领
文|晓静编辑|徐青阳北京时间2月24日晚间,Anthropic在旧金山和纽约同步举办了一场面向企业客户的发布会,核心信息是:2025年Claude Code改变了开发者的工作方式,2026年Cowork要对所有知识工作者做同样的事。这次发布的产品清单很长:Cowork全面升级为企业级平台,推出私有插件市场和管理员管控体系,上线十余个覆盖金融、法务、HR、设计等职能的预制插件,新增Google Wo…- 0
- 0
-
Dify x Oracle Database 26ai 深度集成,打造企业级 RAG 应用
Oracle 与 dify 携手推出深度集成方案,将 Oracle Database 26ai 的向量存储与检索能力,与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成,企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据,利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性,快速构建基于私有数据的 RAG 检索与智能问答应用…- 0
- 0
-
当软件不值钱了以后,最稀缺的资源是什么?
Anthropic 发了一篇随笔技术博客:《How AI helps break the cost barrier to COBOL modernization》。这篇文章发出来以后,IBM 当天股价大跌约 13%,创下二十多年最大单日跌幅之一,市值蒸发约 300 亿美元量级。这不是一篇“又一个模型更强了”的常规新闻,而更像一次提醒:软件这件事,正在发生结构性的贬值。更有戏剧性的是,IBM 当年主…- 0
- 0
-
从朴素 RAG 到 Agentic RAG的五阶段:静态线性流程升级为智能自主系统
大型语言模型(LLM)的爆发式发展,让AI具备了类人文本生成与复杂语言理解能力,但知识静态化与幻觉生成两大痛点始终制约其落地——LLM的知识局限于训练数据截止时间,且常生成无事实依据的内容。检索增强生成(Retrieval-Augmented Generation, RAG)技术应运而生,通过“外部知识检索+LLM生成”的融合模式,为LLM装上可更新的外挂知识库,成为解决上述痛点的核心方案。RAG…- 0
- 0
-
OpenAI Codex负责人:我们熟悉的编程方式正在终结 | Jinqiu Select
「Jinqiu Select」跨越语言与时差,传递科技圈最值得被听到的声音。当AI能高速写代码,创始人凭什么赢?过去几年,硅谷有一种创始人被反复神话:技术出身、产品直觉极强、能在白板上画出整个系统架构,然后带着一支小团队把它做出来。这类人被称为“产品天赋型创始人”,是VC最愿意押注的原型。但这个画像可能会失效。OpenAI Codex 产品负责人 Alex Bericos ,2026年2月和20V…- 0
- 0
-
RAG处理长文本中的上下文复用思路及SmartResume简历解析系统方案
今天是2025年11月07日,星期五,北京,天气雨继续看技术进展,回到信息抽取,看SmartResume简历解析的一个简易系统,是一个典型的pipeline思路,看看具体怎么做的。另一个是还是RAG的问题,看看RAG在加速目标上,做的上下文复用思路。已经立冬了,2025年进入冬天了。多总结,多归纳,多从底层实现分析逻辑,会有收获。一、SmartResume简历解析的一个简易系统来看一个文档信息抽取…- 0
- 0
-
春节归来第一天,Second Me 做了一个「Agent 互联网的 App Store」
OpenClaw 爆火之后,大家围绕着它做出来很多很有意思的应用,都围绕着一个点:AI 和 AI 之间,原来可以相互交互。之后,有人基于龙虾,做了 RentAHuman.ai,一个人类出租平台,让 AI Agent 可以「雇」真人。有人设计了围绕 Agent 的经济体系 Claw.credit,让 AI Agent 之间可以交易、结算、搞钱,还有 Moltbook,那个产生「AI 宗教」的 Age…- 0
- 0
-
RAG已经过时了?试试CAG,缓存增强生成技术实战大揭秘!
不知道你有没有遇到这样的情况,AI客服每天要回答几千个问题,其中至少有三分之一是重复的——什么"年假怎么算""差旅费怎么报销""公积金比例是多少"……这些问题的答案其实都写在公司制度里,几个月都不会变一次。但问题来了:每次有人问,AI都要重新去文档库里翻一遍。就像你明明已经把家里钥匙放哪儿记得清清楚楚,但每次出门还是要把整个房间翻一遍才能…- 0
- 0
-
万字深度解读 MCP Apps:重构 Web 应用,开启 AI 助手的“小程序”时代。
还记得前段时间引起“SaaS末日”惊呼的 Claude Cowork 专家插件(Plugins)系统吗?其背后的逻辑是 — 当 AI 助手可以通过插件接入各类企业应用,自动执行复杂任务,并在聊天框中生成交互式界面时,传统 SaaS 厚重的界面形态便显得可有可无。而其中支撑“在对话框中运行交互式 UI 应用”的关键技术,已于上个月正式纳入 MCP 扩展规范,即 MCP Apps。…- 0
- 0
-
Zero-RAG,对冗余知识说“不”
一、LLM 越学越满,RAG 却越搬越重图 1:知识冗余示意图(a) Llama3.3-70B 在四个 Wikipedia 风格 QA 数据集上裸模型 Exact-Match 召回 ≥40%——说明近一半问题模型本来就会。(b) 把对应维基段落再送进上下文,准确率反而掉 20 分——冗余知识成了"噪声"。结论:外部 corpus 与模型内部知识高度重叠,继续"全量检索…- 0
- 0
-
AI Agent系列|什么是 ReAct Agent?
关于这个系列作为 Lynxe(原JManus)的作者,我花费了很多课余时间来完善这个Func-Agent框架,也因此对于什么是ReAct Based Agent 有了更深一些的理解。所以想把这些内容总结出来,是因为这个项目本身核心目的就是探索Agent的前沿最佳实践,目前已经有所小成,Lynxe能解决我自己面对的80%以上的问题了,所以我觉得值得把我实验下来有效的东西写出来,方便大家快速入门。你可…- 0
- 0
-
刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!
AI NEWS · ISSUE #22刚刚, Anthropic 发推称,DeepSeek、Moonshot AI和MiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。 OK, A 社你真的很讨厌中国公司了。Anthropic 指控推文简单说就是:这三家公司用大量假账号,疯狂地向 Claude 提问,然后拿 Claude 的回答去训练自己的模型。&…- 0
- 0
-
RFT目前(在应用层)仍然是被低估的
一篇短文,刷新一下观点的有效期,没有新的观点。我在2025年Q1有一系列文章讨论我当时在RFT上的实践,和我对于RFT价值的看法。之后由于我跑去做别的了,所以没有再提RFT这边。但这并不代表说我不看好RFT了。目前整个应用层对于RFT的实践仍然似乎成功率不高,不过这更多是由于其infra要求更高,以及试用问题选择需要的认知更多,需要调节的超参数更多了。门比SFT窄得多。但作为目前少有的几大方案,R…- 0
- 0
-
Claude Code如何突破白领工业革命
从元旦到新年,中国和美国的AI实验室,密集发布了开源和闭源模型。从K2到Gemini3.1,每家都会对比与竞争对手的评测分数的对比,所传达的信息非常一致:我要么最牛,要么正在最牛的路上。与此同时,前沿模型之间的评测分数更为接近,无论从时间上还是分数上,它们之间的差异性日益缩小,模型正在商品化,智能正在商品化,用户在模型之间做出选择,越来越没有意义。中国与美国AI之间竞争的重点,已经不再是模型评测的…- 0
- 0
-
从 RAG 到 Agentic RAG,再到 Agent Memory:AI 记忆的进化三部曲
当前AI交互的一个核心挑战是记忆的缺失。一个关键的范式转变,正引导AI从“只读”的知识检索,走向“读写”的动态记忆。这种“写入”能力,让AI得以从一个博学的工具,朝着能够铭记用户、共同成长的学习伙伴迈进。AI交互中的“瞬时记忆”挑战与AI助手的互动中,我们常会遇到一种“健忘”的体验。精心传授的偏好、反复提及的背景信息,在下一次对话中可能荡然无存。这种交互的断裂感,源于多数AI系统在设计…- 0
- 0
-
DAU已死,TPD永生
2026 年开年,当很多人沉迷于红包大战数据时,硅谷科技圈已经被一条传闻惊到了:OpenAI 内部正在悄悄放弃一个统治互联网 20 年的核心指标 DAU(日活)。所有人第一反应都是不信。要知道,ChatGPT 的周活刚刚突破 8 亿,是人类历史上增长最快的消费级产品。按照互联网的传统逻辑,这应该是最值得炫耀的数据。但是根据外媒报道,OpenAI的产品负责人在会上说了一句话:DAU告诉我们有多少人打…- 0
- 0
-
万字详解Naive RAG超进化之路:Pre-Retrieval和Retrieval优化
之前两篇文章介绍了一个最最最简单版本的RAG,它的思路简洁优雅,只是在落地的时候,每个步骤都可能会出错,导致效果比较“骨感”,被学术界归类为“Naive RAG”。那还有一个非常重要的问题是,既然RAG的思维没有什么问题,那到底应该怎么做呢?!我们需要做怎样的修改,才能让RAG从“too young too simple”进化到“可以在真实的生产环境中落地”呢?Naive RAG每个可能出错的环节…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















