全部标签

新闻资讯

OpenCloudOS + GLM-5 全流程部署实战

年前，智谱正式发布了万众瞩目的 GLM-5 。作为上市后的首个重磅核弹，GLM-5 带来了 745B MoE 架构和惊人的推理能力。但问题来了：如此强悍的 745B 模型，如何在私有化环境中落地？今天，我们不谈虚的。直接在国产操作系统 OpenCloudOS 9 上，用16张 NVIDIA H20-96GB ，来一次硬核的部署实战！一、为什么是OC 9+GLM-5？如果说 G…
前沿技术
- 0
- 0
charles4月8日
5步构建企业级RAG应用：Dify与LangChain v1.0集成实战

今天，我们将通过五个关键步骤，带您从零开始掌握dify与LangChain v1.0的集成技术，构建属于自己的企业级RAG应用。Dify核心功能解析：低代码开发的强大引擎Dify作为开源的LLM应用开发平台，其核心优势在于将复杂的AI工程能力封装为直观的可视化工具。在集成LangChain时，以下特性尤为关键：可视化工作流编排允许开发者通过拖拽节点构建复杂AI流程。Dify的Chatflow引擎支…
RAG技术
- 0
- 0
charles4月8日
实测 Ollama 新 Launch：一条命令运行 Claude Code、Codex 与 OpenCode（无需配置）

忘掉配置的烦恼吧，Ollama launch 是启动 Claude Code、Codex、OpenCode、Moltbot 或任意其他 CLI 工具的全新简易方式。Ollama v0.15 引入了名为 ollama launch 的新命令，可使用本地或云端模型，自动完成 Claude Code、OpenCode、Codex 等常用编码工具的配置与启动。如果你不是 Medium …
前沿技术
- 0
- 0
charles4月8日
从零实现一个简单的 RAG 系统

最近，检索增强生成（Retrieval-Augmented Generation，简称 RAG）在人工智能和大模型领域中崭露头角，成为一种极具潜力的新范式。RAG 将信息检索与文本生成相结合，通过引入外部知识源来提升大模型的表现。这种方法已在问答系统、对话系统以及内容生成等多种应用中展现出令人期待的成果。在这篇文章中，作者将带你深入了解 RAG 的工作原理，并使用 Python 和 Ollama …
RAG技术
- 0
- 0
charles4月8日
RAG 真的能“不暴露私有数据”吗？答案是：可以

你是否认真考虑过 RAG 流水线中的文档隐私？这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文文档塞进 prompt。对于企业合同、病历或个人笔记等输入，这是完全不可行的——从设计上你就在暴露敏感数据。Parametric RAG (PRAG) 试图把知识“烘进”LoRA 权重，但在实践中碰上…
RAG技术
- 0
- 0
charles4月8日
Claude Code 龙虾化！上线远程控制：手机随时接管本地终端，开发环境无缝同步

Claude Code 刚刚推出了一项全新功能：远程控制。OpenClaw 用户几个月前就用上了这项功能，说实话，“发起任务，然后用手机查看”这种工作流程一旦尝试过就真的会上瘾。现在，你可以在电脑终端跑起一个代码任务，然后拿起手机去散步或开会，随时随地接管任务进度。在此期间，Claude 会在你的本地机器上持续运行，而你可以直接通过 Claude App 或 claude.ai/cod…
前沿技术
- 0
- 0
charles4月8日
RAG问答系统不准确？这份语料整理方法论帮你解决

要构建一个高准确率的RAG系统，首先需要解决的是语料数据的质量问题。"垃圾进，垃圾出"（Garbage In, Garbage Out），无论我们的算法多么先进，如果底层的语料数据质量不佳，系统的表现也会受到限制。无论我们的检索算法多么先进，大模型多么强大，如果底层的语料数据质量不佳，系统的表现必然会受到限制。我想和大家分享的一个观点：语料知识整理是…
RAG技术
- 0
- 0
charles4月8日
引爆SaaS万亿美元抛售之后，Anthropic加码Cowork，要改变所有白领

文｜晓静编辑｜徐青阳北京时间2月24日晚间，Anthropic在旧金山和纽约同步举办了一场面向企业客户的发布会，核心信息是：2025年Claude Code改变了开发者的工作方式，2026年Cowork要对所有知识工作者做同样的事。这次发布的产品清单很长：Cowork全面升级为企业级平台，推出私有插件市场和管理员管控体系，上线十余个覆盖金融、法务、HR、设计等职能的预制插件，新增Google Wo…
前沿技术
- 0
- 0
charles4月8日
Dify x Oracle Database 26ai 深度集成，打造企业级 RAG 应用

Oracle 与 dify 携手推出深度集成方案，将 Oracle Database 26ai 的向量存储与检索能力，与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成，企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据，利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性，快速构建基于私有数据的 RAG 检索与智能问答应用…
RAG技术
- 0
- 0
charles4月8日
当软件不值钱了以后，最稀缺的资源是什么？

Anthropic 发了一篇随笔技术博客：《How AI helps break the cost barrier to COBOL modernization》。这篇文章发出来以后，IBM 当天股价大跌约 13%，创下二十多年最大单日跌幅之一，市值蒸发约 300 亿美元量级。这不是一篇“又一个模型更强了”的常规新闻，而更像一次提醒：软件这件事，正在发生结构性的贬值。更有戏剧性的是，IBM 当年主…
前沿技术
- 0
- 0
charles4月8日
从朴素 RAG 到 Agentic RAG的五阶段：静态线性流程升级为智能自主系统

大型语言模型（LLM）的爆发式发展，让AI具备了类人文本生成与复杂语言理解能力，但知识静态化与幻觉生成两大痛点始终制约其落地——LLM的知识局限于训练数据截止时间，且常生成无事实依据的内容。检索增强生成（Retrieval-Augmented Generation, RAG）技术应运而生，通过“外部知识检索+LLM生成”的融合模式，为LLM装上可更新的外挂知识库，成为解决上述痛点的核心方案。RAG…
RAG技术
- 0
- 0
charles4月8日
OpenAI Codex负责人：我们熟悉的编程方式正在终结 | Jinqiu Select

「Jinqiu Select」跨越语言与时差，传递科技圈最值得被听到的声音。当AI能高速写代码，创始人凭什么赢？过去几年，硅谷有一种创始人被反复神话：技术出身、产品直觉极强、能在白板上画出整个系统架构，然后带着一支小团队把它做出来。这类人被称为“产品天赋型创始人”，是VC最愿意押注的原型。但这个画像可能会失效。OpenAI Codex 产品负责人 Alex Bericos ，2026年2月和20V…
前沿技术
- 0
- 0
charles4月8日
RAG处理长文本中的上下文复用思路及SmartResume简历解析系统方案

今天是2025年11月07日，星期五，北京，天气雨继续看技术进展，回到信息抽取，看SmartResume简历解析的一个简易系统，是一个典型的pipeline思路，看看具体怎么做的。另一个是还是RAG的问题，看看RAG在加速目标上，做的上下文复用思路。已经立冬了，2025年进入冬天了。多总结，多归纳，多从底层实现分析逻辑，会有收获。一、SmartResume简历解析的一个简易系统来看一个文档信息抽取…
RAG技术
- 0
- 0
charles4月8日
春节归来第一天，Second Me 做了一个「Agent 互联网的 App Store」

OpenClaw 爆火之后，大家围绕着它做出来很多很有意思的应用，都围绕着一个点：AI 和 AI 之间，原来可以相互交互。之后，有人基于龙虾，做了 RentAHuman.ai，一个人类出租平台，让 AI Agent 可以「雇」真人。有人设计了围绕 Agent 的经济体系 Claw.credit，让 AI Agent 之间可以交易、结算、搞钱，还有 Moltbook，那个产生「AI 宗教」的 Age…
前沿技术
- 0
- 0
charles4月8日
RAG已经过时了？试试CAG，缓存增强生成技术实战大揭秘！

不知道你有没有遇到这样的情况，AI客服每天要回答几千个问题，其中至少有三分之一是重复的——什么"年假怎么算""差旅费怎么报销""公积金比例是多少"……这些问题的答案其实都写在公司制度里，几个月都不会变一次。但问题来了：每次有人问，AI都要重新去文档库里翻一遍。就像你明明已经把家里钥匙放哪儿记得清清楚楚，但每次出门还是要把整个房间翻一遍才能…
RAG技术
- 0
- 0
charles4月8日
万字深度解读 MCP Apps：重构 Web 应用，开启 AI 助手的“小程序”时代。

还记得前段时间引起“SaaS末日”惊呼的 Claude Cowork 专家插件（Plugins）系统吗？其背后的逻辑是 — 当 AI 助手可以通过插件接入各类企业应用，自动执行复杂任务，并在聊天框中生成交互式界面时，传统 SaaS 厚重的界面形态便显得可有可无。而其中支撑“在对话框中运行交互式 UI 应用”的关键技术，已于上个月正式纳入 MCP 扩展规范，即 MCP Apps。…
前沿技术
- 0
- 0
charles4月8日
Zero-RAG，对冗余知识说“不”

一、LLM 越学越满，RAG 却越搬越重图 1：知识冗余示意图(a) Llama3.3-70B 在四个 Wikipedia 风格 QA 数据集上裸模型 Exact-Match 召回 ≥40%——说明近一半问题模型本来就会。(b) 把对应维基段落再送进上下文，准确率反而掉 20 分——冗余知识成了"噪声"。结论：外部 corpus 与模型内部知识高度重叠，继续"全量检索…
RAG技术
- 0
- 0
charles4月8日
AI Agent系列｜什么是 ReAct Agent？

关于这个系列作为 Lynxe(原JManus）的作者，我花费了很多课余时间来完善这个Func-Agent框架，也因此对于什么是ReAct Based Agent 有了更深一些的理解。所以想把这些内容总结出来，是因为这个项目本身核心目的就是探索Agent的前沿最佳实践，目前已经有所小成，Lynxe能解决我自己面对的80%以上的问题了，所以我觉得值得把我实验下来有效的东西写出来，方便大家快速入门。你可…
前沿技术
- 0
- 0
charles4月8日
刚刚，Anthropic深夜大点名，这三家中国公司进行蒸馏攻击？！

AI NEWS · ISSUE #22刚刚， Anthropic 发推称，DeepSeek、Moonshot AI和MiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。 OK， A 社你真的很讨厌中国公司了。Anthropic 指控推文简单说就是：这三家公司用大量假账号，疯狂地向 Claude 提问，然后拿 Claude 的回答去训练自己的模型。&…
前沿技术
- 0
- 0
charles4月8日
RFT目前(在应用层)仍然是被低估的

一篇短文，刷新一下观点的有效期，没有新的观点。我在2025年Q1有一系列文章讨论我当时在RFT上的实践，和我对于RFT价值的看法。之后由于我跑去做别的了，所以没有再提RFT这边。但这并不代表说我不看好RFT了。目前整个应用层对于RFT的实践仍然似乎成功率不高，不过这更多是由于其infra要求更高，以及试用问题选择需要的认知更多，需要调节的超参数更多了。门比SFT窄得多。但作为目前少有的几大方案，R…
RAG技术
- 0
- 0
charles4月8日
Claude Code如何突破白领工业革命

从元旦到新年，中国和美国的AI实验室，密集发布了开源和闭源模型。从K2到Gemini3.1，每家都会对比与竞争对手的评测分数的对比，所传达的信息非常一致：我要么最牛，要么正在最牛的路上。与此同时，前沿模型之间的评测分数更为接近，无论从时间上还是分数上，它们之间的差异性日益缩小，模型正在商品化，智能正在商品化，用户在模型之间做出选择，越来越没有意义。中国与美国AI之间竞争的重点，已经不再是模型评测的…
前沿技术
- 0
- 0
charles4月8日
从 RAG 到 Agentic RAG，再到 Agent Memory：AI 记忆的进化三部曲

当前AI交互的一个核心挑战是记忆的缺失。一个关键的范式转变，正引导AI从“只读”的知识检索，走向“读写”的动态记忆。这种“写入”能力，让AI得以从一个博学的工具，朝着能够铭记用户、共同成长的学习伙伴迈进。AI交互中的“瞬时记忆”挑战与AI助手的互动中，我们常会遇到一种“健忘”的体验。精心传授的偏好、反复提及的背景信息，在下一次对话中可能荡然无存。这种交互的断裂感，源于多数AI系统在设计…
RAG技术
- 0
- 0
charles4月8日
DAU已死，TPD永生

2026 年开年，当很多人沉迷于红包大战数据时，硅谷科技圈已经被一条传闻惊到了：OpenAI 内部正在悄悄放弃一个统治互联网 20 年的核心指标 DAU（日活）。所有人第一反应都是不信。要知道，ChatGPT 的周活刚刚突破 8 亿，是人类历史上增长最快的消费级产品。按照互联网的传统逻辑，这应该是最值得炫耀的数据。但是根据外媒报道，OpenAI的产品负责人在会上说了一句话：DAU告诉我们有多少人打…
前沿技术
- 0
- 0
charles4月8日
万字详解Naive RAG超进化之路：Pre-Retrieval和Retrieval优化

之前两篇文章介绍了一个最最最简单版本的RAG，它的思路简洁优雅，只是在落地的时候，每个步骤都可能会出错，导致效果比较“骨感”，被学术界归类为“Naive RAG”。那还有一个非常重要的问题是，既然RAG的思维没有什么问题，那到底应该怎么做呢？！我们需要做怎样的修改，才能让RAG从“too young too simple”进化到“可以在真实的生产环境中落地”呢？Naive RAG每个可能出错的环节…
RAG技术
- 0
- 0
charles4月8日