全部标签

新闻资讯

你花真金白银买的第三方API，有一半都是假的

如果你是一名AI开发者、科研人员，或者平时就喜欢鼓捣大模型的极客，那你大概率干过这件事：花钱去买第三方的中转 API。毕竟，现如今想要用上原汁原味的 GPT、Gemini或者 Claude，门槛实在太高了。网络节点要绝对干净，必须绑定海外实体信用卡，时不时还要面临大规模封号的风险。为了省事，也为了图个便宜，我们往往会求助于市面上各种免配置网络、支持国内支付的第三方 API 代理服务。但是，在使用这…
前沿技术
- 0
- 0
charles4月10日
深度解析丨智能体架构，利用文件系统重塑上下文工程

智能体架构：利用文件系统重塑上下文工程在现代 AI 系统设计的宏伟蓝图中，深度智能体的一个核心特征在于它们能够驾驭一套文件系统工具。通过这些工具，深度智能体得以在文件系统中执行读取、写入、编辑、列出目录以及搜索文件等操作。这不仅仅是功能的堆叠，更是智能体认知架构的一次重要升级。为了理解文件系统的价值，我们必须先审视当下的智能体在哪些环节容易遭遇瓶颈。它们失败通常归结为两个核心原因：模型本身的推理能…
RAG技术
- 0
- 0
charles4月10日
Xiaomi miclaw，小米移动端 Agent 开启小范围封测

Xiaomi miclaw 是我们探索 Agent 的一小步，它是基于小米 MiMo 大模型构建的 AI 交互测试产品，今天开始小范围封闭测试。Xiaomi miclaw 聚焦验证大模型在小米“人车家全生态”系统中的执行能力，探索模型从“对话能力”向“系统级执行能力”的落地路径。它的能力来自四个层次：系统底层能力、个人上下文理解、生态互联、自进化。它能让手机成为 AI 的工具，在理解你的意图和给予…
前沿技术
- 0
- 0
charles4月10日
RAG 答非所问？可能是你少了这一步：深度解析 Rerank 与 Cross-Encoder 的“降维打击”

在 RAG（检索增强生成）的调优过程中，很多应用者会遇到一个瓶颈：你换了最好的向量数据库，用了最贵的 Embedding 模型，切分策略也调了无数遍。但当用户问：“秦始皇死在哪一年？”你的 RAG 依然自信地把“秦始皇生于哪一年”的文档喂给了大模型。为什么？因为在向量的世界里，“生”和“死”长得太像了。这时候，你需要引入 RAG 架构中的“特种部队” —— Rerank（重排序）。而它背…
RAG技术
- 0
- 0
charles4月10日
刚刚！小米手机可以养小龙虾🦞了

AIPress.com.cn报道3月6日消息，小米宣布启动 Xiaomi miclaw 的小范围封闭测试。这是一款基于小米 MiMo 大模型构建的移动端 AI Agent 测试产品，主要用于探索大模型在手机系统中的执行能力，以及其在“小米人车家生态”中的应用方式。根据小米公布的信息，miclaw的核心目标是推动AI从传统对话助手向“系统级执行能力”发展。产品以系统应用形式运行，可以在用…
前沿技术
- 0
- 0
charles4月10日
从 RAG 到 Context：2025 年 RAG 技术年终总结

过去的2025年，对于检索增强生成（RAG）技术而言，是经历深刻反思、激烈辩论与实质性演进的一年。尽管围绕其“临时性”与“被替代性”的疑云一直笼罩，但纵观全年发展轨迹，RAG 并未如部分激进观点所预言的那样黯然退场，反而在企业级 AI 落地的深水区中，愈发彰显出其作为数据基础设施的不可替代性。回顾全年，RAG 的发展态势可谓错综复杂：一方面，其实际应用效果面临诸多质疑，部分源于 RAG 系统自身“…
RAG技术
- 0
- 0
charles4月10日
GPT-5.4实测全记录，当我让它操控我的电脑微信…

奥特曼半夜两点突然毫无征兆发布5.4新模型，我想各位都知道了！美国作息我是真遭不住！同时我有个疑问，GPT你为什么非要大半夜肘击自己？5.3 Instant才上了不到两天？5.4又被你抛了出来？而且 DeepSeek 你看看人家，我期待的 V4 在哪里～～言归正传，早上已经有很多媒体列举了 5.4 的诸多迭代优势。如代码能力的提升，构建应用时能够实时操控，让模型边写代码，边同步修改更夸张的是，GP…
前沿技术
- 0
- 0
charles4月10日
embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

01rerank如何影响业务表现今天聊一聊我们如何做高质量rerank。一个常识是，无论企业知识库、电商、新闻，还是RAG、Agent场景，只依靠语义相似度对检索结果进行排名，无疑都是粗暴且低效的。一方面，元数据往往包含了语义、时间、标签、地理位置等多元信息，语义并不总是最重要的那一项；另一方面，用户检索时，往往还需要对数据按照距离远近、好评分数、复购数量等信息进行综合排序。比如：电商：付费/旗舰…
RAG技术
- 0
- 0
charles4月10日
GPT-5.4发布，AI的最强之争已经结束了！

GPT-5.4发布了。说实话，我犹豫了半天要不要写这篇。真的被模型发布搞疲了。隔几周一个新版本，每次都是「史上最强」，但你真用起来，体感差异越来越小。靠跑一两个benchmark，已经越来越难测出模型的真实能力了，需要更长时间的日常使用才有体感。而且就拿我最常用的Agentic能力和coding能力来说，我不太相信GPT一个小版本的更新能超过Claude。所以对我日常使用最多的模型，其实没什么影响…
前沿技术
- 0
- 0
charles4月10日
企业AI真瓶颈：不在模型，而在语境！

AI代理因缺乏数据平台运行语境而失败，导致幻觉。编排系统提供血缘、健康等运营记录，是AI可靠性的关键。将编排作为共享语境引擎，可实现准确、可解释的AI。每个人都在争相推出用于数据工作的AI代理。他们希望这些代理能够编写SQL、调试管道、生成测试、自动记录资产并按需提供洞察。这几乎让人感觉数据工程师们一直期待的自助式分析承诺终于实现了。不幸的是，这些部署正在失败，仅仅是因为代理不了解数据…
RAG技术
- 0
- 0
charles4月10日
Claude Code 工具调用上下文爆炸？新版占用归零

升级到 Claude Code 2.1.69 后，我输入 /context 看了一眼。System tool 那一栏显示 0。之前这个数字是 10% 左右，有时候更高。现在直接归零了。2.1.69 版本把所有工具都改成了延迟加载（defer loading）。启动时不加载任何工具定义，需要的时候才去搜索、才去加载。另外如果你用过 Claude Code 连接多个 M…
前沿技术
- 0
- 0
charles4月10日
从 1600+ 份 Word 文档到生产级 RAG：一个工控行业知识库的全链路实战复盘

Agent 这个词，25 年下半年以来已经有点烂大街了。从我下半年聊过的大几十个项目里看，绝大多数企业实际连知识库都还没整明白就去追求 Agent，纯属本末倒置。知识库未必是所有场景的前置条件，但如果你想让工作流和 Agent 真正能用，把散落在多源异构文档、业务专家脑子里的经验沉淀下来，往往是绕不开的基础工作。知识库看起来是个老生常谈的需求，但真正做好并不容易。多源异构的非结构化数据怎么清洗、怎…
RAG技术
- 0
- 0
charles4月10日
OpenRouter，AI时代的印钞机

模型会商品化，连接模型的基础设施不会。在 AI 时代，谁站在流量的必经之路上，谁就拥有最持久的商业价值。1. 从一个问题说起2023年，当 Meta 把 LLaMA 开源扔进互联网的那一刻，Alex Atallah 意识到一件事：这个世界将不再只有一个 GPT，而是会有成百上千个大小各异的模型同时涌现。Atallah 是 OpenSea 的联合创始人兼前 CTO，他目睹过 NFT 生态的…
前沿技术
- 0
- 0
charles4月10日
短语检索不等于BM25+向量检索｜ Milvus Phrase Match实战

今天还是来继续聊聊做企业级知识库，那些常见的避坑小技巧，这一次的主题是短语检索。如果你做过搜索、日志分析、知识库、RAG，那么你一定被下面这几个场景折磨过：明明日志里有 `connection reset by peer`，就是搜不到？”北京上海” 和 “上海北京” 能不能算一个短语？英文还好说，中文只要分词一错误，检索就直接废掉？RAG 想加“必须包含某短语”的硬条件，向量模型却完全表达不了…
RAG技术
- 0
- 0
charles4月10日
AI越来越牛马了，GPT-5.4 发布！可以操作电脑

GOPENAI · 2026年3月5日GPT-5.4真正能干活的AI融合推理、编程与智能体能力的新一代旗舰模型。更准、更快、更省 token，一次交付复杂工作。GDPval83%上下文1M幻觉率↓33%不是更大的模型，是更会干活的模型。GPT-5.4 把 GPT-5.3-Codex 的顶级编程能力、GPT-5.2 的深度推理、以及全新的智能体工作流——融入一个统一的前沿模型。01 · SIX KE…
前沿技术
- 0
- 0
charles4月10日
让AI真正懂数据：猫超Matra项目中的AI知识库建设之路

一、背景近年来，人工智能技术正以快速的发展重塑各行各业。大模型(LLM)的突破性进展，使得自然语言理解、生成与推理能力显著提升，AI不再局限于图像识别或推荐系统，而是逐步向复杂决策和自主执行演进。在这一背景下，“Data Agent”成为企业智能化升级的一个探索方向。1.1 数据研发提效：历史积累带来的治理挑战猫超数据资产历经十年建设，已形成规模庞大的数据体系：累计沉淀数万张表、近万个调度节点，…
RAG技术
- 0
- 0
charles4月10日
谷歌NotebookLM深夜大更新！直接把PPT变成电影，效果太炸裂

今天凌晨1点，谷歌对专业文档AI助解读手NotebookLM进行大更新，直接发布了电影级预览功能。和去年7月的版本比起来，提升真的不是一星半点，说是质的飞跃都不为过。多说无益，咱们直接先看效果吧。下面这个是谷歌在2025年7月，第一次放出来的NotebookLM视频预览功能。只能说效果中规中矩，AI味道很浓，效果也一般。下面这个就是今天凌晨最新发布的效果，完完全全就是质的改变，视频、旁白真的都是…
前沿技术
- 0
- 0
charles4月10日
最新力作：一招提升RAG检索精度20%

把文档先“让LLM写摘要+打标签”，再用混合向量做检索，比直接扔原文进RAG，Top-10命中率从73%干到92%， latency 还更低。下面一起来具体分析：痛点直击企业知识库动辄上千页，传统语义分块+Embedding常“漏答案”人工写标签成本高，且随文档膨胀迅速失控长文档“中间丢失”现象导致LLM幻觉频发方案全景环节传统做法本文做法分块语义/固定长度三套并行：Naive / Recursi…
RAG技术
- 0
- 0
charles4月10日
OpenAI 深夜大更新，全世界最好的模型又回来了？！

大半夜的， OpenAI更新GPT-5.4了。 AI开始的前两年，真的很少看到OpenAI 这么高频率的迭代发布模型。今年以来，2月份更了5.3 Codex，写代码上真的口碑好到爆炸，这才刚过一个月，又是更新了GPT-5.3 Instant 缓解了已经臭名在外的对话能力，然后又直接把GPT-5.4端上桌了。先说参数上对我感知最大的提升，上下文窗口提升到1M了。而且GPT-5.4的价格比…
前沿技术
- 0
- 0
charles4月10日
Apple 入局 RAG：深度解析 CLaRa 框架，如何实现 128x 文档语义压缩？

在当前的检索增强生成（RAG）系统中，我们面临着一个经典的“不可能三角”：上下文窗口的限制、检索准确性与推理效率之间的矛盾。传统的 RAG 往往将检索器（Retriever）和生成器（Generator）作为两个割裂的系统进行优化，导致大量 Token 被粗暴地塞入上下文窗口，不仅造成了计算资源的浪费（Double Encoding），更引入了大量的噪声。近日，Apple 与爱丁堡大学的研究团队联…
RAG技术
- 0
- 0
charles4月10日
豆包和豆包负责人的产品哲学

中午和同事聊豆包产品做得怎么样。我的观点是，豆包的模型能力一般，但战略节奏极好。比如现在元宝和千问发红包，请大家喝奶茶，本质上都是在尝试抢占用户的心智入口。但这件事，豆包早就做了。我记得23年底在老家时，我已经帮长辈、父母在手机上装上豆包了。这就是先发优势。当时的豆包在各方面肯定都没那么完美，但它们非常清楚，在当时，只要推出一个60分的产品，就可以抢占心智。剩下不完美的，后续加快迭代就行了。对应的…
前沿技术
- 0
- 0
charles4月10日
客服、代码、法律场景适配：Milvus Ngram Index如何百倍优化LIKE查询| Milvus Week

本文为Milvus Week系列第6篇，该系列旨在把Zilliz团队过去半年多积累的先进的技术实践和创新整理成多篇干货深度文章发布。本系列已发表内容：88.9 倍性能飙升！JSON Shredding 让 JSON 查询告别全表扫描| Milvus WeekStruct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week语义+R-Tree空间索引：Milvus…
RAG技术
- 0
- 0
charles4月10日
刚刚，GPT-5.4 发布，百万上下文、最强全能模型

OpenAI 刚刚发布了 GPT-5.4，把推理、编程、Agent 工作流全部塞进了一个前沿模型里，还首次支持百万级上下文窗口。GPT-5.4 有三个版本：ChatGPT 里叫 GPT-5.4 Thinking，API 和 Codex 里叫 GPT-5.4，追求极限性能的还有 GPT-5.4 Pro。这次，OpenAI 把 GPT-5.2 的通用推理能力和 GPT-5.3-Codex 业界领先的编…
前沿技术
- 0
- 0
charles4月10日
一键把碎片变成有料笔记：NoteGen，一款跨平台的 Markdown 笔记应用

NoteGen 是啥简单说，NoteGen 是一款跨平台的 Markdown 笔记应用（Windows/Mac/Linux 桌面已稳定，移动端在做）。轻量（安装包约 20MB），本地优先，原生用 .md 存储，支持多种记录方式（截图、剪贴、文件、链接等），还能接入 ChatGPT、Gemini、Ollama 等模型，用 RAG 把笔记变成知识库。它解决了哪些痛点• 记录太碎：截图、剪贴…
RAG技术
- 0
- 0
charles4月10日