-
客服、代码、法律场景适配:Milvus Ngram Index如何百倍优化LIKE查询| Milvus Week
本文为Milvus Week系列第6篇,该系列旨在把Zilliz团队过去半年多积累的先进的技术实践和创新整理成多篇干货深度文章发布。本系列已发表内容:88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus WeekStruct Array 如何让多向量检索返回完整实体?知识库、电商、视频通用|Milvus Week语义+R-Tree空间索引:Milvus…- 0
- 0
-
刚刚,GPT-5.4 发布,百万上下文、最强全能模型
OpenAI 刚刚发布了 GPT-5.4,把推理、编程、Agent 工作流全部塞进了一个前沿模型里,还首次支持百万级上下文窗口。GPT-5.4 有三个版本:ChatGPT 里叫 GPT-5.4 Thinking,API 和 Codex 里叫 GPT-5.4,追求极限性能的还有 GPT-5.4 Pro。这次,OpenAI 把 GPT-5.2 的通用推理能力和 GPT-5.3-Codex 业界领先的编…- 0
- 0
-
一键把碎片变成有料笔记:NoteGen,一款跨平台的 Markdown 笔记应用
NoteGen 是啥简单说,NoteGen 是一款跨平台的 Markdown 笔记应用(Windows/Mac/Linux 桌面已稳定,移动端在做)。轻量(安装包约 20MB),本地优先,原生用 .md 存储,支持多种记录方式(截图、剪贴、文件、链接等),还能接入 ChatGPT、Gemini、Ollama 等模型,用 RAG 把笔记变成知识库。它解决了哪些痛点• 记录太碎:截图、剪贴…- 0
- 0
-
面向复杂工程的任务编排设计:Claude Code Tasks 机制详解
最近,Anthropic 为 Claude Code 带来了一项基础设施级的重要更新:全新的 Task 管理系统。它并不是对 Todos 的简单升级,而是一套面向复杂、多会话开发项目的成熟编排层。如果你一直在用 Claude Code,可能已经发现 Tasks 正在逐步替代原来的 Todos。在 AI 编程里,Tasks 的核心思路是把复杂工作拆成一小块一小块的任务。这些任务…- 0
- 0
-
Embedding模型选型思路:相似度高不再代表检索准确(文末附实战指南)
01之前我分享过一篇文章,也是Embedding模型选型,一年过去了,这个领域变化也比较大。Embedding模型选型思路:决定知识库与RAG的准确率上限!以前我们选择 Embedding 模型往往只看一个指标:MTEB(Massive Text Embedding Benchmark)综合得分。但今年随着 RAG系统的普及,工业界对 Embedding 的要求已经从单一的“语义相似度”演变为对 …- 0
- 0
-
移动端里的AI,用户到底要什么?—权衡性能和体验之战
引言:AI 正深刻影响客户端产品的体验与逻辑。本文来自一线客户端开发者的真实思考,从离用户最近的视角出发,聊聊 AI 究竟是让产品变得更加好用,还是在落地过程中带来了新的问题。01一个真实的冲突场景这种场景你们熟不熟悉:AI同学:"我们的新模型精度提升了10个点,识别更准了!"3D同学:"等等,你这模型多大啊?"AI同学:"也就60MB,还行吧。&…- 0
- 0
-
谷歌发布官方 CLI,可操作所有谷歌文档
今天上午的时候,Google Workspace CLI 上线到了 GitHub,挂在 Google Workspace 的官方组织名下我开始写这篇文章的时候,这个项目是 2700 个 Star;当我发出去的时候,重新截了个图,已经有 3500 个 Star 了草...刚发完预览,又变成 3700 个 Star..这个项目,最…- 0
- 0
-
把AI记忆做好,是一个价值6千亿美元的市场
先说一个暴论:AI 记忆正在成为最大商业机会,它是增量价值最明显、但体验最不稳定的一块。2025 年,你买到的很多 AI 产品已经足够聪明了,可一旦你把它放进真实业务,它最容易在一个地方翻车:记忆。这一点在海外Reddit社区上吐槽特别多。例如一个作者记录了 ChatGPT 在长对话里的记忆衰减,做了 11 天观察,核心抱怨是需要反复重建上下文,工作流被打断。再比如,有人抱怨n8n 里的 AI A…- 0
- 0
-
1块8读完3本三体!谷歌最强性价比模型来了,OpenAI两小时后紧急跟进
AI 军备竞赛,正在以肉眼可见的速度卷向“极致性价比”这条新赛道。北京时间 3 月 4 日凌晨,谷歌悄然推出了一款新模型——Gemini 3.1 Flash-Lite。没有发布会,没有大张旗鼓的预热,只是一篇官方博客,却在全球 AI 圈掀起了不小的波澜。而就在这篇博客发出后仅仅两个小时,老对手 OpenAI 便迅速祭出 GPT-5.3 Instant 予以回应。同一天,两大巨头…- 0
- 0
-
我错了,RAG还没完!AI记忆的结合会成为下一个技术风口
昨天和一个做AI产品的朋友聊天,他说现在做智能体项目时遇到个头疼问题:用户每次都要重新介绍自己的背景,智能体完全记不住之前的对话。这让我突然意识到一个深层次的问题——我们一直在优化智能体的大脑,但却忽视了一个更根本的问题:它有没有记忆?这可能就是当前AI产业最大的认知盲区。技术演进的隐藏脉络大多数人以为AI的发展路线是:简单问答 → 复杂推理 → 多模态理解。但真正推动AI智能体进化的核心驱动力,…- 0
- 0
-
OpenAI 遭到狙击!Gemini 3.1 Flash 性价比暴击 GPT-5.3,国外网友狂喜
家人们,这两天 AI 圈又热闹起来了。谷歌已经正式发布了 Gemini 3.1 Flash-Lite,受到国外网友热烈追捧,与此同时,OpenAI 也发布了 GPT-5.3 Instant。Gemini 3.1 Flash-Lite 地表最划算Gemini 3 Flash-Lite 它的作用是规模化任务。专门用来处理:翻译、摘要、客服回复、内容批处理、数据整理,这些每天最常见、…- 0
- 0
-
搜索的终极形态?向量搜索重构信息检索范式
传统的基于关键词的搜索引擎擅长匹配精确的词语,但当用户使用不同的词汇、同义词或更复杂的短语来表达意图时,往往力不从心。而语义搜索,通过理解词语背后的含义和语境,而非仅仅关注词语本身,彻底革新了信息检索方式。本指南将探讨语义嵌入如何实现这种强大的搜索功能。什么是语义搜索?语义搜索是一种数据检索技术,旨在理解搜索查询的含义和上下文意图,而不仅仅是匹配关键词。例如,语义搜索引擎不仅会搜索与“汽车”完全匹…- 0
- 0
-
Claude Code 创始人的 7 步高效工作流,编程小白也能直接抄
油管博主 Alex Finn 拆解了 Claude Code 创始人 Boris Cherny 的完整 AI 编程工作流,喵看完觉得干货密度很高,整理出来分享给大家。不管你是编程老手还是零基础小白,这套工作流的核心思路都值得借鉴:让 AI 干更多活,让自己少踩坑。01 多终端并行 + Ghostty 轻量终端核心做法:同时开 5 个 Claude Code 终端窗口,让 AI 并行处理项目的不同模…- 0
- 0
-
RAG 深度解读:检索增强生成如何改变人工智能
介绍人工智能 (AI) 每年都在变得越来越复杂。像 GPT-4 或 GPT-5 这样的大型语言模型 (LLM) 可以回答问题、撰写论文、总结内容,甚至编写代码。但这些模型存在局限性:他们可能不知道最新的事件,因为他们的训练数据是固定的。他们有时会产生幻觉,产生一些听起来合理但实际上是错误的信息。他们经常对特定领域的知识感到困惑,例如公司政策、医疗指南或法律规则。这就是RAG(检索增强生成)的用武之…- 0
- 0
-
大模型RAG入门宝典|从AI搜索到实战搭建,小白&程序员必收藏的检索增强指南
一、揭开大模型的神秘面纱:并非万能的"超级大脑"旁白:初次踏入AI领域,你便听闻"大模型"的赫赫威名——能写文案、解难题、聊人生,仿佛拥有无所不能的魔力。于是你满怀期待地与它深度互动,却渐渐发现:它也会"答非所问",也会"一本正经地胡说八道",原来所谓的"超级大脑",也有不少能力边界。今天我们就来深…- 0
- 0
-
Gemini 3.1 Flash-Lite、GPT-5.3 Instant 发布
Gemini 3.1 Flash-Lite 在展示“速度感”方面,比 GPT-5.3 Instant 最近主打的“对齐与聊天体验优化”更有冲击力。Gemini 3.1 Flash-Lite 发布主打“动态思考等级”与极致性价比Google 发布了 Gemini 3.1 Flash-Lite(Preview),定位为 Gemini 3 系列中:速度最快成本最低适合高并发场景DeepMind…- 0
- 0
-
货拉拉RAG优化实践:从原始数据到高质量知识库
一、背景知识库一般通过本场景的人工外呼获得专有知识,以及从其他场景的知识库迁移通用知识来人工构建的。图1 知识库初始构建初始构建的知识库一般包含三部分:相似问法、意图、标准话术(如图2所示);知识库在线上使用时,是将RAG召回的意图、相似问法、标准话术拼接到prompt中,由LLM生成相应的话术,所以知识库意图、相似问法、标准话术的映射关系是否准确尤为重要。图2 相似问法、意图、标准话术的映射关系…- 0
- 0
-
Google 发布 Gemini 3.1 Flash-Lite:每秒 363 tokens,百万 token 只要 $0.25
Google 刚发布了 Gemini 3 系列的最新成员,Gemini 3.1 Flash-Lite,主打一个又快又便宜。这个模型有多快呢?输出速度达到了 363 tokens/秒,而上一代 Gemini 2.5 Flash 是 249 tokens/秒,直接快了 45%。首个 token 的响应速度更是提升了 2.5 倍。简单说就是,你话还没问完,它答案都快出来了。…- 0
- 0
-
刚刚,GPT-5.3 发布:专治「油腻」,更准确!GPT-5.4 也快了
GPT-5.3,终于来了。全名 GPT-5.3 Instant。「More accurate, less cringe.」这是 GPT-5.3 的官方标签。翻译一下,「更准确,更不油腻。」OpenAI 说,「上一代 GPT-5.2 Instant 说话有时候咄咄逼人,还会对用户的意图和情绪做没来由的揣测。」有点意思。来看对比。一道纯物理题,弓箭远距离弹道计算。GPT-…- 0
- 0
-
RAG评估:Opik监控追踪RAG应用
随着LLM系统规模的扩大,确保其性能保持稳当可靠成为真正的挑战。因此,构建可靠且高效的基于LLM的应用系统,需要的不仅仅是部署一个模型,还需要持续评估以确保质量和可观察性,以便能够在部署后发现问题。很多团队在兴奋地搭完 RAG 管道后,却发现效果“玄学”:同样一套数据和模型,时而答得精准,时而胡说八道,线上用户反馈也忽好忽坏。到底是检索质量不行?还是生成阶段崩了?抑或上下文过长导致注意力稀释?配置…- 0
- 0
-
马斯克大赞阿里 AI,9B 参数硬刚 120B,海外网友:这叫小模型?
马斯克又双叒叕下场点赞中国 AI 了。昨天深夜,阿里通义千问团队在 X 平台正式发布了 Qwen3.5 小模型系列,覆盖 0.8B、2B、4B 和 9B 四个参数规格。甫一发布,便在海外科技圈引发强烈反响。马斯克也在该推文下评论称:「Impressive intelligence density」(令人印象深刻的智能密度)。这股热度的背后,APPSO 也好奇,为什么这几款小模型能够激起如此大的波澜…- 0
- 0
-
Struct Array 如何让多向量检索返回完整实体?知识库、电商、视频通用|Milvus Week
本文为Milvus Week系列第二篇,该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践,以下是DAY2内容划重点:Struct Array + MAX_SIM ,能够让数据库看懂 “多向量组成一个实体” 的逻辑,进而原生返回业务要的完整结果用向量数据库的人大概率都碰过这类问题:数据库里存的是被拆成片段的向量(比如一篇文档的段落向量、商品的单张图片向量),但业…- 0
- 0
-
企业级 AI Agent规模化落地的避坑指南,就藏在这四大趋势里
SaaS 用不好常卡在“最后一公里”。但 Al Agent 用不好,问题会出在“每一公里”。2025 被普遍视为企业级 Al Agent 的落地拐点:企业从“试试看”走向“用起来”,技术叙事让位于业务结果。美国著名通信 API 服务机构 Plivo 的调研显示,超过六成企业将 Al Agent 列为未来 12 个月的关键布局,“价值导向型…- 0
- 0
-
Claude Code 创造者直言:软件工程师这个头衔,可能要消失了
最近看了一期 Y Combinator 的播客节目 Lightcone,嘉宾是 Boris Cherny,Claude Code 的创造者。这期节目信息量非常大,Boris 从 Claude Code 的诞生讲起,一路聊到 AI 编程的未来、产品哲学、团队协作,甚至聊到了软件工程师这个职业本身会发生什么变化。我把里面最有价值的观点都提炼出来,尽量用大白话讲清楚。一切都是意外开始的Claude Co…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























