全部标签

新闻资讯

DeepSeek V4 悄咪咪上线了？1M 上下文简直爽翻！

DeepSeek更新了，还是那个熟悉的味道，极致低调，直接上线，一句话都没有对外宣布，当然又可能明天或过两天在官号上宣布一下。但这些都不重要，期待多久了，他终于还是来了。废话不多说，赶紧直接上手体验。这波更新到底是不是真的？怎么才能用上？🛠️ 第一步：怎么“强制”唤醒它？很多人打开网页版发现还是老样子，别急，这里有个玄学但有效的方法（亲测 100% 成功）：1. 手机端：赶紧…
前沿技术
- 0
- 0
charles4月6日
MiniMax RAG 技术：从推理、记忆到多模态的演进与优化

导读在智能体与大模型应用不断深入的背景下，检索增强生成（RAG）技术正经历从“检索＋生成”向“检索＋推理＋记忆＋多模态”一体化的跃迁。本文首先剖析 RAG 系统在推理链构建和 Agent Layer 中引入知识图谱、MCTS 及强化学习的优化路径，继而探讨记忆层在动态检索、注意力过滤与多智能体协作中的实现方式；最后聚焦多模态场景下的张量化检索与延迟交互模型（COL），并针对存储膨胀、重…
RAG技术
- 0
- 0
charles4月6日
2026 企业级AI（Agentic AI for Enterprise)，是新大陆

本期要点速览我们正处在一个很奇怪的阶段：AI 能力在飞速增长，但真正把 AI 放进工作和组织里的人，远没有想象中多。你必须持续奔跑，才能保持在原地；AI 抬高了平均值，也同时拉大了人与人之间的差距。未来的分化，可能不再是二八或一九，而是 0.1 和 99.9，差距体现在你是否还“相关”。即便是巨头，也没有真正的安全感，基础技术和上层应用正在同时被重构。真正的壁垒不复杂：一是速度，二是能否真正进入现…
前沿技术
- 0
- 0
charles4月6日
告别新手级RAG！一文掌握专业级后检索优化流水线

众所周知，检索是检索增强生成 (RAG) 系统的核心。它直接决定哪些文档片段给到大语言模型（LLM）来生成最终答案。不过，并不是所有的检索结果都是理想的。比如，在返回的前K个文档结果中，并不是最相关的。还有返回的结果过于冗长或已经过时，也会影响最终答案的质量。在前面我们通过两篇文章学习了两种预检索优化策略：查询路由（Query Routing）和查询构建（Query Construction）。它…
RAG技术
- 0
- 0
charles4月6日
深度求索突然出手！1M上下文碾压GPT-4？国内AI迎来全新突破

深度求索重磅更新！DeepSeek新模型全面解析，1M上下文惊艳亮相近日，AI界迎来一则重磅消息：DeepSeek正式推出新模型！无论是APP用户还是网页端用户，都能体验到这次令人惊喜的升级。从官方推送的更新提示来看，这可能是V4 Preview或V4 lite版本，预示着DeepSeek技术实力的又一次飞跃。当用户打开DeepSeek APP时，会收到“发现新版本，是否立即更新”的提示。更新至1…
前沿技术
- 0
- 0
charles4月6日
切块、清洗、烹饪：RAG知识库构建的三步曲

嘿，各位AI技术爱好者们，你是不是经常遇到这样的情况：辛辛苦苦训练的AI助手，面对专业问题时却"一问三不知"或者"胡言乱语"？明明你已经喂了它一堆PDF和Word文档，为啥它就是不会用？就像你去米其林餐厅，厨师拿着一堆未处理的食材直接上桌一样荒谬！没错，RAG系统也需要一个"厨房"，而文档处理与知识库构建，就是这个厨房里最重要的"…
RAG技术
- 0
- 0
charles4月6日
当 AI Agent 接管手机：移动端如何进行观测

背景介绍Cloud Native最近，基于 AI Agent 的各种手机助手在社交媒体上爆火，它能够通过 AI 自动操作手机完成下单、比价、搜索等复杂任务。用户只需说一句“帮我找最便宜的 iPhone”，AI 就能自动打开购物 App、搜索商品、对比价格并完成下单。这种“AI 接管手机”的场景，让很多人看到了未来人机交互的新形态。然而，当 AI 开始大规模操作手机时，传统的用户行为分析将会面临严重…
前沿技术
- 0
- 0
charles4月6日
终结 “闭卷考试”：RAG 如何从根源上构建可信的AI应用

在上一篇《与 AI 的 “幻觉” 作战》里，我们聊到一个扎心的现实：当AI像一面失真的 “镜子”，即便我们掌握了 “提问” 这把终极杠杆，撬起来的也可能是 “一本正经的胡说八道”。幻觉，这个大模型与生俱来的 “认知缺陷”，至今仍是企业将AI落地到客服、医疗、金融等关键场景的最大拦路虎 —— 没人敢用一个随时可能编造数据的 AI 来回答客户疑问，更别提辅助诊断或生成合同了。当时我们留下了一个 “系统…
RAG技术
- 0
- 0
charles4月6日
DeepSeek 刚刚发布了新模型！

DeepSeek 新模型上线！附体验指南！现在打开 DeepSeek App，你可能收到更新提示（如下图），点击“立即更新”即可体验最新能力。新模型核心亮点（灰度测试）：上下文能力跃升：从 128K Token 大幅提升至 1M Token！这意味着一次可处理的信息量激增近10倍，足以容纳《三体》三部曲这样的超长内容。知识库全面更新：知识截止日期更新至 2025年…
前沿技术
- 0
- 0
charles4月5日
你的RAG应用为什么总“胡说八道”？这份21项优化自查清单，帮你根治AI幻觉

关注我，让我的实验，成为你的经验。大家好，我是dify实验室的超人阿亚。你是否也经历过这样的“社死”瞬间：信心满满地向老板或客户演示你搭建的智能知识库问答机器人，结果它面对一个简单的问题，却给出了一段看似专业、实则完全捏造的答案。场面一度十分尴尬，你开始怀疑人生：“我明明把所有资料都喂给它了啊！” 别灰心，你不是一个人在战斗。RAG应用中的“幻觉”问题，是每个AI应用开发者都会遇到的拦路虎。今…
RAG技术
- 0
- 0
charles4月5日
DeepSeek新模型来了！官网模型更新为最新版，实测显示非此前的DeepSeek V3.2，最高支持100万tokens输入，以及知识截止日期为2025年5月

就在刚才，很多人发现DeepSeek官网已经更新了模型，虽然不确定是DeepSeek-V4，但是目前可以肯定，这不是之前公布的DeepSeek-V3.2而是一个全新的模型。为此，DataLearnerAI实测正式，这个模型的确并非此前的版本。首先，向该模型提问，询问支持的上下文和知识截止日期，得到的回复时100万tokens输入，知识截止日期是2025年5月份。不过，此前DeepSeek从V3.1…
前沿技术
- 0
- 0
charles4月5日
运用 Elasticsearch 进行向量搜索及创建 RAG 应用

导读 Elasticsearch 目前是世界上最大的搜索引擎，在 ToB 业务中应用广泛，携程、抖音、滴滴等平台的搜索引擎都基于此构建。本文介绍会围绕以下五方面展开：1. 智能时代的搜索需求2. Elasticsearch 向量搜索及最新进展3. RAG 实现原理4. 使用 Elasticsearch 在企业搜索中的案例分享5. 附录信息分享嘉宾｜…
RAG技术
- 0
- 0
charles4月5日
AI推理：如何实现吞吐翻倍、时延降90%与GPU资源节省26%？

引言：AI规模化落地，推理系统面临全新挑战全球领先的市场研究和咨询公司IDC预测，到2028年，75%的新 AI 工作负载将实现容器化，从而显著提升模型与工作负载更新的速度、一致性与安全性。容器化技术将成为 AI 推理时代的“默认交付形态”。当前随着大模型技术快速演进与业务场景的深度融合，AI业务对推理基础设施的需求呈现爆发式增长。在早期小流量场景下，手动部署与定制化方案尚可应对；然而当模型规模、…
前沿技术
- 0
- 0
charles4月5日
通过两个案例，看RAG如何解决大模型的“知识短板”

大模型和RAG一样，都是针对用户的问题，给出答复，那么，为什么有问题不直接问DeepSeek，还要跑一遍RAG？RAG的出现，从根本上解决了大模型在处理知识时的一个核心痛点：如何高效、准确且低成本地利用那些未训练过的、私有的或最新的知识来回答问题。如果我们希望大模型根据某些特定的知识内容生成答案，就必须将这些知识提供给模型。似乎我们可以把这些知识全部发送给模型，但实际上并不可行一方面，大模型本身的…
RAG技术
- 0
- 0
charles4月5日
从CLI原理出发，如何做好AI Coding

话题背景：随着LLM的能力提升，从早些AI产品能快速帮助用户制作prototype，到现在当前市面上不断涌现出新的AI Coding工具，这些AI Coding背后的工具原理是什么？我们在选择这些AI Coding工具的时候，需要关注哪些信息，了解背后的原理，才能更好地使用这些工具。Q：回想一下，你接触过哪些AI Coding工具？当前使用过程中有哪些问题？时代在倒退么？ CLI的产品美学当我第一…
前沿技术
- 0
- 0
charles4月5日
给AI装上一个'超级大脑'：信息检索如何改变RAG系统的游戏规则

你是否有过这样的经历？问AI一个问题，它能自信满满地回答，但你稍微验证一下就发现——"这个回答完全是编造的"。没错，这就是当今大模型的典型特点：看似无所不知，实则可能自信地胡说八道。这个问题该怎么解决？今天我们就来聊聊如何给AI装上一个"超级大脑"——通过RAG（检索增强生成）系统中的核心技术：信息检索！当AI成为了"自信的编造者"想象一…
RAG技术
- 0
- 0
charles4月5日
微信AI时代的困境，跟苹果是一样的

2026年的科技圈，正在经历一场昂贵且有趣的竞赛。一边是微信里头闹出的动静。腾讯自家的大模型应用元宝，想趁着春节冲一波用户，老办法，砸钱10个亿，发红包。结果场面一度十分尴尬，红包链接没刷屏多久，就被微信安全机制精准拦截。这种大水冲了龙王庙的乌龙，被外界调侃为自家兄弟打了自家的脸。这让人纳闷：腾讯搞AI，怎么还是撒钱拉人那一套？这种动作显得有些心有余而力不足。另一场竞赛关于大洋彼岸的苹果。即便新i…
前沿技术
- 0
- 0
charles4月5日
别让你的RAG“吃”垃圾数据了！从源头构建高质量知识库的深度文档解析指南

最近有个群友问了我一个问题，非常有代表性。他刚接触RAG，跟着网上的教程，用LangChain框架快速搭起了一套问答系统。他用框架自带的PyPDFLoader加载了公司的几份PDF报告，流程跑通了，但一测试就傻眼了：模型的回答质量极低，各种回避问题、事实错误。这个问题我深有体会。它指向了一个常常被我们忽视，但却至关重要的环节。我在早期实践RAG时，也曾困在这个瓶颈上。当时我只顾把精力都放在了Pro…
RAG技术
- 0
- 0
charles4月5日
Claude Code，它为何这么狠？

怎么让AI编程助手更强？多加几个Agent？搞个复杂的协作框架？用RAG增强检索？训练专门的编程模型？Claude Code对这个问题给出了一个反常识的答案：以上全都不要。摒弃多Agent想象一下你是一个创业公司老板，有个紧急任务要完成。你有两个选择：• 选项A：找一个能力很强的全栈员工，把任务交给他，让他从头到尾搞定。• 选项B：搭一个"完美团队&quo…
前沿技术
- 0
- 0
charles4月5日
别再说你的RAG召回率不行，都怪你文档处理的太差——别拿文档处理是难点当借口

“ 在RAG系统中，业务比技术更重要；好的业务和设计能大大减少你的工作量，并提升召回率。”在刚开始做RAG的时候，认为RAG很简单；虽然说文档处理是一个难点，但那也是没办法的事，毕竟这玩意在业界就是一个难点；但随着这段时间做RAG的数据处理和优化才发现事情远远没有自己想的那么简单。虽然说复杂文档处理是一个难点，但那并不是你做不好RAG的理由；原因就在于你根本没有弄明白，怎么才能做好一个R…
RAG技术
- 0
- 0
charles4月5日
2026 必须学一手：Claude Skills 指南

Skills 出现后已经改变了 Agent 开发范式，以往我们主要通过 Tools / MCP 来实现外部接口调用从而增强模型能力，但现在又有了更轻量更专业拓展 Agent 能力的方式，它就是 Skill。下面的内容是 Claude 官方文档整理过来，值得所有 Agent 开发同学学一手！什么是 Skill？🎯核心定义Skill = 一个文件夹，包含教 Claude 如何处理特定任务的指令集，主要…
前沿技术
- 0
- 0
charles4月5日
【RAG的16种玩法】反馈闭环、自适应检索增强(中)

09反馈闭环在构建高质量的检索增强生成系统(RAG)时，我们常常调到一个关键:当前知识库和检索流程都是静态的，无法根据用户使用过程中的真实反馈进行优化和调整。因此，需要引入一种持续改进的机制【反馈闭环】。什么是反馈闭环？在 RAG 系统中设计一套机制，收集用户对回答内容的反馈(如点击、评分、点赞、修改建议等)，并基于这些数据不断优化检索策略、知识库内容和生成质量。目的：提高问答系统的准…
RAG技术
- 0
- 0
charles4月5日
让我们接着聊Claude Cowork带来的认知变化

之前说了我们着重聊聊Anthropic Claude看看去年他们都干了什么，把整个SaaS行业整的快半身不遂了。1、Agent到Skill的选择【初窥门径】2、Claude Code【筑基】3、Claude Cowork【结丹】Claude Code上期已经说了，显示出了Anthropic对于AI的理解和选择，希望对大家有启发。从SaaSpocalypse（SaaS 末日）聊下Anthropic …
前沿技术
- 0
- 0
charles4月5日
在RAG文档处理中——怎么处理噪音问题

“ RAG文档处理的原则是找出有效数据，剔除无效数据，而不是为了大而全整一堆没用的数据。”在RAG增强检索中，文档处理是重中之重，但是很多人的文档处理做的很粗糙，然后还奇怪为什么我的RAG质量不好，召回率太低，原因就在于你的文档处理真的不咋地。虽然说现在的文档处理是大模型应用中的一个难点，但既然用了那就要想办法把它做好，因此我们现在需要考虑的不是文档处理有多复杂，而是应该考虑怎么提升文档…
RAG技术
- 0
- 0
charles4月5日