全部标签

新闻资讯

重新定义Agent Memory：一份覆盖形式、功能与动态的全景综述

记忆(Memory)已成为基础模型驱动的Agent的核心能力，它支撑着长周期推理、持续适应和与复杂环境的有效交互。然而，随着Agent记忆研究的快速扩展，该领域也变得日益碎片化——不同工作在动机、实现、假设和评估协议上差异巨大，而大量松散定义的记忆术语更是模糊了概念边界。传统的"长期/短期记忆"分类已经无法捕捉当代Agent记忆系统的多样性和动态性。为何需要新的分类框架论文指出…
前沿技术
- 0
- 0
charles3月28日
Claude官方Skill-Excel源码拆解，学习如何写一个好的Skill

前段时间大家都在传“Vibe Coding”（氛围感编程），仿佛写代码就是喝着咖啡动动嘴皮子。但作为技术人，我们不仅要懂“氛围”，更要懂“原理”。Anthropic 官方给 Claude 定义的 excel skill。这不仅仅是一段代码，我认为它是大模型与实体文件交互的优秀范例。很多人觉得给 AI 加个功能就是写个 Function Call，但看了这份源码，你会发现——…
前沿技术
- 0
- 0
charles3月28日
苹果官宣：Siri 将由 Gemini 驱动，Claude 太贵被 Pass

就在刚刚，苹果正式确认和 Google 达成多年期 AI 合作每年 10 亿美元，拿到一个 1.2 万亿参数的定制版 Gemini，共 Siri 使用这个模型比苹果现有的云端模型大 8 倍苹果向 CNBC 提供的声明里，这么表达：经过仔细评估，我们确定 Google 的技术为 Apple Foundation Models 提供了最强大的基础翻译一下：我们尝试自研了，但没搞定Anthr…
前沿技术
- 0
- 0
charles3月28日
为什么我会讲物理AI与记忆科学深度融合

当人工智能从数字空间的文本交互，迈向与物理世界深度联动的新阶段，一场认知体系的革命正在悄然酝酿。英伟达创始人黄仁勋提出的“物理AI”概念，为行业指明了AI突破现有瓶颈的核心方向；而记忆科学作为人类认知的底层逻辑，其与物理AI的深度融合，更将打破智能系统“知其然不知其所以然”的局限，构建起真正具备环境感知、经验沉淀、自主决策能力的颠覆式认知体系。红熊AI立足时代技术浪潮，以“软件结果化”与“软件硬件…
前沿技术
- 0
- 0
charles3月28日
我试了三个AI文档解析工具，一文讲透你想知道的真相

测试背景很早之前使用的微软markdown-it这个开源文档解析工具几乎不可用：一是大量文档识别失败，二是解析速度非常慢。但是被大家博主吹的神乎其神，几乎每隔一段时间都在x上赚一波流量，我想说的是，你们脸不红心不跳的一味搞流量，自己连clone下测试都没测试，直接吹？确认这条路走不通之后，我又连续尝试了几种常见的文档解析方案，效果都不理想。后来在进一步搜索中发现：各家大模型厂商已经陆续开放了文档解…
前沿技术
- 0
- 0
charles3月28日
刚刚，苹果官宣 iPhone 将搭载最强 AI！马斯克第一个跳出来骂

一觉醒来，你的 iPhone 即将用上最强 AI 了。就在刚刚，苹果和 Google 发布联合声明，双方达成达成多年深度合作协议。下一代「苹果基础模型」将直接基于 Google 的 Gemini 模型和云技术构建。这意味着，未来驱动 Apple Intelligence 的核心大脑，将流淌着 Google 的血液。曾经那个被诟病「人工智障」的 Siri，今年晚些时候就会迎来基于 Gemini 模型…
前沿技术
- 0
- 0
charles3月28日
Anthropic官方万字长文：AI Agent评估的系统化方法论

上周，Anthropic 发布了一篇重磅技术博客《Demystifying evals for AI Agents》，系统性地阐述了如何为 AI Agent 构建评估体系。做过 Agent 开发的同学应该深有体会：传统软件测试的那套方法论，在 Agent 面前彻底失效了。写几个单测、跑个回归的老套路行不通，因为 Agent 天生带着两个"反骨"属性：• 非确定性：同一…
前沿技术
- 0
- 0
charles3月28日
Claude Code 源码揭秘：为什么不造 100 个工具？一个 Bash 打天下的哲学

今天来拆工具系统。这么能打的 Agent，工具应该很多吧？毕竟功能那么丰富，文件操作、代码搜索、网络请求、进程管理...结果打开 src/tools/index.ts 一看，核心工具就那么几个：export function registerAllTools(): void { // Bash 工具家族 toolR…
前沿技术
- 0
- 0
charles3月28日
Anthropic工程实践：AI Agent如何连续工作数天完成复杂项目？

AI Agent 现在能处理需要数小时甚至数天的任务。但有个难题:它们无法在多个上下文窗口之间保持进度。核心问题在哪?Agent 以离散会话方式工作,每次新会话启动时完全不记得之前发生的事。想象一个软件项目,工程师轮班作业,但每位新工程师上岗时对前一班的工作一无所知。上下文窗口容量有限,大多数复杂项目无法在单个窗口内完成。Agent 需要找到跨越这些间隙的方法。我们为 Claude Agent S…
前沿技术
- 0
- 0
charles3月28日
2026大模型伦理深度观察：理解AI、信任AI、与AI共处

2025年，大模型技术继续高歌猛进。在编程、科学推理、复杂问题解决等多个领域，前沿AI系统已展现出接近“博士级”的专业能力，业界对通用人工智能（AGI）的预期时间表不断提前。然而，能力的飞跃与理解的滞后之间的鸿沟也在持续扩大——我们正在部署越来越强大的AI系统，却对其内部运作机制知之甚少。这种认知失衡催生了大模型伦理领域的四个核心议题：如何“看清”AI的决策过程（可解释性与透明度）、如何确保AI的…
前沿技术
- 0
- 0
charles3月28日
发现一个比AutoGLM更小的GUI模型，仅4B参数，附实测和部署教程

昨天分享完智谱的AutoGLM，就有好友凌晨1点多给我发消息，说阶跃也有一个GUI的模型，而且只有4B。我看了一下，是GELab-Zero-4B-preview模型，这个模型我自己台式机4070super 12G就能部署。相较于AutoGLM来说，资源就少了很多。同时，还可以量化，进一步减少资源，但是部署到手机上，端侧推理的话，速度应该还是不行。Github：https://github.com/…
前沿技术
- 0
- 0
charles3月28日
阿里云全新发布的 UModel 是什么

每个时代基础设施的变革，都始于对“混乱”的优雅重组。19 世纪，钢铁把不可控的垂直空间变成工程秩序，城市才得以向上生长；20 世纪，电网将分散的能源重新编排，工业生产才不再被河流左右。而如今的 IT 领域，我们正面临一场新的秩序重建，即如何让海量、碎片化、动态变化的观测数据，不再是噪音，而成为可理解、可推理、可优化智能体行为的燃料？要回答这个问题，我们先简单回溯下：IT 系统的可观测体系是如何走到…
前沿技术
- 0
- 0
charles3月28日
Claude Skills 到底是什么？万字长文深度解析

卷首语如果说通用AI是智能底座，那Claude Skills就是让底座迸发垂直价值的“魔法插件”。这篇万字干货，浓缩了对Skills的完整应用思考：无需懂代码，只需梳理专业经验，就能低成本打造媲美专业AI产品的垂直Agent。其实Claude Skills的潜力，远未被充分挖掘。一个优质Skill能实现的智能效果，甚至能超越专门开发的AI产品。今天就从概念、价值、教程到场景，全方位拆解…
前沿技术
- 0
- 0
charles3月28日
Agent Skill 即将统治一切？Claude Code 2.1.3 把斜杠命令"杀"了

早上起来看了眼Claude Code，发现又更新了，最新版本是v2.1.3，扫了一眼 Changelog，忍不住有点兴奋：Anthropic 终于把那个让人精神分裂的设计给改了。"Merged slash commands and skills"——这行字虽然短，但信息量极大。简单说，斜杠命令（比如 /review、/commit）正式"转正&q…
前沿技术
- 0
- 0
charles3月28日
如何用AI表格低门槛手搓一个业务系统？

最近2周认真体验了一下飞书的多维表格，尤其是它的AI功能。作为一名自封的EXCEL高手、多年的主流BI系统的管理员，同时又积极主动拥抱AI潮流并可以手搓Data Agent的数据从业者，我来聊一下多维表格由浅入深的实操体验。一、多维表格之表格先从EXCEL视角来看，多维表格有很多和EXCEL相似的地方，会用EXCEL就可以入门多维表格。1、公式：首先，最直观的体验就是，你再也不能在表格手输=然后敲…
前沿技术
- 0
- 0
charles3月28日
Agent Skills入门指南，看这篇就够了 | 保姆级教程

说实话，之前第一次了解到 Claude Agent Skills 这个功能时，我还有点不以为然。不就是个提示词模板吗？能有多大用处？结果真香。。用了一段时间后，我发现这玩意儿简直是工作流神器。比如以前每次跟 Claude Code 对话都要重新解释一遍项目规范，现在直接把专业知识打包成 Skill，Claude Code 自动就懂了。当然Skills的能力远不止于此。今天这篇文章，我就给大家讲讲&…
前沿技术
- 0
- 0
charles3月28日
当技能库超过50个，AI的选择能力会断崖式下跌

多Agent系统（Multi-Agent System，MAS）近年来在复杂推理任务中表现出色，但代价是巨大的计算开销。一个自然的问题是：能否用单个agent配合技能库来替代多agent协作，同时保持性能？论文通过实验发现，这种"编译"策略确实可行——在保持准确率的同时，token消耗降低54%，延迟降低50%。然而，更深层的问题随之浮现：当技能库规模扩大时，AI的技能选择能力…
前沿技术
- 0
- 0
charles3月27日
5个让Claude Code效率翻倍的Skill！

最近时间线被Claude Skills刷屏了，为什么Skills这么火？以为 Skill 是本地文件，以 markdown 文件作为指导，可以定制流程、可以调用本地 python 方法，定制方便，而且比使用 MCP 方式省 token。从此，你不再是被动使用AI，而是主动定制AI的能力边界。这些本地化、可定制的技能包正在改变AI编程的玩法。我挑出了5个最实用的，分享给你。1. skill-crea…
前沿技术
- 0
- 0
charles3月27日
使用 IChatReducer 进行聊天记录缩减

序言在多轮对话场景中，随着聊天次数增加，发送给大语言模型（LLM）的上下文会持续膨胀，带来 Token 成本上升与上下文溢出风险。 Microsoft Agent Framework 将这一问题抽象为 Chat Reduction（聊天记录缩减），并通过 IChatReducer 策略对聊天历史进行统一治理，而不是在业务代码中零散地裁剪或拼接历史消息。本文基于“客户端本地存储聊…
前沿技术
- 0
- 0
charles3月27日
“基模四杰”开年首炸：Chat已死，Agent已来

前言就在昨天，2026年1月10日，北京。这场被称为AGI-NEXT的前沿峰会，可能不仅是一场技术峰会，更像是一场对过去三年“聊天机器人”时代的集体告别。首先感谢“数字生命卡兹克”大佬第一时间将“基模四杰”（智谱AI唐杰、月之暗面杨植麟、阿里通义林俊旸、腾讯混元姚顺雨）在《AGI-NEXT前沿峰会》的会议内容毫无修饰、处理的全文发布。这3个小时的高密度输出，抛出了国内AI产业最残酷的真相：单纯的对…
前沿技术
- 0
- 0
charles3月27日
Anthropic联创：还不存在真正递归自我改进的AI！曝内部调查结果：AI未必能实现开发效率爆炸式增长；Claude也能修水管，看好分布式预训练

Anthropic联创又出来说话了！就在刚刚，小编刷到一位知名的前对冲基金经理Michael Burry 在X上发布了一期访谈，参与者有Anthropic 联创 Jack Clark、 Dwarkesh 播客的创始人兼主持人 Dwarkesh Patel 以及软件创业者 Patrick McKenzie。四位大佬同台都聊了点啥？小编细听下来发现，他们透露了不少反直觉的细节和数据。比如，AI工具究竟…
前沿技术
- 0
- 0
charles3月27日
Claude Skill 快照：给你的 AI 技能迭代加个「后悔药」

之前我的一篇介绍 Claude Skill 的文章很受大伙欢迎。很多小伙伴看过之后都跃跃欲试。不知你都做了几个 Claude Skill 出来了？假设为了完成某项任务，你参考我的教程创作了一个 Claude Code 的技能，并且不断迭代改进。折腾了好几天，技能终于调通了，效果也不错。你长舒一口气，想着「太好了，终于搞定」。然后，你有了一…
前沿技术
- 0
- 0
charles3月27日
Step-DeepResearch：深度研究的全能选手，规划、检索、反思一网打尽！

在当今信息爆炸的时代，深度研究对于推动学术发展、商业决策以及技术创新等方面具有至关重要的作用。然而，传统的研究方式往往面临着效率低下、成本高昂以及难以应对复杂多变的研究需求等诸多挑战。为了解决这些问题，深度研究领域不断涌现出新的技术和方法，而Step-DeepResearch 作为一款具有创新性的深度研究 AI 模型，凭借其卓越的性能和高性价比，正在引领这一领域的变革…
前沿技术
- 0
- 0
charles3月27日
静态分析只能查规则，AI 才能懂语义：PR-Agent 和 ESLint/Sonar 的正确分工

周五下午 5 点，你终于把那坨改了两天的代码推上去，开了个 PR，长舒一口气：今晚可以安心下班了。然后你盯着 PR 页面刷新了两次——没动静。你发了句“麻烦帮忙看下”，同事头像亮了一秒又灰了：人家要赶地铁、要接娃、要过周末。你也理解。结果周一早上 10 点，review 终于来了，但不是“LGTM”，而是一串你自己都想捂脸的评论：没处理异常、变量命名乱、边界条件没考虑、还有个日志把敏感信息打出来了…
前沿技术
- 0
- 0
charles3月27日