-
重新定义Agent Memory:一份覆盖形式、功能与动态的全景综述
记忆(Memory)已成为基础模型驱动的Agent的核心能力,它支撑着长周期推理、持续适应和与复杂环境的有效交互。然而,随着Agent记忆研究的快速扩展,该领域也变得日益碎片化——不同工作在动机、实现、假设和评估协议上差异巨大,而大量松散定义的记忆术语更是模糊了概念边界。传统的"长期/短期记忆"分类已经无法捕捉当代Agent记忆系统的多样性和动态性。为何需要新的分类框架论文指出…- 0
- 0
-
Claude官方Skill-Excel源码拆解,学习如何写一个好的Skill
前段时间大家都在传“Vibe Coding”(氛围感编程),仿佛写代码就是喝着咖啡动动嘴皮子。但作为技术人,我们不仅要懂“氛围”,更要懂“原理”。Anthropic 官方给 Claude 定义的 excel skill。 这不仅仅是一段代码,我认为它是大模型与实体文件交互的优秀范例。很多人觉得给 AI 加个功能就是写个 Function Call,但看了这份源码,你会发现——…- 0
- 0
-
苹果官宣:Siri 将由 Gemini 驱动,Claude 太贵被 Pass
就在刚刚,苹果正式确认和 Google 达成多年期 AI 合作每年 10 亿美元,拿到一个 1.2 万亿参数的定制版 Gemini,共 Siri 使用这个模型比苹果现有的云端模型大 8 倍苹果向 CNBC 提供的声明里,这么表达:经过仔细评估,我们确定 Google 的技术为 Apple Foundation Models 提供了最强大的基础翻译一下:我们尝试自研了,但没搞定Anthr…- 0
- 0
-
为什么我会讲物理AI与记忆科学深度融合
当人工智能从数字空间的文本交互,迈向与物理世界深度联动的新阶段,一场认知体系的革命正在悄然酝酿。英伟达创始人黄仁勋提出的“物理AI”概念,为行业指明了AI突破现有瓶颈的核心方向;而记忆科学作为人类认知的底层逻辑,其与物理AI的深度融合,更将打破智能系统“知其然不知其所以然”的局限,构建起真正具备环境感知、经验沉淀、自主决策能力的颠覆式认知体系。红熊AI立足时代技术浪潮,以“软件结果化”与“软件硬件…- 0
- 0
-
我试了三个AI文档解析工具,一文讲透你想知道的真相
测试背景很早之前使用的微软markdown-it这个开源文档解析工具几乎不可用:一是大量文档识别失败,二是解析速度非常慢。但是被大家博主吹的神乎其神,几乎每隔一段时间都在x上赚一波流量,我想说的是,你们脸不红心不跳的一味搞流量,自己连clone下测试都没测试,直接吹?确认这条路走不通之后,我又连续尝试了几种常见的文档解析方案,效果都不理想。后来在进一步搜索中发现:各家大模型厂商已经陆续开放了文档解…- 0
- 0
-
刚刚,苹果官宣 iPhone 将搭载最强 AI!马斯克第一个跳出来骂
一觉醒来,你的 iPhone 即将用上最强 AI 了。就在刚刚,苹果和 Google 发布联合声明,双方达成达成多年深度合作协议。下一代「苹果基础模型」将直接基于 Google 的 Gemini 模型和云技术构建。这意味着,未来驱动 Apple Intelligence 的核心大脑,将流淌着 Google 的血液。曾经那个被诟病「人工智障」的 Siri,今年晚些时候就会迎来基于 Gemini 模型…- 0
- 0
-
Anthropic官方万字长文:AI Agent评估的系统化方法论
上周,Anthropic 发布了一篇重磅技术博客《Demystifying evals for AI Agents》,系统性地阐述了如何为 AI Agent 构建评估体系。做过 Agent 开发的同学应该深有体会:传统软件测试的那套方法论,在 Agent 面前彻底失效了。写几个单测、跑个回归的老套路行不通,因为 Agent 天生带着两个"反骨"属性:• 非确定性:同一…- 0
- 0
-
Claude Code 源码揭秘:为什么不造 100 个工具?一个 Bash 打天下的哲学
今天来拆工具系统。这么能打的 Agent,工具应该很多吧?毕竟功能那么丰富,文件操作、代码搜索、网络请求、进程管理...结果打开 src/tools/index.ts 一看,核心工具就那么几个:export function registerAllTools(): void { // Bash 工具家族 toolR…- 0
- 0
-
Anthropic工程实践:AI Agent如何连续工作数天完成复杂项目?
AI Agent 现在能处理需要数小时甚至数天的任务。但有个难题:它们无法在多个上下文窗口之间保持进度。核心问题在哪?Agent 以离散会话方式工作,每次新会话启动时完全不记得之前发生的事。想象一个软件项目,工程师轮班作业,但每位新工程师上岗时对前一班的工作一无所知。上下文窗口容量有限,大多数复杂项目无法在单个窗口内完成。Agent 需要找到跨越这些间隙的方法。我们为 Claude Agent S…- 0
- 0
-
2026大模型伦理深度观察:理解AI、信任AI、与AI共处
2025年,大模型技术继续高歌猛进。在编程、科学推理、复杂问题解决等多个领域,前沿AI系统已展现出接近“博士级”的专业能力,业界对通用人工智能(AGI)的预期时间表不断提前。然而,能力的飞跃与理解的滞后之间的鸿沟也在持续扩大——我们正在部署越来越强大的AI系统,却对其内部运作机制知之甚少。这种认知失衡催生了大模型伦理领域的四个核心议题:如何“看清”AI的决策过程(可解释性与透明度)、如何确保AI的…- 0
- 0
-
发现一个比AutoGLM更小的GUI模型,仅4B参数,附实测和部署教程
昨天分享完智谱的AutoGLM,就有好友凌晨1点多给我发消息,说阶跃也有一个GUI的模型,而且只有4B。我看了一下,是GELab-Zero-4B-preview模型,这个模型我自己台式机4070super 12G就能部署。相较于AutoGLM来说,资源就少了很多。同时,还可以量化,进一步减少资源,但是部署到手机上,端侧推理的话,速度应该还是不行。Github:https://github.com/…- 0
- 0
-
阿里云全新发布的 UModel 是什么
每个时代基础设施的变革,都始于对“混乱”的优雅重组。19 世纪,钢铁把不可控的垂直空间变成工程秩序,城市才得以向上生长;20 世纪,电网将分散的能源重新编排,工业生产才不再被河流左右。而如今的 IT 领域,我们正面临一场新的秩序重建,即如何让海量、碎片化、动态变化的观测数据,不再是噪音,而成为可理解、可推理、可优化智能体行为的燃料?要回答这个问题,我们先简单回溯下:IT 系统的可观测体系是如何走到…- 0
- 0
-
Claude Skills 到底是什么?万字长文深度解析
卷首语如果说通用AI是智能底座,那Claude Skills就是让底座迸发垂直价值的“魔法插件”。这篇万字干货,浓缩了对Skills的完整应用思考:无需懂代码,只需梳理专业经验,就能低成本打造媲美专业AI产品的垂直Agent。其实Claude Skills的潜力,远未被充分挖掘。一个优质Skill能实现的智能效果,甚至能超越专门开发的AI产品。今天就从概念、价值、教程到场景,全方位拆解…- 0
- 0
-
Agent Skill 即将统治一切?Claude Code 2.1.3 把斜杠命令"杀"了
早上起来看了眼Claude Code,发现又更新了,最新版本是v2.1.3,扫了一眼 Changelog,忍不住有点兴奋:Anthropic 终于把那个让人精神分裂的设计给改了。"Merged slash commands and skills"——这行字虽然短,但信息量极大。简单说,斜杠命令(比如 /review、/commit)正式"转正&q…- 0
- 0
-
如何用AI表格低门槛手搓一个业务系统?
最近2周认真体验了一下飞书的多维表格,尤其是它的AI功能。作为一名自封的EXCEL高手、多年的主流BI系统的管理员,同时又积极主动拥抱AI潮流并可以手搓Data Agent的数据从业者,我来聊一下多维表格由浅入深的实操体验。一、多维表格之表格先从EXCEL视角来看,多维表格有很多和EXCEL相似的地方,会用EXCEL就可以入门多维表格。1、公式:首先,最直观的体验就是,你再也不能在表格手输=然后敲…- 0
- 0
-
Agent Skills入门指南,看这篇就够了 | 保姆级教程
说实话,之前第一次了解到 Claude Agent Skills 这个功能时,我还有点不以为然。不就是个提示词模板吗?能有多大用处?结果真香。。用了一段时间后,我发现这玩意儿简直是工作流神器。比如以前每次跟 Claude Code 对话都要重新解释一遍项目规范,现在直接把专业知识打包成 Skill,Claude Code 自动就懂了。当然Skills的能力远不止于此。今天这篇文章,我就给大家讲讲&…- 0
- 0
-
当技能库超过50个,AI的选择能力会断崖式下跌
多Agent系统(Multi-Agent System,MAS)近年来在复杂推理任务中表现出色,但代价是巨大的计算开销。一个自然的问题是:能否用单个agent配合技能库来替代多agent协作,同时保持性能?论文通过实验发现,这种"编译"策略确实可行——在保持准确率的同时,token消耗降低54%,延迟降低50%。然而,更深层的问题随之浮现:当技能库规模扩大时,AI的技能选择能力…- 0
- 0
-
5个让Claude Code效率翻倍的Skill!
最近时间线被Claude Skills刷屏了,为什么Skills这么火?以为 Skill 是本地文件,以 markdown 文件作为指导,可以定制流程、可以调用本地 python 方法,定制方便,而且比使用 MCP 方式省 token。从此,你不再是被动使用AI,而是主动定制AI的能力边界。这些本地化、可定制的技能包正在改变AI编程的玩法。我挑出了5个最实用的,分享给你。1. skill-crea…- 0
- 0
-
使用 IChatReducer 进行聊天记录缩减
序言在多轮对话场景中,随着聊天次数增加,发送给大语言模型(LLM)的上下文会持续膨胀,带来 Token 成本上升与上下文溢出风险。 Microsoft Agent Framework 将这一问题抽象为 Chat Reduction(聊天记录缩减),并通过 IChatReducer 策略对聊天历史进行统一治理,而不是在业务代码中零散地裁剪或拼接历史消息。本文基于“客户端本地存储聊…- 0
- 0
-
“基模四杰”开年首炸:Chat已死,Agent已来
前言就在昨天,2026年1月10日,北京。这场被称为AGI-NEXT的前沿峰会,可能不仅是一场技术峰会,更像是一场对过去三年“聊天机器人”时代的集体告别。首先感谢“数字生命卡兹克”大佬第一时间将“基模四杰”(智谱AI唐杰、月之暗面杨植麟、阿里通义林俊旸、腾讯混元姚顺雨)在《AGI-NEXT前沿峰会》的会议内容毫无修饰、处理的全文发布。这3个小时的高密度输出,抛出了国内AI产业最残酷的真相:单纯的对…- 0
- 0
-
Anthropic联创:还不存在真正递归自我改进的AI!曝内部调查结果:AI未必能实现开发效率爆炸式增长;Claude也能修水管,看好分布式预训练
Anthropic联创又出来说话了!就在刚刚,小编刷到一位知名的前对冲基金经理Michael Burry 在X上发布了一期访谈,参与者有Anthropic 联创 Jack Clark、 Dwarkesh 播客的创始人兼主持人 Dwarkesh Patel 以及软件创业者 Patrick McKenzie。四位大佬同台都聊了点啥?小编细听下来发现,他们透露了不少反直觉的细节和数据。比如,AI工具究竟…- 0
- 0
-
Claude Skill 快照:给你的 AI 技能迭代加个「后悔药」
之前 我的一篇介绍 Claude Skill 的文章 很受大伙欢迎。很多小伙伴看过之后都跃跃欲试。不知你都做了几个 Claude Skill 出来了?假设为了完成某项任务,你 参考我的教程 创作了一个 Claude Code 的技能,并且不断迭代改进。折腾了好几天,技能终于调通了,效果也不错。你长舒一口气,想着「太好了,终于搞定」。然后,你有了一…- 0
- 0
-
Step-DeepResearch:深度研究的全能选手,规划、检索、反思一网打尽!
在当今信息爆炸的时代,深度研究对于推动学术发展、商业决策以及技术创新等方面具有至关重要的作用。然而,传统的研究方式往往面临着效率低下、成本高昂以及难以应对复杂多变的研究需求等诸多挑战。为了解决这些问题,深度研究领域不断涌现出新的技术和方法,而Step-DeepResearch 作为一款具有创新性的深度研究 AI 模型,凭借其卓越的性能和高性价比,正在引领这一领域的变革…- 0
- 0
-
静态分析只能查规则,AI 才能懂语义:PR-Agent 和 ESLint/Sonar 的正确分工
周五下午 5 点,你终于把那坨改了两天的代码推上去,开了个 PR,长舒一口气:今晚可以安心下班了。然后你盯着 PR 页面刷新了两次——没动静。你发了句“麻烦帮忙看下”,同事头像亮了一秒又灰了:人家要赶地铁、要接娃、要过周末。你也理解。结果周一早上 10 点,review 终于来了,但不是“LGTM”,而是一串你自己都想捂脸的评论:没处理异常、变量命名乱、边界条件没考虑、还有个日志把敏感信息打出来了…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!






















