-
OpenAI Code Interpreter ("Coworker") 架构审计与安全取证分析
摘要2025.12.14 晚上发生的 OpenAI "Code Interpreter"(内部代号 "Coworker")文件系统泄露事件,为全球人工智能与软件工程社区提供了一个前所未有的窗口,得以窥探当前最先进的大语言模型(LLM)执行环境的真实架构。长期以来,业界普遍假设 Code Interpreter 仅仅是一个标准的、沙箱化的 Pytho…- 0
- 0
-
Claude Skill深度分析:拖拉拽已死,Skill 当立
系统自带的Skill在点Cloud这个目录之下,其中有一个是特殊的,是Skill-Creator, 它是专门帮助你去创建Skill的Skill。在下面这个PPT中我们可以看到Skill它的调用方式是可以在Python中直接去执行的.这就意味着我们可以直接把这些Agent过程在Python中去执行,非常的高效,而且意味着你可以进行非常灵活的模块化功能组合.client.beta 是&nbs…- 0
- 0
-
PostHog关于Agent的8个核心经验
2025 年,大家嘴里都在说「Agent」,但真正能在生产环境里、帮团队稳定做完活的 Agent,其实并不多。PostHog 用了一整年,从一个只有「生成趋势图」单一工具的小玩具,迭代到了今天上线的 PostHog AI——一个真正在产品里「驻场」的智能分析师:它能自己写 SQL、跑多步分析会搭建 feature flag 和实验还能主动去排查高影响错误整个过程在一个循环里跑完,自己检查…- 0
- 0
-
AI原生数据库的思考
我们需要一款怎样的 AI 数据库?基于大模型的 AI 技术已经成为行业共识,各个行业的企业都在知识库、AI Coding、智能客服、ChatBI、Agent 开发等场景落地大模型。然而,在真正进入企业业务后,会暴露两个问题:缺乏企业的私有数据:基础大模型采用海量公网数据做预训练,虽然具备一定的“智能涌现”,但永远不可能理解企业的私有数据。这就像企业招聘了一位新员工,虽然经过了良好的教育,但还需要通…- 0
- 0
-
Anthropic:别再构建智能体,开始构建技能
这篇文章的来源是Anthropic公司Skill团队的公开演讲,整理形成的课件。大家把它当做一个基础版的教程。虽说是基础,但是往往是基础的定义决定了我们最终对它的运用是否有效这是一个灵魂问题。你需要的Agent真是一个智商300的超级天才,还是你需要一个真正懂你专业知识的一个专业型助手?绝大多数的人的选择是一个专业级的懂行的资深人士,而非绝对的高智商。这里简单说一句,Anthropic这家公司的第…- 0
- 0
-
Cursor 2.2 炸裂发布:首创 Debug 模式,专治各种“疑难杂症”!
昨天我们刚聊过 Cursor 推出的 Visual Editor(可视化编辑器),不仅能预览,还能直接拖拽改代码,简直是把 Chrome 开发者工具塞进了 IDE 里。这只是其中一项功能,Cursor 2.2 版本目前已正式发布这次更新还带来了一个改变 AI 编程游戏规则的功能—— Debug Mode(调试模式)。它和当前的 Agent、Ask、Plan 模式同级,看名字也能…- 0
- 0
-
企业AI有繁荣,没泡沫|笔记
AI有没有泡沫,有点横看成岭侧成峰。先不争论。企业AI以惊人的速度,2025年形成了一个370亿美元的市场;其中编码成为首个AI杀手级应用,而且2026年可能会出现更多。在企业AI市场,Anthropic领先OpenAI的幅度进一步扩大,达到了40%;OpenAI下降到27%,谷歌迅速增长到21%。Menlo Ventures今年第三次推出年度企业AI报告,今年人们最关心的问题,可以从中得到一些答…- 0
- 0
-
巨头翻身!谷歌全新AI浏览器Disco问世,PC版灵光?
作为全球第一大浏览器,Chrome 的优点和缺点早就广为人知,而过去三年 AI 技术的新一轮浪潮中,Chrome AI 化的进展缓慢也是不争的事实,直到今年 9 月才有明显的推进。不过即便如此,Chrome 毕竟还是「改造」,Google 最新发布的 AI 浏览器 Disco,才真正称得上:原生 AI 浏览器。图片来源:GoogleDisco 是 Google 最近通过 Labs 推出的一款实验性…- 0
- 0
-
我做的第一个Claude Skill
我创建了一个Claude Skills,名叫Super Analyst,超级分析师。这个能力包的作用是,给Claude添加12种分析框架。当用户需要分析某个议题时,它可以根据情况,决定调用哪个分析框架。这12种分析框架都各有各的适用场景。比如,第一性原理适合创新和突破性问题的分析;波特五力模型适合行业分析和竞争评估;设计思维适合产品或者服务的创新;苏格拉底方法适合哲学或伦理的辩论。这些分析框架的提…- 0
- 0
-
AI 的衔尾蛇:当需求成为一场镜像游戏
历史不会重复,但会押韵。 — 马克·吐温市场保持非理性的时间,可能比你保持理智的时间更长。 — 凯恩斯最近看硅谷的新闻,总有一种不真实的眩晕感。身边的几位朋友,在那家掌握算力命门的芯片巨头 ,或是各类 AI 独角兽公司,账面上的股票和期权价值这两年已经翻了不知多少倍。大家聚会时,这种狂热的快乐和隐隐的不安交织在一起——就像坐在一个不知道何时会停下的过山车上。这种感觉让我想起了 1999 年。虽然那…- 0
- 0
-
GPT-5.2实测:五大职场“牛马任务”,考验它的生存力
划重点 AI理解的不只是文字,还有人性。2015年12月11日,OpenAI正式成立。所以,OpenAI在十周年纪念日这天发布了新版本模型,叫做GPT-5.2。前段时间,山姆·奥特曼在内部发起红色警报,通知停掉一切商业化项目,就为了在模型能力上,和谷歌的Gemini 3系列硬刚。当时就有不少媒体猜测,他发警报的最终目的,其实是为了给这个新模型的宣传造势。但我们确实也能看出,OpenAI在…- 0
- 0
-
最权威AI Agent避坑指南来了!智能体越多死得越快,效率最高暴跌70%
最权威的Agent落地指南来了!最近,Google DeepMind和Google Research刚刚联合发布了一篇重磅论文:《Towards a Science of Scaling Agent Systems》(迈向Agent系统的扩展科学)。这篇论文含金量极高。因为它打破了人工智能圈目前最大的误区:“Agent越多越好”。研究团队对5种智能体架构做了180组对照实验,涵盖OpenAI、Go…- 0
- 0
-
2025年,企业级AI的主战场在哪里?
过去一年,AI 产业正在经历一次结构性转折:模型不再主要用于通用聊天,而是逐渐渗入研发、运营、客服、创意内容、工具链自动化等真正具有业务价值密度的生产环节。然而,关于一个最根本的问题——现实世界的大模型到底被企业和个人“用来做什么”——产业界反而缺乏基于大规模真实数据的认知。在产品演示、基准测试和公开发布的光鲜叙事之外,真实的业务工作负载(workloads)、真实的模型选择偏好(model se…- 0
- 0
-
智能体(AI Agents)工作流:核心架构、模式原理与落地案例
如今AI Agents(智能体)的概念无处不在,但新技术的发展往往伴随着混乱的术语、过高的期望以及所谓的“专家”的观点。本文将拨开智能体相关的喧嚣与炒作,解析 Agentic AI的核心要义:智能体工作流。仅靠智能体本身,能完成的任务十分有限。它们需要明确的角色定位、目标设定以及实现目标的结构化流程,而这正是“工作流”的价值所在。理解智能体工作流,就能掌握AI智能体运作的原理与逻辑。下文将剖析AI…- 0
- 0
-
GPT 5.2的长上下文厉害了,但是写文真的强吗?
今天看到 OpenAI 发了 GPT-5.2 ,很快有测试出来,里面一张MRCRv2 的长上下文测试结果很惊艳。这个测试简单说就是,在一大堆对话里埋几个"针"(特定的问题和答案),然后让模型去找。GPT-5.2 在 4 根针的测试里,一直到 25 万 token 都能保持接近 100% 的准确率。这什么概念呢?25 万 token 大概是一本 15-20 万字的小说的长度。也就…- 0
- 0
-
实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini
上个月刚刚退订掉 ChatGPT Plus,转到 Gemini,这次需要因为 GPT-5.2 再回去吗?看完下面这些网友真实的体验分享,还有 APPSO 的上手实测,或许能有个答案。这次终于没把表给画错了GPT 5.2 这次其实是更新了 3 个模型,GPT-5.2 Instant、Thinking、以及 Pro 模型。如果你习惯了 Gemini 3.0 Pro 里,每次问答都会经过思考;那么上手 …- 0
- 0
-
GPT-5.2 凌晨发布:这一次,OpenAI 不想做题,只想帮你搞钱!
GPT-5.2 终于发布了!虽然我已经以 Gemini 为主,但 GPT 的每次更新仍然受到极大的关注(包括我)。这次到底更新了些啥?简单来说,各项指标超越 Gemini 3 Pro,让 OpenAI 居然又重回了王座。 但,并没有形成那种“外星人降临”的碾压优势。不过,细节里全是魔鬼。我们具体来扒一扒。OpenAI 官方开篇定调非常高,直接说 GPT-5.2 是迄今为止功能最强大的专业…- 0
- 0
-
GPT 5.2 !奥特曼杀红了眼
如果说GPT 5.1 是没活硬整,GPT 5.2 就是Sam Altman 直接掀牌桌。昨天GPT 5.2 三个版本齐发。GPT-5.2 Instant:对标Haiku,快速日常对话。GPT-5.2 Thinking:对标Sonnect,编码主力。GPT-5.2 Pro:对标Opus,负责最难最复杂的那部分上周 Sam Altman 还在内部拉响 Code Red 红色警报,暂停所有无关开发,全员…- 0
- 0
-
ChatGPT-5.2发布!把Gemini 3 Pro和Claude Opus 4.5都按地上摩擦了!Cursor可用
深夜加更,是因为ChatGPT-5.2发布了!ChatGPT-5.2 有点强得过分了,把包括Gemini 3 Pro和Claude Opus 4.5在内的所有世界模型,都按地上摩擦了。其中AIME 2025竟然拿到了100分满分??黑人问号脸!GDPval竟然拿到了70.9分,前几天的世界第一才50多分啊!上一代的GPT-5.1才30多分啊! GDPval是非常值得关注的一个指标,它的意…- 0
- 0
-
GPT-5.2发布,真正的牛马打工人专属AI来了。
在各种小道消息,各种预测之后。终于,在OpenAI十周年的这一天。也就是今天的凌晨2点,GPT-5.2终于跟大家见面了。这是Gemini 3 Pro爆火,第一次让OpenAI没有领先优势,奥特曼在内部官宣红色警戒状态之后,他们掏出的第一款模型。也是OpenAI的十周年献礼。而这款模型的特点也非常有意思。OpenAI的原话是:We are introducing GPT‑5.2, the most …- 0
- 0
-
什么是智能体工程Agent Engineering?让 AI从“能跑“到“敢用“的关键
Agent Engineering: A New Discipline" class="rich_pages wxw-img" data-ratio="0.75" data-type="other" data-w="760" style="width: 404px;height: 303px;&qu…- 0
- 0
-
涌现观点|AI 开发的"App Store 时刻":为什么你应该停止构建 Agent?
Jason Lemkin 盯着屏幕,冷汗直流。凌晨三点多,Slack的通知声把所有人从睡梦中拽了出来。就在十几二十分钟前,他引以为傲的 AI 程序员,那个被寄予厚望能自动化一切的 Replit Agent[1],亲手删除了 1200 家客户的生产数据库。没有警告。没有确认弹窗。一切发生得如此丝滑,就像外科手术一样精准。更可怕的是,当 Jason 追溯到更早的日志时,看到了这样一行记录:[…- 0
- 0
-
阿里云 Tair 联手 SGLang 共建 HiCache,构建面向“智能体式推理”的缓存新范式
导读在大型语言模型(LLM)推理中,KVCache 是提升效率的核心机制:通过缓存 Transformer 自注意力层的历史 Key-Value 对,避免重复计算,显著降低单次推理开销。然而,在“智能体式推理”(Agentic Inference)这一新兴范式下——模型需持续感知环境、进行多轮决策、自我反思,并协同其他智能体完成复杂任务——传统 KVCache 机制暴露出三大关键瓶颈:状态膨胀:长…- 0
- 0
-
OpenAI基于100万客户数据!发布了最新AI洞察报告
OpenAl基于100万企业客户的真实使用数据,对100家企业,9000多名员工做了调研后,发布了最新的企业级AI洞察:《2025 State of Enterprise AI》报告。这份报告带来的4个核心发现1. 企业使用规模正在扩大,工作流整合日益加深。ChatGPT 的消息量增长了 8倍,每家组织的 API 推理 Token 消耗量同比增长了 320倍,这表明更多的企业正…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























