-
Kubernetes 会成为 AI Agent 的最佳运行平台吗?
📄 文章摘要从云原生演进视角出发,系统阐述为什么 AI Agent 需要 Kubernetes 级别的基础设施,以及如何通过 Agent 编排、MCP 服务化与 AI 原生网关,构建真正生产级的 AI 原生架构。作为一个长期在云原生领域工作的实践者,我越来越确信一件事:AI Agent 不只是一个应用形态的变化,而是基础设施范式的迁移。随着人工智能从 Demo、Copilot 逐步走向真正承担任务…- 0
- 0
-
2026 年 ChatGPT 要加广告了,最懂你的 AI 都开始出卖你
2026 年,很可能是人类首次需要给 AI 安装「广告拦截器」的一年。就在今天凌晨,据 The Information 爆料称,OpenAI 员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示「赞助内容」。比如你问睫毛膏推荐,就可能看到厂商的软广。近几周内,OpenAI 的员工还制作了多种广告展示方式的原型图,其中就包括可能会出现在 ChatGPT 的界面侧边栏中。从 2…- 0
- 0
-
凯文·凯利的2049:一份写给中国企业家的未来地图
2025年8月7日,OpenAI发布了GPT-5。沃顿商学院的教授伊桑·莫利克(Ethan Mollick)长期关注创新创业与人工智能,第二天他就在博客上分享了他的GPT-5使用感受。他只输入了一句话:“做一个野兽派建筑生成器,要酷。”两分钟后,他的屏幕上便出现了一个可以随意拖拽、编辑的3D城市模拟器:有霓虹灯,有飞驰的汽车,有动态摄像机。他全程没看一行代码,甚至在后续的优化中,他也只是不断地说“…- 0
- 0
-
全新输入法发布,终于舒服了!
作为自媒体工作者,每天不仅要写文案,还要面对不同的沟通对象。回复粉丝留言、处理商务合作、和老板同事沟通,这些都需要通过敲键盘去完成。一直以来我非常渴望有一款高效的输入工具,能帮我提升工作效率,现在终于找到了。智谱 AutoGLM 团队推出了电脑端智能语音助手「智谱 AI 语音输入法」,经过一段时间的体验,我觉得可以将它推荐给各位。智谱 AI 语音输入法已经上线了 MacOS 和 Windows 版…- 0
- 0
-
skill如何实现近乎无限上下文?:《Equipping agents…… with Agent Skills》 ②
Skill是由指令、脚本和资源组成的结构化文件夹,用来补足 Agent 在过程知识和组织背景上的能力缺口。本文将深入解析 Skill 的内部构成、渐进式披露的三层加载机制,以及它如何让大语言模型拥有近似“无限上下文”的工作方式。01Skill的核心构成:SKILL.md每一个 Skill 都是一个文件夹,而它的核心文件是 SKILL.md。可以将其理解为这项技能的“使…- 0
- 0
-
上下文缩减新视角-可逆vs不可逆:Manus联合创始人 Peak Ji最新分享①
在长上下文处理的实践中,上下文压缩常面临丢失关键信息的挑战。Manus公司的联合创始人Peak Ji分享了他们的最新实践,提出了一套关于“可逆”与“不可逆”的精妙平衡策略,为上下文管理提供了新的视角。01可逆压缩 vs. 不可逆摘要首先,需要更新一个认知:不能笼统地将所有“减小上下文”的操作都称为“压缩”。为了精细化管理,Manus将其严格划分为两种操作。第一种是压缩 (Compaction),其…- 0
- 0
-
Open WebUI:可能是目前最好用的本地大模型 Web 界面
做本地大模型(Local LLM)折腾久了,大家应该都绕不开 Ollama。东西是好东西,但天天对着黑底白字的命令行窗口(Terminal)聊天,体验确实差点意思,尤其是想发个图、传个文件的时候,命令行就捉襟见肘了。最近在 云栈社区 有个项目被大家反复安利 —— Open WebUI(以前叫 Ollama WebUI)。我也跟风部署了一套,用了几天,感觉这玩…- 0
- 0
-
Claude Agent Skills 深度解析:原理、工作流与最佳实践
Claude 现已引入 Skills 功能,显著提升了其执行特定任务的能力。Skills 本质上是一个包含指令、脚本和资源的结构化文件夹,Claude 能够根据任务需求动态加载这些资源。这一机制的核心优势在于按需加载:Claude 仅在检测到当前任务与特定技能相关时才会调用该技能。这种设计不仅确保了 Claude 的运行效率,还能使其快速获取特定领域的专业知识,从而更高效地完成任务。在执行过程中,…- 0
- 0
-
Seed Prover 1.5:全新 Agentic 架构,更强数学推理表现
今年 7 月,字节跳动 Seed 团队受邀参加了 IMO 2025。我们的形式化数学推理模型 Seed Prover 通过 3 天的尝试,完整解决了 6 道题目中的 4 道以及一道题的部分证明,达到官方认证的银牌成绩。近日,我们推出新一代形式化数学推理专用模型 Seed Prover 1.5 ,通过大规模的 Agentic RL 训练,其推理能力和推理效率取得显著进步。相比上一…- 0
- 0
-
MiniMax M2.1 终于上线,咱憋了一肚子话终于能说了。。。。。
昨天,MiniMax M2.1 发布。前脚 MiniMax 刚传出通过港交所聆讯的消息,后脚就直接发布了新一代模型 —— M2.1。巧的是 GLM-4.7 也几乎选在同一时间段发布。你品,你细品这个时间点。这哪是发模型啊!不过我不想聊资本故事,因为我拿到了 M2.1 的内测资格,连测了一晚上,觉得这个模型有点东西啊,体感约等于 90% 的 claude,怕是自己“幸存者偏差”,一直捂着没…- 0
- 0
-
GLM-4.7发布后,n8n就不用学了!搭个AI Skills一键生成工作流
今天,我又要来得罪人了。甚至可以说,这篇文章发出来,可能会直接断了很多人的财路。起因是我前几天分享的两篇关于n8n工作流的文章,彻底爆了:这10个n8n工作流,直接干死了90%的Tiktok视频生产,一键直出100条这15个n8n工作流,直接干掉了90%的跨境电商营销工作这几天应该有超过500人加我微信。。但因为我还在外面出差,导致很多消息回复很慢加我的很多同学都想学n8n,还有一部分让我帮忙定制…- 0
- 0
-
在引入 AI Agent 之前,企业至少要先想清楚这 5 件事
前两篇文章里,我反复强调一个判断:AI Agent 进入企业,卡住的不是能力,而是组织是否准备好承担后果。但现实中,真正让企业犯错的,往往不是“大方向没想清楚”,而是在具体决策时,没有一套可以反复使用的判断标准。于是问题就会变成:这个 Agent 到底能不能上?是现在上,还是等等再上?是小范围试,还是直接进主流程?下面这 5 个问题,是我认为任何企业在引入 AI Agent 之前,都必须先想清楚的…- 0
- 0
-
MiniMax M2.1 首测——从零构建应用的新体验
很幸运前两天受邀参加了 M2.1 的内测,然后今天看到 MiniMax 官方正式发布了,先说结论:我觉得叫 M2.1 有点谦虚了,因为实际体验下来,MiniMax M2.1 的提升很明显。1.延迟和长程任务的管理明显做了优化,同样的任务比之前效率更高,消耗更少的tokens,写代码不啰嗦;2.另外指令遵循能力变强;3.代码能力绝对称得上第一梯队(包括开源和闭源)实际上,Minimax 在发布 M2…- 0
- 0
-
阿里 Qwen3-TTS 两大更新直接封神!支持跨物种音色克隆,3 秒复刻!
说实话,今年语音模型的内卷程度已经到了不讲武德的地步。但这次,Qwen3-TTS 的更新,是真的有点狠,可能会直接刷新你的认知。阿里通义刚刚上线了 Qwen3-TTS 的两大核心能力:• VoiceDesign(VD-Flash):用文字“设计”声音,而不是选声音。• VoiceClone(VC-Flash):3 秒音频,跨语言、跨物种级别的音色克隆。不仅可以让你自…- 0
- 0
-
探秘 AgentRun丨流量一大就瘫痪?如何解决 AI 模型调用之痛
阿里云函数计算 AgentRun 全新发布后,我们整理了“探秘 AgentRun”系列文章,本系列将梳理企业落地 Agent 常见难题,给出具体解法,助力 Agentic AI 快速走进生产级环境。欢迎加入“函数计算 AgentRun 客户群”与我们交流,钉钉群号:134570017218。在《通过无代码创建的 Agent,如何用高代码进行更新?》文章中,我们提到过一个真实用户的痛点:“我之前做过…- 0
- 0
-
智能时代的数据基座:烟台银行构建“可信数据存储安全体系”的实践与展望
导读 传统的以网络边界防护和静态灾备为核心的数据安全模式,正面临根本性挑战:数据流动速度与价值密度激增使得攻击面无限扩大,合规底线日趋严格,尤其是若不能保障数据全生命周期内的机密性、完整性与可用性,所有基于数据的AI智能体都将成为“无源之水”甚至因“数据中毒”而引发战略风险。本文由来自烟台银行的同行分享了该行“三层递进、持续自愈”的数据存储安全体系建设实践,包括技术路线评估选…- 0
- 0
-
Claude Code Skill 设计机制深度分析
最近我们对 claude code 的 skills 能力做了一些深度调研,并开发了一个在 claude 里调用 nano-banana-pro 生成图片的 skill(类似工作流),并提供 slash command 封装。我们的nano-banana-pro生图skill支持图片打开和ascii渲染两种模式在这个过程中我们发现,基于 skill 的单元开发模式(然后对外暴露 skill 接口、…- 0
- 0
-
深度解读DeepMind最新研究:为什么需要像管股市一样去管AI?
最近,谷歌DeepMind发布了一篇关于AGI安全的最新研究。这份文件主要讲的是 Google DeepMind 对未来通用人工智能(AGI)安全问题的一个全新视角。简单来说,Google 认为大家都把 AGI 想简单了,以前大家觉得 AGI 是一个超级大脑,但其实未来更有可能出现的是一群 AI 协作产生的拼凑型 AGI。为了管好这一群 AI,我们需要像管理人类经济市场一样,建立一套复杂的规则和监…- 0
- 0
-
人工智能 | 企业级AI市场的快速爆发,但仍停留在Copilot阶段、Agent还没到来 —— Menlo Ventures
今天的内容来自于Menlo Ventures, Menlo Ventures 是一家老牌硅谷 VC,如今强烈押注 AI,管理规模约 58–68 亿美元,重点覆盖从种子到成长期的科技公司,尤其是生成式 AI、企业软件和医疗健康。如果对内容的原文PDF感兴趣,请后台留言;或者联系邮箱contact-growth@proton.me整体市场与格局企业 GenAI 支出从 2024 年的 115 亿美元跃…- 0
- 0
-
剿杀n8n!Google Gems 重塑AI工作流,真一句话一个应用
Google正式将Opal集成了进 Gemini。不再需要做n8n连连看,现在一句话就可以实现完整工作流。一句话,一个应用Opal是Google AI 退出原生应用生成器,目前仍然处于测试阶段,是n8n最头痛的竞争对手。传统的n8n需要进行复杂的连线和逻辑的编写,Opal 不会不需要你写一句代码。下达命令之后它会直接给你生成一个可视化的工作流。第一步搜索,第二步总结,第三步改写,第四步配图。这次在…- 0
- 0
-
2026年将属于能善用最便宜的Token,解决最脏最累问题的“务实主义者”(长文)
随着全球科技产业告别2025年的投机狂热,步入实质性落地阶段,我们观察到市场正经历着深刻的三层“重构”,每一项都潜移默化影响着未来的竞争格局:首先是高层研究领导者中的人员结构倒置,即“原生AI一代”开始掌舵核心研究,而基础设施层则回归老将治下的成本控制;其次是资本效率危机,以甲骨文(Oracle)股价暴跌为标志,市场首次对债务驱动的扩张模式投下不信任票;最后是技术架构的持续演进,正如Andrej …- 0
- 0
-
警惕!每天用AI的人,大脑正在变“懒”:MIT实验证实思考退化危机
神经科学家与精神科医生联合警示:“认知的假动作”正在侵蚀人类创造力——但AI并非敌人,关键在于如何用引言:效率的幻觉 vs. 思考的退化2025年,人工智能已深度融入日常工作的每个角落。从撰写邮件到生成报告,从策划营销方案到辅导孩子作业,AI似乎无所不能。然而,一项由麻省理工学院(MIT)媒体实验室主导的神经科学研究却敲响了警钟:当人们使用如ChatGPT这样的大语言模型进行写作时,大脑多个关键区…- 0
- 0
-
CosyVoice3一键包,3秒完美复刻声音!
终于把 CosyVoice3 这个一键包给搞出来了!(见文末)前两天阿里通义突然就开源了一个语音合成模型,一个语音识别模型。这两个模型可玩性很高!其中的语音合成模型 CosyVoice,我在很久之前就介绍过,很厉害,也制作过一键包。下面让马老板亲自给大家介绍一下这个模型:然后来听一段悄悄话:很显然 CosyVoice3 会比之前的版本强很多,具体有哪些方面的提升,可以看下面的介绍。Fun-Cosy…- 0
- 0
-
AI写代码,越改越错?前OpenAI首席科学家:我们高估了它的理解
在生成式人工智能狂飙突进的2025年,一个令人困惑的现象正引发业界高度关注:大模型在各类评测基准(eval)中屡创佳绩,却在真实应用场景中频频“掉链子”。尤其在软件开发领域,“氛围编程”(Vibe Coding)——即开发者仅凭模糊描述或直觉提示让AI自动生成代码——看似高效,实则隐患重重。前OpenAI联合创始人、首席科学家Ilya Sutskever近日在一档深度访谈中罕见发声,直指这一现象背…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

























