全部标签

新闻资讯

Kubernetes 会成为 AI Agent 的最佳运行平台吗？

📄 文章摘要从云原生演进视角出发，系统阐述为什么 AI Agent 需要 Kubernetes 级别的基础设施，以及如何通过 Agent 编排、MCP 服务化与 AI 原生网关，构建真正生产级的 AI 原生架构。作为一个长期在云原生领域工作的实践者，我越来越确信一件事：AI Agent 不只是一个应用形态的变化，而是基础设施范式的迁移。随着人工智能从 Demo、Copilot 逐步走向真正承担任务…
前沿技术
- 0
- 0
charles3月23日
2026 年 ChatGPT 要加广告了，最懂你的 AI 都开始出卖你

2026 年，很可能是人类首次需要给 AI 安装「广告拦截器」的一年。就在今天凌晨，据 The Information 爆料称，OpenAI 员工正在琢磨如何让 ChatGPT 在用户提出相关问题时，优先显示「赞助内容」。比如你问睫毛膏推荐，就可能看到厂商的软广。近几周内，OpenAI 的员工还制作了多种广告展示方式的原型图，其中就包括可能会出现在 ChatGPT 的界面侧边栏中。从 2…
前沿技术
- 0
- 0
charles3月22日
凯文·凯利的2049：一份写给中国企业家的未来地图

2025年8月7日，OpenAI发布了GPT-5。沃顿商学院的教授伊桑·莫利克（Ethan Mollick）长期关注创新创业与人工智能，第二天他就在博客上分享了他的GPT-5使用感受。他只输入了一句话：“做一个野兽派建筑生成器，要酷。”两分钟后，他的屏幕上便出现了一个可以随意拖拽、编辑的3D城市模拟器：有霓虹灯,有飞驰的汽车,有动态摄像机。他全程没看一行代码，甚至在后续的优化中，他也只是不断地说“…
前沿技术
- 0
- 0
charles3月22日
全新输入法发布，终于舒服了！

作为自媒体工作者，每天不仅要写文案，还要面对不同的沟通对象。回复粉丝留言、处理商务合作、和老板同事沟通，这些都需要通过敲键盘去完成。一直以来我非常渴望有一款高效的输入工具，能帮我提升工作效率，现在终于找到了。智谱 AutoGLM 团队推出了电脑端智能语音助手「智谱 AI 语音输入法」，经过一段时间的体验，我觉得可以将它推荐给各位。智谱 AI 语音输入法已经上线了 MacOS 和 Windows 版…
前沿技术
- 0
- 0
charles3月22日
skill如何实现近乎无限上下文？：《Equipping agents…… with Agent Skills》 ②

Skill是由指令、脚本和资源组成的结构化文件夹，用来补足 Agent 在过程知识和组织背景上的能力缺口。本文将深入解析 Skill 的内部构成、渐进式披露的三层加载机制，以及它如何让大语言模型拥有近似“无限上下文”的工作方式。01Skill的核心构成：SKILL.md每一个 Skill 都是一个文件夹，而它的核心文件是 SKILL.md。可以将其理解为这项技能的“使…
前沿技术
- 0
- 0
charles3月22日
上下文缩减新视角-可逆vs不可逆：Manus联合创始人 Peak Ji最新分享①

在长上下文处理的实践中，上下文压缩常面临丢失关键信息的挑战。Manus公司的联合创始人Peak Ji分享了他们的最新实践，提出了一套关于“可逆”与“不可逆”的精妙平衡策略，为上下文管理提供了新的视角。01可逆压缩 vs. 不可逆摘要首先，需要更新一个认知：不能笼统地将所有“减小上下文”的操作都称为“压缩”。为了精细化管理，Manus将其严格划分为两种操作。第一种是压缩 (Compaction)，其…
前沿技术
- 0
- 0
charles3月22日
Open WebUI：可能是目前最好用的本地大模型 Web 界面

做本地大模型（Local LLM）折腾久了，大家应该都绕不开 Ollama。东西是好东西，但天天对着黑底白字的命令行窗口（Terminal）聊天，体验确实差点意思，尤其是想发个图、传个文件的时候，命令行就捉襟见肘了。最近在云栈社区有个项目被大家反复安利 —— Open WebUI（以前叫 Ollama WebUI）。我也跟风部署了一套，用了几天，感觉这玩…
前沿技术
- 0
- 0
charles3月22日
Claude Agent Skills 深度解析：原理、工作流与最佳实践

Claude 现已引入 Skills 功能，显著提升了其执行特定任务的能力。Skills 本质上是一个包含指令、脚本和资源的结构化文件夹，Claude 能够根据任务需求动态加载这些资源。这一机制的核心优势在于按需加载：Claude 仅在检测到当前任务与特定技能相关时才会调用该技能。这种设计不仅确保了 Claude 的运行效率，还能使其快速获取特定领域的专业知识，从而更高效地完成任务。在执行过程中，…
前沿技术
- 0
- 0
charles3月22日
Seed Prover 1.5：全新 Agentic 架构，更强数学推理表现

今年 7 月，字节跳动 Seed 团队受邀参加了 IMO 2025。我们的形式化数学推理模型 Seed Prover 通过 3 天的尝试，完整解决了 6 道题目中的 4 道以及一道题的部分证明，达到官方认证的银牌成绩。近日，我们推出新一代形式化数学推理专用模型 Seed Prover 1.5 ，通过大规模的 Agentic RL 训练，其推理能力和推理效率取得显著进步。相比上一…
前沿技术
- 0
- 0
charles3月22日
MiniMax M2.1 终于上线，咱憋了一肚子话终于能说了。。。。。

昨天，MiniMax M2.1 发布。前脚 MiniMax 刚传出通过港交所聆讯的消息，后脚就直接发布了新一代模型 —— M2.1。巧的是 GLM-4.7 也几乎选在同一时间段发布。你品，你细品这个时间点。这哪是发模型啊！不过我不想聊资本故事，因为我拿到了 M2.1 的内测资格，连测了一晚上，觉得这个模型有点东西啊，体感约等于 90% 的 claude，怕是自己“幸存者偏差”，一直捂着没…
前沿技术
- 0
- 0
charles3月22日
GLM-4.7发布后，n8n就不用学了！搭个AI Skills一键生成工作流

今天，我又要来得罪人了。甚至可以说，这篇文章发出来，可能会直接断了很多人的财路。起因是我前几天分享的两篇关于n8n工作流的文章，彻底爆了：这10个n8n工作流，直接干死了90%的Tiktok视频生产，一键直出100条这15个n8n工作流，直接干掉了90%的跨境电商营销工作这几天应该有超过500人加我微信。。但因为我还在外面出差，导致很多消息回复很慢加我的很多同学都想学n8n，还有一部分让我帮忙定制…
前沿技术
- 0
- 0
charles3月22日
在引入 AI Agent 之前，企业至少要先想清楚这 5 件事

前两篇文章里，我反复强调一个判断：AI Agent 进入企业，卡住的不是能力，而是组织是否准备好承担后果。但现实中，真正让企业犯错的，往往不是“大方向没想清楚”，而是在具体决策时，没有一套可以反复使用的判断标准。于是问题就会变成：这个 Agent 到底能不能上？是现在上，还是等等再上？是小范围试，还是直接进主流程？下面这 5 个问题，是我认为任何企业在引入 AI Agent 之前，都必须先想清楚的…
前沿技术
- 0
- 0
charles3月22日
MiniMax M2.1 首测——从零构建应用的新体验

很幸运前两天受邀参加了 M2.1 的内测，然后今天看到 MiniMax 官方正式发布了，先说结论：我觉得叫 M2.1 有点谦虚了，因为实际体验下来，MiniMax M2.1 的提升很明显。1.延迟和长程任务的管理明显做了优化，同样的任务比之前效率更高，消耗更少的tokens，写代码不啰嗦；2.另外指令遵循能力变强；3.代码能力绝对称得上第一梯队（包括开源和闭源）实际上，Minimax 在发布 M2…
前沿技术
- 0
- 0
charles3月22日
阿里 Qwen3-TTS 两大更新直接封神！支持跨物种音色克隆，3 秒复刻！

说实话，今年语音模型的内卷程度已经到了不讲武德的地步。但这次，Qwen3-TTS 的更新，是真的有点狠，可能会直接刷新你的认知。阿里通义刚刚上线了 Qwen3-TTS 的两大核心能力：• VoiceDesign（VD-Flash）：用文字“设计”声音，而不是选声音。• VoiceClone（VC-Flash）：3 秒音频，跨语言、跨物种级别的音色克隆。不仅可以让你自…
前沿技术
- 0
- 0
charles3月22日
探秘 AgentRun丨流量一大就瘫痪？如何解决 AI 模型调用之痛

阿里云函数计算 AgentRun 全新发布后，我们整理了“探秘 AgentRun”系列文章，本系列将梳理企业落地 Agent 常见难题，给出具体解法，助力 Agentic AI 快速走进生产级环境。欢迎加入“函数计算 AgentRun 客户群”与我们交流，钉钉群号：134570017218。在《通过无代码创建的 Agent，如何用高代码进行更新？》文章中，我们提到过一个真实用户的痛点：“我之前做过…
前沿技术
- 0
- 0
charles3月22日
智能时代的数据基座：烟台银行构建“可信数据存储安全体系”的实践与展望

导读传统的以网络边界防护和静态灾备为核心的数据安全模式，正面临根本性挑战：数据流动速度与价值密度激增使得攻击面无限扩大，合规底线日趋严格，尤其是若不能保障数据全生命周期内的机密性、完整性与可用性，所有基于数据的AI智能体都将成为“无源之水”甚至因“数据中毒”而引发战略风险。本文由来自烟台银行的同行分享了该行“三层递进、持续自愈”的数据存储安全体系建设实践，包括技术路线评估选…
前沿技术
- 0
- 0
charles3月22日
Claude Code Skill 设计机制深度分析

最近我们对 claude code 的 skills 能力做了一些深度调研，并开发了一个在 claude 里调用 nano-banana-pro 生成图片的 skill（类似工作流），并提供 slash command 封装。我们的nano-banana-pro生图skill支持图片打开和ascii渲染两种模式在这个过程中我们发现，基于 skill 的单元开发模式（然后对外暴露 skill 接口、…
前沿技术
- 0
- 0
charles3月22日
深度解读DeepMind最新研究：为什么需要像管股市一样去管AI？

最近，谷歌DeepMind发布了一篇关于AGI安全的最新研究。这份文件主要讲的是 Google DeepMind 对未来通用人工智能（AGI）安全问题的一个全新视角。简单来说，Google 认为大家都把 AGI 想简单了，以前大家觉得 AGI 是一个超级大脑，但其实未来更有可能出现的是一群 AI 协作产生的拼凑型 AGI。为了管好这一群 AI，我们需要像管理人类经济市场一样，建立一套复杂的规则和监…
前沿技术
- 0
- 0
charles3月22日
人工智能 | 企业级AI市场的快速爆发，但仍停留在Copilot阶段、Agent还没到来 —— Menlo Ventures

今天的内容来自于Menlo Ventures, Menlo Ventures 是一家老牌硅谷 VC，如今强烈押注 AI，管理规模约 58–68 亿美元，重点覆盖从种子到成长期的科技公司，尤其是生成式 AI、企业软件和医疗健康。如果对内容的原文PDF感兴趣，请后台留言；或者联系邮箱contact-growth@proton.me整体市场与格局企业 GenAI 支出从 2024 年的 115 亿美元跃…
前沿技术
- 0
- 0
charles3月22日
剿杀n8n！Google Gems 重塑AI工作流，真一句话一个应用

Google正式将Opal集成了进 Gemini。不再需要做n8n连连看，现在一句话就可以实现完整工作流。一句话，一个应用Opal是Google AI 退出原生应用生成器，目前仍然处于测试阶段，是n8n最头痛的竞争对手。传统的n8n需要进行复杂的连线和逻辑的编写，Opal 不会不需要你写一句代码。下达命令之后它会直接给你生成一个可视化的工作流。第一步搜索，第二步总结，第三步改写，第四步配图。这次在…
前沿技术
- 0
- 0
charles3月22日
2026年将属于能善用最便宜的Token，解决最脏最累问题的“务实主义者”（长文）

随着全球科技产业告别2025年的投机狂热，步入实质性落地阶段，我们观察到市场正经历着深刻的三层“重构”，每一项都潜移默化影响着未来的竞争格局：首先是高层研究领导者中的人员结构倒置，即“原生AI一代”开始掌舵核心研究，而基础设施层则回归老将治下的成本控制；其次是资本效率危机，以甲骨文（Oracle）股价暴跌为标志，市场首次对债务驱动的扩张模式投下不信任票；最后是技术架构的持续演进，正如Andrej …
前沿技术
- 0
- 0
charles3月22日
警惕！每天用AI的人，大脑正在变“懒”：MIT实验证实思考退化危机

神经科学家与精神科医生联合警示：“认知的假动作”正在侵蚀人类创造力——但AI并非敌人，关键在于如何用引言：效率的幻觉 vs. 思考的退化2025年，人工智能已深度融入日常工作的每个角落。从撰写邮件到生成报告，从策划营销方案到辅导孩子作业，AI似乎无所不能。然而，一项由麻省理工学院（MIT）媒体实验室主导的神经科学研究却敲响了警钟：当人们使用如ChatGPT这样的大语言模型进行写作时，大脑多个关键区…
前沿技术
- 0
- 0
charles3月22日
CosyVoice3一键包，3秒完美复刻声音！

终于把 CosyVoice3 这个一键包给搞出来了！（见文末）前两天阿里通义突然就开源了一个语音合成模型，一个语音识别模型。这两个模型可玩性很高！其中的语音合成模型 CosyVoice，我在很久之前就介绍过，很厉害，也制作过一键包。下面让马老板亲自给大家介绍一下这个模型：然后来听一段悄悄话：很显然 CosyVoice3 会比之前的版本强很多，具体有哪些方面的提升，可以看下面的介绍。Fun-Cosy…
前沿技术
- 0
- 0
charles3月22日
AI写代码，越改越错？前OpenAI首席科学家：我们高估了它的理解

在生成式人工智能狂飙突进的2025年，一个令人困惑的现象正引发业界高度关注：大模型在各类评测基准（eval）中屡创佳绩，却在真实应用场景中频频“掉链子”。尤其在软件开发领域，“氛围编程”（Vibe Coding）——即开发者仅凭模糊描述或直觉提示让AI自动生成代码——看似高效，实则隐患重重。前OpenAI联合创始人、首席科学家Ilya Sutskever近日在一档深度访谈中罕见发声，直指这一现象背…
前沿技术
- 0
- 0
charles3月22日