90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

导读

如果你最近还在用“写代码效率提升了多少倍”来衡量AI，那已经落后一代了。

真正发生的变化是——“人写代码 → 人调度AI写代码” 的范式切换，已经在头部AI公司内部落地。

Claude 5.0（Mythos）这波内测，不是性能升级那么简单，而是把软件工程的底层逻辑，直接改写了一遍。

Claude 5.0 内测，到底强在哪
90分钟挖出20年漏洞，这件事的真实含义
AI不只是写代码，而是开始“做安全研究”
Anthropic内部变化：工程师正在消失？
多智能体协作，正在成为默认开发模式
对测试开发的冲击：机会与重构
落地建议：普通工程师该怎么跟上

1、Claude 5.0 内测，到底强在哪

这次曝光的 Claude Mythos 5.0，本质上是一个“顶配级模型”：

规模更大，推理更深
编程能力显著增强
安全能力出现“质变级跃迁”
已集成进 Claude / Claude Code 体系

从定位来看，它类似一个“强化版 Opus”，但更激进：

不只是生成代码，而是能主动发现系统问题

这点，是关键分水岭。

90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

2、90分钟挖出20年漏洞，这件事的真实含义

最炸裂的事情，是安全研究员 Nicholas Carlini 的现场演示：

Claude 在约 90 分钟内完成了：

自动分析系统
发现漏洞
编写利用代码
输出完整攻击路径

涉及两个典型场景：

场景一：Ghost CMS

自动发现 SQL 注入漏洞
读取管理员 API Key
获取密码哈希

场景二：Linux 内核（NFSv4）

发现堆栈缓冲区溢出漏洞
该漏洞存在时间：约 20 年

这件事真正的含义不是“AI很强”，而是：

AI已经具备自主漏洞挖掘能力
能处理复杂系统级代码（如内核）
不依赖人工引导完成完整攻击链

这已经超出“代码生成”的范畴，进入了：

“系统理解 + 安全推理 + 自动执行”

3、AI不只是写代码，而是开始“做安全研究”

过去AI在安全领域的能力，大多停留在：

简单漏洞扫描
规则匹配
辅助分析

但这次变化是：

能力维度	过去	Claude 5.0
漏洞发现	规则驱动	推理驱动
分析深度	函数级	系统级
利用能力	辅助生成	自动构造
执行方式	人主导	AI主导

这意味着：

AI开始具备“类安全专家”的工作能力

这对整个安全行业、测试行业，都是结构性冲击。

4、Anthropic内部变化：工程师正在消失？

另一个被广泛传播的信息是：

Anthropic内部，工程师已经“几个月不写代码”

需要理性看待，这里有两个层面的事实：

真实变化

大量代码由 Claude Code 生成
工程师角色转向：

任务拆解
Agent调度
结果校验

多智能体并行成为常态

需要注意的点

并非“完全不写代码”
关键逻辑、复杂系统仍需人工介入
AI目前仍存在：

不稳定性
幻觉问题
边界场景失效

所以更准确的说法是：

工程师没有消失，而是从“执行者”变成了“调度者”

5、多智能体协作，正在成为默认开发模式

目前最前沿的开发方式，已经不是：

“一个人 + 一个AI助手”

而是：

“一个人 + 多个AI Agent 并行工作”

典型模式：

需求输入
   ↓
任务拆解 Agent
   ↓
多个执行 Agent（并行）
   ↓
测试 / 校验 Agent
   ↓
汇总输出

在这种模式下：

人不再写代码
人负责“调度 + 控制 +判断”
AI负责“执行”

6、对测试开发的冲击：机会与重构

对测试行业来说，这不是坏消息，反而是机会窗口。

正在发生的变化

1）测试对象变化

从“系统” → “AI系统 + Agent系统”

2）测试内容变化

功能正确性 → 推理正确性
接口稳定性 → 行为稳定性

3）测试方法变化

用例驱动 → 数据驱动 / 评测驱动

新能力要求（核心）

Prompt设计能力
RAG系统理解
Agent流程调试能力
AI评测体系设计

扫码进群，咨询人工智能测试开发训练营详情

测试工程师，正在向“AI系统验证工程师”演进

7、落地建议：普通工程师该怎么跟上

这波变化，不是未来，是现在。

给三个务实建议：

1）尽快掌握 Agent 工作流

至少要理解：

多Agent如何拆任务
如何并行执行
如何做结果校验

2）从“写代码”转向“设计流程”

重点提升：

任务拆解能力
系统建模能力
自动化流程设计

3）补齐AI工程能力

建议优先学习：

RAG（检索增强）
工具调用（Tool Calling）
Agent框架（如 LangChain / LangGraph）

结尾

Claude 5.0这波，并不是简单的“模型升级”。

它真正带来的，是一个信号：

软件开发正在从“人写程序”，进入“人调度智能体”的时代

当AI可以：

找漏洞
写代码
跑测试
做决策

那么人类的价值，就只剩下一件事：

定义问题，以及控制系统不失控

如果你是测试工程师，现在要思考的已经不是：

“AI会不会替代我”

而是：

“我能不能成为那个调度AI的人”

{{userData.name}}已认证