外企测开实战：我把40页PRD扔给Claude，3分钟生成80条测试用例

省了70%时间，但别信AI一次就完美

上个月接了个大需求，PRD 40页，功能用例要写200多条。手写至少两周。

我不想加班。花了半天，用Claude Code捣鼓了个小Agent——输入PRD链接，自动输出功能测试用例。

效果还行。今天把真实思路、方案和踩过的坑全写出来。

一、我的方案

没搞复杂多智能体，就是一个Python脚本 + Claude API，跑在终端里。

流程： 读PRD → 拆功能点 → 每个功能点生成测试场景 → 展开用例 → 输出Excel

核心prompt简化版：

text

你是资深测试。根据PRD，每个功能点生成：- 1条正向用例 + 2条异常 + 1条边界- 步骤要具体可执行- PRD模糊处标[待确认]- 输出JSON数组

加了个few-shot示例（登录功能用例），让AI照着格式来。

坑1：PRD里的图和表格AI看不懂
流程图、状态机、表格，纯文本输入后全丢。
解法：手动把关键表格转markdown，流程图用文字描述（“从状态A到B，触发条件X”）。花10分钟，AI多理解30%。

坑2：上下文一长，AI开始胡编
40页塞进去，AI看到后面忘了前面。
解法：分模块生成。先让AI输出“功能点列表”，再对每个功能点单独调API。慢一点，但准很多。

坑3：异常用例太模板化
总写“输入为空”“超长”，业务相关异常（如“已支付再次支付”）漏掉。
解法：prompt里强制要求“结合业务规则，至少生成一条业务异常用例”。

坑4：输出格式不统一
JSON里步骤有时数组有时字符串。
解法：用Claude的结构化输出（response_format: json_schema）强制字段类型。不支持就后处理，写个函数把字符串按换行拆开。

现在工作流：

实测：20个功能点，AI生成50-80条用例。60%直接用，30%微调，10%删掉。节省70%时间。 两周变3天。

AI Agent不是魔法。它不能替代你对业务的理解，也不能替代你判断“这个bug要不要修”。

但它能把你从重复造轮子里拉出来。省下的时间，去思考测试策略、优化框架、跟开发撕架构问题。

这才是测开该干的。

我把核心脚本简化版整理出来了，后台回复“PRD2Case”发你参考。（纯分享）

欢迎留言聊聊：你被PRD折磨过的最惨经历？点赞最高的我下次写“如何用AI自动生成API测试代码”。