省了70%时间,但别信AI一次就完美
上个月接了个大需求,PRD 40页,功能用例要写200多条。手写至少两周。
我不想加班。花了半天,用Claude Code捣鼓了个小Agent——输入PRD链接,自动输出功能测试用例。
效果还行。今天把真实思路、方案和踩过的坑全写出来。
一、我的方案
没搞复杂多智能体,就是一个Python脚本 + Claude API,跑在终端里。
流程: 读PRD → 拆功能点 → 每个功能点生成测试场景 → 展开用例 → 输出Excel
核心prompt简化版:
text
你是资深测试。根据PRD,每个功能点生成:- 1条正向用例 + 2条异常 + 1条边界- 步骤要具体可执行- PRD模糊处标[待确认]- 输出JSON数组
加了个few-shot示例(登录功能用例),让AI照着格式来。
二、四个坑和我的解法
坑1:PRD里的图和表格AI看不懂
流程图、状态机、表格,纯文本输入后全丢。
解法:手动把关键表格转markdown,流程图用文字描述(“从状态A到B,触发条件X”)。花10分钟,AI多理解30%。
坑2:上下文一长,AI开始胡编
40页塞进去,AI看到后面忘了前面。
解法:分模块生成。先让AI输出“功能点列表”,再对每个功能点单独调API。慢一点,但准很多。
坑3:异常用例太模板化
总写“输入为空”“超长”,业务相关异常(如“已支付再次支付”)漏掉。
解法:prompt里强制要求“结合业务规则,至少生成一条业务异常用例”。
坑4:输出格式不统一
JSON里步骤有时数组有时字符串。
解法:用Claude的结构化输出(response_format: json_schema)强制字段类型。不支持就后处理,写个函数把字符串按换行拆开。
三、最终效果
现在工作流:
-
把PRD扔给AI
-
终端执行
python prd2case.py --input prd.txt --output cases.xlsx -
等3-5分钟
-
打开Excel,人工review
实测:20个功能点,AI生成50-80条用例。60%直接用,30%微调,10%删掉。节省70%时间。 两周变3天。
四、给想自己动手的人几点建议
-
别追求100%自动化。目标是帮你完成70%脏活,剩下30%必须人工。隐性业务知识AI搞不定。
-
prompt要迭代。我改了十几个版本。每次看哪里不对,就往prompt里加规则。比如“步骤以动词开头”“预期结果要可验证”。
-
用git管理prompt和脚本。prompt也是代码,改崩了能回滚。
-
成本:Claude API按量付费,单次生成0.3-0.8美元。我用的是Claude Pro($20/月),API调用含在订阅内,不用额外掏钱。
-
对团队透明。我直接跟leader说:“AI辅助生成初版,省了两天,建议再让同事交叉review。” 领导反而觉得靠谱。
五、说句大实话
AI Agent不是魔法。它不能替代你对业务的理解,也不能替代你判断“这个bug要不要修”。
但它能把你从重复造轮子里拉出来。省下的时间,去思考测试策略、优化框架、跟开发撕架构问题。
这才是测开该干的。
我把核心脚本简化版整理出来了,后台回复“PRD2Case”发你参考。(纯分享)
欢迎留言聊聊:你被PRD折磨过的最惨经历?点赞最高的我下次写“如何用AI自动生成API测试代码”。


