大家好,OpenAI 于 4 月 15 日发布了针对其最新语言模型 GPT-4.1 的提示工程指南:
https://github.com/openai/openai-cookbook/blob/main/examples/gpt4-1_prompting_guide.ipynb

但是,这篇文档非常晦涩难懂,本文试图帮你做个简单版的总结。
GPT-4.1 有哪些新特性?
GPT-4.1 比之前的 GPT-4o 更强大,特别是在编程、理解指令和处理超长文本方面有很大提升。它能更好地理解你的指令,并且只要你说得清楚,它就能严格按照你的要求来做。
如何写好 Prompt(提示词)?
基本原则
-
越具体越好:你说得越详细,AI 回答得越准确。
-
多举例子:给 AI 看你想要的例子,它会更容易理解你的需求。
-
分步骤:复杂任务可以让 AI 一步步来,先计划再执行。
针对 GPT-4.1 的特别建议
-
GPT-4.1 会非常“听话”,如果你发现它没按你想的做,只要加一句明确的指令,通常就能纠正。
-
以前的 prompt 可能需要调整,因为 GPT-4.1 不会像老版本那样“猜测”你的意图,而是更倾向于字面理解。
智能体(Agentic)工作流
GPT-4.1 非常适合做“智能体”——也就是能自主解决问题的 AI 助手。写智能体 prompt 时,建议加上三类提醒:
-
持续性:让 AI 明白要一直做下去,直到问题彻底解决。
-
工具调用:鼓励 AI 多用工具(比如查文件、运行代码),不要乱猜。
-
计划与反思(可选):让 AI 每次调用工具前都先计划、每次调用后都反思。
这样能让 AI 更像一个主动解决问题的助手,而不是被动聊天机器人。
工具调用(Tool Calls)
-
GPT-4.1 对“工具调用”训练得更好,建议用 API 的 tools 字段传递工具,而不是把工具描述直接写进 prompt。
-
工具和参数要命名清晰,描述详细。
-
如果工具复杂,可以在 prompt 里加 # Examples 部分,举例说明怎么用。
长上下文处理
GPT-4.1 支持超长输入(最多 100 万 token),适合处理大文档、代码库等。注意事项:
-
上下文越长,AI 检索和推理的难度越大,性能可能下降。
-
指令最好放在上下文的开头和结尾,效果更好。
Chain of Thought(思维链)
虽然 GPT-4.1 不是“推理模型”,但你可以通过 prompt 让它“逐步思考”,比如:
-
先让 AI 分析问题,再一步步给出解决方案。
-
这样做能让 AI 的回答更有条理、更靠谱。
指令遵循(Instruction Following)
GPT-4.1 对指令的遵循非常好。你可以:
-
用“规则”或“说明”部分列出高层要求。
-
针对某些行为加详细说明,比如输出格式、语气、要避免的话题等。
-
如果发现 AI 没按要求做,检查是不是有冲突或不明确的指令,并加上例子。
常见问题与调试建议
-
如果让 AI 必须调用工具,但信息不够,它可能会乱填参数。可以加一句“如果信息不够,先问用户”。
-
如果给了示例短语,AI 可能会重复用。可以要求它多变换表达。
-
没有明确格式要求时,AI 可能会输出多余的解释或格式。可以通过指令和例子来规范。
Prompt 结构推荐
一个好的 prompt 通常包括:
-
角色和目标(Role and Objective)
-
总体说明(Instructions)
-
细分说明(Sub-categories)
-
推理步骤(Reasoning Steps)
-
输出格式(Output Format)
-
示例(Examples)
-
上下文(Context)
-
最后的逐步思考提示
分隔符建议
-
推荐用 Markdown 标题、代码块等分隔不同部分。
-
也可以用 XML 标签,尤其是需要嵌套结构时。
-
JSON 结构虽然常见,但在长上下文下效果不如 Markdown 和 XML。
代码补丁(Diff)格式
GPT-4.1 在生成代码补丁(diff)方面有很大提升。 推荐使用官方的 V4A diff 格式,或者类似的“搜索/替换”格式,避免用行号,直接用上下文和代码片段来定位和修改。
总结
-
GPT-4.1 更“听话”,但更需要你把需求说清楚。
-
多用例子、分步骤、明确格式,能让 AI 表现更好。
-
工具调用、长上下文、代码补丁等新特性都能大大提升开发效率。
-
多试、多调、多总结,找到最适合你场景的 prompt 写法。

