OpenAI 图像生成 API 开放！开发者也能“一键出图”了

图像生成的新时代，来了。这一次，不再只是“艺术家用AI玩玩”，而是每一个开发者，都能把视觉魔法装进自己的App里。

今天OpenAI正式开放图像生成API接口，背后搭载的是他们新一代的多模态模型——gpt-image-1，也就是ChatGPT背后的GPT-4o的“画画脑”。

全场景通吃的“画图神器”，终于开放！

自从 GPT-4o 上线图像生成功能以来，仅一周时间，全球 1.3 亿用户就撸出了 7 亿+ 张图，风格横跨动漫、写实、童话、赛博、扁平……应有尽有，直接刷爆社媒，还顺手把服务器都卷出了热浪。

撇开吉卜力的风格不谈，OpenAI 的这款模型本质上靠的不是情怀，而是精准提示遵循能力碾压行业平均线。相比之下，Midjourney V7虽然更新了草图模式，但在画面一致性和上下文理解上，还是差了一截。

不过，这些“魔法般的体验”一直只对C端用户开放，企业和开发者早就嗷嗷待哺。今天，API终于来了。

从此，不止你会玩，你的产品也能会画图了。

开发者最爱：灵活、精细，还能按需定制

这个 API 有多香？简单列几个关键点你就懂了：

✅ 风格丰富：不管是吉卜力、赛博朋克、低多边形还是写实风，一句话就能调出你要的感觉；最高支持 1536×1024 像素；
✅ 文字嵌图很精准：英文效果非常稳，中文偶尔还会翻车，但已经比老一代模型进步不少；
✅ 上下文记得牢：能连续对话、迭代创作，不用从头再说一遍；
✅ 参数自由调：尺寸、颜色、透明度全都可以微调，想要透明底？直接支持！
✅ 格式全家桶：PNG、JPEG、WebP全都支持，最大单图 20MB，输出够灵活；

此外，图像 API 提供了两种核心能力：

? 生成图像：根据文本提示从零开始画；
✂️ 编辑图像：上传已有图片，用新提示局部或整体修改。

甚至支持超长 Prompt（最多 32000 字符）——比 DALL·E 那代直接高一个量级，真·能听你说废话也不烦。

一句话总结：不会画画也没关系，用它你就是“下一代视觉设计师”。

开发者上手示例（Python + OpenAI SDK）

GPT-Image-1 的 API 不仅支持自定义尺寸、风格、透明度输出，还支持一次生成多张图（n 参数最多支持10张）。下面是一个用 Python 快速生成图片并保存的完整示例：

from openai import OpenAIimport base64client = OpenAI()prompt = """A children's book drawing of a veterinarian using a stethoscopeto listen to the heartbeat of a baby otter."""result = client.images.generate(    model="gpt-image-1",    prompt=prompt)image_base64 = result.data[0].b64_jsonimage_bytes = base64.b64decode(image_base64)with open("otter.png", "wb") as f:    f.write(image_bytes)

生成的图如下：

除了会“凭空造图”，它还能修图、模仿、套图，连“视觉小工”都不放过?

?图像编辑 & 参考生图：不仅会画，还会改、会学

除了从零开始生成图像，GPT-image-1 还支持一整套强大的图像编辑与参考生图能力，让它真正具备“创作 + 修图 + 模仿”的多栖能力：

✏️ 编辑已有图像：你可以上传一张图片，再加上新的 Prompt，让它在原图基础上进行整体重绘或细节调整；
局部修复（inpainting）：上传图像 + 遮罩，精准替换特定区域，修人脸、补背景、去水印都不在话下；
参考图生成（image reference）：上传一张或多张参考图，AI会从中提取风格、结构或物体特征，生成融合参考内容的新图像。

举个例子：你上传 4 张图片，然后告诉 AI “给我生成一张礼品篮，里面放这些东西”——它就能自动组合成图，从“会画”进化到“懂组合”。

import base64from openai import OpenAIclient = OpenAI()prompt = """Generate a photorealistic image of a gift basket on a white background labeled 'Relax & Unwind' with a ribbon and handwriting-like font, containing all the items in the reference pictures."""result = client.images.edit(    model="gpt-image-1",    image=[        open("body-lotion.png", "rb"),        open("bath-bomb.png", "rb"),        open("incense-kit.png", "rb"),        open("soap.png", "rb"),    ],    prompt=prompt)image_base64 = result.data[0].b64_jsonimage_bytes = base64.b64decode(image_base64)# Save the image to a filewith open("gift-basket.png", "wb") as f:    f.write(image_bytes)

?价格怎么说？不算最便宜，但性价比真不低

GPT-image-1 的 API 计费方式分得非常细，按 token 数量 来算，具体如下：

? 文本输入（你写的Prompt）：100 万 token = $5
?️ 图像输入（如果你上传一张图给它参考）：100 万 token = $10
? 图像输出（生成出来的图）：100 万 token = $40

换句话说，按图像大小和质量估算，单张图的价格大致如下：

? 低质量图：$0.02（适合快速迭代、草图阶段）
⚖️ 中质量图：$0.07（大多数日常使用都够用）
高质量图：$0.19（用于商业发布、印刷级别）

虽然单价看上去比一些竞品略高，但考虑到它的图文精准度、上下文保持能力和图像一致性，可以说——贵得有理，用得值

{{userData.name}}已认证