最近一直在内测一款令人惊艳的 Agent 产品,今天总算官宣了。
它叫 Lovart,是世界上第一个专业设计 Agent。
在 GPT 4o 生图功能上线之后,文生图领域便进入了新的时代。
文生图模型的重大进步,也为设计工具的 Agent 化提供了全新的可能。
那设计 Agent 到底是什么?
让我们来看一段官方视频,感受一下:
一、全链路设计和执行,一句话搞定
以前的文生图工具,它们所提供的任务是“生成图片”这一环。
而设计 Agent,则像一位“设计执行官”,覆盖从创意拆解到专业交付的整个视觉流程。
从意图拆解 → 任务链 → 最后成品,一句话全搞定。
单次可以执行上百步,最多可以一次产出40张设计成品图。
比如,我可以让它根据我家猫的照片做一套银渐层表情包,它会自己设计表情,挨个生图,还可以全部编辑,一键做出所有表情包的黑底渐变色版本。

Prompt:
Use the cat in this picture as a template to design a set of 12 silver gradient emoji packs. Style 3D cartoon, to express the most popular and trendy emoji this year.
再比如,为宣传智能家居扬声器的 30 秒视频广告创建一个 6 帧故事板。
它会先根据需求,写出故事,然后开始进行角色设计。
完成之后,会进行关键场景的设计。
在最后把场景填充到故事板里,为每个画面配上光线、摄影机移动等信息。
Prompt:
Create a 6-frame storyboard for a 30-second video ad promoting a smart home speaker.
Scene progression:
Modern living room, family interacting
Voice command to the speaker
Music starts playing
Speaker answers a question
Lighting adjusts automatically
Close-up of product and brand tagline
Style: clean, semi-realistic illustration, soft light.
二、图像视频音乐,自由调度
只有具备了充足的工具箱,Agent 才能更全面地完成任务。
Lovart 集成了一系列前沿的 AI 模型,比如 GPT image-1, Flux pro, OpenAI-o3, Gemini Imagen 3, Kling AI, Tripo AI, Suno AI等。
设计师可以在一个统一的界面内完成设计、编辑与生成,再也不必在多个软件和模型之间来回切换。
我让它设计一个 "VIVIDPIX "的新生活科技品牌,并创建跨媒体发布活动。
它不仅设计了logo、海报、周边,还用可灵制作了3D版本的logo动画,用suno制作了bgm。
由于所有的模型都拥有相同的 Context 上下文,配合起来丝滑无缝。

Prompt:
Prompt:
Create a cross-media launch campaign for a new lifestyle tech brand called “VIVIDPIX”.
Visuals: Design two main brand posters in different styles (futuristic minimalism and playful retro), including editable text layers and logo integration.
Video/3D: Generate a dynamic 10-second video loop of the brand logo morphing in 3D space, with smooth, modern animation, suitable for website and social sharing. Leverage Kling or equivalent video/animation AI tools.
Music: Compose an original 15-second catchy theme music that matches the brand’s energetic and optimistic tone. Use Suno or other advanced AI music models.
Packaging: Output a box and product mockup, harmonizing visuals across all touchpoints.
Canvas: Bring all assets together onto a single editable Lovart canvas, allowing for integrated fine-tuning and end-to-end brand asset delivery.
All elements—visuals, video, music, packaging—should have a cohesive color palette and brand personality, and be ready to use for a multi-platform product launch.
三、生成结果自动分图层,随心修改
在海报的生成中,最大的痛点是文字后期的编辑,Lovart 很好地解决了这一痛点。
举例来说,我这里要为一种新的植物蛋白饮料设计一张宣传海报。
一分钟后,它就生成了左侧的标准海报,同时在右侧附上了图文分离的版本。
现在我可以自由修改文字的内容、大小、颜色,真的太方便了。

Prompt:
Design a promotional poster for a new plant-based protein drink.
Style: vibrant and energetic, modern editorial layout.
Color palette: green, cream, and orange.
Text: “Fuel Your Day, Naturally”.
Aspect ratio: 3:4, for Instagram feed.
Include editable text layers.
使用小技巧:
在使用 Lovart 的过程中也发现了一些小心得,在这里分享给大家:
-
1. Lovart 内置了很多图像、视频、音乐模型,但并不是每个模型都对中文支持够好,所以使用英文进行提示词会获得最佳体验。 -
2. 设计的起点是需求,只有把需求描述好,Agent 才能设计好,所以建议在发布任务之前,先和 AI 聊一下需求,让 AI 输出最后的提示词。提示词里可以包含风格、颜色、文字、比例等结构化信息,结构化信息本身是对复杂需求的一种拆解,这样写出来的提示词,Lovart 在执行的时候效果也最好。 -
3. 如果需要独立的文字图层,只需要在指令中加上这句话即可: Include editable text layers.
结语
Lovart 的出现,代表 AI 在设计领域的角色,正在从单纯的“图像生成器”向更深层次的“设计执行官”转变。
它试图解决的,不仅仅是“画出一张图”,更是“完成一个设计任务”的问题。
有人曾问我,4o 生图的出现是否会干掉图像的工作流。
当 AI Agent 开始尝试理解并执行更复杂的设计流程时,
我们与 AI ,也将迎来全新的协作方式。
