看见设计的未来：Lovart 全球首个设计 Agent 体验

最近一直在内测一款令人惊艳的 Agent 产品，今天总算官宣了。

它叫 Lovart，是世界上第一个专业设计 Agent。

在 GPT 4o 生图功能上线之后，文生图领域便进入了新的时代。

文生图模型的重大进步，也为设计工具的 Agent 化提供了全新的可能。

那设计 Agent 到底是什么？

让我们来看一段官方视频，感受一下：

Lovart 的三个特点：

一、全链路设计和执行，一句话搞定

以前的文生图工具，它们所提供的任务是“生成图片”这一环。

而设计 Agent，则像一位“设计执行官”，覆盖从创意拆解到专业交付的整个视觉流程。

从意图拆解 → 任务链 → 最后成品，一句话全搞定。

单次可以执行上百步，最多可以一次产出40张设计成品图。

比如，我可以让它根据我家猫的照片做一套银渐层表情包，它会自己设计表情，挨个生图，还可以全部编辑，一键做出所有表情包的黑底渐变色版本。

Prompt：

Use the cat in this picture as a template to design a set of 12 silver gradient emoji packs. Style 3D cartoon, to express the most popular and trendy emoji this year.

再比如，为宣传智能家居扬声器的 30 秒视频广告创建一个 6 帧故事板。

它会先根据需求，写出故事，然后开始进行角色设计。

完成之后，会进行关键场景的设计。

在最后把场景填充到故事板里，为每个画面配上光线、摄影机移动等信息。

看见设计的未来：Lovart 全球首个设计 Agent 体验

Prompt：

Create a 6-frame storyboard for a 30-second video ad promoting a smart home speaker.

Scene progression:

Modern living room, family interacting

Voice command to the speaker

Music starts playing

Speaker answers a question

Lighting adjusts automatically

Close-up of product and brand tagline

Style: clean, semi-realistic illustration, soft light.

二、图像视频音乐，自由调度

只有具备了充足的工具箱，Agent 才能更全面地完成任务。

Lovart 集成了一系列前沿的 AI 模型，比如 GPT image-1, Flux pro, OpenAI-o3, Gemini Imagen 3, Kling AI, Tripo AI, Suno AI等。

设计师可以在一个统一的界面内完成设计、编辑与生成，再也不必在多个软件和模型之间来回切换。

我让它设计一个 "VIVIDPIX "的新生活科技品牌，并创建跨媒体发布活动。

它不仅设计了logo、海报、周边，还用可灵制作了3D版本的logo动画，用suno制作了bgm。

由于所有的模型都拥有相同的 Context 上下文，配合起来丝滑无缝。

Prompt：

Create a cross-media launch campaign for a new lifestyle tech brand called “VIVIDPIX”.

Visuals: Design two main brand posters in different styles (futuristic minimalism and playful retro), including editable text layers and logo integration.

Video/3D: Generate a dynamic 10-second video loop of the brand logo morphing in 3D space, with smooth, modern animation, suitable for website and social sharing. Leverage Kling or equivalent video/animation AI tools.

Music: Compose an original 15-second catchy theme music that matches the brand’s energetic and optimistic tone. Use Suno or other advanced AI music models.

Packaging: Output a box and product mockup, harmonizing visuals across all touchpoints.

Canvas: Bring all assets together onto a single editable Lovart canvas, allowing for integrated fine-tuning and end-to-end brand asset delivery.

All elements—visuals, video, music, packaging—should have a cohesive color palette and brand personality, and be ready to use for a multi-platform product launch.

三、生成结果自动分图层，随心修改

在海报的生成中，最大的痛点是文字后期的编辑，Lovart 很好地解决了这一痛点。

举例来说，我这里要为一种新的植物蛋白饮料设计一张宣传海报。

一分钟后，它就生成了左侧的标准海报，同时在右侧附上了图文分离的版本。

现在我可以自由修改文字的内容、大小、颜色，真的太方便了。

Prompt：

Design a promotional poster for a new plant-based protein drink.

Style: vibrant and energetic, modern editorial layout.

Color palette: green, cream, and orange.

Text: “Fuel Your Day, Naturally”.

Aspect ratio: 3:4, for Instagram feed.

Include editable text layers.

使用小技巧：

在使用 Lovart 的过程中也发现了一些小心得，在这里分享给大家：

1. Lovart 内置了很多图像、视频、音乐模型，但并不是每个模型都对中文支持够好，所以使用英文进行提示词会获得最佳体验。
2. 设计的起点是需求，只有把需求描述好，Agent 才能设计好，所以建议在发布任务之前，先和 AI 聊一下需求，让 AI 输出最后的提示词。提示词里可以包含风格、颜色、文字、比例等结构化信息，结构化信息本身是对复杂需求的一种拆解，这样写出来的提示词，Lovart 在执行的时候效果也最好。
3. 如果需要独立的文字图层，只需要在指令中加上这句话即可： Include editable text layers.

结语

Lovart 的出现，代表 AI 在设计领域的角色，正在从单纯的“图像生成器”向更深层次的“设计执行官”转变。

它试图解决的，不仅仅是“画出一张图”，更是“完成一个设计任务”的问题。

有人曾问我，4o 生图的出现是否会干掉图像的工作流。

我所看到的情况，不是干掉，而是解放。

这种解放，将图像工作流推向设计 Agent 的新范式。

技术的发展总是在不断挑战我们的想象边界。

当 AI Agent 开始尝试理解并执行更复杂的设计流程时，

我们与 AI ，也将迎来全新的协作方式。

我把这篇文章写完，放到 Lovart 里，让它生成10张公众号配图。

于是就有了这篇文章的封面图。

以上就是今天橘子汽水铺分享的全部内容。

{{userData.name}}已认证

看见设计的未来：Lovart 全球首个设计 Agent 体验

一、全链路设计和执行，一句话搞定

二、图像视频音乐，自由调度

三、生成结果自动分图层，随心修改

使用小技巧：

结语

微软 Copilot 再添猛将！Researcher Agent 如何从数据到PPT一气呵成？

从复杂文档到AI秒懂的高质量数据：EasyDoc解析实战指南