一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


摘要:我们经常在小红书上看到各种图片和视频,其实有部分是大模型生成的,本文介绍如何利用dify与豆包生成大模型构建文生图片 / 文生视频的 Agent。本文通过实操的方式进行介绍,避免大家踩坑。


  • 安装插件

  • 申请大模型

  • 配置流程


一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


01

安装插件


在进行流程配置前,我们需要安装豆包的文生图片和文生视频的插件,安装方法如下:

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

在dify的插件市场,搜索文生图片,则会看到doubao image….,点击安装就可以进安装了,有了这些插件,使用dify开发agent就方便很多。

安装完成之后,可以在dify的开发界面中可以查看一下。

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

任意打开一个编排工具,然后添加节点,选择工具,看到截图的工具,则表示安装成功了。


一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


02

申请大模型


本文是使用火山引擎的文生图片和文生视频的大模型进行测试的,大家也可以使用别的大模型都可以。

在注册了火山引擎的账户之后登陆到开通管理的界面,链接如下:

https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenTokenDrawer=false&tab=ComputerVision

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


点击开通服务,则就开通了文生图的模型,其实这个模型也是可以进行文生视频,和图生视频的,开通默认有200次的试用。

开通完成之后,点击接入文档获取APIkey

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


进入API key之后,不要用它默认的key,需要重新生成一个,就没有问题。默认的使用有问题(是个坑)

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


创建完成之后copy这个API key,然后绑定到插件中。

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


把API key填入后,点击保存,显示已经授权,则显示成功。

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


接下来可以创建一个agent 测试一下插件功能。

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


这么看插件安装成功,且大模型也调用成功,接下来我们来配置一个chatflow来进行文生图火子文生视频。

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


03

配置流程


首先选择chatflow,创建一个空白的chatflow.


一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

然后按照如下流程配置:

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

总体流程说明:

1、开始,有三个入参,分别是prompt、type、picture

2、根据开始进行条件分类,主要分成,文生图片,文生视频,图片生成视频

3、文生图片,文生视频 都需要进行提示词改写

4、接入豆包的文生图片、文生视频,图片生成视频插件

5、其中文生视频的视频内容需要提取一下

6、返回展示。

下面详细说明下不同组件的配置:

1、开始组件

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

新增三个变量

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

2、条件分类组件

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

3、文生图片提示词改写组件

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

其中系统提示词为:

# Role: 即梦AI文生图结构化提示词生成器 (Jmeng AI Image Structured Prompt Generator)

## Background:

– 这是一个专门为即梦AI生成静态图像提示词的工具

– 将用户的画面创意转换为结构化提示词

– 输出格式固定且简洁

## Core Objectives:

– 将用户输入的画面创意转换为结构化提示词

– 确保输出格式统一且易于使用

– 提供丰富且具体的画面描述

## Constraints:

1. 输出格式必须严格遵循:

   “`

   画面主体:[内容] 场景描述:[内容] 风格关键词:[内容] 细节修饰:[内容]

   “`

2. 禁止输出任何额外的文字说明或格式

3. 各字段之间使用空格分隔

4. 直接输出结果,不进行对话

## Skills:

1. 静态构图能力:


   – 准确描述主体位置

   – 定义姿态和表情

   – 把握画面重点

2. 场景描写能力:


   – 营造环境氛围

   – 描述天气光线

   – 构建空间感

3. 风格定义能力:


   – 应用艺术流派

   – 把控色彩风格

   – 确定渲染技术

4. 细节补充能力:


   – 添加画质要素

   – 强化材质表现

   – 突出关键特征

## Workflow:

1. 接收用户输入的画面创意

2. 将创意拆解为四个维度

3. 组合成规定格式字符串

4. 直接输出结果

## OutputFormat:

“`

画面主体:[主体描述] 场景描述:[场景内容] 风格关键词:[风格定义] 细节修饰:[细节内容]

“`

## Init:

我已准备好接收您的画面创意,将直接输出符合格式的提示词。

用户提示词为:

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

4、文生视频提示词改写组件

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

系统提示词内容

# Role: 即梦AI文生视频结构化提示词生成器 (Jmeng AI Video Structured Prompt Generator)

## Background:

– 这是一个专门为即梦AI生成视频提示词的工具

– 将用户的视频创意转换为结构化提示词

– 输出格式固定且简洁

## Core Objectives:

– 将用户输入的视频创意转换为结构化提示词

– 确保输出格式统一且易于使用

– 提供丰富且具体的动态场景描述

## Constraints:

1. 输出格式必须严格遵循:

   “`

   画面主体:[内容] 动作描述:[内容] 场景描述:[内容] 风格关键词:[内容] 细节修饰:[内容]

   “`

2. 禁止输出任何额外的文字说明或格式

3. 各字段之间使用空格分隔

4. 直接输出结果,不进行对话

## Skills:

1. 动态构图能力:

   – 准确描述主体位置

   – 定义动作流程

   – 把握动态重点

2. 场景描写能力:

   – 营造环境氛围

   – 描述天气光线

   – 构建空间感

3. 风格定义能力:

   – 应用视频风格

   – 把控色彩风格

   – 确定渲染技术

4. 细节补充能力:

   – 添加动态要素

   – 强化材质表现

   – 突出关键特征

## Workflow:

1. 接收用户输入的视频创意

2. 将创意拆解为五个维度

3. 组合成规定格式字符串

4. 直接输出结果

## OutputFormat:

“`

画面主体:[主体描述] 动作描述:[动作内容] 场景描述:[场景内容] 风格关键词:[风格定义] 细

节修饰:[细节内容]

“`

## Init:

我已准备好接收您的视频创意,将直接输出符合格式的提示词。

用户提示词

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

5、文生图片、文生视频、图片生成视频组件配置

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
注意这里的提示词采用的是提示词改写之后的文案
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
注意这里的提示词采用的是提示词改写之后的文案
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


6、视频提取组件配置

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent

7、三个回复组件配置

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
生成的图片是文生图片生成的文件
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
生成的视频是提取之后的text内容
一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent
生成的视频是图片生成视频的文件。


最后测试一下:

一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


一键解锁创意魔法!用 Dify + 豆包大模型搭建文生图 / 文生视频 Agent


可以去试一试了。

前沿技术大模型技术新闻资讯

🤯 终于搞懂了!LLM、RAG 和 AI Agents 到底是什么关系?

2026-4-29 11:56:20

前沿技术提示词技巧新闻资讯

拿到提示词只是开始,Know-how才是核心竞争力

2026-4-29 12:08:46

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索