


|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. 内容拆分 → 将主题拆分为多页,确定每页的标题和要点
2. 生成提示词 → 为每页编写独立的图像生成提示词
3. 调用模型 → 逐页生成幻灯片图像
4. 迭代优化 → 不满意则调整提示词重新生成
5. 导入 PPT → 将图像插入幻灯片(手动或脚本批量处理)
-
输入:用户提供演示主题、目标受众、大致页数要求 -
LLM 处理:分析主题,规划逻辑结构(开场→正文→总结),拆分为具体页面 -
输出:每页的标题、核心要点、建议的视觉元素
-
通用部分(所有页面共享):整体风格、配色方案、字体风格、品牌元素 -
独立部分(每页特有):该页标题、具体内容、布局建议、图表类型
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-
视觉效果出色,可达专业设计水准 -
自动生成图表、插图等复杂元素 -
上手门槛极低,会写描述就能用
-
输出为静态图像,后期编辑困难 -
无法直接添加动画效果 -
修改内容需重新生成整页


-
版面分析:使用 MinerU 等工具分析幻灯片图片,识别文字、表格、图片等组件及其位置 -
背景修复:通过 AI inpainting 技术,将识别出的元素从原图中移除,生成干净的背景图 -
样式提取:调用视觉语言模型(VLM)提取文字的颜色、字体、字号等样式信息 -
PPTX 重建:将干净背景设为幻灯片底图,在对应位置创建可编辑的文本框、表格等元素


演示文稿.pptx (解压后)
├── [Content_Types].xml # 文件类型声明
├── _rels/ # 顶层关系文件
├── ppt/
│ ├── presentation.xml # 主文档(幻灯片目录)
│ ├── slides/ # 各页幻灯片内容
│ │ ├── slide1.xml
│ │ └── slide2.xml
│ ├── slideLayouts/ # 布局版式
│ ├── slideMasters/ # 母版模板
│ └── theme/ # 主题配色字体
1. 理解结构 → 解压模板 PPTX,研究 XML 结构
2. 准备内容 → 整理大纲(Markdown 或 XML 片段)
3. AI 生成 → 让 LLM 生成符合 OOXML 规范的 XML 代码
4. 组装文件 → 将 XML 部件打包成 .pptx
5. 验证调试 → 用 PowerPoint 打开检查,迭代修正
-
完全可编辑,与手工制作的 PPT 无异 -
高度自动化,可与数据源集成批量生成 -
精确控制每个元素,灵活性极高
-
技术门槛高,需理解 XML 和 OOXML 规范 -
调试复杂,格式错误会导致文件无法打开 -
视觉效果依赖预设模板质量
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-
追求快速出稿和视觉冲击力 -
内容基本确定,后期不需大改 -
不想学习技术细节
-
需要频繁更新内容或与他人协作 -
有编程基础或愿意投入学习 -
需要批量生成或集成到自动化流程

