dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

 


1.前言

支持PDF原文件文档翻译是指能够将PDF文件中的文本内容自动翻译成另一种语言,并且在翻译过程中保留原始文档的格式、布局和排版。这种翻译方式不仅提高了翻译效率,还确保了翻译后的文档在视觉上与原文档保持一致,便于阅读和使用。

支持PDF原文件文档翻译的工具通常具备以下特点:

  1. 1. 保持格式和排版:许多工具在翻译PDF时会尽量保留原文档的格式,包括字体、颜色、图片位置等。例如,SDL Trados Studio 和 PDF Translator 都强调了这一点,它们能够智能识别文档结构和图片位置,确保翻译后的文档视觉效果与原文档相似。
  2. 2. 支持多种语言和格式:这些工具通常支持多种语言的互译,并且可以处理多种文件格式,如PDF、Word、PPT、Excel等。例如,智能翻译系统支持304种语言互译,并且可以保留原文档格式。
  3. 3. OCR技术:对于扫描的PDF文档,一些工具使用OCR(光学字符识别)技术来提取文本,然后进行翻译。例如,Microsoft Azure Cognitive Services 的文档翻译功能可以自动识别PDF文档是否包含扫描图像内容,并将其内部路由到OCR引擎以提取文本。
  4. 4. 批量处理:许多工具支持批量处理多个PDF文件,提高工作效率。例如,PDF Translator 支持批量处理多页PDF文档。
  5. 5. 在线和离线版本:有些工具提供在线服务,用户只需上传文件即可进行翻译;而另一些工具则提供离线版本,适合需要在没有网络连接的情况下使用的情况。例如,PDFMathTranslate 是一款完全免费的PDF文档翻译软件,无需安装,打开即可使用。
  6. 6. 用户友好界面:大多数工具都提供直观的用户界面,使用户能够轻松上传文件、设置翻译参数并查看翻译结果。例如,TranslaPdf 提供了用户友好的界面,支持多种语言的翻译。
  7. 7. 高精度和一致性:为了确保翻译质量,一些工具采用了先进的翻译引擎和算法,以提高翻译的准确性和一致性。例如,PDF Translator 利用Claude AI进行高质量翻译,确保文档内容准确无误。
dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译
img
dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

之前有小伙伴和我提出有没有办法实现文档的翻译,翻译需要保持原文档格式的不变。我后面时间研究了一下,一开始我想简单了以为靠传统的大模型翻译就可以解决,经过这几天的努力目前初步完成了。今天刚好基于dify1.6版本做了一个支持原始MCP的一个PDF文档翻译的Agent。那么我们看一下效果。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

上面文档基于双语翻译后的文档。左边是原文法语,右边是翻译后的中文。大家看一下效果怎么样? 还不错吧,文档保持原来格式没有变化。dify 实现的效果如下:

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

那么这样的agent是如何制作的呢?话不多说下面带大家制作一个。

2.Agent制作

这个agent调用了一个我自己制作的一个MCP-Server 这个MCP 对外提供SSE方式调用,我们已经提前部署好了。接下来我们需要在dify1.6+版本上配置这个MCP

MCP配置

打开工作流工作台,点击工具按钮

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

我们点击MCP

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

这里我们点击添加基于HTTP服务的MCP

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

我们按照上面图配置好基于SSE的MCP-Server。配置完成后,点击右上角授权,这样我们就可以现在这个MCP-Server可以使用的9个工具

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

Agent制作

Agent创建

点击创建空白应用

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

进入Agent页面

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

MCP设置

我们点击工具-添加按钮,在弹出工具选择我们选择dify内置的MCP

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

目前我这里就配置了一个pdftranslate-mcp-server。所以我们点开它,把它9个工具都选中。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

点击添加完成后,我们的MCP 配置就算完成了。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

开场白设置

接下来我们添加开场白,点击右边右下角管理按钮,弹出管理设置页面

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

添加上面的开场白,这样的开场白设置就完成了。

模型设置

模型这里我们选择硅基流动提供的DeepSeek-ai/DeepSeek-V3 模型,如果没有硅基的小伙伴可以去这个地址https://cloud.siliconflow.cn/i/e0f6GCrN 新户可以送14元。他们家最近上新了不少新模型。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译
dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

以上我们就完成了agent设置了,这个应该非常简单的,小白一看就会。

3.测试及验证

dify验证

点击工作流左上角“发布” 按钮,发布这个Agent

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译
img

接下来我们输入我们的问题

请把这个文件翻译一下,文件URL地址https://music-1258720957.cos.ap-nanjing.myqcloud.com/11.pdf

接下来模型会调用这个PDF链接下载并上传到MCP-Server中,大概过几分钟会返回信息

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

测试过程中,文档翻译是需要时间的。所以模型会调用状态不断获取生成状态给客户端返回。如果返回不了,可以输入下面信息

请刚我把刚才翻译后的PDF下载链接地址发给我 

让模型继续调用直到返回成功为止。

调用成功后默认会返回2个文档 双语 和翻译后的单语言。 当然你也可以让它只返回一个PDF文档。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

我们点击链接下载这个翻译的PDF文件

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译
img

这个就是翻译后的文档。

同时我们也能在后端MCP 服务中看到请求日志

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

其他平台

以上我们就完成了dify 验证测试。 这个MCP 也可以发布在其他支持的mcp-client中使用,比如我本地电脑上的Cherry Studio

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译

疑惑

可能有小伙伴会问,这类文档是否需要上传带链接的版本?其实,MCP 支持三种文件传入方式:

  1. 1. 基于文件的 base64 值;
  2. 2. 基于 URL 链接(本次测试采用这种方式);
  3. 3. 基于本地文件。

其中,第三种本地文件方式,若要发布 MCP,需基于 stdio 实现;但如果用 dify 调用,这种方式就不太合适。而第一种 base64 值方式,由于文件转成 base64 后会导致 token 过大,多数模型对上下文大小有限制,容易出现调用失败的情况。

因此,本次文件上传最终选择通过 URL 链接的方式来实现。

下一步

我前2天也基于这个项目做了一版网页版本的pdftranslate PDF翻译工具。部署在服务器上可以支持更大文件的翻译。

dify案例分享-揭秘!如何用 Dify 实现多语言 PDF 文档原格式翻译
img

感兴趣小伙伴可以关注哦。

基于dify 体验地址

工作流地址:https://dify.duckcloud.fun/chat/ltoJtnaKY6J6DmfO备用地址(http://14.103.204.132/chat/ltoJtnaKY6J6DmfO)

另外方便大家使用MCP,这个MCP请求地址也开放给大家(无密码)

https://pdftranslate2.duckcloud.fun/sse

4.感谢

这个PDF文档的原始材料是基于网友:王科提供的,该同志具有丰富的海外项目背景知识。项目最早的想法也是基于它提出来的。(他们直接工作中有这类PDF文档翻译的需求)

5.总结

今天主要带大家制作了一个基于 Dify 1.6+ 版本的支持原始 MCP 的 PDF 文档翻译 Agent。此次实践不仅实现了 PDF 文档的高质量翻译,还重点展示了 Dify 在集成外部服务、简化工具配置方面的强大能力。

总的来说,通过此次实践,我们充分体验到了 Dify 在 AI 应用开发中的便捷性和高效性。它通过集成 MCP 服务,简化了与外部工具的集成过程,提高了工作流的可重用性和系统的稳定性,为 PDF 文档翻译等特定任务提供了强大、便捷的解决方案。

感兴趣的小伙伴可以按照本文步骤去尝试制作自己的 PDF 文档翻译 Agent,并体验 Dify 带来的新功能。今天的分享就到这里结束了,我们下一篇文章见。


 

阿里开源 Wan2.2:视频生成迈入电影级时代,部署教程全解析
开源版COZE-字节 Coze Studio 重磅开源!保姆级本地安装教程,手把手带你体验
免费玩转顶尖代码生成!魔搭社区 + Qwen3-Coder+Claude Code 全攻略
5 分钟搞定系统架构图!魔搭社区免费工具,小白也能轻松上手
mcp-server案例分享-零代码挑战!用 RovoDev 一键生成 Mermaid 驱动的 MCP-Server

RAG技术前沿技术新闻资讯

Chonkie:开源、轻量、极速的 RAG 分块神器 🦛

2025-7-31 22:32:13

RAG技术前沿技术新闻资讯

Chonkie:开源、轻量、极速的 RAG 分块神器 🦛

2025-7-31 23:35:40

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索