告别 PDF 解析烦恼,迎接知识无缝转化
• PDF文档结构复杂,解析后格式混乱
• 扫描件内容无法被正确识别
• 图表变形或消失
• 公式转换成乱码
图片?消失了!
重要的图表和示意图全都"蒸发",只剩下占位符
表格?不存在的!
你期待的是数据分析,得到的却是一团乱码
➗ LaTeX公式?变成天书!
精心编写的数学公式变成了一串无法辨认的符号
密密麻麻的文字墙…
没有结构、没有层次,密密麻麻的文字堆在一起看得头疼,阅读五分钟就想闭眼
知识库不应该是这样的!
这哪是AI助手,分明是"折磨助手"…
说好的提升效率,怎么变成了增加烦恼?
作为国内领先的知识库产品,FastGPT决定彻底解决这些痛点!
FastGPT 4.9版本强势来袭,带来全方位的知识库体验升级!
PDF增强解析:向知识库"两眼一黑"说再见!
告别传统知识库的单调文本体验,FastGPT 4.9带您进入多模态知识管理新时代!
? PDF增强解析有多强?
还在为知识库中的PDF内容展示不全面而烦恼吗?FastGPT最新版带来革命性体验:
FastGPT现已在页面上集成PDF增强解析交互功能,并内嵌Doc2x专业文档处理服务,让您的PDF文件解析达到新高度!
-
扫描件精准识别 – 支持扫描版PDF识别,文字清晰可辨
-
文本结构化 – PDF可转换为结构化Markdown格式,保留原始排版和层次关系
-
?️ 图片保留 – 可以提取文档中的所有图片,并以链接形式报错
-
➗ LaTeX公式 – 数学公式、专业符号精准识别并转换,文档处理更专业
-
? 表格数据 – 复杂表格结构化呈现,数据关系一目了然
?? 如何使用?超简单!
Step 1: 准备工作
打开您的知识库,在右侧根据需要选择合适的模型
Step 2: 导入文档
点击右上角的"新建/导入"按钮选择"文本数据集"上传您的文档
Step 3: 开启增强解析
上传完成后点击"下一步",您会看到全新的PDF增强解析选项
我们推荐同时开启自动生成补充索引和图片自动索引,效果更佳
Step 4: 预览与完成
点击左侧的文件进行预览
系统会显示分块预览内容
确认无误后,点击"下一步",再点击"开始上传"
耐心等待训练完成,状态变为"已就绪"
? 感受效果,惊艳体验!
点击目标文件,立即体验增强解析的强大功能:
文本呈现清晰整洁
图片识别完整精准
LaTeX公式自动识别渲染
表格数据结构化展示,一整个爱上
PDF 扫描增强,丝滑转化
FastGPT 4.9 更多亮点功能与重要更新
除了革命性的PDF增强解析,我们还带来了更多实用功能和性能提升!
? 图片自动标注:让视觉元素更有价值
FastGPT全新推出的图片自动标注功能,彻底改变了知识库处理视觉内容的方式,让图片都能够更好地被理解、被检索、被利用。
-
自动识别 PDF 中的图片内容并生成 Markdown 格式准确描述,并为图片创建可检索的标签
实际效果展示
来看一个真实案例,当我们在知识库中上传了 RAG 相关内容:
我们可以看到增加了对图片的索引部分
如果不打开这个功能,我们就只能自定义索引
-
为图片创建可检索的标签
这意味着您可以通过关键词直接搜索相关图片的内容
-
优化知识库内图片的搜索体验
-
无需人工干预,全程自动化处理
同时,我们还重新设计了知识库文件上传的数据逻辑和交互流程,让整个过程更加流畅高效。
检索能力大幅提升
通过升级 pg vector 插件至 0.8.0 版本,我们引入了迭代搜索技术:
-
扩大检索范围,减少死元组影响召回数量
新版本在保持检索精度的同时,将原本难以检索到的"边缘信息"纳入搜索范围,实现了更全面的知识覆盖。
FastGPT 4.9 系统优化与问题修复
除了闪亮的新功能,我们还对系统进行了全方位的优化与修复,让您的使用体验更加流畅!
⚙️ 系统优化:更快、更强、更智能
♾️ 知识库索引全面升级
重大突破:知识库索引数量不再受限!
-
可无限创建自定义索引,满足不同场景需求
-
系统会自动更新输入文本的索引
利用无限索引功能,您可以为同一知识点创建多种表述形式,大幅提高检索命中率!
? Markdown解析优化
我们优化了Markdown内容处理,特别是:
-
自动检测链接后的中文标点符号
?️ Prompt模式增强
Prompt模式工具调用现已支持思考模型,同时:
-
显著减少空输出概率
? 文件处理性能飞跃
通过优化代码和数据库存储结构,我们实现了大幅的性能提升:
-
成果:50M PDF读取速度提升3倍!
? 问题修复:更稳定、更安全
? 网页抓取安全增强
增加了网页抓取的安全链接校验机制防止潜在风险
? 全局变量传递修复
解决了批量运行时全局变量传递的问题:
-
修复了变量未能正确传递到下一次运行的bug
⚠️ 重要更新通知
为了提供更好的服务体验,我们进行了以下必要调整:
1️⃣ 私有化部署变更
私有化部署的自定义文件解析方案已弃用
请尽快同步更新到最新的配置方案,享受更稳定的服务和新功能支持
2️⃣ API 接口更新
-
旧版本地文件上传 API 已弃用:
/api/core/dataset/collection/create/file
(原商业版专属API)已切换为:/api/core/dataset/collection/create/localFile
-
外部文件库相关 API 即将停用:建议尽快迁移至功能更完善的 API 文件库
3️⃣ 接口参数规范化
上传文件至知识库、创建连接集合等接口的trainingType
字段调整:
-
未来仅支持
chunk
和QA
两种模式 -
增强索引模式将使用独立字段:
autoIndexes
-
目前仍兼容旧版
trainingType=auto
,但请尽快更新您的代码
这些优化和修复也许不如新功能那样引人注目,但它们是提升整体用户体验的关键基石。我们致力于在每个细节上精益求精,让FastGPT成为您最可靠的AI助手!