2025 年 1 月 7 日,OpenSPG/KAG 正式发布 v0.6 版本,此次发布带来多个功能更新,包括摘要生成类任务支持、垂域 Schema 管理、可视化知识探查等;用户体验上,提供知识库任务的断点续跑机制,新增用户登录与权限体系、优化构建任务调度;开发者模式下支持不同阶段配置不同模型、支持 schema-constraint 模式抽取等,极大地提升了系统的灵活性、易用性、性能和安全性,为用户提供一个更加强大,且适应多样化应用场景的知识管理平台。
新增功能

摘要生成类任务支持
不牺牲多跳事实推理精度的情况下,原生支持摘要生成任务。

领域 Schema 管理
产品侧提供 SPG Schema 管理能力,支持用户根据通过自定义 Schema 以优化知识库构建&推理问答的效果。

知识探查
新增知识探查功能,实现知识库数据的可视化查询分析,并提供HttpAPI 与其它系统对接。

知识库构建支持挂载领域知识(开发者模式)
开发者模式下,支持将领域知识(领域词汇、词条间关系)注入知识库中,可显著提升知识库构建、推理问答效果(医疗场景下有10%+ 的提升)。

构建链路增加知识对齐组件
KAG-Builder 提供默认的知识对齐组件,并内嵌无效数据过滤、相似实体链指等功能,以优化图谱的结构和数据质量。
用户体验优化

断点续跑
产品模式、开发者模式下,分别提供文件级别、Chunk 级别的知识库构建任务的断点续跑能力,以降低任务失败后全量重跑所带来的时间和tokens 消耗。

用户登录&权限体系
提供用户登录&权限体系,防止未经授权的知识库数据访问和操作。

知识库构建任务调度优化
提供基于数据库的知识库构建任务调度能力,避免容器重启后任务异常或者中断。

支持不同阶段配置不同模型(开发者模式)
提供基于注册器的组件管理机制,允许用户通过配置文件实例化组件对象,支持用户开发&嵌入自定义组件到KAG-Builder、KAG-Solver 工作流 中,同时在工作流的不同阶段配置不同规模的大模型,以提升整体的推理问答性能。

Markdown、PDF、Word 文件版面分析优化
Markdown、pdf、word 等文件优先根据文件章节划分Chunk,以实现同一chunk 的内容更内聚。

项目全局配置及知识库配置
提供知识库全局配置功能,统一设置存储引擎、生成模型、表示模型的访问信息。

支持 Schema-constraint 模式的抽取链接(开发者模式)
提供 Schema-constraint 模式,知识库构建阶段,严格按照 Schema 的定义进行操作,从而实现更细粒度和更复杂的知识抽取。
未来规划


