在当今信息爆炸的时代,我们常常需要从半结构化知识库(Semi-structured Knowledge Base, SKB)中获取信息来回答复杂问题。这类知识库既包含文本文档,也包含实体之间的关联关系。然而,许多现实中的问题属于“混合型问题”,即同时需要文本信息和关系信息才能正确回答。
传统的检索方法往往难以兼顾这两类信息:
-
传统RAG 只检索文本,忽略了实体之间的关系; -
图RAG(GRAG) 只关注知识图谱中的关系,容易遗漏文本内容; -
问题路由方法 在识别问题类型时容易混淆文本与关系部分,导致检索失败。
HYBGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases
HYBGRAG 不仅是一个技术框架,通过多模态检索 + 自我反思的机制,实现了对复杂问题的精准理解与回答,特别适用于学术文献、企业知识库、智能客服等需要结合文本与关系的场景。

|
|
|
|
|
|
|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| HYBGRAG | 全部类型 |
|
|
|
问题定义:什么是混合问答(HQA)?
首先,明确一下研究范围:
-
半结构化知识库(SKB) = 知识图谱(实体和关系) + 文本文档集合 -
混合问题 = 需要同时使用文本信息和关系信息才能回答的问题 -
HQA的目标 = 从SKB中检索出既满足关系条件又满足文本条件的文档集合
🔍 挑战一:混合来源问题(Hybrid-Sourcing Question)
研究者比较了两种单一检索方式的效果:
-
文本检索器:基于向量相似度搜索,专注文本内容 -
图检索器:基于个性化PageRank,专注知识图谱关系
惊人发现文本检索和图检索的效果相当,但它们的优势领域几乎不重叠!如果有一个“完美调度器”总能选择正确的检索器,性能将大幅提升。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
| 最优路由 | 45.22% | 74.63% |
这意味着:很多问题必须同时使用两种信息源才能正确回答。
🔍 挑战二:需要优化的问题(Refinement-Required Question)
在知识图谱问答中,成功的关键往往在于能否从图谱中提取出包含目标实体的正确子图。
研究者测试了LLM在首次尝试时能否提取出包含目标实体的子图:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
92.31% |
在混合问题中,LLM很难在第一次就准确区分文本方面和关系方面,经常把文本内容误认为是实体。
-
仅让LLM重试一次,命中率就能显著提升 -
如果提供具体的错误反馈(如“提取的主题实体错误”),效果提升更加明显
这两个挑战直接催生了HYBGRAG的核心设计:
-
针对挑战一 → 引入检索器组,同时利用文本和关系检索器 -
针对挑战二 → 设计评判模块,通过自我反思不断优化问题解析
HYBGRAG技术详解:如何构建自适应混合检索系统

检索器组
检索模块类型:
-
文本检索模块
-
基于向量相似度搜索 -
直接在文本文档中寻找答案 -
适用于纯文本问题或混合检索模块无法提取信息的情况
-
混合检索模块 -
输入:识别出的主题实体 + 有用关系 -
过程:从主题实体的自我图中提取实体,然后用VSS排序 -
关键创新:确保关系信息和文本信息的协同作用 -
首先识别问题的关系方面(主题实体和有用关系) -
然后决定使用文本检索还是混合检索模块 -
智能逻辑:如果识别不出任何实体,自动选择文本检索模块 -
主题实体: {John Smith} -
有用关系: {author writes paper} -
选择:混合检索模块 -
验证器:判断检索结果是否正确 -
评论器:提供具体改进反馈 -
任务:二元分类,判断检索结果是否满足问题要求 -
关键创新:提供验证上下文(推理路径) -
例子:使用路径" {作者} → {撰写} → {论文}"来验证结果 -
任务:当检索错误时,提供具体改进反馈 -
反馈类型:纠正性反馈(非自然语言)
路由器:智能调度中心
对于问题"约翰·史密斯的纳米流体传热论文",路由器会识别:
评判模块
将复杂的评判任务分解为两个专门化的LLM:
验证器:质量守门员
评论器:精准指导教练
HYBGRAG实验验证


STARK基准测试结果:
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| HYBGRAG | 65.40% | 28.56% | 平均51% |
多代理设计价值:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
| 多代理 | 65.40% | 完整HYBGRAG设计 |
在CRAG基准测试中,HYBGRAG同样表现出色:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
| HYBGRAG | 63.22% |
框架使用的实体和提示词




