前几天我分享了一篇文章知识图谱+向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。
Microsoft GraphRAG
微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。它能够从私有文档中自动构建知识图谱,在查询时借助图结构进行多跳推理,提升复杂问答表现。
它支持图结构推理和链式多轮查询,提供完整的端到端数据管道,并兼容 Azure 等企业级部署。该项目通过 GitHub 地址(microsoft/graphrag)提供,适用于企业内部文档问答、复杂信息抽取以及语义搜索等场景,帮助用户高效处理和分析海量数据。
Nano-GraphRAG
Nano-GraphRAG 是一个专注于简化的 GraphRAG 实现,代码量仅约 1100 行,却保留了核心能力,并兼容多种本地/云模型。
Nano-GraphRAG架构精简,支持异步处理,同时默认集成向量库Faiss,图数据库Neo4j以及大模型调用工具Ollama。有全局和局部两种查询方式,支持增量更新、定制模板。
相对来说,因为Nano-GraphRAG代码更少,部署简单,因此更适合本地知识图构建以及用于轻量级语义问答服务。
DIGIMON
由 JayLZhou 等人开发的 DIGIMON(又名 GraphRAG)是一个用于研究 GraphRAG 多种算法效果的平台,特别适合学术研究者和算法团队。
DIGIMON支持实现多种变种(如 LGraphRAG、HippoRAG 等),通过 YAML 配置实现快速策略切换,并附带评估脚本与数据集,同时兼容本地及 OpenAI 模型。该项目更适用于图谱问答算法研究以及多跳 QA 效果评估等场景。
Fast GraphRAG
Fast GraphRAG 由 CircleMind AI 发布,主打高性能和高可解释性,在保持查询准确度的同时,显著降低计算开销。
fast-graphrag 项目支持 PageRank 式图遍历搜索、增量更新与自动图精炼、异步推理以及类型安全等亮点特性,在官方文档说明中,表示其可节省约 6 倍推理成本。该项目更适用于需要高性价比和低延迟知识问答系统的企业部署。
LightRAG
LightRAG 由香港大学开发,是一个带有图谱可视化界面的 RAG 系统,支持多种文件类型的解析,适合教学、演示及快速开发。
LightRAG 项目支持文档上传、实体识别、图谱构建、可视化查询路径、多格式导出,并集成 Ollama、本地模型与图数据库,提供 Web 前端和 RAG 对话接口。该项目更适用于教育、知识展示以及通用 RAG 服务化部署等场景。
HuixiangDou2
由华师大团队推出的 HuixiangDou2(又名 ROGRAG)专注于多轮问答场景中的知识增强,支持双层检索策略,强调中文能力与鲁棒性。
HuixiangDou2 项目支持 Group Chat 场景、文档层与图谱层双重检索增强,默认支持中文 (zh_cn) 接口,并适配客服和技术支持类问答系统。该项目更适用于中文环境下的客服系统和智能助手等场景。
最后再总结一波,对于工业级企业部署,建议使用Microsoft GraphRAG和Fast GraphRAG;对于轻量级或本地测试,推荐Nano-GraphRAG 和LightRAG;针对图谱问答研究,选择DIGIMON;对于中文多轮问答,推荐HuixiangDou2(ROGRAG)。这些项目可根据具体场景进行选择,以优化知识图谱和问答系统的性能。