01
为什么传统的RAG与大模型上下文,无法带来输出质量提升?
(1)大模型全量加载上下文:成本和准确率成为问题
(2)传统RAG的问题:盲目检索
02
新型RAG应该如何搭建

节点1,IF:路由决策
节点2,WHAT:查询构造
节点3,WHERE & HOW:策略选择
节点4,GENERATE:最小上下文生成
03
关键技术节点1:混合检索带来RAG效果提升

04
关键技术节点2:如何对RAG结果做评估
-
路由层看F1分数,假阴性率过高说明太多需要检索的查询被误判为直接生成。 -
查询改写层看实体识别准确率和同义词覆盖率。 -
检索层看Recall@K和NDCG@10,这两个指标分别反映召回能力和排序质量。 -
重排序层看top-3文档的相关性得分分布。 -
生成层看答案对召回文档的引用准确率。


